Gemini деген эмне: Google'дун жаңы AI модели жөнүндө

08/02/2024 22:28

Google жаңы эле өзүнүн эң күчтүү AI моделин чыгарды Gemini. Ал эмне жана ал эмне кыла алат? Биздин макалада баары жөнүндө.

Google көп жылдар бою өзүнүн AI куралдарын иштеп чыгууда. OpenAIден ChatGPT-3 коомдук релизинен кийин, дүйнөдөгү эң популярдуу издөө системасын иштеткен компания дагы ушундай эле куралды, Bard түздү. Бирок бул курал дагы деле Google уруксат бере алган эмес, атаандаштарына утулуп калды. Ошондуктан, дүйнө жакында Google'дун жаңы тил модели Geminiди көргөнү таң калыштуу эмес, ал тууралуу презентация учурунда билдик.

Ал гиганттын мурунку LLM (Large Language Model) программасын өркүндөтүү үчүн гана эмес, текстти иштетүү, графика жана үн чөйрөсүндө таптакыр жаңы мүмкүнчүлүктөрдү сунуштоо үчүн иштелип чыккан.

Андыктан келгиле, Google Gemini тилинин жаңы моделин кененирээк карап чыгалы.

Ошондой эле кызыктуу: OpenAI долбоору Q*: бул эмне жана долбоор эмне үчүн тынчсыздандырат

МАЗМУНУ

1. Google Gemini деген эмне?

2. Моделди ким жараткан?

3. Мүмкүнчүлүктөр

4. Ар кандай версиялар барбы?

5. Gemini кантип кирүүгө болот?

6. Google Барддагы Gemini: Эмне өзгөрөт?

7. Google Pixel смартфондорундагы Gemini

8. Gemini башка AI моделдеринен эмнеси менен айырмаланат, мисалы, GPT-4?

9. Тактык жана калыстык жөнүндө тынчсыздануу

10. Келечек Gemini менен

Google Gemini деген эмне?

Бул текстти гана эмес, сүрөттөрдү, видеолорду жана аудиону да түшүнө алган Google жасалма интеллектинин жаңы жана күчтүү модели. Бул мультимодалдык модель математика, физика жана башка чөйрөлөрдөгү татаал тапшырмаларды аткарууга, ошондой эле ар кандай программалоо тилдеринде жогорку сапаттагы кодду түшүнүүгө жана жаратууга жөндөмдүү катары сүрөттөлөт.

Gemini учурда Google Bard жана Google Pixel 8 менен интеграция аркылуу жеткиликтүү жана бара-бара башка Google кызматтарына кошулат.

"Gemini - бул Google топторунун, анын ичинде Google Researchтеги кесиптештерибиздин биргелешкен аракетинин натыйжасы", — деди Google DeepMind компаниясынын башкы директору жана негиздөөчүсү Деннис Хассабис. "Ал башынан эле мультимодалдык болушу үчүн курулган, башкача айтканда, текст, код, аудио, сүрөттөр жана видеолорду камтыган маалыматтын ар кандай түрлөрүн жалпылап, кемчиликсиз түшүнүп, иштетип жана айкалыштыра алат".

Ошондой эле кызыктуу: Биз AI деп атаган нерселердин бардыгы эле жасалма интеллект эмес. Бул жерде сиз эмнени билишиңиз керек

Моделди ким жараткан?

Сиз ойлогондой, Gemini Google жана Google компаниясынын башкы компаниясы Alphabet тарабынан түзүлгөн жана компаниянын бүгүнкү күнгө чейин эң өнүккөн AI модели болуп саналат. Анын өнүгүшүнө Google'дун DeepMind бөлүмү да чоң салым кошкон. Азырынча иштеп чыгууга канча кызматкер катышканы жана бул үчүн кандай каражаттар бөлүнгөнү белгисиз, бирок Google'дун мүмкүнчүлүктөрүн билүү менен биз абдан чоң сумма бар экенине ишенсек болот.

Ошондой эле кызыктуу: Windows 12: Жаңы OS кандай болот

Мүмкүнчүлүктөр

Мен жогоруда белгилегендей, бул мультимодалдык модель, башкача айтканда, текст, код, аудио, сүрөттөр жана видео сыяктуу маалыматтардын ар кандай түрлөрүн түшүнүп, иштетип жана айкалыштыра алат. Бул мурунку AI системаларына салыштырмалуу жакшыраак түшүнүү, ой жүгүртүү жана коддоо көндүмдөрүн камсыз кылат.

моделдин негизги мүмкүнчүлүктөрү болуп төмөнкүлөр саналат:

Котормо, жыйынтыктоо жана диалог сыяктуу тапшырмалар үчүн табигый тилди иштетүү
Математикалык ой жүгүртүү жана маселелерди чечүү
Кодду жана документтерди түзүү мүмкүнчүлүгү
Сүрөттөрдү, аудио жана видеону түшүнүү
Ар кандай домендерде көп тапшырма

Көрүнүп тургандай, мүмкүнчүлүктөрү башка моделдерге караганда жогору.

Тилди түшүнүү, математикалык ой жүгүртүү жана коддоо тесттеринде Gemini Ultra GPT-4 сыяктуу моделдерден ашып түштү. Тактап айтканда, бул 90%дан ашык тактыкка жетишип, Массивдүү көп тапшырма тилди түшүнүү (MMLU) сынагында адам деңгээлиндеги аткаруудан ашып кеткен биринчи модель.

Чоң тил моделин изилдөөнүн 32 академиялык тестинде Gemini GPT-4тен ашып кетти. 30 учурда Google'дун жаңы тил модели атаандашынан жакшыраак болгон. Бул моделдин тилди толук түшүнүү жөндөмүн көрсөтөт.

Ошондой эле окуңуз: Адамдын мээси долбоору: Адамдын мээсин тууроо аракети

Ар кандай версиялар барбы?

Google бул AIды каалаган түзмөктө иштей ала турган ийкемдүү модель катары сүрөттөйт: Google маалымат борборлорунан мобилдик түзмөктөргө чейин. Бул масштабдуулукка жетүү үчүн Gemini үч версияда келет: Nano, Pro жана Ultra.

Эгиздердин ар кандай версиялары жөнүндө кененирээк сүйлөшөлү.

Gemini Nano: смартфондордо, атап айтканда, Google Pixel 8де иштөө үчүн иштелип чыккан. Ал тышкы серверлерге туташуусуз жасалма интеллект менен эффективдүү иштетүүнү талап кылган тапшырмаларды аткаруу үчүн иштелип чыккан, мисалы, чат программаларында жооп сунуштоо же текстти жыйынтыктоо. Бул компакт түзүлүш модели 6 миллиардга жакын параметрлерге ээ.
GeminiPro: Google маалымат борборлорунда иштейт. Pro Bard AI чатботунун акыркы версиясы менен иштөө үчүн иштелип чыккан. Ал тез жооп берүү жолу менен камсыз кылуу жана татаал суроолорду түшүнө алат. Орто өлчөмдөгү модель болжол менен 100 миллиард параметрге ээ жана Барддын сүйлөшүүчү AIсынын өзөгүн түзөт. Pro Google Булут аркылуу жеткиликтүү болот.
Gemini Ultra: Ultra версиясы кеңири жеткиликтүү эмес болсо да, Google аны "чоң тил моделин (LLM) изилдөөдө колдонулган 30 кеңири колдонулган академиялык тесттердин 32у үчүн учурдагы заманбап үлгүдөн ашып, анын эң мыкты үлгүсү катары сүрөттөйт. " Эң чоң жана эң күчтүү версия катары Ultra 1 триллиондон ашык параметрлерди алат. Ал маалымат борборлорунда жайгашат. Ultra корпоративдик колдонуу үчүн ылайыкташтырылган. Версия абдан татаал милдеттерди аткаруу үчүн иштелип чыккан. Google аны учурдагы сыноо этабы аяктагандан кийин чыгарууну пландаштырууда. Башкача айтканда, эң күчтүү версия колдонуучуларга азырынча жеткиликтүү эмес.

Ошондой эле кызыктуу: Google Bard AI: Сиз билишиңиз керек болгон нерселердин баары

Gemini кантип кирүүгө болот?

Nano жана Pro версияларындагы AI азыр тиешелүүлүгүнө жараша Google Pixel 8 смартфондору жана Bard чатботу сыяктуу Google өнүмдөрүндө жеткиликтүү. Google акыры аны издөө системасына, жарнамага, Gmail электрондук почта кызматына, Chrome браузерине жана башка кызматтарга кошууну пландаштырууда.

Иштеп чыгуучулар жана корпоративдик кардарлар 13-жылдын 2023-декабрынан баштап Google AI Studio жана Google Cloud Vertex AIдеги Gemini API аркылуу Pro'го кире алышат. Иштеп чыгуучулар Android AICore аркылуу Nano версиясынын моделине кирүү мүмкүнчүлүгүнө ээ болот, ал эрте алдын ала кароодо жеткиликтүү болот.

Ошондой эле окуңуз: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: Эки Йокозундун салгылашы

Google Барддагы Gemini: Эмне өзгөрөт?

Презентация учурунда берилген маалыматка ылайык, модель Google Bardга татаалыраак көйгөйлөрдү чечүүгө мүмкүндүк берет, деп айтылган:

«Биз Gemini модели табигый түрдө мультимодалдык жана башынан эле бир нече модальдүүлүк боюнча алдын ала даярдалгандай кылып иштеп чыктык. Андан кийин ишти жакшыртуу үчүн мультимодалдык маалыматтарды кошуу менен аны тактадык. Натыйжада, Gemini оңой түшүнөт жана мурунку мультимодалдык моделдерге караганда алда канча жакшыраак тыянак чыгарат жана дээрлик бардык тармактарда заманбап мүмкүнчүлүктөрү менен мактанат.

Gemini'нин өзгөчө мультимодалдык мүмкүнчүлүктөрү татаал тексттик жана визуалдык маалыматты түшүнүүгө жардам берет. Алар чоң маалымат топтомдорунан конкреттүү маалыматты алууда өзгөчө пайдалуу. Бул моделдин жүз миңдеген документтерди окуу, чыпкалоо жана талдоо аркылуу маалыматтын маңызын бөлүп алуу өзгөчө жөндөмү илимден финансыга чейин ар түрдүү тармактарда жаңы, чагылгандай ылдам ачылыштарга салым кошоору шексиз».

Презентациянын жүрүшүндө комплекстүү изилдөөнүн үлгүсү көрсөтүлдү, анда 200 миңден ашык жазуу камтылган, алардын айрымдары жаңы маалыматтар боюнча жаңыртылышы керек болчу. Сиз ойлогондой, муну кол менен жасоо абдан көп убакытты талап кылат, ошондуктан изилдөөнүн авторлору Gemini кодду даярдоо үчүн киришти жана керектүү жаңыртууларды жасашты. Дагы бир реалдуу мисал, математика же физика маселелерин түшүндүрүү үчүн Google'дун тил моделин колдонуу.

Бул жерде киргизилген маалыматтар мектеп сабагынан тапшырманын сүрөтү/скандоосу болгон. Система ал жерде сакталган графиканы жана текстти иштетип, андан кийин үй тапшырмасынын кайсы бөлүктөрү туура аткарылганын жана кайсынысына көбүрөөк көңүл буруу керектигин көрсөтө алган. Презентация колдонуучу Geminiден тапшырманы түшүндүрүп берүүнү кайра-кайра сурай аларын көрсөттү жана ар бир кийинки аракет жөнөкөй тил менен түшүндүрүлүшү керек. Gemini канчалык так жана туура болорун, албетте, кызыккандар текшеришет, бирок текстти сүрөттөрдөн түздөн-түз окуу жана иштетүү жөндөмдүүлүгү таасирдүү. Презентация учурунда кошумчалангандай:

«Gemini бир эле учурда текстти, сүрөттөрдү, үндөрдү жана башкаларды таанууга жана түшүнүүгө үйрөтүлгөн. Мунун аркасында ал маалыматтын нюанстарын жакшы түшүнөт жана татаал суроолорго жооп бере алат. Бул математика жана физика менен байланышкан темаларды түшүндүрүүдө өзгөчө натыйжалуу, ошондуктан ал жеке үй тапшырмасын жардамчы катары кызмат кыла алат".

Google Pixel смартфондорундагы Gemini

Google ошондой эле Gemini жаңы TPUv5 чипсеттерин "үйрөнүүдө" деп мактанган жана Gemini Ultra'ны 2024-жылдын башында киргизүүнү пландап жатат, анда гиганттын сүйлөө моделинин керектөөчү версиясынын жаңы версиясы Bard Advanced колдонулат. Gemini Ultra учурда тестирлөөдө жана коопсуздук боюнча эксперттерди тандоо үчүн жеткиликтүү.

Акыркы маанилүү маалымат бул Google Pixel 8 смартфондоруна Gemini киргизүү.Бул башка нерселер менен катар мессенджерлерде Gboard тиркемеси аркылуу тез жоопторду түзүүгө мүмкүндүк берет. Биринчиси WhatsApp, бирок кийинки жылы мындай чечимдер байланышка байланыштуу башка тиркемелерде пайда болот. Бирок, бул башталышы гана, анткени Google Pixel 8 смартфондору үчүн көптөгөн жаңы AI куралдарын жарыялады жана алар келечекте кээ бир башка түзмөктөрдө жеткиликтүү болот. Android. Бирок бул дагы пландар жана азырынча эч кандай маалымат бериле элек.

Gemini башка AI моделдеринен эмнеси менен айырмаланат, мисалы, GPT-4?

Google'дун жаңы Gemini модели бүгүнкү күнгө чейин эң чоң жана эң өнүккөн AI моделдеринин бири болуп көрүнөт, бирок Ultra моделинин чыгарылышы аны так аныктайт. Учурда AI чатботторун колдонуп жаткан башка популярдуу моделдерге салыштырмалуу Gemini өзүнүн мультимодалдык өзгөчөлүгү менен өзгөчөлөнөт, ал эми GPT-4 сыяктуу башка моделдер плагиндерге жана интеграцияга таянышат.

Тактык жана калыстык жөнүндө тынчсыздануу

Gemini жасалма интеллекттин мүмкүнчүлүктөрүн өнүктүрүүдө алдыга чоң секирик болгону менен, башка негизги тил моделдериндей эле кемчиликтери бар. Биринчиден, бул жалган маалымат түзүү мүмкүнчүлүгү. Бир тараптуулуктар жаңы тил моделинде жеткиликтүү болгон окутуу маалыматтарына да негизделген. Чыныгы дүйнөнүн чектелген түшүнүгүн да айта кетели. Google жаңы Gemini модели ката кетирип, далилдерге негизделбеген жана акылга карама-каршы келген фактыларды бере аларын моюнга алат.

Көбүрөөк тесттер керек, айрыкча Gemini Ultra үчүн, али толук изилдене элек жаңы мүмкүнчүлүктөр бар. Google мүмкүн болуучу зыянды азайтуу үчүн Gemini кылдаттык менен баалоого милдеттенет.

Ошондой эле кызыктуу: Бардык жөнүндө Microsoft Копилот: келечек же туура эмес жол?

Келечек Gemini менен

Google тарабынан Gemini ишке киргизүү AI өнүктүрүүнүн жаңы доорун ачты. Мурунку моделдерге жана адамдын базалык көрсөткүчтөрүнө салыштырмалуу эң жакшы көрсөткүчү менен Gemini жасалма интеллекттин келечектеги мүмкүнчүлүктөрүн көрсөтөт, бирок дагы эле кээ бир кемчиликтерди жоюу үчүн көбүрөөк изилдөө керек.

Келечекте Gemini Google өнүмдөрүндө көбүрөөк пайдалуу жана акылдуу функцияларды берет деп күтсөңүз болот. Алдыда компания Gemini-ди англисчеден тышкары кеңейтүүнү жана анын негизги моделдик методологиясына таянууну улантууну пландаштырууда.

Биз бир гана карап, Google эмне кылып жатканын билет деп үмүттөнөбүз.

Ошондой эле окуңуз:

Yuri Svitlyk

Карпат тоосунун уулу, математиканын таанылбаган генийи, "юрист"Microsoft, практикалык альтруист, сол-оң

Кийинки макала Acer Predator Extreme электр скутерин, жаңы оюн мониторлорун жана ноутбуктарын жарыялады »

Мурунку макала « Homeworld 3 чыгаруу 2024-жылдын май айына жылдырылды

Таштап Жооп

Tags: ГуглтандалдыЖасалма интеллект