Google жаңы эле өзүнүн эң күчтүү AI моделин чыгарды Gemini. Ал эмне жана ал эмне кыла алат? Биздин макалада баары жөнүндө.
Google көп жылдар бою өзүнүн AI куралдарын иштеп чыгууда. OpenAIден ChatGPT-3 коомдук релизинен кийин, дүйнөдөгү эң популярдуу издөө системасын иштеткен компания дагы ушундай эле куралды, Bard түздү. Бирок бул курал дагы деле Google уруксат бере алган эмес, атаандаштарына утулуп калды. Ошондуктан, дүйнө жакында Google'дун жаңы тил модели Geminiди көргөнү таң калыштуу эмес, ал тууралуу презентация учурунда билдик.
Ал гиганттын мурунку LLM (Large Language Model) программасын өркүндөтүү үчүн гана эмес, текстти иштетүү, графика жана үн чөйрөсүндө таптакыр жаңы мүмкүнчүлүктөрдү сунуштоо үчүн иштелип чыккан.
Андыктан келгиле, Google Gemini тилинин жаңы моделин кененирээк карап чыгалы.
Ошондой эле кызыктуу: OpenAI долбоору Q*: бул эмне жана долбоор эмне үчүн тынчсыздандырат
Бул текстти гана эмес, сүрөттөрдү, видеолорду жана аудиону да түшүнө алган Google жасалма интеллектинин жаңы жана күчтүү модели. Бул мультимодалдык модель математика, физика жана башка чөйрөлөрдөгү татаал тапшырмаларды аткарууга, ошондой эле ар кандай программалоо тилдеринде жогорку сапаттагы кодду түшүнүүгө жана жаратууга жөндөмдүү катары сүрөттөлөт.
Gemini учурда Google Bard жана Google Pixel 8 менен интеграция аркылуу жеткиликтүү жана бара-бара башка Google кызматтарына кошулат.
"Gemini - бул Google топторунун, анын ичинде Google Researchтеги кесиптештерибиздин биргелешкен аракетинин натыйжасы", — деди Google DeepMind компаниясынын башкы директору жана негиздөөчүсү Деннис Хассабис. "Ал башынан эле мультимодалдык болушу үчүн курулган, башкача айтканда, текст, код, аудио, сүрөттөр жана видеолорду камтыган маалыматтын ар кандай түрлөрүн жалпылап, кемчиликсиз түшүнүп, иштетип жана айкалыштыра алат".
Ошондой эле кызыктуу: Биз AI деп атаган нерселердин бардыгы эле жасалма интеллект эмес. Бул жерде сиз эмнени билишиңиз керек
Сиз ойлогондой, Gemini Google жана Google компаниясынын башкы компаниясы Alphabet тарабынан түзүлгөн жана компаниянын бүгүнкү күнгө чейин эң өнүккөн AI модели болуп саналат. Анын өнүгүшүнө Google'дун DeepMind бөлүмү да чоң салым кошкон. Азырынча иштеп чыгууга канча кызматкер катышканы жана бул үчүн кандай каражаттар бөлүнгөнү белгисиз, бирок Google'дун мүмкүнчүлүктөрүн билүү менен биз абдан чоң сумма бар экенине ишенсек болот.
Ошондой эле кызыктуу: Windows 12: Жаңы OS кандай болот
Мен жогоруда белгилегендей, бул мультимодалдык модель, башкача айтканда, текст, код, аудио, сүрөттөр жана видео сыяктуу маалыматтардын ар кандай түрлөрүн түшүнүп, иштетип жана айкалыштыра алат. Бул мурунку AI системаларына салыштырмалуу жакшыраак түшүнүү, ой жүгүртүү жана коддоо көндүмдөрүн камсыз кылат.
моделдин негизги мүмкүнчүлүктөрү болуп төмөнкүлөр саналат:
Көрүнүп тургандай, мүмкүнчүлүктөрү башка моделдерге караганда жогору.
Тилди түшүнүү, математикалык ой жүгүртүү жана коддоо тесттеринде Gemini Ultra GPT-4 сыяктуу моделдерден ашып түштү. Тактап айтканда, бул 90%дан ашык тактыкка жетишип, Массивдүү көп тапшырма тилди түшүнүү (MMLU) сынагында адам деңгээлиндеги аткаруудан ашып кеткен биринчи модель.
Чоң тил моделин изилдөөнүн 32 академиялык тестинде Gemini GPT-4тен ашып кетти. 30 учурда Google'дун жаңы тил модели атаандашынан жакшыраак болгон. Бул моделдин тилди толук түшүнүү жөндөмүн көрсөтөт.
Ошондой эле окуңуз: Адамдын мээси долбоору: Адамдын мээсин тууроо аракети
Google бул AIды каалаган түзмөктө иштей ала турган ийкемдүү модель катары сүрөттөйт: Google маалымат борборлорунан мобилдик түзмөктөргө чейин. Бул масштабдуулукка жетүү үчүн Gemini үч версияда келет: Nano, Pro жана Ultra.
Эгиздердин ар кандай версиялары жөнүндө кененирээк сүйлөшөлү.
Ошондой эле кызыктуу: Google Bard AI: Сиз билишиңиз керек болгон нерселердин баары
Nano жана Pro версияларындагы AI азыр тиешелүүлүгүнө жараша Google Pixel 8 смартфондору жана Bard чатботу сыяктуу Google өнүмдөрүндө жеткиликтүү. Google акыры аны издөө системасына, жарнамага, Gmail электрондук почта кызматына, Chrome браузерине жана башка кызматтарга кошууну пландаштырууда.
Иштеп чыгуучулар жана корпоративдик кардарлар 13-жылдын 2023-декабрынан баштап Google AI Studio жана Google Cloud Vertex AIдеги Gemini API аркылуу Pro'го кире алышат. Иштеп чыгуучулар Android AICore аркылуу Nano версиясынын моделине кирүү мүмкүнчүлүгүнө ээ болот, ал эрте алдын ала кароодо жеткиликтүү болот.
Ошондой эле окуңуз: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: Эки Йокозундун салгылашы
Презентация учурунда берилген маалыматка ылайык, модель Google Bardга татаалыраак көйгөйлөрдү чечүүгө мүмкүндүк берет, деп айтылган:
«Биз Gemini модели табигый түрдө мультимодалдык жана башынан эле бир нече модальдүүлүк боюнча алдын ала даярдалгандай кылып иштеп чыктык. Андан кийин ишти жакшыртуу үчүн мультимодалдык маалыматтарды кошуу менен аны тактадык. Натыйжада, Gemini оңой түшүнөт жана мурунку мультимодалдык моделдерге караганда алда канча жакшыраак тыянак чыгарат жана дээрлик бардык тармактарда заманбап мүмкүнчүлүктөрү менен мактанат.
Gemini'нин өзгөчө мультимодалдык мүмкүнчүлүктөрү татаал тексттик жана визуалдык маалыматты түшүнүүгө жардам берет. Алар чоң маалымат топтомдорунан конкреттүү маалыматты алууда өзгөчө пайдалуу. Бул моделдин жүз миңдеген документтерди окуу, чыпкалоо жана талдоо аркылуу маалыматтын маңызын бөлүп алуу өзгөчө жөндөмү илимден финансыга чейин ар түрдүү тармактарда жаңы, чагылгандай ылдам ачылыштарга салым кошоору шексиз».
Презентациянын жүрүшүндө комплекстүү изилдөөнүн үлгүсү көрсөтүлдү, анда 200 миңден ашык жазуу камтылган, алардын айрымдары жаңы маалыматтар боюнча жаңыртылышы керек болчу. Сиз ойлогондой, муну кол менен жасоо абдан көп убакытты талап кылат, ошондуктан изилдөөнүн авторлору Gemini кодду даярдоо үчүн киришти жана керектүү жаңыртууларды жасашты. Дагы бир реалдуу мисал, математика же физика маселелерин түшүндүрүү үчүн Google'дун тил моделин колдонуу.
Бул жерде киргизилген маалыматтар мектеп сабагынан тапшырманын сүрөтү/скандоосу болгон. Система ал жерде сакталган графиканы жана текстти иштетип, андан кийин үй тапшырмасынын кайсы бөлүктөрү туура аткарылганын жана кайсынысына көбүрөөк көңүл буруу керектигин көрсөтө алган. Презентация колдонуучу Geminiден тапшырманы түшүндүрүп берүүнү кайра-кайра сурай аларын көрсөттү жана ар бир кийинки аракет жөнөкөй тил менен түшүндүрүлүшү керек. Gemini канчалык так жана туура болорун, албетте, кызыккандар текшеришет, бирок текстти сүрөттөрдөн түздөн-түз окуу жана иштетүү жөндөмдүүлүгү таасирдүү. Презентация учурунда кошумчалангандай:
«Gemini бир эле учурда текстти, сүрөттөрдү, үндөрдү жана башкаларды таанууга жана түшүнүүгө үйрөтүлгөн. Мунун аркасында ал маалыматтын нюанстарын жакшы түшүнөт жана татаал суроолорго жооп бере алат. Бул математика жана физика менен байланышкан темаларды түшүндүрүүдө өзгөчө натыйжалуу, ошондуктан ал жеке үй тапшырмасын жардамчы катары кызмат кыла алат".
Google ошондой эле Gemini жаңы TPUv5 чипсеттерин "үйрөнүүдө" деп мактанган жана Gemini Ultra'ны 2024-жылдын башында киргизүүнү пландап жатат, анда гиганттын сүйлөө моделинин керектөөчү версиясынын жаңы версиясы Bard Advanced колдонулат. Gemini Ultra учурда тестирлөөдө жана коопсуздук боюнча эксперттерди тандоо үчүн жеткиликтүү.
Акыркы маанилүү маалымат бул Google Pixel 8 смартфондоруна Gemini киргизүү.Бул башка нерселер менен катар мессенджерлерде Gboard тиркемеси аркылуу тез жоопторду түзүүгө мүмкүндүк берет. Биринчиси WhatsApp, бирок кийинки жылы мындай чечимдер байланышка байланыштуу башка тиркемелерде пайда болот. Бирок, бул башталышы гана, анткени Google Pixel 8 смартфондору үчүн көптөгөн жаңы AI куралдарын жарыялады жана алар келечекте кээ бир башка түзмөктөрдө жеткиликтүү болот. Android. Бирок бул дагы пландар жана азырынча эч кандай маалымат бериле элек.
Google'дун жаңы Gemini модели бүгүнкү күнгө чейин эң чоң жана эң өнүккөн AI моделдеринин бири болуп көрүнөт, бирок Ultra моделинин чыгарылышы аны так аныктайт. Учурда AI чатботторун колдонуп жаткан башка популярдуу моделдерге салыштырмалуу Gemini өзүнүн мультимодалдык өзгөчөлүгү менен өзгөчөлөнөт, ал эми GPT-4 сыяктуу башка моделдер плагиндерге жана интеграцияга таянышат.
Gemini жасалма интеллекттин мүмкүнчүлүктөрүн өнүктүрүүдө алдыга чоң секирик болгону менен, башка негизги тил моделдериндей эле кемчиликтери бар. Биринчиден, бул жалган маалымат түзүү мүмкүнчүлүгү. Бир тараптуулуктар жаңы тил моделинде жеткиликтүү болгон окутуу маалыматтарына да негизделген. Чыныгы дүйнөнүн чектелген түшүнүгүн да айта кетели. Google жаңы Gemini модели ката кетирип, далилдерге негизделбеген жана акылга карама-каршы келген фактыларды бере аларын моюнга алат.
Көбүрөөк тесттер керек, айрыкча Gemini Ultra үчүн, али толук изилдене элек жаңы мүмкүнчүлүктөр бар. Google мүмкүн болуучу зыянды азайтуу үчүн Gemini кылдаттык менен баалоого милдеттенет.
Ошондой эле кызыктуу: Бардык жөнүндө Microsoft Копилот: келечек же туура эмес жол?
Google тарабынан Gemini ишке киргизүү AI өнүктүрүүнүн жаңы доорун ачты. Мурунку моделдерге жана адамдын базалык көрсөткүчтөрүнө салыштырмалуу эң жакшы көрсөткүчү менен Gemini жасалма интеллекттин келечектеги мүмкүнчүлүктөрүн көрсөтөт, бирок дагы эле кээ бир кемчиликтерди жоюу үчүн көбүрөөк изилдөө керек.
Келечекте Gemini Google өнүмдөрүндө көбүрөөк пайдалуу жана акылдуу функцияларды берет деп күтсөңүз болот. Алдыда компания Gemini-ди англисчеден тышкары кеңейтүүнү жана анын негизги моделдик методологиясына таянууну улантууну пландаштырууда.
Биз бир гана карап, Google эмне кылып жатканын билет деп үмүттөнөбүз.
Ошондой эле окуңуз:
Таштап Жооп