Root NationЖаңылыктарIT жаңылыктарыFigure AI өзүнүн гуманоид AI роботунун жаңы жөндөмдөрүн көрсөттү

Figure AI өзүнүн гуманоид AI роботунун жаңы жөндөмдөрүн көрсөттү

-

Гуманоид роботтордун өнүгүшү эки он жылдыктын жакшы бөлүгүндө жай темп менен жылып келди, бирок жакында биз бул тармакта көбүрөөк жетишкендиктерди көрүп жатабыз. Жакында жазгандай, MWC 2024 көргөзмөсүндө AI роботу көрсөтүлдү Америкажана дагы бир өнүгүү, Unitree H1, гуманоид роботтор арасында ылдамдык рекордун жаңыртты. Эми Интернетте Figure AI жана OpenAI компанияларынын ортосундагы кызматташуунун укмуштуудай натыйжасы пайда болду - азыр адамдар менен баарлаша алган гуманоид роботтун укмуштуудай видеосу.

Figure AI жана OpenAI AI менен жаңы гуманоид роботту тааныштырды

Startup Figure AI жаңы Visual Language Model (VLM) менен иштеген Figure 01 роботун көрсөткөн видеону чыгарды. Анда 01-сүрөт табак, алма жана чыны турган столдо турат. Сол жакта кургаткыч бар. Ал эми адамдын алдында робот эмнени көрөт деген суроого столдун үстүндө жаткан нерселердин баарын майда-чүйдөсүнө чейин сүрөттөп жооп берет.

Анан ал киши бир нерсе жей алабы деп сурайт, робот: "Албетте" деп жооп берет, анан эптүү жылмакай кыймыл менен алманы алып, адамга берет. Андан кийин дагы бир укмуштуудай демонстрация келет – бир адам 01-сүрөттүн алдына себеттен бырышталган таштандыларды төгүп, роботтон эмне үчүн мындай кылганын түшүндүрүп берүүнү суранат жана ошол эле учурда таштандыны себетке чогултат. Ал эми кагазды кайра таштандыга салып жатып «ойун» түшүндүрөт. "Ошондуктан мен сага алма бердим, анткени бул мен сага дасторкондон бере турган жалгыз жеген нерсе", - деди робот.

Компаниянын өкүлдөрү 01-сүрөт алдын ала даярдалган мультимодалдык моделди колдоноорун түшүндүрүштү OpenAI, VLM, сүрөттөрдү жана тексттерди түшүнүү үчүн жана анын жоопторун түзүү үчүн үн сунуштарына таянат. Бул, айталы, OpenAIдин GPT-4тен айырмаланат, ал жазуу жүзүндөгү эскертүүлөргө басым жасайт.

Ал ошондой эле компания "үйрөнгөн төмөнкү деңгээлдеги бимануалдык манипуляциялар" деп атаган нерсени колдонот. Система кыймылды башкаруу үчүн нейрон тармагы менен сүрөттүн так калибрлөөсүн (пиксел деңгээлине чейин) координациялайт. "Бул тармактар ​​10 Гц жыштыктагы сүрөттөрдү алышат жана 24 Гцте 200-DOF аракеттерин (билектин позалары жана манжалардын муун бурчтары) жаратышат", - деп айтылат AI билдирүүсүндө.

Компания видеодогу ар бир жүрүм-турум системаны үйрөнүүгө негизделген деп ырастайт, андыктан көшөгө артында эч ким фигура 01дин жиптерин тартпайт. Албетте, бир нюанс бар - робот бул процедурадан канча жолу өткөнү белгисиз. Мүмкүн бул жүзүнчү жолу болгондур, бул анын так кыймылдарын түшүндүрөт. Бирок, кандай болгон күндө да, бул жетишкендик укмуштуудай жана бир аз фантастикалык көрүнөт.

Ошондой эле окуңуз:

Кирүү
жөнүндө кабарлоо
конок

0 Comments
Камтылган сын-пикирлер
Бардык комментарийлерди көрүү