Root NationЖаңылыктарIT жаңылыктарыIBM Project CodeNet маалымат топтомун түздү: 14 миллион код үлгүлөрү AIди программалоого үйрөтөт

IBM Project CodeNet маалымат топтомун түздү: 14 миллион код үлгүлөрү AIди программалоого үйрөтөт

-

бирдиги IBM Жасалма интеллект (AI) изилдөөсү программалоо тапшырмаларына жардам бере турган машина үйрөнүү моделдерин иштеп чыгуу үчүн 14 миллион үлгүдөн турган маалымат топтомун сунуштады. аттуу берилиштер топтому CodeNet долбоору, өзүнүн атын компьютердик көрүнүштү жана терең үйрөнүүнү революция кылган атактуу ImageNet репозиторийинен алат.

Программисттер аң-сезимдүү жана аң-сезимсиз ой жүгүртүүнүн көптөгөн механизмдерин колдонуу менен жаңы көйгөйлөрдү таап, ар кандай чечимдерди изилдешет. Көпчүлүк машина үйрөнүү алгоритмдери бирдей маселелерди чече ала турган моделдерди иштеп чыгуу үчүн так аныкталган тапшырмаларды жана чоң көлөмдөгү аннотацияланган маалыматтарды талап кылат.

IBM Project CodeNet
CodeNet долбоору - ондогон программалоо тилдерине чачыраган ~ 14 миллион код мисалдарынын чоң маалымат топтому.

Эксперттик коомчулук тарабынан AI-код системаларын иштеп чыгуу жана баалоо үчүн маалыматтар топтомун жана эталондорду түзүүгө көп күч жумшалды. Бирок, программалык камсыздоону иштеп чыгуунун чыгармачыл жана ачык мүнөзүн эске алганда, программалоо үчүн идеалдуу маалымат топтомун түзүү абдан кыйын. Project CodeNet менен IBM изилдөөчүлөрү ар кандай тапшырмалар боюнча машина үйрөнүү моделдерин үйрөтүү үчүн колдонула турган көп максаттуу маалымат топтомун түзүүгө аракет кылышкан. CodeNetтин жаратуучулары аны "код үчүн AIдагы алгоритмдик жетишкендиктерди тездетүү үчүн өтө чоң масштабдуу, ар түрдүү жана жогорку сапаттагы маалымат топтому" катары сүрөттөшөт.

Берилиштер топтому 14 түрдүү программалоо тилинде жазылган 500 миллион сап коддун 55 миллион мисалын камтыйт. Код үлгүлөрү AIZU жана AtCoder онлайн коддоо платформаларында жайгаштырылган дээрлик 4000 тапшырмадан алынды. Код мисалдары берилген тапшырмаларга туура жана туура эмес жоопторду камтыйт.

Ошондой эле кызыктуу:

CodeNetтин негизги өзгөчөлүктөрүнүн бири - бул мисалдарга аннотациялардын саны. Берилиштер топтомун камтыган коддоо тапшырмаларынын ар биринин тексттик сүрөттөлүшү, ошондой эле CPU убактысы жана эстутум чектөөлөрү бар. Ар бир код тапшыруу тили, тапшыруу күнү, өлчөмү, аткаруу убактысы, кабыл алуу жана ката түрлөрүн камтыган ондогон маалыматты камтыйт. IBM изилдөөчүлөрү ошондой эле маалыматтар топтому программалоо тили, кабыл алынышы жана ката түрлөрү боюнча ар кандай параметрлер боюнча тең салмактуу болушун камсыз кылуу үчүн көп аракет кылышты.

IBM Project CodeNet

CodeNet программалоо тапшырмалары боюнча машина үйрөнүү моделдерин үйрөтүү үчүн жалгыз маалымат топтому эмес. Бирок аны бөлүп турган бир нече өзгөчөлүктөр бар. Биринчиси, үлгүлөрдүн санын жана тилдердин көп түрдүүлүгүн камтыган маалыматтар топтомунун чоң көлөмү. Бирок, балким, андан да маанилүүсү, код үлгүлөрү менен келген метадайындар. CodeNet'ке кошулган бай аннотациялар аны конкреттүү программалоо тапшырмаларына адистешкен башка коддоо маалымат топтомдорунан айырмаланып, ар түрдүү тапшырмалар үчүн ылайыктуу кылат.

CodeNet колдонуунун бир нече жолу бар. Алардын бири тил котормосу. Берилиштер топтомундагы ар бир коддоо тапшырмасы ар кандай программалоо тилдеринин өкүлчүлүктөрүн камтыгандыктан, окумуштуулар аны кодду бир тилден экинчи тилге которуучу машина үйрөнүү моделдерин куруу үчүн колдоно алышат. Бул эски кодду жаңы тилдерге көчүрүүнү жана аларды программисттердин жаңы муундары үчүн жеткиликтүү кылууну каалаган уюмдар үчүн ыңгайлуу болушу мүмкүн.

Ошондой эле окуңуз:

Кирүү
жөнүндө кабарлоо
конок

2 Comments
Жаңылар
Улуулар Эң популярдуу
Камтылган сын-пикирлер
Бардык комментарийлерди көрүү
Виктор
Виктор
2 жыл мурун

Каада-салттар жана тукум куучулук ар түрдүү ой жүгүртүү менен, нейрон алгоритмдеринин эң жаш муундары жана ML-методдору менен бирге ойношу керек, бири-бирин өз ара жакшыртуу

Aasd
Aasd
2 жыл мурун

Убакыттын өтүшү менен программисттердин деңгээли дагы (азыркыга салыштырмалуу) төмөндөйт. Башкача айтканда, «бок тилинде» кыйшык, кыйшык код жазууга болот. Ошондо машина оптималдаштырылып, профессионал ассемблер программистинин (же андан да жакшыраак) оптималдаштырылган кодун алууга мүмкүн болот.