Root NationЖаңылыктарIT жаңылыктарыAI сүрөт генераторуна музыка жаратууга үйрөтүлгөн

AI сүрөт генераторуна музыка жаратууга үйрөтүлгөн

-

Жасалма интеллект (AI) тарабынан түзүлгөн музыка буга чейин реалдуулукка айланган. AI инструменттер азыр эч нерсе жок музыканы түзө алат, бирок натыйжалары күтүүлөрдөн ашып кетет.

Бирок, бул AI куралдары музыканы түз түзө алат дегенди билдирбейт. Анын ордуна, музыка музыканын спектрограммаларын түзгөн AI сүрөт генераторлору аркылуу өтөт. Андан кийин бул спектрограммаларды аудио клиптерге айландырсаңыз болот. Бул AI жараткан музыка келечекте адам жараткан музыканы алмаштырат дегенди билдиреби?

Риффузия

Сүрөткө негизделген AI компьютердик алгоритмдерди жерлердин жана объекттердин сүрөттөрүн таанууга үйрөтөт. Андан кийин окшош, бирок уникалдуу сүрөттөрдү чыгаруу үчүн алгоритмдер колдонулат. DALL-E жана туруктуу диффузия жакшы мисалдар болуп саналат. Азырынча сиз бул программаларды каалаган нерсеңизди көрсөтө аласыз. Бардык текст аркылуу!

Ошентип, спектрограммаларды түзө турган AI куралы Riffusion деп аталат. Бул акыркы AI долбоору жана анын маңызы боюнча, ал туруктуу диффузияга (Туруктуу диффузия) негизделген тексттен сүрөттөрдүн генератору. Бирок ал кантип музыка жаратууга жөндөмдүү болуп калды?

Риффузия

Riffusion артында роботист Хайк Мартирос жана программалык камсыздоону иштеп чыгуучу Сет Форсгрен турат. Алар заманбап AI программалары аудио тармагында иштей алабы же жокпу, текшергиси келген. Ошентип, Riffusion музыка жаратуу сапары башталды. Форсгрен технология жөнүндө мындай дейт: «Хейк экөөбүз чакан топтун курамында ойнойбуз жана музыканы сүйгөнүбүз үчүн эле долбоорду баштадык. Сүрөттөрдү түзүү үчүн туруктуу диффузиянын укмуштуудай натыйжаларын көргөндөн кийин, музыканы түзүү үчүн диффузиялык ыкманы колдонуу кандай болот деп өзүбүзгө суроо бердик?

Аны билүү үчүн, эки адамдан турган команда спектрограмма сүрөттөрүндө ачык булактагы туруктуу диффузияны үйрөтүштү. Алар текст менен айкалыштырылган. Андан кийин, программа белгилүү бир ишараттардын негизинде музыканын спектрограммаларын түзө алган.

Башында алар Stable Diffusion моделинин архитектурасы аудиого айландыруу үчүн жетиштүү тактык менен спектрограмманын сүрөтүн түзө алар-албасын билишкен эмес, бирок ал ушуну жана башкаларды жасай алары белгилүү болду. Мартирос жана Форсгрен өз жыйынтыгын расмий Riffusion сайтында жарыялашты. Алгач бул хобби долбоору болчу. Бирок азыр коноктор өздөрүнүн текст кеңештерин кошо алышат. Бул Риффузияны спектрограмма түзүүгө мажбурлайт. Кийинчерээк коноктор аны аудио клип катары колдонуп, сайтта ойной алышат.

Бул этапта натыйжалар өтө сапаттуу болушу мүмкүн эмес. Бирок бул, албетте, сиз ойлогондой жаман эмес.

Riffusion да камтылган ырларды ойнотууга аракет кылышы мүмкүн Эминемдин стилинде рэп жана K-Pop. Бирок текстти жаратуу функциясы анчалык деле жакшы эмес. Тексттин ордуна сиз адамдын мукам кептерин угасыз. Бирок, эң кызыгы, бул шылдың дагы эле ырдын обонуна дал келет.

Бул технология адам жасаган музыканы алмаштырууга азырынча даяр эмес. Бирок долбоор бизге AI сүрөтүн иштетүү алгоритмдеринин дагы эле чоң потенциалы бар экенин көрсөттү. Жакында ал музыкалык авторлордун жардамчысы боло алат. Балким, ыр жазууга бир аз илхам керек.

Сиз Украинага орус баскынчыларына каршы күрөшүүгө жардам бере аласыз. Мунун эң жакшы жолу - Украинанын Куралдуу күчтөрүнө каражат берүү Savelife же расмий баракчасы аркылуу NBU.

Булакgizchina
Кирүү
жөнүндө кабарлоо
конок

0 Comments
Камтылган сын-пикирлер
Бардык комментарийлерди көрүү