AI tööriistad muusika tootmises pole midagi uut. Aga kuidas on lood AI-ga nullist loodud muusikaga? Ka see on nüüd reaalsus.

Generatiivne AI levib aeglaselt loometööstuse üha enamatesse distsipliinidesse. See sai alguse AI kunstigeneraatoritest ja seejärel levis tehisintellekti loodud tekstiga kirjutamisele. Nüüd saame sellesse loendisse muusikat lisada.

Lähitulevikus saab AI-ga loodud muusika, mis on loodud nullist, reaalsuseks. Tegelikult on see OpenAI muusikat loova AI mudeli Jukeboxiga juba võimalik. Seda pole veel hõlpsasti kasutatavas rakenduses saadaval ja see ei kõla veel piisavalt hästi, kuid algoritmilised luud on olemas.

Siin on see, mida peate teadma OpenAI Jukeboxi ja selle kohta, mida saate sellega teha.

Jukebox: AI, mis loob muusikat töötlemata helina

Jukebox on närvivõrk, mis suudab genereerida muusikat töötlemata heli kujul, kui sisestate sellele sisendi, näiteks žanri, esitaja või laulusõnad. Selle avaldas 2020. aasta aprillis OpenAI, sama ettevõte, mis tõi meile tehisintellekti kunstigeneraatori nimega Dall-E ja AI-vestlusroboti nimega ChatGPT.

Erinevalt Dall-E-st, mis levis kiiresti üle maailma ja muutis tehisintellekti uudiste ja meedia kuumaks teemaks, ei registreerinud Jukebox pärast selle ilmumist suurt huvi. Selle üheks põhjuseks on see, et sellel pole kasutajasõbralikku veebirakendust – vähemalt mitte veel.

Koodi leiate aadressilt OpenAI veebisait, koos põhjaliku selgitusega kodeerimis- ja dekodeerimisprotsessi toimimise kohta.

Teine tõenäoline põhjus on see, et see võtab tohutult aega ja arvutusvõimsust. Aimu andmiseks võib öelda, et vaid ühe minuti pikkuse heli renderdamiseks võib kuluda 9 tundi. Kui soovite näha, mida AI-mudel muusika loomiseks teha saab, on teil vaja valmisolekut uurida mudelit selle koodi kujul ja palju kannatlikkust.

Või võite vahele jätta Jukebox Sample Explorer. See on koht, kus OpenAI on postitanud oma katsed Ella Fitzgeraldi või 2Paci sarnaste lugude loomisel.

Et oleks selge, muud AI muusikariistad on olemas, et aidata teil laulu luua, kuid need ei loo heli nullist. Selle asemel kombineerivad nad eelsalvestatud sämpleid või loovad MIDI-teavet, mis juhitakse läbi digitaalse süntesaatori.

Kuidas Jukebox kõlab?

Jukeboxi tulemused on äratuntavad, kuid kummalised. Loo kuju ja žanri, kuhu see kuulub, pole raske mõista, vaid tulemuste kvaliteeti paneb kõlama, nagu kuulaksite mõnda kõige varasemat salvestatud muusikat: see tähendab, et see on summutatud rohke müra.

Võib julgelt öelda, et Jukebox ei tooda sellist ülitäpset heli, mida kuuleksite headest kõrvaklappidest. See sarnaneb pigem muusika kuulamisega raadiojaamast, mis pole täielikult häälestatud õigele sagedusele. Mõned laulud on taasesitus, teised aga olemasolevate lugude jätkud. Seal on ka kategooria uudsete kunstnike ja stiilide ning seninägematute laulusõnade jaoks.

Vaatamata helikvaliteedile kirjeldavad varased eksperimenteerijad, et nad on Jukeboxi loodud muusika jubeda ilu ja veidra olemuse ees aukartust tekitanud. "Nagu heliriba dokumentatsioonile tundmatu maa ja tundmatu kultuuri kohta", kirjutab Merzmench keskmisel.

Praegu pole tulemused kaugeltki piisavalt head, et kopeerida või isegi asendada inimeste loodud muusikat, kuid tehnoloogia liigub kiiresti ja varsti suudavad sellised mudelid nagu Jukebox neid saavutusi teha ka.

Kuidas OpenAI Jukeboxi koolitati

Osa sellest, kuidas Jukebox suudab luua muusikat, mida pole kunagi varem eksisteerinud, on see, et see on õpetatud tõeliste muusikute muusikale. OpenAI selgitab, et:

"Selle mudeli koolitamiseks roomasime veebis, et kureerida uut 1,2 miljonist laulust koosnevat andmekogumit (millest 600 000 on inglise keeles), mis on seotud LyricWiki vastavate laulusõnade ja metaandmetega."

Andmete otsimine on tava, mida mõned AI-ettevõtted kasutavad andmete kogumi loomiseks, millest tehisintellekti mudel saab pildi, teksti või antud juhul muusika loomisel õppida ja otsuseid teha. Roomamise teel loodud andmestikud on vastuolulised, kuna nõusolekut ei saada kõigepealt andmete omanikelt. Kuigi mõned platvormid võimaldavad teil seda teha loobuda oma sisust andmekogumitest.

Võib arvata, et 1,2 miljonit laulu on palju, kuid võrdluseks on Dall-E 2 treenitud sadade miljonite pildi-teksti paaride jaoks Internetist. Seda silmas pidades on Jukeboxil oma piirangud.

Selle suhteliselt väike koolitusbassein ei suuda tabada inimeste muusika rikkust ja mitmekesisust. OpenAI on teatanud, et see on suures osas väljaõpetatud lääne muusikale, mis näitab selget eelarvamust selles, millist muusikat see on võimeline genereerima.

Mida saab Jukeboxiga teha?

Mida saate Jukeboxiga teha, pidades silmas selle piiranguid? Kiire viis sellele küsimusele vastata on öelda, mida te Jukeboxiga teha ei saa.

Kuna ühe minuti muusika esitamiseks kulub peaaegu pool päeva, pole see muusika tootmiseks kuigi kasulik. Vähemalt mitte traditsioonilises mõttes. Tavaliselt liiguvad muusikud pillimängu (improviseerimise) ja loo struktuuri kavandamise vahel edasi-tagasi. Jukeboxiga pole samasugune katsetamine võimalik.

Kuna praeguses etapis pole Jukeboxiga laulu loomine lihtne, võite seda pidada pigem uudseks viisiks muusikanäidiste genereerimiseks. Kui olete loonud heli, mis teile meeldib, saate seda kasutada oma loomingulistes projektides nagu tavaliselt.

Allolev video on tingitud sellest, et keegi kasutab Jukeboxiga loodud muusikat lühikese montaaživideo rõhutamiseks.

Tehisintellektil on lai valik rakendusi ka väljaspool loomingulisi rakendusi, mistõttu on see väärt mõista, mis on AI ja millised ohud see endast kujutab.

Kas AI muusika liigutab teid?

Jukeboxi loodud muusikat pole lihtne kõrvale heita ning kogu selle kummalisuse ja jubeda inimese-masina kvaliteedi juures kõlab see lõpuks nagu muusika. Kui muusikatööstus on AI-tööriistu kasutanud juba mõnda aega, siis võimalus luua muusikat toorhelina on alles nüüd reaalsus.

Kuid kuigi sellised mudelid nagu Jukebox on olemas, ei ole neid veel kommertstööriistadesse pakendatud ja need ei vasta inimmuusikute võimetele.