Vaid kuud tagasi, kui tahtsite millestki pilti luua, pidite saama visandada, maalida või kasutada mõnda Photoshopi tööriista, millest teised pidevalt räägivad. Pärast 2022. aastat muutus aga kõik tänu AI-le – jah, nagu "tehisintellekti" puhul.

Selle asemel, et püüda maailma domineerida, saavad kunstilise kallakuga AI-tööriistad muuta pildiks kõik, mida neile kirjeldate.

Tulge meiega, kui siseneme tehisintellektil põhineva teksti visualiseerimise maailma, ja vaadake, kuidas saate selliseid tööriistu kasutada oma mõtete tegelikeks piltideks teisendamiseks, lihtsalt tippides selle, mis teil meeles on.

Dall-E: OpenAI GPT-3 kunstiline pool

Esimesed AI-toega tööriistad, mis said populaarseks, põhinesid OpenAI GPT-3-l. Üks põhjusi oli projekti avatus välisele juurdepääsule, mis tõi kaasa mõned ettepanekud, et GPT-3 on loometöö tulevik.

Täna saate kasutada ametlikke tööriistu, mille leiate aadressilt OpenAI beetaversioon või kolmandate osapoolte lahendusi, mis kasutavad ära selle keelelisi supervõimeid. Näiteks võite paluda GPT-3-l koostada postituse mustand, vastata lihtsatele küsimustele või isegi mõnda teksti muuta või tõlkida.

instagram viewer

2022. aastal paljastas OpenAI, et GPT-3 oli sama hea piltide loomisel. Projekt DALL-E, lavastus Pixari WALL-E filmist ja Dali nimest, kasutab GPT-3 mitte tekstiga töötamiseks, vaid pildi tegemise mootorina.

Nii nagu GPT-3 ja teksti puhul, pole ka DALL-E loominguline geenius, kes materialiseerib pilte tühjast-tähjast. Selle asemel on seda "koolitatud" miljonite piltide põhjal, mis on juba Internetis olemas. Selle tehisintellekti võimsus seisneb nende piltide analüüsimises, nende elementide võtmises, näpistamises, morfimises, kohandamises ja lõpuks uuteks kujutisteks kombineerimises.

Vähemalt on see taustal toimuva lihtsustatud versioon. Enamik inimesi hoolib ainult sellest, mida nad enda ees näevad, ja see on tekstikast, kuhu saate midagi tippida ja näha, kuidas see mõne minuti pärast pildiks muudetakse.

Google'i piltvastus

Google on AI-uuringutes üks kolmest parimast "mängijast". Siiski ei ole nende edenemine kergesti tajutav ega ka nende juurutamine toodetesse nii ligipääsetav kui OpenAI pakkumised.

Üks Google'i tehisintellekti esimesi laialdaselt kättesaadavaid rakendusi oli Google'i dokumentides ja Gmailis intelligentsema automaatse täitmise ja soovituste kujul, mida nimetatakse nutikaks koostamiseks. Me ei sukeldu üksikasjadesse, kuna oleme seda varem käsitlenud Nutikas koostamine (ja kuidas seda kasutada).

Kui need funktsioonid on aktiivsed, võrdlevad Google'i veebirakendused kasutaja sisestatavat teksti sellega, mida miljonid teised varem kirjutasid. Seejärel soovitab see, mida nad hiljem kirjutasid.

See on tõend, et hoolimata sellest, mida meile meeldib uskuda, ei ole me nii erinevad. Kui 99 inimest 100-st tippib sõna "näeme" järel sõna "hiljem", jätkaksime tõenäoliselt ka seda.

Oleme kõik kasutanud mingit automaatse täitmise vormi, isegi "dumbphone" ajastu T9 ennustava tekstisüsteemiga. Seetõttu ei tundunud Google'i AI tööriistad nii intelligentsed kui OpenAI GPT-3. Neid ei tundunud nii palju rohkem kasutatud kui parem T9 süsteem, mida täiustati 21. sajandiks. Ja seepärast oli ka Imageni paljastamine pisut šokk.

Nagu steroidide DALL-E, on Imagen teksti visualiseerimise tööriist. Tänapäeval saadaolevale tuginedes suudab Imagen toota "puhtamaid" ja erksamaid pilte, teades samas, kuidas käsitleda täiustatud funktsioone, nagu difusioon ja läbipaistvus.

Kahjuks oli selle kirjutamise ajal juurdepääs Imagenile piiratud, nii et me ei saanud seda proovida.

DALL-E Mini ja sõbrad: avatud ettevõtetele

Te ei pääse DALL-E-le ja Imagenile veel vabalt juurde. Siiski on palju alternatiive juba saadaval, kui soovite AI-toega tekstipiltide genereerimisega lolli ajada.

Pidades meeles, et need on alles algusajad ja nende pakutavad tulemused või kasutuskogemus ei pruugi olla kaugeltki optimaalne, tasub siiski vaadata mõnda järgmistest.

Meemide tegemine Dall-E Mini abil

Tänu enam kui piisavate tulemuste ja kasutajasõbraliku liidese kombinatsioonile, kuid mis veelgi olulisem, selle laialdasele kättesaadavusele sai DALL-E minist üks populaarsemaid AI teksti visualiseerijaid.

Kaugeltki täiuslikkusest võivad mõnikord DALL-E mini tulemused olla kavandatust abstraktsemad.

Teinekord ei pruugi see luua seda, mida olete mõelnud, kuid võib jõuda üsna lähedale.

Pärast selle plahvatuslikku populaarsust kolisid DALL-E mini loojad selle uue kaubamärgi all uude koju. Nüüd leiate DALL-E mini uusima versiooni kui Craiyon omal saidil.

Craiyoni kasutamine on tänapäeval sama lihtne kui olemasoleva pildi Internetist otsimine. Võite külastada selle saiti, tippida oma pildi kirjeldus selle tekstiväljale ja vajutada sisestusklahvi. Mõne aja pärast näete tulemusi oma ekraanil.

Silmatorkav on see, kui head on Craiyon ja sarnased tööriistad visuaalsete stiilide matkimisel. Näiteks oleme palunud tal luua pilte rulal olevast kutsikast:

Seejärel kasutasime täpset fraasi, kuid lisasime selle järele "Pixari stiili". Mõne aja pärast näitas Craiyon ruudustikku rohkem "koomiksilaadseid" pilte, mis on lähemal sellele, mida me tajume Pixari kiirjäljega graafikana nende armastatud filmides.

Craiyon andis meile veelgi paremaid tulemusi, kui asendasime samas käsus "Pixari stiili" sõnaga "anime style".

Anime on oma välimuselt stiliseeritum kui Pixari realistlikumad kujutised, mis näib olevat aidanud Craiyonil toota mõningaid peaaegu kasutusvalmis pilte.

Varjatud difusiooniga narrimine

LAION-400M andmestikul koolitatud Latent Diffusion mudel on veel üks huvitav AI teksti visualiseerija. Kuid selle kasutamine on ka keerulisem. Peate seda võrgus virtuaalmasinas käivitama ja selle erinevate parameetritega mängima, selle asemel, et lihtsalt tekstiväljale tippida. Siiski on see lihtsam, kui see kõlab.

  1. Külastage Google Latent Diffusion koostööruum see on praegu tema kodu.
  2. Kerige veidi alla ja märkake Viip väli all Parameetrid. Asendage vaikeviip sellega, mida soovite oma pildil kujutada.
  3. Vali Käivita kõik alates Kestus menüüst või vajutage CTRL + F9.
  4. Kui soovite toodetud pilte otse tööriista seest eksportida, vastake positiivselt, kui küsitakse, kas soovite selle linkida oma Google Drive'i kontoga. Tööriistal kulub konfiguratsiooni lõpuleviimiseks veidi aega ja protsessi käigus tuleb alla laadida mõned failid.

Väärtuste suurendamine Sammud, Iteratsioonidja Näidised_paralleelselt, võib anda täpsemaid tulemusi. Tööriist on aga Google'i serverite ressursside osas äärmiselt nõudlik. Selle tulemusena võib see kokku kukkuda, kui suurendate neid väärtusi liiga palju, või muutub konkreetse pildi loomise protsess oodatust keerulisemaks.

Huvitavad alternatiivid

Oleme kulutanud palju aega DALL-E mini ja Latent Diffusioni testimisele. Meie teaduslik meetod koosnes kahest erinevast osast. Esiteks pidime välja mõtlema mõisted, mida saaks täpselt kirjeldada kui pätte. Seejärel paluge neil AI visualiseerijatel need kujutisteks muuta. Oodatust sagedamini see neil õnnestus, jõudes peaaegu ette kujutatule.

Oleme proovinud ka mõnda selle artikli jaoks saadaolevat alternatiivi. Ootame endiselt juurdepääsu teistele. Mõned neist, mida tasub kontrollida, on (mitte kindlas järjekorras):

  • Keskteekond
  • MindsEye beeta
  • StarryAI
  • Unistus
  • Disko difusioon

Kas tehisintellekti loodud kunst asendab visuaalse kunsti?

Pilte loovate tehisintellektiga töötavate tööriistade rohkus ja pidevalt kasvav populaarsus paneb paljud järeldama, et kujutav kunst sureb peagi. Mis mõte on investeerida aega ja energiat, et õppida joonistama või kasutama keerulist tarkvara asjade visualiseerimiseks, kui tehisintellekt suudab seda kiiremini (ja peagi paremini) teha kui sina?

Kui märkasite, on need tööriistad kõik "andmekogumite järgi koolitatud". Lihtsas inglise keeles tähendab see, et nad teevad seda, mida nad teevad tänu sellele, et inimesed on sama asja juba varem teinud.

See on vihje, miks need tööriistad ei saa asendada inimese kunstilisust, loovust ja leidlikkust. Need on miimikad, nutikad replikaatorid. Ilma inimeste poolt toodetud originaalideta, mille kallal nad on koolitatud, ei saaks nad väljundit toota.

Siiski on see praegune aeg ja me tunnistame, et me ei tea, mida tulevik toob. Praegu saavad visuaalkunstnikud rahulikult magada. Tehisintellekt areneb kiirusega, kuid paljud selle teema spetsialistid nõustuvad, et pole oluline, kas see kunagi asendab teiesuguste inimeste tööd. Küsimus on ainult millal.

Aga hei, see pole kõik hukk ja süngus. Sel ajal, kui Skynet valmistub meie töökohale asuma, saame vähemalt oma tuju heledamaks teha, luues ruladel kutsikate vaevata pilte!