AI kunstigeneraatoritel on käte ebatäpsete kujutiste loomiseks halb räpp. Paneme vastamisi Midjourney v5 ja Dall-E 2, et näha, kumb teeb seda paremini.
AI kunstigeneraatorid avaldavad jätkuvalt muljet, võimaldades meil luua peaaegu kõike, mida suudame ette kujutada. Siiski tundub, et tehnika on realistliku välimusega käte loomiseks tabanud telliskiviseina.
Siin vaatleme kahte juhtivat generatiivse kunsti rakendust ja paneme need üksteisele – või käsikäes –, et näha, kumb võib luua paremaid käsi, kas Midjourney v5 või Dall-E 2. Kas üks neist rakendustest on oma kätega hakkama saanud? Uurime välja!
AI probleem kätega
Alates sellest, kui AI-ga loodud kunst Internetis laialdaselt levis, on selle kohta kritiseeritud AI joonistatud käte kvaliteet. Vaatamata hiljutistele uuendustele, nagu on näidatud meie kõrvuti võrdlustes, ei ole tulemused olnud rahuldavad.
Mõlemad kandidaadid on iga iteratsiooniga parandanud oma võimeid ja oma väljundite kvaliteeti. Viimane värskendus, Midjourney 5. versioon, on näidanud muljetavaldavat edu. Kuid probleem AI joonistatud kätega jääb lahendamata ja seda ei saa ignoreerida.
1. võrdlus: viipade "Käs" ja "Käed" kasutamine
Meie võrdlused sisaldavad täpselt samu viipasid nii Dall-E 2 kui ka Midjourney v5 jaoks. Kujundame viipad nii, et need oleksid käepõhised, selle asemel, et luua inimesi, kes näevad, kuidas käed välja näevad. Samuti anname igale rakendusele iga viipa jaoks ainult ühe võimaluse (veeretamine).
Käsi
Alustame asja kõige elementaarsema ja asjakohaseima viipaga: "käsi".
Kesktee v5:
Dall-E 2:
Me ei alusta hästi!
Midjourney valis ebahariliku tee, seostades kätt üsna loominguliste olukordadega. Selle asemel, et keskenduda ainult käele, näeme võlurit, kindaid, skeletti ja pisikest kujukest. Kinnaste pildil on ka sõrm puudu.
Dall-E 2 kasutab vastupidist lähenemist ja pakub meile lihtsal taustal vaid ühte kätt. Kuid kummalisel kombel on mõned kummalised asendid, eriti pöialdega, mis ei tundu loomulikud ega mugavad. Iga käsi on ka piltide ühelt küljelt ära lõigatud.
Kes selle vooru võidab? Üldise täpsuse tagamiseks anname selle Dall-E 2-le.
Käed
Nüüd teeme viipa mitmuse "käed" ja vaatame, mida tehisintellektid välja mõtlevad.
Kesktee v5:
Dall-E 2:
Midjourney katse "kätega" osutub seekord paremaks. Kuid kõik neli pilti on mustvalged ja meil on mõned sõrmed puudu. Lähemal uurimisel näete ka seda, et mõned numbrid on kummalise kujuga või muutuvad üksteiseks.
Dall-E 2-l on jätkuvalt tavalise taustaga käed. Puuduvaid numbreid pole, kuid kolmandal pildil on käed välja lõigatud ja ülejäänud versioonid tunduvad kompositsioonilt kuidagi kohmakad ja neil puudub üldse loovus.
Nimetagem seda võrdlust viigiks. Dall-E 2 võidaks täpsuse eest, kui see oleks ainus tegur, kuid Midjourney suudab must-valgetes esitusviisides kaunid kujutised, isegi kui kõik neli versiooni pole just eriti head realistlik.
Alati saab kasutage oma Midjouney kunsti parandamiseks Photoshopi, sealhulgas käed.
2. võrdlus: käeliigutused
Võrdleme paari käeliigutust, mis on peaaegu üldtunnustatud.
Pöidlad pihus
Kõigepealt proovime "näpud ristis".
Kesktee v5:
Dall-E 2:
Võib julgelt öelda, et Midjourney tegi selle viipa täiesti sassi. Meil puuduvad sõrmed ja ükski versioon ei näe üldse loomulik välja.
Müts maha veel kord Dall-E 2 ees, et ta tegi sõrmede arvu õigeks, kuid see on ainus hea uudis. Iga versioon näeb välja nii, et sõrmed löövad Twisteri mängus oma joogapoose.
Selles võrdluses pole võitjat.
Pöidlad üles
Järgmisena läheme "pöidlad püsti".
Kesktee v5:
Dall-E 2:
Midjourney teeb sõrmede arvu õigeks, käsitledes iga viipa loominguliselt. Kas märkate illustreeriva stiili kasutuselevõttu?
Dall-E 2 saab punkte ka täpsuse eest, kuid ei ürita paati kõigutada, lisades igale tulemusele midagi loomingulist.
Siin pole selget võitjat.
Võrdlus 3: Käed esemetega
Nüüd suurendame keerukust, kutsudes käsi objektidega suhtlema.
Käes hoidev Kristallkuul
Alustame juhusliku objektiga, kasutades käsku "käsi hoides kristallkuuli".
Kesktee v5:
Dall-E 2:
Kui me keerukust suurendame, hakkab Midjourney särama. Peale paari ebaloomuliku väljanägemise näevad käed ja kristallkuulid ilusad välja. Midjourney võtab isegi aega, et tekitada klaasis peegeldusi, mis kindlasti lisavad üldist loovust.
Kuid esimest korda näeme, et Dall-E 2-l on vähemalt ühes käes number puudu ja neljas käsi näeb lihtsalt imelik välja. Samuti ei näe kristallkuulid Midjourneyga võrreldes nii muljetavaldavad.
Midjourney saab oma esimese võidu.
Käsi Hoiab vett
Proovime midagi veelgi keerukamat käsklusega "kätt hoides vett".
Kesktee v5:
Dall-E 2:
Midjourney suudab veeretada vaid ühe pildi õige arvu numbritega. Kuigi see on ilusti renderdatud, hakkame taaskord nägema mõrasid usutavuse osakonnas.
Dall-E 2 võitleb ka loomulike käte saavutamisega, kuid teeb palju paremat tööd. See muudab teatud sortide jaoks ka tausta värvi.
Anname selle vooru Dall-E 2-le.
Võrdlus 4: Töötavad käed
Selle võrdluse jaoks loome viibad, mille käed on tegevustesse kaasatud.
Käte vormimine savi
Vaatame, kuidas tehisintellekti mudelitel "savi käsitsi vormimisega" läheb.
Kesktee v5:
Dall-E 2:
Midjourney jättis kahel pildil sõrme vahele, kuid kõik muu näeb hea välja.
Dall-E 2 pildid tunduvad segased ja ülerahvastatud ning pooltel versioonidel on kasutatud teise inimese käte lisamist.
Serv läheb Midjourneyni.
Käed Vajutades Tainas
Proovime sarnast tegevust, "käed suruvad tainast".
Kesktee v5:
Dall-E 2:
Midjourney pildid näevad üldiselt suurepärased välja. Aga jällegi on pooltel numbrid puudu. Kuid piltidele ei saa ette heita nende kunstilist stiili.
Dall-E 2 versioonidel puuduvad ka pooltel esitustel sõrmed ja need lisatakse isegi komplekti viimasele käele.
Nimetagem seda viigiks.
Kui soovite neid võrdlusi ise proovida, näitame teile kuidas kasutada Midjourney'i AI kunsti loomiseks.
Mida tulemused meile räägivad?
Lõbus on teha võrdlusi ja välja selgitada üldvõitja. Ja kui peaksime valima, nimetaksime seda Midjourney v5 kasuks. Kuigi Dall-E 2 lõi sagedamini õige arvu sõrmedega käsi, tegi just Midjourney kunstipärasemalt renderdatud ja ahvatlevamaid pilte.
Kuid mõlemal rakendusel on turul koht kunstnikele, kes kasutavad oma töö jaoks Dall-E 2 ja Midjourney pilte. Mõlemad on võimelised looma käsi, mida saab kasutada väljalõigetena või komposiitidena kunstiliseks, toimetamiseks ja kommertskasutuseks. See on lihtsalt isiklike eelistuste küsimus.
AI vallutab lõpuks käed
Generatiivsed kunstirakendused, nagu Dall-E 2 ja Midjourney, on realistliku ja fantastilise kunsti loomisel kaugele jõudnud. Nad võitlevad endiselt genereerivate kätega, kuid arvestades generatiivse tehnoloogia kiirenemist, võime lähitulevikus oodata ainult paranemist.