Kõik arvavad, et suudavad märgata sügavat võltsitud videot, kuid kiiresti arenev tehnoloogia, sealhulgas tehisintellekti tööriistad, muudab võltsvideo tuvastamise raskemaks kui kunagi varem.
Võtmed kaasavõtmiseks
- Sügavvõltsingud kujutavad endast ühiskonnale märkimisväärset ohtu, sealhulgas levitavad desinformatsiooni, kahjustavad mainet kellegi teisena esinemise kaudu ja õhutavad rahvusliku julgeoleku nimel konflikte.
- Kuigi tehisintellekti tehnoloogia pakub tööriistu sügavate võltsingute tuvastamiseks, ei ole need täiuslikud ja inimese kaalutlusõigus on sügavvõltsingute tuvastamisel otsustava tähtsusega.
- Inimestel ja tehisintellekti tuvastamise tööriistadel on sügavvõltsingute tuvastamisel erinevad tugevused ja nõrkused nende võimete kombineerimine võib parandada edumäärasid sügavvõltsimise ohtude tuvastamisel ja leevendamisel tehnoloogia.
Deepvõltsingud ohustavad ühiskonna kõiki aspekte. Meie võime tuvastada võltsitud sisu on desinformatsiooni tühistamiseks ülioluline, kuid tehisintellekti tehnoloogia paranedes saame usaldada süvavõltsinguid tuvastama: inimest või masinat?
Sügavate võltsingute ohud
AI tehnoloogia arenedes sügavvõltsingute ohud kujutavad endast üha suuremat ohtu meile kõigile. Siin on kiire kokkuvõte kõige pakilisematest probleemidest, mida süvavõltsingud tekitavad:
- Desinformatsioon: Süvavõltsitud videod ja helisalvestised võivad levitada desinformatsiooni, näiteks võltsuudiseid.
- Kellegi teisena esinemine: Isikutena esinedes võivad süvavõltsingud kahjustada inimeste mainet või petta kõiki, keda nad tunnevad.
- Rahvuslik julgeolek: Ilmselge viimsepäeva stsenaarium sügavate võltsingutega on väljamõeldud kaadrid või helipildid ülemaailmsest liidrist, kes õhutab konflikti.
- Kodanikurahutused: Osapooled võivad kasutada ka petlikku kaadrit ja heli, et õhutada viha ja rahutusi teatud rühmade vahel.
- Küberturvalisus: Küberkurjategijad kasutavad juba tehisintellekti hääle kloonimise tööriistu, et suunata inimesi veenvate sõnumitega inimestele, keda nad tunnevad.
- Privaatsus ja nõusolek: Süvavõltsingute pahatahtlik kasutamine võtab inimeste sarnasuse ilma nende nõusolekuta.
- Usaldus ja enesekindlus: Kui te ei suuda vahet teha tõe ja pettuse vahel, muutub täpne teave sama ebausaldusväärseks.
Süvavõltsingud muutuvad ainult veenvamaks, seega vajame nende tuvastamiseks tugevaid tööriistu ja protsesse. AI pakub ühte sellist tööriista sügavate võltsingute tuvastamise mudelite kujul. Samas meeldib algoritmid, mis on loodud tehisintellekti loodud kirjutamise tuvastamiseks, sügavate võltsingute tuvastamise tööriistad pole täiuslikud.
Praegu on inimlik diskreetsus ainus tööriist, millele saame toetuda. Niisiis, kas oleme süvavõltsingute tuvastamisel algoritmidest paremad?
Kas algoritmid tuvastavad sügavaid võltsinguid paremini kui inimesed?
Süvavõltsingud on piisavalt tõsine oht, et tehnoloogiahiiglased ja uurimisrühmad pühendavad teadus- ja arendustegevusele tohutult ressursse. 2019. aastal pakkusid Meta, Microsoft ja Amazon auhindu 1 000 000 dollarit Süvavõltsingute tuvastamise väljakutse kõige täpsema tuvastamismudeli jaoks.
Kõige paremini toimiv mudel oli 82,56% täpsus võrreldes avalikult kättesaadavate videote andmekogumiga. Kui aga samu mudeleid testiti 10 000 nägemata videoga "musta kasti andmekogumiga", oli parima jõudlusega mudeli täpsus vaid 65,18%.
Meil on ka palju uuringuid, mis analüüsivad tehisintellekti süvavõltsimise tuvastamise tööriistade toimivust inimeste vastu. Muidugi on tulemused uuringuti erinevad, kuid üldiselt on inimesed kas võrdsed või paremad kui sügava võltsimise tuvastamise tööriistade edukus.
Üks 2021. aasta uuring avaldati PNAS avastasid, et "tavalised inimvaatlejad" saavutasid veidi kõrgema täpsusastme kui juhtivad sügavvõltsingute tuvastamise tööriistad. Kuid uuringus leiti ka, et inimestest osalejad ja AI mudelid olid vastuvõtlikud erinevat tüüpi vigadele.
Huvitav on see, et uuringud, mille viis läbi Sydney ülikool on leidnud, et inimese aju on alateadlikult sügavate võltsingute tuvastamisel tõhusam kui meie teadlikud jõupingutused.
Visuaalsete vihjete tuvastamine sügavates võltsingutes
Süvavõltsingute tuvastamise teadus on keeruline ja nõutav analüüs varieerub olenevalt kaadri iseloomust. Näiteks Põhja-Korea liidri Kim Jong-uni kurikuulus deepfake-video aastast 2020 on põhimõtteliselt rääkiva peaga video. Sel juhul võib kõige tõhusam sügavvõltsingu tuvastamise meetod olla viseemide (suuliigutuste) ja foneemide (foneetilised helid) analüüs vastuolude tuvastamiseks.
Inimeksperdid, juhuslikud vaatajad ja algoritmid saavad seda tüüpi analüüsi teha isegi siis, kui tulemused erinevad. The MIT määratleb abistamiseks kaheksa küsimust tuvastada sügavvõltsitud videod:
- Pöörake tähelepanu näole. Tipptasemel DeepFake'i manipulatsioonid on peaaegu alati näo muutused.
- Pöörake tähelepanu põskedele ja otsaesisele. Kas nahk tundub liiga sile või liiga kortsus? Kas naha vananemine on sarnane juuste ja silmade vanusega? DeepFakes võib mõne mõõtme puhul olla ebaühtlane.
- Pöörake tähelepanu silmadele ja kulmudele. Kas varjud ilmuvad kohtadesse, mida ootate? DeepFakes ei pruugi stseeni loomulikku füüsikat täielikult esindada.
- Pöörake tähelepanu prillidele. Kas on mingit sära? Kas sära on liiga palju? Kas pimestamise nurk muutub, kui inimene liigub? Taaskord ei pruugi DeepFakes valgustuse loomulikku füüsikat täielikult esindada.
- Pöörake tähelepanu näokarvadele või nende puudumisele. Kas need näokarvad näevad tõelised välja? DeepFakes võib lisada või eemaldada vuntsid, kõrtsed või habe. Kuid DeepFakes ei pruugi muuta näokarvade muutusi täiesti loomulikuks.
- Pöörake tähelepanu näo muttidele. Kas mutt näeb tõeline välja?
- Pöörake tähelepanu vilkumisele. Kas inimene pilgutab piisavalt või liiga palju?
- Pöörake tähelepanu huulte liigutustele. Mõned süvavõltsingud põhinevad huulte sünkroonimisel. Kas huulte liigutused näevad loomulikud?
Uusimad tehisintellekti süvavõltsimise tuvastamise tööriistad suudavad analüüsida samu tegureid ja seda erineva eduga. Andmeteadlased töötavad pidevalt välja ka uusi meetodeid, nagu näiteks loomuliku verevoolu tuvastamine ekraanil kuvatavate kõlarite nägudes. Uued lähenemisviisid ja olemasolevate täiustused võivad viia selleni, et tehisintellekti süvavõltsingute tuvastamise tööriistad suudavad tulevikus järjekindlalt inimesi paremini teha.
Heli vihjete tuvastamine sügavates võltsingutes
Süvavõltsitud heli tuvastamine on täiesti erinev väljakutse. Ilma video visuaalsete vihjeteta ja võimaluseta tuvastada audiovisuaalseid ebakõlasid, sügavvõlts tuvastamine sõltub suuresti helianalüüsist (mõnel juhul võivad abiks olla ka muud meetodid, näiteks metaandmete kontrollimine juhtudel).
Uuring, mille avaldas Londoni ülikooli kolledž 2023. aastal leiti, et inimesed suudavad tuvastada sügavat võltskõnet 73% ajast (inglise ja mandariini keeles). Nagu süvavõltsitud videote puhul, tuvastavad inimkuulajad tehisintellekti loodud kõnes sageli intuitiivselt ebaloomulikke kõnemustreid, isegi kui nad ei suuda täpsustada, mis näib olevat vale.
Tavalised märgid hõlmavad järgmist:
- Segamine
- Väljendusvõime puudumine
- Taust- või häiremüra
- Vokaal või kõne ebakõlad
- Häälte "täiuse" puudumine
- Liiga skriptitud edastamine
- Puuduste puudumine (vale käivitamine, parandused, kõri puhastamine jne)
Taaskord suudavad algoritmid kõnet analüüsida ka samade sügavate võltssignaalide jaoks, kuid uued meetodid muudavad tööriistad tõhusamaks. Uurimistöö autor USENIX tuvastas AI vokaaltrakti rekonstrueerimise mustrid, mis ei suuda jäljendada loomulikku kõnet. See võtab kokku, et tehisintellekti häälegeneraatorid toodavad heli, mis sobib kitsastele hääletrassidele (ligikaudu joogikõrre suurusele) ilma inimkõne loomulike liigutusteta.
Varasemad uuringud alates Horst Görtzi instituut analüüsis ehtsat ja sügavat võltsitud heli inglise ja jaapani keeles, paljastades peened erinevused ehtsa kõne kõrgemates sagedustes ja sügavates võltsingutes.
Inimkuulajatele ja tehisintellekti tuvastamise mudelitele on tajutavad nii hääletrakti kui ka kõrgsageduslikud ebakõlad. Kõrgsageduslike erinevuste korral võivad AI mudelid teoreetiliselt muutuda üha täpsemaks, kuigi sama võib öelda ka AI sügavvõltsingute kohta.
Inimesi ja algoritme petavad nii sügavad võltsingud, kuid erineval viisil
Uuringud näitavad, et inimesed ja uusimad tehisintellekti tuvastamise tööriistad on samamoodi võimelised tuvastama sügavaid võltsinguid. Edukuse määrad võivad sõltuvalt testi parameetritest varieeruda vahemikus 50% kuni 90+%.
Kokkuvõttes pettuvad süvavõltsingud sarnasel määral ka inimesi ja masinaid. Kuid ülioluline on see, et oleme vastuvõtlikud erineval viisil ja see võib olla meie suurim eelis sügavvõltsitud tehnoloogia ohtudega võitlemisel. Inimeste tugevate külgede ja sügavate võltsingute tuvastamise tööriistade ühendamine leevendab nende nõrkusi ja parandab edukuse määra.
Näiteks, MIT Uuringud näitasid, et inimesed suudavad paremini tuvastada maailma liidrite ja kuulsate inimeste süvavõltsinguid kui tehisintellekti mudelid. Samuti selgus, et tehisintellekti mudelitel oli raskusi kaadritega, kus oli palju inimesi, kuigi see viitas sellele, et algoritmid on treenitud üksikute kõlaritega kaadrite jaoks.
Seevastu samas uuringus leiti, et tehisintellekti mudelid edestasid inimesi madala kvaliteediga kaadritega (udused, teralised, tumedad jne), mida võis tahtlikult kasutada inimestest vaatajate petmiseks. Samuti ei suuda inimesed hiljutised AI tuvastamise meetodid, nagu verevoolu jälgimine teatud näopiirkondades, analüüsida.
Sedamööda, kuidas arendatakse välja rohkem meetodeid, paraneb tehisintellekti võime tuvastada märke, mida me ei saa, vaid paraneb ka selle võime petta. Suur küsimus on selles, kas süvavõltsingute tuvastamise tehnoloogia edestab jätkuvalt süvavõltsinguid.
Sügavate võltsingute ajastul asjade nägemine teisiti
AI süvavõltsingute tuvastamise tööriistad, nagu ka sügavvõltsitud sisu kvaliteet, paranevad jätkuvalt. Kui tehisintellekti pettusvõime ületab selle tuvastamisvõimet (nagu tehisintellekti loodud teksti puhul), võib inimese diskreetsus olla ainus vahend, mis meil sügavvõltsingute vastu võitlemiseks jäänud on.
Igaüks vastutab sügavate võltsingute tunnuste ja nende äratundmise eest. Lisaks pettuste ja turvaohtude eest kaitsmisele on kõik, mida veebis arutame ja jagame, desinformatsiooni suhtes haavatav, kui kaotame reaalsuse mõistmise.