OpenAI on andnud ChatGPT-le võimaluse rääkida sünteesitud häälega ja see jõuab peagi teie nutitelefoni.
ChatGPT-st saab interaktiivne generatiivne AI kogemus. OpenAI paljastas, et maailma juhtiv AI-vestlusbot suudab rääkida ja vastata kasutajate päringutele sünteesitud, arvatavasti AI-ga loodud hääle abil.
Lisaks uuele häälele saab ChatGPT reageerida ja arutada konkreetseid pilte, mis on talle üles laaditud või jäädvustatud ChatGPT Androidi või iOS-i rakenduse kasutamise ajal. Pildituvastusfunktsioon kõlab sarnaselt Google Lensi ja muude rakendustega, mis kasutavad andmete ja teabe täpseks tuvastamiseks närvivõrke.
OpenAI annab ChatGPT-le hääle
25. septembril 2023 ChatGPT arendaja OpenAI paljastas see annaks oma maailma juhtivale generatiivsele AI-vestlusbotile hääle. ChatGPT kasutajad saavad otse vestlusrobotiga rääkida ja paluda tal tagasi rääkida, võimaldades ChatGPT-l esimest korda otse häälega vestelda.
OpenAI näidisklipis on üks naine, kes palub ChatGPT-l luua unikaalse unejuttu, millele ChatGPT vastab nõuetekohaselt naissoost sünteesitud häälega.
Vastavalt Ühendatud, töötati uus tekst kõneks muutmise mudel välja ettevõttesiseselt. See võib tekstist ja mõnesekundilisest näidiskõnest genereerida "inimlikku" heli (kasutades OpenAI Whisper mudelit) ja räägivad erinevates toonides ja stiilides. Siit leiate hulga häälenäidiseid OpenAI ajaveeb.
Mõned ettevõtted kasutavad juba OpenAI uut häälemudelit. Näiteks Spotify kasutab OpenAI teksti kõneks muutmise mudelit taskuhäälingusaadete tõlkimiseks erinevatesse keeltesse, ühendades ChatGPT keeletõlkeoskuse uue kõnevõimega.
ChatGPT uus tekst kõneks muutmise mudel on saadaval ainult Plusi ja Enterprise'i tellijatele, kes kasutavad ametlikku Androidi ja iOS-i rakendused ning see peaks välja tulema järgmise kahe nädala jooksul (alates 25. 2023). Lisaks on uus häälefunktsioon esialgu piiratud inglise keelega, kuigi eeldame, et see muutub kiiresti.
ChatGPT suudab pilte ja fotosid ära tunda ja analüüsida
OpenAI ChatGPT värskenduse teine osa on võimalus analüüsida ja rääkida tööriista üles laaditud pilte. Visuaalse kujutise analüüsi võimalust kasutati GPT-4 värskendusvideotes, kuid sellest ajast alates pole seda palju arutatud (ChatGPT kooditõlk kõrvale).
Nüüd saab ChatGPT Google Lensile sarnase funktsiooni. Saate ChatGPT-sse üles laadida pildi või teha foto oma nutitelefoni kaameraga rakenduses ChatGPT ja see täpsustab pilti, lisades vajadusel konteksti.
Selle nimetamine "sarnaseks Google Lensiga" teeb selle ülekohtu. Võimalus pildi üle edasi-tagasi vestelda, et saada rohkem teavet ja konteksti, muudab selle väga kasulikuks paljude seadete puhul. Siiski on oluline tähele panna peenes kirjas, kuna OpenAI teeb selgeks, et see on privaatsuse ja täpsuse huvides piiranud ChatGPT "võimet analüüsida ja teha inimeste kohta otseseid avaldusi". Siiski, kas OpenAI-toega tööriist "Kes see on" võiks olla tulevikus töös? (Loodame, et mitte!)
Nagu uus tekst kõneks muutmise mudel, võtab OpenAI järgmise kahe nädala jooksul kasutusele pildituvastuse, kuigi see on saadaval kõigil platvormidel, mitte ainult rakenduses ChatGPT.
Privaatsus, turvalisus ja muud probleemid
Häältoitega ChatGPT tagajärjed on karmid. Muidugi, see on põnev. Võimalusel luua ainulaadselt sünteesitud hääl, kasutades näitena vaid lühikest katkendit, on aga märkimisväärseid privaatsus- ja turvaprobleeme. Pahatahtlike osalejate potentsiaal neid tööriistu ära kasutada on tohutu ja nagu iga generatiivse AI-tööriista puhul, kui džinn pudelist välja tuleb, ei lähe see enam tagasi. Ükski valitsuste või mõtteliidrite AI määrus ei saa tõusu tagasi pöörata.
Isegi OpenAI hoiatus selle teema kohta näib olevat ilmselge, hoolimata probleemide mainimisest:
Kuid need võimalused kujutavad endast ka uusi riske, nagu pahatahtlike osalejate võimalus esineda avaliku elu tegelastena või sooritada pettusi. Seetõttu kasutame seda tehnoloogiat konkreetse kasutusjuhtumi – häälvestluse – käivitamiseks.
Kuna see on jäämäe tipp, oodake ChatGPT äsja leitud hääle vastu tagasilööki, eriti kui ebameeldivad pealkirjad, mis väidavad, et ChatGPT-d kasutatakse pettuste sooritamiseks ja nii, on ennustatavalt kasvanud. peal.
OpenAI muudab ChatGPT-i AI-rakenduseks
Mida rohkem OpenAI lisab ChatGPT-le kasutajasõbralikke funktsioone, seda enam muutub see generatiivseks AI-rakenduseks. Esimesena, kes saavutas esialgse generatiivse AI buumi ajal laialdase kuulsuse, on ChatGPT endiselt teejuhiks ja ainult rakendusi, mida kasutatakse, vaatamata konkurentsile nagu Google Bard (ja potentsiaalselt Google Gemini) ja Anthropics Claude.
Niikaua kui OpenAI saab jätkata funktsioonide lisamist, mis muudavad ChatGPT kasutamise lihtsamaks, hoiab see inimesi konksus ja läheneb oma eesmärgile – tõeliselt multimodaalne AI-tööriist.