ChatGPT tegijatel on veel üks tööriist, mille eesmärk on teie sõrmede koormus maha võtta.
Samad inimesed ChatGPT taga on loonud teise AI-põhise tööriista, mida saate täna oma tootlikkuse suurendamiseks kasutada. Peame silmas Whisperit, häälest tekstiks muutmise lahendust, mis varjutas kõik sarnased lahendused, mis olid enne seda.
Saate kasutada Whisperit oma programmides või käsureal. Ja siiski, see kaotab oma eesmärgi: trükkimine ilma klaviatuurita. Kui selle kasutamiseks on vaja tippida, siis miks kasutada seda tippimise vältimiseks? Õnneks saate nüüd Whisperit kasutada töölaua GUI kaudu. Veelgi parem, see suudab ka teie hääle peaaegu reaalajas transkribeerida. Vaatame, kuidas saate Whisper Desktopi abil oma häälega tippida.
Mis on OpenAI Whisper?
OpenAI Whisper on automaatne kõnetuvastussüsteem (lühidalt ASR) või lihtsamalt öeldes lahendus kõnekeele tekstiks teisendamiseks.
Erinevalt vanematest dikteerimis- ja transkriptsioonisüsteemidest on Whisper tehisintellekti lahendus, mis on treenitud üle 680 000 tunni kõnele erinevates keeltes. Whisper pakub võrratut täpsust ja üsna muljetavaldav on see, et see pole mitte ainult mitmekeelne, vaid suudab tõlkida ka keelte vahel.
Veelgi olulisem on see, et see on tasuta ja saadaval avatud lähtekoodiga. Tänu sellele on paljud arendajad lisanud selle koodi oma projektidesse või loonud sellele tuginevaid rakendusi, näiteks Whisper Desktop.
Kui eelistate kohmakate GUI-de asemel Whisperi "vanilje" versiooni ja terminali mitmekülgsust, vaadake meie artiklit kuidas muuta oma hääl tekstiks OpenAI Whisper for Windows abil.
Kas Whisper ja Whisper Desktop on samad?
Vaatamata oma ametlikult kõlavale nimele on Whisper Desktop Whisperi jaoks mõeldud kolmanda osapoole GUI, mis on loodud kõigile, kes eelistavad käskude tippimise asemel nuppe klõpsata.
Whisper Desktop on eraldiseisev lahendus, mis ei tugine olemasolevale Whisperi installile. Boonusena kasutab see Whisperi alternatiivset optimeeritud versiooni, seega peaks see toimima paremini kui eraldiseisev versioon.
Olete spektri teises otsas ja selle asemel, et otsida terminalist lihtsamat viisi Whisperi kasutamiseks, otsite viise, kuidas seda oma lahendustes rakendada? Rõõmustage, selle eest OpenAI on avanud juurdepääsu ChatGPT ja Whisper API-dele.
Laadige alla ja installige Whisper Desktop
Kuigi Whisper Desktopi on lihtsam kasutada kui eraldiseisvat Whisperit, on selle installimine keerulisem kui viisardis korduvalt nupul Edasi klõpsamine.
- Külastage Whisper Desktopi ametlik Githubi leht. Vaadake paremalt ja klõpsake alloleval uusimal versioonil Väljaanded.
- Under Varad, klõpsake WhisperDesktop.zip ja laadige see oma arvutisse alla.
- Pakkige allalaaditud arhiiv välja kausta ja kasutage selle külastamiseks failihaldurit. Seest leiate rakenduse Whisper Desktop. Selle käivitamiseks topeltklõpsake sellel.
- Teil on vaja ka Whisper keele mudelit GCML binaarne vorming. Whisper Desktop annab teile kaks linki ühe hankimiseks. Oma mudeli loomiseks jätke teine link vahele, kuna see on keerulisem protsess. Kliki Kallistav nägu lehe avamiseks vaikebrauseris, kust saate alla laadida kasutusvalmis faili.
- Whisper Desktopi versioon, mida kasutasime selle artikli kirjutamise ajal, andis lingi Hugging Face'i vananenud hoidlasse. Kui teil on sama probleem, märkige linki a uus asukoht. Uue hoidla külastamiseks klõpsake sellel.
- Klõpsake lingil, mis viib teid saadaolevasse mudelid.
- Klõpsake selles loendis ükskõik kumba ggml-medium.bin või ggml-medium.en.bin, olenevalt sellest, kas soovite Whisperis mitmekeelset või ainult inglisekeelset tuge.
- Lõpuks oleksite pidanud sihtkohta jõudma. Pange tähele rida, mis ütleb, et see fail on salvestatud Git LFS-i ja on kuvamiseks liiga suur, kuid saate selle siiski alla laadida. Kliki lae alla täpselt seda teha.
- Kui faili allalaadimine on lõppenud, kasutage oma lemmikfailihaldurit (File Explorer seda teeb), et teisaldada allalaaditud keelemudeli fail Whisper Desktopiga samasse kausta.
Transkribeerimine Whisper Desktopiga
Whisper Desktopiga transkribeerimine on lihtne, kuid rakenduse kasutamiseks võib siiski vaja minna ühte või kahte klõpsu.
Käivitage Whisper Desktop uuesti. Kas sellel (veel) puudub õige tee teie allalaaditud keelemudeli juurde? Klõpsake nuppu kolme punktiga nuppu väljast paremal ja valige käsitsi Hugging Face'ist alla laaditud fail.
Sellest kohast saate kasutada ka kõrval olevat rippmenüüd Mudeli rakendamine et valida, kas soovite Whisperit oma GPU-l käivitada (GPU), nii CPU-l kui ka GPU-l (Hübriid) või ainult CPU-l (Viide).
The Täpsemalt nupp viib rohkemate valikuteni, mis mõjutavad seda, kuidas Whisper teie riistvaras töötab. Kuna aga nupp näitab selgelt, et need on täiustatud, soovitame teil neid muuta ainult siis, kui tegelete tõrkeotsinguga või teate, mida teete. Valede suvandite väärtuste määramine siin võib määrata jõudlustrahvi või muuta rakenduse kasutuskõlbmatuks.
Rakenduse põhiliidese juurde liikumiseks klõpsake nuppu OK.
Kui teil on juba oma hääle salvestis, mida soovite kirjalikuks tekstiks muuta, klõpsake nuppu Faili transkribeerimine ja valige see. Siiski kasutame selle artikli reaalajas transkriptsiooniks Whisper Desktopi.
Pakutavad valikud on lihtsad. Saate valida keel Sosin kasutab, valige, kui soovite tõlkida keelte vahel ja lubage rakendus Silumiskonsool.
Enamik inglise keelt kõnelevaid kasutajaid võivad need valikud ohutult vahele jätta ja tagada, et valiku kõrval olevast rippmenüüst valitakse ainult õige helisisend. Püüdmisseade.
Tee kindlaks Salvesta tekstifaili ja Lisa sellele failile on lubatud lasta Whisper Desktopil salvestada oma väljund faili ilma selle sisu üle kirjutamata. Kasuta kolme punktiga nuppu faili tee väljast paremal, et määratleda nimetatud tekstifail.
Kliki Jäädvusta et alustada oma kõne tekstiks transkribeerimist.
Whisper Desktop näitab teile kolme indikaatorit, millal see tuvastab häältegevuse, millal see aktiivselt transkribeerib ja millal protsess on seiskunud.
Saate rääkida nii kaua kui soovite ja peaksite aeg-ajalt nägema kahte esimest indikaatorit vilkumas, kui rakendus muudab teie hääle tekstiks. Klõpsake Peatus kui tehtud.
Valitud tekstifail peaks avanema teie vaiketekstiredaktoris, sisaldades kirjalikul kujul kõike, mida ütlesite kuni klõpsamiseni Peatus.
Peaksime märkima, et saate teha ka vastupidiselt sellele, mida siin nägime: teisendada mis tahes teksti kõneks. Nii saate kuulata kõike nagu taskuhäälingusaadet, selle asemel, et väsitada oma silmi ekraane kissitades. Selle kohta lisateabe saamiseks vaadake meie artiklit mõned parimad tasuta veebitööriistad teksti kõneks muutmise MP3-helina allalaadimiseks.
Nõuanded sosistades töölaua häälsisestuse sisestamiseks
Kuigi Whisper Desktop võib olla elupäästja, mis võimaldab teil kirjutada oma häälega palju kiiremini, kui jõuaksite tippida, pole see kaugeltki täiuslik.
Testimise käigus avastasime, et see võib aeg-ajalt kokuda, mõned sõnad vahele jätta või transkribeerimine ebaõnnestuda enne, kui käsitsi peatage ja taaskäivitage protsess või jääge ahelasse ja jätkake sama fraasi uuesti transkribeerimist korduvalt.
Usume, et need on ajutised tõrked, mis parandatakse, kuna eraldiseisval Whisperil ei esine samu probleeme.
Peale nende väiksemate tõrgete peaks Whisper Desktopiga oma hääle tekstiks muutmine olema lihtne. Siiski leidsime oma katsete käigus, et see võib veelgi paremini toimida, kui...
- Selle asemel, et lausuda kaks või kolm sõna ja seejärel peatuda, mõistab Whisper teid paremini, kui jätkate pikemalt. Proovige anda sellele vähemalt terve lause korraga.
- Samal põhjusel vältige transkriptsiooniprotsessi korduvat käivitamist ja peatamist.
- Kui saate aru, et tegite vea, ignoreerige seda ja jätkake. Keelemudeli laadimine ja mahalaadimine näib Whisperi praeguse oleku ja meie olemasoleva riistvara juures olevat protsessi kõige aeganõudvam osa. Seega on kiirem edasi rääkida ja siis hiljem oma vigu parandada.
- Nagu Whisperi eraldiseisva versiooni puhul, on kõige parem kasutada olemasoleva riistvara jaoks optimaalset keelemudelit. Saate kasutada kuni keskmine mudelit, kui teie GPU-l on 8 GB VRAM-i. Kui soovite vähem VRAM-i, valige väiksemad mudelid. Valige ainult veidi täpsem, kuid ka palju nõudlikum suur mudelit, kui kasutate 16 GB või enama VRAM-iga GPU-d.
- Pidage meeles, et mida suurem on keelemudel, seda aeglasem on transkriptsiooniprotsess. Ärge otsige mudelit, mis on suurem kui vaja. Tõenäoliselt leiate, et Whisper Desktop saab juba keskmiste või väiksemate mudelite puhul enamiku ajast teist aru, kusjuures lõigu kohta on ainult üks või kaks viga.
Kas kirjutate ikka veel? Kasutage oma häält sosistades
Vaatamata sellele, et seadistamine nõuab veidi aega, nagu näete seda proovides, toimib Whisper Desktop palju paremini kui enamik alternatiive, palju suurema täpsuse ja suurema kiirusega.
Pärast seda, kui hakkate seda oma häälega tippimiseks kasutama, võib teie klaviatuur välja näha nagu iidsetest aegadest pärit relikt.