Google avaldas GitHubis oma Lyra helikoodeki beetaversiooni, muutes kõigi arendajate jaoks kättesaadavaks uskumatu kvaliteediga madala bitikiirusega helitöötluse. Koodek on kõige kasulikum sisseehitatud ja ribalaiusega piiratud olukordades, kus tuleb salvestada nii palju andmeid kui võimalik.

Lyra: Peaaegu mitte miski ei kõlanud kunagi nii hästi

Helikoodek töötab põhimõttel, et võimalikult loomuliku kõlaga kõne oleks võimalikult madal. Sellega õnnestub luua peaaegu õõvastav helitaasesituse tase, mille bitikiirus on nii madal kui 3 kbps. Google kasutab reaalajas Lyra tihendamist juba oma Duo rakenduses, kuigi teid ei süüdistata selles, et te isegi ei teadnud erinevust tavalisest ribalaiusega helist.

Et näidata, kui palju parem on Lyra kui muud koodekid, pakub Google näiteid a blogipostitus masinõppe juhitud tihenduskoodeki võrdlemine teiste 3 ja 6 kbps alternatiividega.

See on öö ja päeva vahe ning arendajatele kogu maailmas nende tööriistade pakkumine on märkimisväärne tõukejõud suhtlemise kvaliteedi parandamiseks seal, kus ribalaiust on vähe. See on ka suurepärane motivaator arendajatele, kes soovivad arenevatel turgudel uusi rakendusi luua, mida Google kindlasti selle aasta jooksul kajastab

instagram viewer
tasuta virtuaalne Google I / O veebikonverents.

Beeta-lähtekood on praegu loodud 64-bitiseid Arm-seadmeid silmas pidades, ehkki näited töötavad ka 64-bitistes x86 Linuxi süsteemides. Lähtekood on täielikult dokumenteeritud, kuigi see on beetaversioon ning GitHubi leht sisaldab installijuhiseid ja kuidas Lyra Linuxi jaoks armi 64-bitiste sihtmärkide jaoks üles ehitada.

Lyra beetaversiooni lähtekoodi saamiseks minge lehele Lyra GitHubi leht.

Kuidas Lyra töötab?

Kuigi tegelik protsess, mida Lyra kasutab, on uskumatult keeruline kombinatsioon masinõppemudelitest, millele on koolitatud tuhandeid tunde kõneandmeid ja olemasoleva helikoodekite tehnoloogia optimeerimist, on teooria üsna õige lihtne.

Iga 40 ms tagant võetakse funktsioonid kõnest ja tihendatakse 3 kbps-ni. Need omadused tähistavad kõne energiapunkte kogu sagedusspektris, mis on inimese kuulmiskõne reaktsioonile kõige lähemal - asjad, mida peame kellegi rääkimisel ära tundma ja mõistma.

Peamine osa Lyra teeb eriliseks see, kuidas ta seda teavet kasutab:

Kuid traditsioonilised parameetrilised koodekid, mis lihtsalt eraldavad kõnekriitilistest parameetritest, mis siis olla võivad kasutatakse signaali taastamiseks vastuvõtvas otsas, madala bitikiiruse saavutamiseks, kuid sageli robotlikult ja ebaloomulikult. Need puudused on viinud uue põlvkonna kvaliteetsete heligeneratiivsete mudelite väljatöötamiseni tegi selle valdkonna revolutsiooniliseks, kuna suutis signaale mitte ainult eristada, vaid ka luua täiesti uusi ühed.

Pärast edastamist taastab Lyra lainekuju, täites selle protsessi abil puuduva, kuid pole kuidagi arvutuslikult liiga keeruline.

Ühelt poolt on see tehnoloogiline ime, mis jookseb peaaegu kõikjal. Teiselt poolt pole ma ikka veel 100% veendunud, et see pole nõidumine.

E-post
10 Google Duo funktsiooni, mida peaksite tegelikult kasutama

Google Duo on seal üks parimaid videokõnede rakendusi. Sellel on palju funktsioone ja siin on need, mida meie arvates peaksite tõesti kasutama.

Loe edasi

Seotud teemad
  • Tehnikauudised
  • Google
  • Android
  • Masinõpe
Autori kohta
Ian Buckley (Avaldatud 209 artiklit)

Ian Buckley on vabakutseline ajakirjanik, muusik, esineja ja videoprodutsent, kes elab Saksamaal Berliinis. Kui ta ei kirjuta ega laval, nokib ta meisterdatud elektroonikat või koodi lootuses saada hulluks teadlaseks.

Veel Ian Buckley käest

Telli meie uudiskiri

Liituge meie uudiskirjaga, kus leiate tehnilisi näpunäiteid, ülevaateid, tasuta e-raamatuid ja eksklusiivseid pakkumisi!

Veel üks samm !!!

Palun kinnitage oma e-posti aadress meilis, mille me just saatsime.

.