Hääletuvastustehnoloogial on rikkalik arengulugu, mis viis selle praeguseni. See on kaasaegse elu keskmes, andes meile võimaluse teha ülesandeid lihtsalt seadmega rääkides. Niisiis, kuidas see hämmastav tehnoloogia on aastate jooksul arenenud? Vaatame.

1952: Audrey süsteem

Esimene samm häältuvastuses tehti 1950ndate alguses. Bell Laboratories töötas 1952. aastal välja esimese inimese häält mõistva masina ja selle nimeks sai Audrey System. Nimi Audrey oli omamoodi kokkutõmbumine fraasist Automaatne numbrite tuvastamine. Kuigi see oli suur uuendus, oli sellel mõned olulised piirangud.

Kõige silmatorkavamalt tundis Audrey ära ainult numbrilised numbrid 0–9, ilma sõnadeta. Audrey annaks tagasisidet, kui kõneleja ütles numbri, süüdates ühe kümnest lambist, millest igaüks vastab numbrile.

Pildikrediit: metamorworks/Shutterstock.com

Kuigi Audrey sai numbritest aru 90% täpsusega, piirdus Audrey kindla häältüübiga. Seetõttu oli ainus inimene, kes seda tõesti kasutaks, üks arendajaid HK Davis. Kui number öeldi, peaks kõneleja enne järgmise ütlemist ootama vähemalt 300 millisekundit.

instagram viewer

See ei olnud mitte ainult funktsionaalne, vaid ka piiratud kasulikkusega. Masinatest, mis ainult numbritest aru sai, polnud suurt kasu. Üks võimalik kasutusviis oli telefoninumbrite valimine, kuid käsitsi numbrite valimine oli palju kiirem ja lihtsam. Ehkki Audreyl ei olnud graatsilist eksistentsi, on see siiski suur verstapost inimeste saavutustes.

Seotud: Kuidas kasutada häälsisestust Microsoft Wordis

1962: IBMi kingakarp

Kümme aastat pärast Audreyt proovis IBM kätt häältuvastussüsteemi väljatöötamisel. 1962. aasta maailmanäitusel demonstreeris IBM häältuvastussüsteemi nimega Showbox. Nagu Audrey, oli selle põhitööks numbrite 0–9 mõistmine, kuid see sai aru ka kuuest sõnast: pluss, miinus, vale, kokku, vahesumma ja välja.

Shoebox oli matemaatikamasin, mis suutis teha lihtsaid aritmeetilisi ülesandeid. Tagasiside osas suutis Shoebox tulede asemel tulemused paberile välja printida. See muutis selle kalkulaatoriks kasulikuks, kuigi kõneleja peaks siiski iga numbri/sõna vahel pausi pidama.

1971: IBMi automaatne kõnetuvastus

Pärast Audrey ja Shoeboxi töötasid teised laborid üle maailma välja häältuvastustehnoloogia. See tõusis aga alles 1970ndatel, kui 1971. aastal tõi IBM turule omalaadse leiutise. Seda nimetati automaatseks kõnetuvastussüsteemiks. See oli esimene kõnetuvastussüsteem, mida kasutati telefonisüsteemi kaudu.

Insenerid helistaksid ja oleksid arvutiga ühendatud Põhja -Carolinas Raleighis. Helistaja lausuks seejärel ühe oma sõnavarast 5000 sõnast ja saaks vastuseks "suulise" vastuse.

Seotud: Kuidas hääldikteerimist Macis kasutada

1976: Harpy

1970ndate alguses tundis USA kaitseministeerium huvi häältuvastuse vastu. DARPA (Defense Advanced Research Projects Agency) töötas 1971. aastal välja programmi Speech Understanding Research (SUR). Selle programmi raames rahastati mitut ettevõtet ja ülikooli, et toetada teadustööd ja arendust hääle tuvastamiseks.

1976. aastal arendas Carnegie Melloni ülikool SURi tõttu välja Harpy Systemi. See oli suur hüpe häältuvastustehnoloogias. Seni olid süsteemid võimelised mõistma sõnu ja numbreid, kuid Harpy oli ainulaadne selle poolest, et ta sai aru lausetest.

Selle sõnavara sisaldas vaid umbes 1011 sõna, mis vastavalt väljaandele B. Lowerre ja R. Reddy, võrdsustatud enam kui triljoni erineva võimaliku lausega. Väljaanne nendib seejärel, et Harpy sai sõnadest aru 93,77% täpsusega.

1980ndad olid häältuvastustehnoloogia jaoks pöördeline aeg, sest see on kümnend, mil hääl äratundmistehnoloogia, kuna just sel kümnendil tutvustati meile peidetud Markovi meetodit (HMM). HMM -i peamine liikumapanev jõud on tõenäosus.

Kui süsteem registreerib foneemi (väikseim kõneelement), on teatud tõenäosus, milline saab olema järgmine. HMM kasutab neid tõenäosusi, et teha kindlaks, milline foneem järgneb tõenäoliselt ja moodustab kõige tõenäolisemad sõnad. Enamik kõnetuvastussüsteeme kasutab tänapäeval kõne mõistmiseks endiselt HMM -i.

1990ndad: hääletuvastus jõuab tarbijaturule

Alates kõnetuvastustehnoloogia kontseptsioonist on see olnud teekond, et leida tarbijaturult ruumi. 1980ndatel tutvustas IBM arvuti prototüüpi, mis suudab kõnet tekstiks dikteerida. Kuid alles 1990ndate alguses hakkasid inimesed oma kodus selliseid rakendusi nägema.

Aastal 1990 tutvustas Dragon Systems esimest kõnet tekstiks dikteerimistarkvara. Selle nimi oli Dragon Dictate ja see ilmus algselt Windowsi jaoks. See 9000 dollari suurune programm oli revolutsiooniline häältuvastustehnoloogia massidesse toomiseks, kuid seal oli üks viga. Kasutatud tarkvara diskreetne dikteerimine, see tähendab, et programm peab iga sõna vahel pausi tegema, et programm neid kätte saaks.

1996. aastal andis IBM taas oma panuse sellesse valdkonda Medspeakiga. See oli ka kõnest tekstiks dikteerimisprogramm, kuid see ei kannatanud diskreetse dikteerimise all nagu Dragon Dictate. Selle asemel võiks see programm dikteerida pidevat kõnet, mis muutis selle köitvamaks tooteks.

Seotud: Google'i assistendi kasutamine kõrvaklappidega

2010: Tüdruk nimega Siri

Kõigi 2000ndate aastate jooksul kasvas häältuvastustehnoloogia populaarsus. Seda rakendati rohkem tarkvara ja riistvara kui kunagi varem ning üks oluline samm häältuvastuse arengus oli Siri, digitaalne assistent. 2010. aastal tutvustas Siri -nimeline ettevõte virtuaalset assistenti kui iOS -i rakendust.

Tol ajal oli Siri muljetavaldav tarkvara, mis suutis dikteerida kõneleja juttu ja anda haritud ja vaimuka vastuse. See programm oli nii muljetavaldav, et Apple omandas ettevõtte samal aastal ja tegi Sirile veidi kapitaalremonti, lükates selle täna tuntud digitaalse assistendi poole.

Siri sai Apple'i kaudu oma ikoonilise hääle (hääl Susan Benett) ja hulga uusi funktsioone. See kasutab loomuliku keele töötlemine enamiku süsteemi funktsioonide juhtimiseks.

2010ndad: suured 4 digitaalset assistenti

Praegusel kujul domineerivad hääletuvastuses ja lisatarkvaras neli suurt digitaalassistenti.

  • Siri on saadaval peaaegu kõigis Apple'i toodetes: iPhone'ides, iPodides, iPadides ja Maci arvutiperekonnas.
  • Google'i assistent on saadaval enamikus turul olevatest 3 miljardist + Android -seadmest. Lisaks saavad kasutajad kasutada käske paljudes Google'i teenustes, nagu Google Home.
  • Amazon Alexa tal pole palju spetsiaalset platvormi, kus ta elab, kuid see on siiski silmapaistev assistent. Seda saab alla laadida ja kasutada Android -seadmetes, Apple'i seadmetes. ja isegi valida Lenovo sülearvuteid
  • Bixby on digiassistentide loendi uusim kirje. See on Samsungi kodumaine digitaalne assistent ning see on ettevõtte telefonide ja tahvelarvutite hulgas.

Räägitud ajalugu

Hääletuvastus on Audrey päevilt kaugele jõudnud. See on toonud suurt kasu mitmes valdkonnas; näiteks vastavalt Clear Bridge Mobile, sai meditsiinivaldkond kasu pandeemia ajal 2020. Alates numbrite mõistmisest kuni täielike lausete erinevate variatsioonide mõistmiseni on hääletuvastus osutumas üheks meie kaasaegse aja kõige kasulikumaks tehnoloogiaks.

JagaPiiksumaE -post
Kuidas hääletuvastus toimib?

Me kasutame häältuvastust kogu aeg, aga kuidas see toimib?

Loe edasi

Seotud teemad
  • Tehnoloogia selgitatud
  • Siri
  • Google'i assistent
  • Alexa
  • Bixby
  • Häälkäsklused
Autori kohta
Arthur Brown (31 artiklit avaldatud)

Arthur on Ameerikas elav tehnikaajakirjanik ja muusik. Ta on selles valdkonnas tegutsenud peaaegu kümme aastat, kirjutades veebiväljaannetele, näiteks Android Headlines. Tal on sügavad teadmised Androidist ja ChromeOS -ist. Koos infoteemaliste artiklite kirjutamisega on ta vilunud ka tehnikauudiste teatamisel.

Veel Arthur Brownilt

Telli meie uudiskiri

Liituge meie uudiskirjaga, et saada tehnilisi näpunäiteid, ülevaateid, tasuta e -raamatuid ja eksklusiivseid pakkumisi!

Tellimiseks klõpsake siin