Kui inimene vaatab stseeni või pilti, saab ta sellest aru - mis objektid selles on ja mis juhtub, kui tegevus toimub. Seevastu arvuti töötleb ainult digitaalseid andmeid, mis kirjeldavad iga piksli värvi väärtust. Inimese jaoks on pitsa äratundmine soditud laual vaevatu. Kuid kuni viimase ajani ei suutnud arvutid sama ülesannet täita.
Arvutinägemus ehk CV võimaldab arvutil visuaalsetest sisenditest olulist teavet välja valida ning selle teabe põhjal täpseid ennustusi ja soovitusi teha.
Kuidas arvutinägemine töötab?
Enne arvutinägemist peaks konkreetse pildi tuvastava programmi loomiseks inimene tundide kaupa käsitsi jalga tegema. Esiteks tuleks võrrelda sarnaste piltide andmebaas.
Seejärel tuleks neid pilte käsitsi analüüsida, mõõta ja märkida asjakohaste andmetega et uurija arvas, et suudab tuvastada kõnealuse objekti (näiteks värv, mõõtmed ja kuju). Alles seejärel sai tarkvara ennustamiseks kasutada.
Teiselt poolt automatiseerib arvutinägemine kogu selle protsessi, kasutades masinõppe lähenemist, mida nimetatakse sügavaks õppimiseks.
Sügav õppimine kasutab mitmekihilist närvivõrku sadade potentsiaalsete kihtidega. Piltide puhul on see tavaliselt konvolutsiooniline närvivõrk (CNN).Üksikasjalik selgitamine, kuidas süvaõpe ja närvivõrgud toimivad, on selle artikli raamidest kaugel. Põhimõtteliselt sisestatakse närvivõrku palju andmeid. Närvivõrk analüüsib andmeid korduvalt, kuni suudab nende kohta täpseid ennustusi moodustada.
Arvutinägemisülesande jaoks kasutatava CNN-i korral viib närvivõrk andmeid läbi mitme etapi. Esiteks ahendab see pildi mitmeks osaks (üksikud pikslid või eelnevalt märgistatud pikslite rühmad).
Seejärel ennustab see pildi erinevates osades (nt kõvad servad või konkreetsed objektid) oleva sisu kohta. See kontrollib nende ennustuste täpsust korduvalt ja muudab algoritmi osi iga kord veidi, kuni see muutub väga täpseks.
Arvutid on nüüd nii võimsad, et saavad pilti analüüsida palju kiiremini kui inimese aju, eriti kui nad on õppinud teatud mustreid ära tundma. Sel viisil on lihtne mõista, kuidas sügav õppimisalgoritm võiks ületada inimese võimeid.
Millised on arvutinägemise tüübid?
Arvutinägemine hõlmab piltide analüüsimist ja mõistmist ning asjakohaseid ennustusi või otsuseid piltide kohta. Nende eesmärkide saavutamiseks kasutatakse arvutivisioonil erinevaid ülesandeid. Mõned neist hõlmavad järgmist:
- Piltide klassifikatsioon: Tuvastatakse pildi tüüp. Näiteks, kas see on inimese nägu, maastik või objekt. Sellist ülesannet saab kasutada piltide kiireks tuvastamiseks ja klassifitseerimiseks. Selle üks kasutus on sotsiaalmeedias sobimatu sisu automaatne tuvastamine ja blokeerimine.
- Objekti tuvastamine: Sarnaselt piltide klassifikatsiooniga saab objektide tuvastamise abil tuvastada konkreetse objekti stseenis - nagu näiteks pitsa sassis laual.
- Servade tuvastamine: Arvutinägemise tavaline kasutamine ja tavaliselt objektide tuvastamise esimene samm on pildi kõvade servade tuvastamine.
- Objekti identifitseerimine: See on objekti või pildi üksikute näidete, näiteks konkreetse isiku, sõrmejälgede või sõiduki tuvastamine.
- Objekti tuvastamine: Tuvastamine on konkreetse tunnuse tuvastamine pildil, nagu luu murd röntgenpildil.
- Objektide segmentimine: See näitab, millised pildi pikslid kuuluvad kõnealusele objektile.
- Objekti jälgimine: Kui videojärjestuses on objekt tuvastatud, saab seda hõlpsasti kogu video ulatuses jälgida.
- Kujutise taastamine: Hägususe, müra ja muud pildi artefaktid saab eemaldada, tuvastades täpselt pildi objekti versus tausta.
Näited arvutinägemisest
Tehisintellekt on kasutatakse juba mitmes tööstusharus vapustava efektiga, mis kehtib arvuti nägemise kohta. Siin on mõned näited juba täna kasutatud CV-st.
Näotuvastus
Näotuvastus on tänapäeval üks peamisi viise, kuidas arvutinägemist kasutatakse. Kui võrrelda tuntud nägude andmebaasidega, siis arvutinägemisalgoritmid suudavad üksikuid inimesi väga täpselt tuvastada.
- Sotsiaalmeedia analüüsib pilte ja märgistab kasutajad automaatselt, et sellel on hea piltide valik.
- Sülearvutid, telefonid ja turvaseadmed võimaldavad juurdepääsu tuvastamiseks inimesi tuvastada.
- Korrakaitse kasutab kahtlustatavate tuvastamiseks CCTV-süsteemides näotuvastust.
Ravim
Arvutinägemist kasutatakse praegu tervishoius, et saada kiiremini ja täpsemalt diagnoose, kui eksperdid suudavad panna. Paljud rakendused hõlmavad röntgen-, CT- või MRI-piltide analüüsimist konkreetsete seisundite, sealhulgas neuroloogiliste haiguste, kasvajate ja luumurdude või murdude korral.
Isejuhtivad autod
Autonoomsed sõidukid peavad mõistma oma ümbrust ohutult sõita. See tähendab teede, sõiduradade, liiklusmärkide, muude sõidukite, jalakäijate ja muu tuvastamist. Kõigi nende ülesannete puhul kasutatakse arvutivisioonisüsteeme reaalajas, et vältida kokkupõrkeid ja sõita ohutult.
Arvutinägemine on väljakutse
Praegused arvutinägemise rakendused hakkavad juba erinevates tööstusharudes töötamist muutma. Alates suutlikkusest avastada vigaseid või katki läinud seadmeid kuni vähi täpse diagnoosimiseni, on arvuti nägemine võimeline süsteeme parandama ja elusid päästma.
Kuid see pole ilma probleemideta. Arvutinägemine on ikka veel kaugel sellest, mis on inimese nägemus. Meil on tuhandeid aastaid kestnud evolutsioon, mis võimaldab meil reaalajas ära tunda ja mõista peaaegu kõike, mis meie ümber toimub. Kuid meil pole aimugi, kuidas inimaju neid ülesandeid täidab.
Sügav õppimine on tohutu samm õiges suunas, kuid see nõuab siiski hämmastavalt palju tööd luua süsteem, mis suudaks täita ülesandeid, mida inimesed saavad teha väga lihtsalt, näiteks tuvastada auto tee. Seda seetõttu, et arvutid täidavad piiratud ülesandeid väga tõhusalt. Visuaalse maailma kogu keerukust mõistva arvuti arendamine on täiesti erinev pallimäng.
Kuna rohkem uuritakse nii tehisintellekti rakendusi kui ka inimese bioloogiat, näeme tõenäoliselt lähitulevikus arvutinägemise võimalike kasutuste plahvatust.
Masinõppe algoritmid on loodud elu lihtsustamiseks ja süsteemide täiustamiseks, kuid võivad halbade tagajärgedega sassi minna.
Loe edasi
- Tehnoloogia selgitatud
- Programmeerimine
- Tehisintellekt
- Närvivõrgud
Jake Harfield on Austraalias Perthis asuv vabakutseline kirjanik. Kui ta ei kirjuta, on ta tavaliselt põõsas ja kohalikke elusloodusi pildistamas. Saate teda külastada aadressil www.jakeharfield.com
Telli meie uudiskiri
Liituge meie uudiskirjaga, kus leiate tehnilisi näpunäiteid, ülevaateid, tasuta e-raamatuid ja eksklusiivseid pakkumisi!
Veel üks samm !!!
Palun kinnitage oma e-posti aadress e-kirjas, mille just teile saatsime.