Suured keelemudelid (LLM-id) on aluseks olev tehnoloogia, mis on käivitanud generatiivsete tehisintellekti vestlusrobotite meteoroloogilise tõusu. Tööriistad, nagu ChatGPT, Google Bard ja Bing Chat, põhinevad LLM-idel, et genereerida teie viipadele ja küsimustele inimsarnaseid vastuseid.
Kuid mis on LLM-id ja kuidas nad töötavad? Siin asusime LLM-e demüstifitseerima.
Mis on suur keelemudel?
Lihtsamalt öeldes on LLM tohutu tekstiandmete andmebaas, millele saab viidata, et luua teie viipadele inimsarnaseid vastuseid. Tekst pärineb erinevatest allikatest ja võib ulatuda miljarditesse sõnadesse.
Levinud tekstiandmete allikate hulgas on järgmised:
- Kirjandus: LLM-id sisaldavad sageli tohutul hulgal kaasaegset ja klassikalist kirjandust. See võib hõlmata raamatuid, luulet ja näidendeid.
- Veebisisu: LLM sisaldab enamasti suurt veebisisu hoidlat, sealhulgas ajaveebid, veebisisu, foorumi küsimused ja vastused ning muu veebitekst.
- Uudised ja päevakajalised sündmused: Mõned, kuid mitte kõik, LLM-id pääsevad juurde praegustele uudisteemadele. Teatud LLM-id, nagu GPT-3.5, on selles mõttes piiratud.
- Sotsiaalmeedia: Sotsiaalmeedia on tohutu loomuliku keele ressurss. LLM-id kasutavad teksti suurematelt platvormidelt, nagu Facebook, Twitter ja Instagram.
Muidugi on tohutu tekstiandmebaasi olemasolu üks asi, kuid LLM-e tuleb koolitada, et sellest aru saada, et anda inimesele sarnaseid vastuseid. Kuidas see seda teeb, käsitleme järgmisena.
Kuidas LLM-id töötavad?
Kuidas LLM-id neid hoidlaid oma vastuste loomiseks kasutavad? Esimene samm on andmete analüüsimine, kasutades protsessi, mida nimetatakse sügavaks õppimiseks.
Inimkeele mustrite ja nüansside tuvastamiseks kasutatakse süvaõpet. See hõlmab grammatika ja süntaksi mõistmist. Kuid mis kõige tähtsam, see hõlmab ka konteksti. Konteksti mõistmine on LLMide oluline osa.
Vaatame näidet, kuidas LLM-id saavad konteksti kasutada.
Järgmisel pildil olev viip mainib nahkhiire öösel nägemist. Sellest sai ChatGPT aru, et me räägime loomast, mitte näiteks pesapallikurikast. Muidugi meeldib teistele vestlusrobotidele Bing Chat või Google Bard võib sellele täiesti erinevalt vastata.
Kuid see ei ole eksimatu ja nagu see näide näitab, peate mõnikord soovitud vastuse saamiseks esitama lisateavet.
Sel juhul viskasime tahtlikult veidi kõverat, et näidata, kui kergesti konteksti kaotsi läheb. Kuid inimesed võivad ka küsimuste kontekstist valesti aru saada ja vastuse parandamiseks on vaja ainult lisaviipa.
Nende vastuste genereerimiseks kasutavad LLM-id tehnikat, mida nimetatakse loomuliku keele genereerimiseks (NLG). See hõlmab sisendi uurimist ja selle andmehoidlast õpitud mustrite kasutamist kontekstuaalselt õige ja asjakohase vastuse genereerimiseks.
Kuid LLM-id lähevad sellest sügavamale. Samuti saavad nad kohandada vastuseid sisendi emotsionaalsele toonile vastavaks. Koos kontekstuaalse mõistmisega on need kaks tahku peamised tõukejõud, mis võimaldavad LLM-idel luua inimsarnaseid vastuseid.
Kokkuvõttes kasutavad LLM-id tohutut tekstiandmebaasi koos sügava õppimise ja NLG tehnikate kombinatsiooniga, et luua teie viipadele inimsarnaseid vastuseid. Kuid selle saavutamisel on piirangud.
Millised on LLM-ide piirangud?
LLM-id esindavad muljetavaldavat tehnoloogilist saavutust. Kuid tehnoloogia pole kaugeltki täiuslik ja nende saavutustele on endiselt palju piiranguid. Mõned neist tähelepanuväärsemad on loetletud allpool:
- Kontekstuaalne arusaam: Mainisime seda kui midagi, mida LLM-id oma vastustesse lisavad. Siiski ei saa nad sellest alati õigesti aru ja sageli ei suuda nad kontekstist aru saada, mis toob kaasa sobimatuid või lihtsalt valesid vastuseid.
- Eelarvamus: Vastustes võivad sageli esineda kõik koolitusandmetes esinevad kõrvalekalded. See hõlmab eelarvamusi soo, rassi, geograafia ja kultuuri suhtes.
- Terve mõistus: Tervet mõistust on raske mõõta, kuid inimesed õpivad seda juba varakult, lihtsalt ümbritsevat maailma jälgides. LLM-idel pole seda loomupärast kogemust, millele tagasi pöörduda. Nad mõistavad ainult seda, mida on neile nende treeningandmete kaudu edastatud, ja see ei anna neile tõelist arusaama maailmast, milles nad eksisteerivad.
- LLM on täpselt nii hea kui selle koolitusandmed: Täpsust ei saa kunagi garanteerida. Vana arvuti kõnekäänd "Prügi sisse, prügi välja" võtab selle piirangu suurepäraselt kokku. LLM-id on täpselt nii head, kui head nende koolitusandmete kvaliteet ja kvantiteet võimaldavad.
On ka argument, et eetilisi probleeme võib pidada LLM-ide piiranguks, kuid see teema jääb käesoleva artikli reguleerimisalast välja.
3 Populaarsete LLM-ide näiteid
AI jätkuvat arengut toetavad nüüd suuresti LLM-id. Ehkki need pole just uus tehnoloogia, on need kindlasti jõudnud kriitilise hoo punkti ja nüüd on palju mudeleid.
Siin on mõned kõige laialdasemalt kasutatavad LLM-id.
1. GPT
Generative Pre-trained Transformer (GPT) on ehk kõige laiemalt tuntud LLM. GPT-3.5 toidab selle artikli näidete jaoks kasutatud ChatGPT platvormi, samas kui saadaval on uusim versioon GPT-4 ChatGPT Plusi tellimuse kaudu. Microsoft kasutab ka uusimat versiooni oma Bing Chati platvormil.
2. LaMDA
See on esialgne LLM, mida kasutab Google Bard, Google'i AI-vestlusbot. Algselt kasutusele võetud Bardi versiooni kirjeldati kui LLM-i "lihtsat" versiooni. LLM-i võimsam PaLM-iteratsioon asendas selle.
3. BERT
BERT tähistab Transformerite kahesuunalist kodeerija esitust. Mudeli kahesuunalised omadused eristuvad BERT teistelt LLM-idelt nagu GPT.
LLM-e on välja töötatud palju rohkem ja suuremate LLM-ide võsud on tavalised. Nende arenedes suureneb nende keerukus, täpsus ja asjakohasus. Aga mida toob LLM-ide tulevik?
LLM-ide tulevik
Need kujundavad kahtlemata viisi, kuidas me tulevikus tehnoloogiaga suhtleme. Seda tõendab selliste mudelite nagu ChatGPT ja Bing Chat kiire kasutuselevõtt. Lühiajalises perspektiivis Tõenäoliselt ei asenda AI teid tööl. Kuid endiselt on ebaselge, kui suurt rolli need tulevikus meie elus mängivad.
Eetilistel argumentidel võib siiski olla sõnaõigus selles, kuidas me need vahendid ühiskonda integreerime. Kuid kui see kõrvale jätta, siis mõned eeldatavad LLM-i arengud hõlmavad järgmist:
- Parem Tõhusus: sadade miljonite parameetritega LLM-idega on nad uskumatult ressursinäljased. Riistvara ja algoritmide täiustamisega muutuvad need tõenäoliselt energiatõhusamaks. See kiirendab ka reageerimisaega.
- Parem kontekstuaalne teadlikkus:LLM-id treenivad ise; mida rohkem kasutust ja tagasisidet nad saavad, seda paremaks nad muutuvad. Oluline on see, et see toimub ilma suuremate projektideta. Tehnoloogia arenedes paraneb keeleoskus ja kontekstiteadlikkus.
- Konkreetsete ülesannete jaoks koolitatud: Täiuslikud tööriistad, mis on LLM-ide avalik nägu, on altid vigadele. Kuid kui nad arenevad ja kasutajad koolitavad neid konkreetsete vajaduste jaoks, võivad LLM-id mängida suurt rolli sellistes valdkondades nagu meditsiin, õigus, rahandus ja haridus.
- Suurem integratsioon: LLM-idest võiks saada personaaldigiassistendid. Mõelge Sirile steroidide kasutamisel ja saate sellest aru. LLM-idest võivad saada virtuaalsed assistendid, kes aitavad teil kõiges alates söögisoovimisest kuni kirjavahetusega tegelemiseni.
Need on vaid mõned valdkonnad, kus LLM-id saavad tõenäoliselt suuremaks osaks meie eluviisist.
LLM-id transformeerivad ja harivad
LLM-id avavad põneva võimaluste maailma. Vestlusrobotite, nagu ChatGPT, Bing Chat ja Google Bard, kiire kasv on tõend selle valdkonna ressursside kasutamisest.
Ressursside selline paljunemine võib muuta need tööriistad vaid võimsamaks, mitmekülgsemaks ja täpsemaks. Selliste tööriistade potentsiaalsed rakendused on tohutud ja praegu on meil vaid uskumatu uue ressursi pinda.