PaLM 2 toob Google'i LLM-i tohutult täiendusi, kuid kas see tähendab, et see saab nüüd OpenAI GPT-4-ga hästi toimida?

Google esitles 10. mail 2023 Google I/O 2023 konverentsil oma Pathways Language Model (PaLM 2) järgmise põlvkonna versiooni. Selle uus suur keelemudel (LLM) on oma eelkäijaga (PaLM) võrreldes palju edasi arenenud ja võib lõpuks olla valmis võtma vastu oma suurima rivaali OpenAI GPT-4.

Aga kui palju on Google teinud edusamme? Kas PaLM 2 on see erinevuste tegija, mida Google loodab, ja mis veelgi olulisem – nii paljude sarnaste võimalustega erineb PaLM 2 OpenAI GPT-4-st?

PaLM 2 vs. GPT-4: toimivuse ülevaade

PaLM 2 on täis uusi ja täiustatud võimalusi võrreldes oma eelkäijaga. Üks unikaalseid eeliseid, mis PaLM 2-l GPT-4 ees on, on asjaolu, et see on saadaval väiksemates suurustes, mis on spetsiifilised teatud rakendustele, millel pole nii palju sisemist töötlemisvõimsust.

Kõigil neil erinevatel suurustel on oma väiksemad mudelid nimega Gecko, Otter, Bison ja Unicorn, kusjuures Gecko on väikseim, millele järgneb Otter, Bison ja lõpuks Unicorn, suurim mudel.

Google väidab ka, et GPT-4 arutlusvõime paraneb WinoGrande'is ja DROPis, kusjuures esimene tõmbab ARC-C-s kitsa varu. Siiski on PaLM-i ja SOTA-ga seoses tehtud olulisi edusamme.

Google'i 91-leheküljelise lehe järgi on PaLM 2 parem ka matemaatikas PaLM 2 uurimistöö [PDF]. Kuid viis, kuidas Google ja OpenAI on oma testitulemusi struktureerinud, muudab kahe mudeli otsese võrdlemise keeruliseks. Google jättis ka mõned võrdlused välja, tõenäoliselt seetõttu, et PaLM 2 ei toiminud peaaegu nii hästi kui GPT-4.

MMLU-s sai GPT-4 tulemuseks 86,4, PaLM 2 aga 81,2. Sama kehtib ka HellaSwagi kohta, kus GPT-4 lõi värava 95,3, kuid PaLM 2 suutis koguda ainult 86,8 ja ARC-E, kus GPT-4 ja PaLM 2 said 96,3 ja 89,7, vastavalt.

PaLM 2 perekonna suurim mudel on PaLM 2-L. Kuigi me ei tea selle täpset suurust, teame, et see on oluliselt väiksem kui suurim PaLM-mudel, kuid kasutab rohkem treeningarvutusi. Google’i järgi, PalLMil on 540 miljardit parameetrit, nii et "oluliselt väiksem" peaks PaLM 2 paigutama 10 kuni 300 miljardi parameetri vahele. Pidage meeles, et need arvud on vaid oletused, mis põhinevad Google'il PaLM 2 dokumendis.

Kui see arv on kuskil 100 miljardi lähedal või alla selle, on PaLM 2 parameetrite poolest tõenäoliselt väiksem kui GPT-3.5. Arvestades, et mudel, mille väärtus on alla 100 miljardi, võib GPT-4-ga minna ja seda isegi ületada, on muljetavaldav. GPT-3.5 puhus alguses kõik veest välja, sealhulgas PaLM, kuid PaLM 2 on paranenud.

GPT-4 ja PaLM 2 koolitusandmete erinevused

Kuigi Google ei ole avalikustanud PaLM 2 koolitusandmestiku suurust, teatab ettevõte oma uurimistöös, et uue LLM-i koolitusandmete kogum on oluliselt suurem. OpenAI kasutas sama lähenemisviisi ka GPT-4 avalikustamisel, jättes koolituse andmestiku suuruse kohta mingeid väiteid.

Google soovis aga keskenduda matemaatika, loogika, arutluskäigu ja teaduse sügavamale mõistmisele, mis tähendab, et suur osa PaLM 2 koolitusandmetest on keskendunud eelnimetatud teemadele. Google ütleb oma dokumendis, et PaLM 2 eelkoolituse korpus koosneb mitmest allikast, sealhulgas veebidokumentidest, raamatuid, koodi, matemaatikat ja vestlusandmeid, pakkudes neile igakülgseid täiustusi, vähemalt võrreldes nendega PaLM.

Ka PaLM 2 vestlusoskused peaksid olema teisel tasemel, arvestades, et mudel on koolitatud enam kui 100 keeles, et anda sellele parem kontekstimõistmine ja parem tõlge võimeid.

Niipalju kui GPT-4 koolitusandmed on kinnitatud, on OpenAI meile öelnud, et on koolitanud mudelit avalikult kättesaadavate andmete ja litsentsitud andmete abil. GPT-4 uurimisleht märgib: "Andmed on veebipõhise andmekogu, mis sisaldab õigeid ja valesid lahendusi matemaatikaülesannetele, nõrkadele ja tugevaid arutluskäike, enesele vasturääkivaid ja järjekindlaid väiteid ning esindades väga erinevaid ideoloogiaid ja ideid."

Kui GPT-4-le esitatakse küsimus, võib see anda palju erinevaid vastuseid, millest kõik ei pruugi olla teie päringu jaoks asjakohased. Selle kooskõlla viimiseks kasutaja kavatsustega täpsustas OpenAI mudeli käitumist, kasutades inimese tagasisidet tugevdavat õpet.

Kuigi me ei pruugi teada täpseid treeninguandmeid kummagi mudeli järgi, teame, et koolituse eesmärk oli väga erinev. Peame ootama ja nägema, kuidas see koolituse kavatsuste erinevus kahe mudeli vahel reaalses kasutuses erineb.

PaLM 2 ja GPT-4 vestlusbotid ja teenused

Esimene portaal, mis pääseb juurde mõlemale LLM-ile, kasutab nende vastavaid vestlusroboteid, PaLM 2 Bard ja GPT-4 ChatGPT. Sellegipoolest on GPT-4 ChatGPT Plusiga tasulise seina taga ja tasuta kasutajad saavad juurdepääsu ainult GPT-3.5-le. Bard on seevastu kõigile tasuta ja saadaval 180 riigis.

See ei tähenda, et te ei pääseks ka GPT-4-le tasuta juurde. Microsofti Bing AI Chat kasutab GPT-4 ja on täiesti tasuta, kõigile avatud ja saadaval otse Google'i suurima rivaali Bing Searchi kõrval.

Google I/O 2023 oli täis teadaandeid selle kohta, kuidas PaLM 2 ja generatiivne AI integratsioon parandavad Google Workspace'i kogemusi tehisintellekti funktsioonidega, mis tulevad teenusesse Google Docs, Arvutustabelid, Esitlused, Gmail ja peaaegu kõik otsinguhiiglase pakutavad teenused. Lisaks on Google kinnitanud, et PaLM 2 on juba integreeritud enam kui 25 Google'i tootesse, sealhulgas Androidi ja YouTube'i.

Võrdluseks on Microsoft juba toonud tehisintellekti funktsioonid Microsoft Office'i programmikomplekti ja paljudesse oma teenustesse. Praegu saate kogeda mõlemat LLM-i oma versioonides sarnastest pakkumistest kahelt konkureerivalt ettevõttelt, kes astuvad üksteise vastu tehisintellekti lahingus.

Kuna aga GPT-4 ilmus varakult ja on olnud ettevaatlik, et vältida paljusid vigu, mida Google algse Bardiga tegi, on see olnud de facto LLM kolmandate osapoolte arendajatele, idufirmadele ja peaaegu kõigile teistele, kes soovivad oma teenusesse lisada võimeka tehisintellekti mudeli. kaugele. Meil on GPT-4 rakenduste loend, kui soovite neid kontrollida.

See ei tähenda, et arendajad ei läheks üle või vähemalt ei prooviks PaLM 2-d, kuid Google peab sellel rindel siiski OpenAI-le järele jõudma. Ja tõsiasi, et PaLM 2 on avatud lähtekoodiga, selle asemel, et lukustada tasulise API taha, tähendab, et see võib olla laiemalt kasutusele võetud kui GPT-4.

Kas PaLM 2 suudab vastu võtta GPT-4?

PaLM 2 on endiselt väga uus, nii et vastus küsimusele, kas see võib võtta GPT-4 või mitte, jääb vastamata. Kuid arvestades kõike, mida Google lubab, ja agressiivset viisi, mida ta on otsustanud selle levitamiseks kasutada, tundub, et PaLM 2 suudab GPT-4 oma raha eest ära kasutada.

Kuid GPT-4 on endiselt üsna võimekas mudel ja, nagu eelnevalt mainitud, ületab PaLM 2 üsna mitmes võrdluses. Sellegipoolest annavad PaLM 2 mitmed väiksemad mudelid sellele ümberlükkamatu eelise. Gecko ise on nii kerge, et see töötab mobiilseadmetes isegi võrguühenduseta. See tähendab, et PaLM 2 suudab toetada täiesti erinevat klassi tooteid ja seadmeid, millel võib olla raskusi GPT-4 kasutamisega.

AI võidujooks kuumeneb

PaLM2 turuletoomisega on võidujooks AI domineerimise pärast kuumenenud, sest see võib olla esimene väärt vastane, kes läheb GPT-4 vastu. Kuna uuem multimodaalne tehisintellekti mudel nimega "Gemini" on samuti treeningul, ei näita Google siin mingeid märke aeglustumisest.