Olete ilmselt kuulnud OpenAI GPT-st, kuid nad pole ainsad LLM-id selles plokis.

Võtmed kaasavõtmiseks

  • OpenAI GPT-4 on kõige arenenum ja laialdasemalt kasutatav suur keelemudel, millel on 1,76 triljonit parameetrit ja multimodaalseid võimeid.
  • Anthropic's Claude 2 konkureerib GPT-4-ga loomingulistes kirjutamisülesannetes ja püsib selles, hoolimata vähematest ressurssidest.
  • Kuigi Google'i PaLM 2 pole GPT-4 tapja, on see võimas keelemudel, millel on tugevad mitmekeelsed ja loomingulised võimed. Falcon-180B on avatud lähtekoodiga mudel, mis konkureerib kommertshiiglastega ja suudab GPT-3.5-ga vastu pidada.

Käes on tehisintellekti hooaeg ja tehnoloogiaettevõtted toodavad suuri keelemudeleid, nagu pagariäri leib. Uued mudelid lastakse välja kiiresti ja neid on liiga raske jälgida.

Kuid keset uute väljaannete saginat on vaid mõned mudelid tõusnud tippu ja tõestanud end suures keelemudeliruumis tõeliste kandidaatidena. 2023. aasta lõpu lähenedes oleme kokku pannud kuus kõige muljetavaldavamat suurt keelemudelit, mida peaksite proovima.

1. OpenAI GPT-4

GPT-4 on seni kõige arenenum avalikult saadaval suur keelemudel. OpenAI poolt välja töötatud ja 2023. aasta märtsis välja antud GPT-4 on Generative Pre-trained Transformer seeria uusim iteratsioon mis sai alguse 2018. aastal. Oma tohutute võimalustega on GPT-4-st saanud üks enimkasutatavaid ja populaarsemaid suurkeele mudeleid maailmas.

Kuigi ametlikult pole kinnitatud, võib allikate hinnangul GPT-4 sisaldada hämmastavalt 1,76 triljonit parameetrit, umbes kümme korda rohkem kui tema eelkäija GPT-3.5 ja viis korda suurem kui Google'i lipulaev PaLM 2. See tohutu skaala võimaldab GPT-4 multimodaalseid võimeid, võimaldades sellel töödelda sisendina nii teksti kui ka pilte. Selle tulemusena saab GPT-4 tõlgendada ja kirjeldada lisaks tekstile ka visuaalset teavet, nagu diagrammid ja ekraanipildid. Selle multimodaalne olemus annab inimesele sarnasema arusaamise reaalsetest andmetest.

Teaduslikes võrdlusalustes ületab GPT-4 erinevates katsetes oluliselt teisi kaasaegseid mudeleid. Kuigi võrdlusnäitajad üksi ei näita täielikult mudeli tugevusi, on tegelikud kasutusjuhtumid näidanud, et GPT-4 on erakordselt osav praktiliste probleemide intuitiivseks lahendamiseks. GPT-4 arve on praegu 20 dollarit kuus ja juurdepääsetav ChatGPT Plusi plaani kaudu.

2. Anthropic's Claude 2

Pildi krediit: Antroopne

Kuigi Anthropic AI poolt välja töötatud Claude 2 pole nii populaarne kui GPT-4, suudab see mitmes valdkonnas vastata GPT -4 tehnilistele kriteeriumidele ja tegelikule jõudlusele. Mõnes standardkatses, sealhulgas valitud eksamites, ületab Claude 2 GPT-4. Tehisintellekti keelemudelil on ka tohutult parem kontekstiaken umbes 100 000 märgiga võrreldes GPT -4 8k ja 32k märgimudelitega. Kuigi konteksti suurem pikkus ei tähenda alati paremat jõudlust, pakub Claude 2 laiendatud võimsus selgeid eeliseid, näiteks tervete 75 000-sõnaliste raamatute analüüsimiseks seedimine.

Üldise jõudluse poolest on GPT-4 parem, kuid meie ettevõttesisesed testid näitavad, et Claude 2 ületab selle mitmes loovkirjutamise ülesandes. Claude 2 järgib meie hinnangute põhjal ka GPT-4 programmeerimis- ja matemaatikaoskusi, kuid annab suurepäraselt inimlikke ja loomingulisi vastuseid. Kui palusime kõigil selles loendis olevatel mudelitel loovteost kirjutada või ümber kirjutada, valisime kuuel korral kümnest Claude 2 tulemuse selle loomulikku inimlikkust meenutavate tulemuste tõttu. Praegu Claude 2 on tasuta saadaval Claude AI vestlusroti kaudu. Lisafunktsioonidele juurdepääsuks on ka 20-dollarine tasuline plaan.

Vaatamata väiksemale rahalisele toetusele kui hiiglastel, nagu OpenAI ja Microsoft, on Anthropicu Claude 2 AI-mudel populaarsete GPT mudelite ja Google'i PaLM-seeria ees oma. Vähemate ressurssidega tehisintellekti jaoks on Claude 2 muljetavaldavalt konkurentsivõimeline. Kui olla sunnitud panustama sellele, millisel olemasoleval mudelil on lähitulevikus parim võimalus GPT-ga konkureerida, tundub Claude 2 kõige turvalisem panus. Ehkki Claude 2 on rahastamise poolest alla jäänud, viitab Claude 2 täiustatud võimalustele isegi hästi rahastatud behemotid (kuigi väärib märkimist, et Google on andnud mitme suure panuse Antroopne). Mudel ületab oma kaaluklassi ja näitab paljulubavust esilekerkiva väljakutsujana.

3. OpenAI GPT-3.5

Pildi krediit: Marcelo Mollaretti/Shutterstock

Kuigi GPT-4 väljaandmine varjutab, ei tohiks GPT-3.5 ja selle 175 miljardit parameetrit alahinnata. Iteratiivse peenhäälestamise ja jõudlusele, täpsusele ja ohutusele keskendunud versiooniuuenduste kaudu on GPT-3.5 jõudnud algsest GPT-3 mudelist kaugele. Kuigi sellel puuduvad GPT-4 multimodaalsed võimalused ja see jääb konteksti pikkuse ja parameetrite arvu poolest maha, GPT-3.5 on endiselt väga võimekas, GPT-4 on ainus mudel, mis suudab ületada oma kõikehõlmavat jõudlust otsustavalt.

Hoolimata sellest, et GPT-3.5 on GPT-perekonnas teise järgu mudel, suudab see püsida ja isegi ületada Google'i ja Meta lipulaevade mudeleid mitmes võrdlusaluses. Matemaatika- ja programmeerimisoskuste kõrvuti testides Google'i PaLM 2-ga ei olnud erinevused suured, GPT-3.5-l oli mõnel juhul isegi väike eelis. Loovamad ülesanded, nagu huumor ja jutustuste kirjutamine, aitasid GPT-3.5 otsustavalt edasi liikuda.

Ehkki GPT-4 tähistab AI-s uut verstaposti, jääb GPT-3.5 muljetavaldavalt võimsaks mudeliks, mis suudab konkureerida ja mõnikord ületada isegi kõige arenenumad alternatiivid. Selle jätkuv viimistlemine tagab, et see jääb asjakohaseks isegi koos säravamate järgmise põlvkonna mudelitega.

4. Google'i PaLM 2

Pildi krediit: Google

Tehisintellekti mudeli võimaluste hindamisel on tõestatud valem lugeda tehnilist aruannet ja kontrollige võrdlusaluste tulemusi, kuid võtke kõike, mida õppisite, kergelt soolaga ja testige mudelit ise. Nii vastuoluline kui see ka ei tundu, ei ole võrdlusuuringu tulemused mõne AI mudeli puhul alati vastavuses reaalse jõudlusega. Paberil pidi Google'i PaLM 2 olema GPT-4 tapja ning ametlikud testitulemused viitavad sellele, et see ühtib mõnes võrdlusaluses GPT-4-ga. Igapäevasel kasutamisel avaneb aga hoopis teine ​​pilt.

Loogilises mõtlemises, matemaatikas ja loovuses jääb PaLM 2 alla GPT-4-le. Samuti jääb see Anthropic's Claude'ist maha paljudes loomingulistes kirjutamisülesannetes. Kuigi see ei suuda oma arveldust GPT-4 tapjana täita, Google'i PaLM 2 on endiselt võimas keelemudel omaette, tohutute võimalustega. Suur osa negatiivsetest emotsioonidest tuleneb pigem võrdlustest mudelitega nagu GPT-4, mitte aga otseselt kehvast jõudlusest.

340 miljardi parameetriga PaLM 2 kuulub maailma suurimate mudelite hulka. See sobib eriti hästi mitmekeelsete ülesannete lahendamiseks ning omab tugevaid matemaatika- ja programmeerimisoskusi. Kuigi PaLM 2 pole selles kõige parem, on see üsna tõhus ka loominguliste ülesannete, näiteks kirjutamise jaoks. Ehkki võrdlusnäitajad andsid optimistliku pildi, mis ei realiseerunud täielikult, näitab PaLM 2 siiski muljetavaldavaid tehisintellekti oskusi, isegi kui see ei ületa kõiki konkurente.

5. TII Falcon-180B

Kui te pole AI keelemudelite väljalaske kiire tempoga sammu pidanud, pole te tõenäoliselt kunagi Falcon-180B-d kohanud. AÜE Tehnoloogiainnovatsiooni Instituudi poolt välja töötatud 180 miljardi parameeter Falcon-180 on üks võimsamaid. avatud lähtekoodiga keelemudelid, isegi kui sellel puudub GPT mudelite nimetuvastus või Meta laialdane kasutamine Laama 2. Kuid ärge tehke viga – Falcon-180B talub oma klassi parimate õlavarreteni.

Võrdlustulemused näitavad, et Falcon-180B ületab enamiku avatud lähtekoodiga mudeleid ja konkureerib selliste kommertsjuggernautidega nagu PaLM 2 ja GPT-3.5. Matemaatika-, kodeerimis-, arutlus- ja loova kirjutamise ülesannete testimisel ületas see isegi GPT-3.5 ja PaLM 2. korda. GPT-4, GPT-3.5 ja Falcon-180B järjestamisel asetaksime Falcon-180B mitmel kasutusjuhtumil tugevate külgede järgi GPT-4 ja GPT-3.5 vahele.

Kuigi me ei saa kindlalt väita, et see on üldise jõudluse poolest parem kui GPT-3.5, teeb see enda jaoks tõeliseks. Kuigi see mudel on ebaselge, väärib see tähelepanu paremini tuntud alternatiivide sobitamise või nende võimekuse ületamise eest. Saate proovida Falcon-180B mudelit Kallistav nägu (avatud lähtekoodiga LLM-platvorm).

Llama 2, Meta AI 70 miljardi parameetriga suur keelemudel, põhineb oma eelkäijal Llama 1. Kuigi Llama 2 on juhtivatest mudelitest väiksem, edestab see märkimisväärselt enamikku avalikult saadaolevaid avatud lähtekoodiga LLM-e võrdlusaluste ja reaalse kasutuse osas. Erandiks oleks Falcon-180B.

Testisime Llama 2 GPT-4, GPT-3.5, Claude 2 ja PaLM 2 vastu, et hinnata selle võimalusi. Pole üllatav, et GPT-4 edestas Llama 2 peaaegu kõigis parameetrites. Siiski hoidis Llama 2 GPT-3.5 ja PaLM 2 vastu mitmes hinnangus. Kuigi oleks ebatäpne väita, et Llama 2 on PaLM 2-st parem, lahendas Llama 2 palju probleeme, mis PaLM 2 häirisid, sealhulgas kodeerimisülesanded. Claude 2 ja GPT-3.5 ületasid mõnes valdkonnas Llama 2, kuid olid otsustavalt paremad vaid piiratud arvu ülesannete puhul.

Seega, kuigi see ei ületa suurimate patenteeritud mudelite võimalusi, avatud lähtekoodiga Llama 2 lööb oma kaaluklassist kõrgemale. Avatud mudeli puhul näitab see muljetavaldavat jõudlust, konkureerides valitud hinnangutes tehisintellekti hiiglastega, nagu PaLM 2. Llama 2 annab ülevaate avatud lähtekoodiga keelemudelite tulevikupotentsiaalist.

AI-mudelite jõudluse erinevus väheneb

Kuigi tehisintellekti maastik areneb kiires tempos, on OpenAI GPT-4 endiselt paki liider. Kuigi GPT-4 on mastaabis ja jõudluses võrreldamatu, näitavad sellised mudelid nagu Claude 2, et piisava oskusega suudavad väiksemad mudelid teatud aladel konkureerida. Vaatamata sellele, et Google'i PaLM 2 ei vasta mõnedele kõrgetele ootustele, on sellel siiski sügavad võimalused. Ja Falcon-180B tõestab, et avatud lähtekoodiga algatused suudavad tööstuse titaanidega õlg-õla kõrval seista, kui neile antakse piisavalt ressursse.