Bard vs. ChatGPT vs. Võrguühenduseta Alpaca: milline on parim LLM?

Suuri keelemudeleid (LLM-e) on igasuguse kuju ja suurusega ning need aitavad teid mis tahes viisil, mis teie arvates sobib. Aga milline on parim? Panime proovile Alphabeti, OpenAI ja Meta domineerivad AI-d.

Mida peate AI vestlusrobotite kohta teadma

Üldine tehisintellekt on olnud arvutiteadlaste eesmärk aastakümneid ning tehisintellekt on olnud ulmekirjanike ja filmitegijate tugisammas veelgi kauem.

AGI-l on inimese kognitiivsete võimetega sarnane intelligentsus ja Turingi test— test masina võimele näidata üles intelligentset käitumist, mis on inimese omast eristamatu — püsis seitsme aastakümne jooksul alates selle esmakordsest väljatöötamisest peaaegu vaidlustamata.

Äärmiselt suuremahulise andmetöötluse, tohutute rahahulkade ja hämmastava teabemahu hiljutine lähenemine avatud Internetis saadaval olev tehnoloogia võimaldas tehnoloogiahiiglastel treenida mudeleid, mis suudavad ennustada järgmist sõnaosa või märgi märgid.

Kirjutamise ajal mõlemad Google'i Bard ja OpenAI ChatGPT on nende veebiliideste kaudu kasutamiseks ja testimiseks saadaval.

instagram viewer

Meta keelemudel LLaMa pole veebis saadaval, kuid saate hõlpsalt laadige alla ja käivitage LLaMa oma riistvaras ja kasutage seda käsurea kaudu või käivitage Dalai oma masinas— üks mitmest kasutajasõbraliku liidesega rakendusest.

Testi läbiviimiseks kasutame Stanfordi ülikooli mudelit Alpaca 7B – LLaMa kohandamist – ning võrdleme seda Bardi ja ChatGPT-ga.

Järgmised võrdlused ja testid ei ole ammendavad, vaid annavad teile ülevaate põhipunktidest ja võimalustest.

Millist suure keele mudelit on kõige lihtsam kasutada?

Nii Bard kui ka ChatGPT nõuavad teenuse kasutamiseks kontot. Nii Google'i kui ka OpenAI kontode loomine on lihtne ja tasuta ning saate kohe hakata küsimusi esitama.

LLaMa kohalikuks käitamiseks peab teil olema aga eriteadmisi või oskust õpetust järgida. Samuti vajate märkimisväärsel hulgal salvestusruumi.

Milline on kõige privaatsem suure keele mudel?

Nii Bardil kui ka ChatGPT-l on ulatuslikud privaatsuspoliitikad ja Google rõhutab seda oma dokumentides korduvalt et te "ei tohi lisada teavet, mida saab kasutada teie või teiste teie Bardis tuvastamiseks vestlused."

Vaikimisi kogub Google teie vestlusi ja teie üldist asukohta teie IP-aadressi, teie tagasiside ja kasutusteabe põhjal. Seda teavet säilitatakse teie Google'i kontol kuni 18 kuud. Kuigi saate oma Bardi tegevuse salvestamise peatada, peaksite teadma, et "oma toodete kvaliteedi parandamiseks ja täiustamiseks loevad ülevaatajad teie Bardi vestlusi, lisavad neile märkusi ja töötlevad neid."

Standardile kehtib ka Bardi kasutamine Google'i privaatsuspoliitika.

OpenAI privaatsuspoliitika on üldjoontes sarnane ja kogub IP-aadressi ja kasutusandmeid. Vastupidiselt Google'i ajaliselt piiratud säilitamisele säilitab OpenAI teie isikuandmeid ainult nii kaua, kui vajame oma teabe edastamiseks. Teenuse osutamine teile või muudel seaduslikel ärieesmärkidel, nagu vaidluste lahendamine, ohutus- ja turvakaalutlused või meie õigusnormide järgimine kohustused."

Seevastu teie enda masinas olev kohalik mudel ei vaja kontot ega jaga kasutajaandmeid kellegagi.

Millisel LLM-il on parimad üldteadmised?

Testimaks, millisel LLM-il on parimad üldteadmised, esitasime kolm küsimust.

Esimene küsimus: "Millise riigi lipul on viis külge?" õigesti vastas Bard, kes tuvastas, et Nepali riigilipul on viis külge.

ChatGPT väitis enesekindlalt, et "ei ole ühtegi riigilippu, millel oleks viis külge. Riigilipud on tavaliselt ristküliku- või ruudukujulised, mida iseloomustavad nende erinevad värvid, mustrid ja sümbolid.

Meie kohalik mudel jõudis lähedale, öeldes, et "India riigilipul on viis külge ja see kujundati 1916. aastal Indiat esindama. Iseseisvusliikumine." Kuigi see lipp oli olemas ja sellel oli viis külge, oli see India koduriigi liikumise lipp, mitte rahvuslipp.

Ükski meie mudel ei suutnud vastata, et õige termin hernekujulise objekti jaoks on "pisiform" ja ChatGPT töötab niipalju, et oletada, et hernestel on "kolmemõõtmeline geomeetriline kuju, mis on täiesti ümmargune ja sümmeetriline."

Kõik kolm vestlusbotti tuvastasid Franco Malerba õigesti Itaalia astronaudina ja astronaudina Euroopa Parlament, kus Bard andis vastuse, mis on sõnastatud identselt Malerba Wikipedia osaga sisenemine.

Milline LLM sobib tehniliste juhiste jaoks?

Kui teil on tehnilisi probleeme, võib teil tekkida kiusatus pöörduda abi saamiseks vestlusroti poole. Kuigi tehnoloogia areneb, jäävad mõned asjad samaks. BS 1363 elektripistikut on Suurbritannias, Iirimaal ja paljudes teistes riikides kasutatud alates 1947. aastast. Küsisime keelemudelitelt, kuidas seda õigesti ühendada.

Pistiku külge kinnitatavatel kaablitel on pingestatud juhe (pruun), maandusjuhe (kollane/roheline) ja nulljuhe (sinine). Need tuleb ühendada õigete klemmidega pistiku korpuses.

Meie Dalai teostus tuvastas õigesti, et pistik on "inglise stiilis", kaldus siis kursist kõrvale ja andis selle asemel juhised vanema ümmarguse kontaktiga BS 546 pistiku jaoks koos vanemate juhtmestiku värvidega.

ChatGPT oli veidi kasulikum. See märgistas õigesti juhtmestiku värvid ja andis materjalide loendi ja kaheksa juhise komplekti. ChatGPT soovitas ka panna pruuni juhtme klemmiga, millel on silt "L", ja sinise juhtme "N" klemm ja kollane juhe "E." See oleks õige, kui BS1363 klemmid oleksid märgistatud, kuid need ei ole.

Bard tuvastas juhtmete õiged värvid ja andis meile korralduse ühendada need Live, Neutral ja Earth klemmidega. See ei andnud juhiseid nende tuvastamiseks.

Meie arvates. ükski vestlusrobot ei andnud piisavalt juhiseid, et aidata kellelgi BS 1363 elektripistikut õigesti ühendada. Lühike ja õige vastus oleks: "Vasakul sinine, paremal pruun."

Milline LLM sobib koodi kirjutamiseks?

Python on kasulik programmeerimiskeel mis töötab enamikel kaasaegsetel platvormidel. Me juhendasime oma mudeleid kasutama Pythonit ja "Ehitage põhiline kalkulaatorprogramm, mis suudab sooritada aritmeetilisi toiminguid, nagu liitmine, lahutamine, korrutamine ja jagamine. See peaks võtma kasutaja sisendi ja kuvama tulemuse." See on üks parimad programmeerimisprojektid algajatele.

Kuigi nii Bard kui ka ChatGPT tagastasid koheselt kasutatava ja põhjalikult kommenteeritud koodi, mida saime testida ja kontrollida, ei tööta ükski meie kohaliku mudeli kood.

Milline LLM räägib parimaid nalju?

Huumor on üks inimeseks olemise põhialuseid ja kindlasti üks parimaid viise inimese ja masina eristamiseks. Andsime igale oma modellile lihtsa juhise: "Loo originaalne ja naljakas nali."

Kõikjal koomikute ja laiemalt inimkonna õnneks ei suutnud ükski modellidest originaalset nalja tekitada.

Bard avaldas klassika: "Miks võitis hernehirmutis auhinna? Ta oli omal alal silmapaistev."

Nii meie kohalik rakendus kui ka ChatGPT pakkusid oigamist väärivat küsimust: "Miks teadlased ei usalda aatomeid? Sest nad moodustavad kõik!"

Tuletatud, kuid originaalne nali oleks: "Kuidas on suured keelemudelid nagu aatomid? Mõlemad mõtlevad asjad välja!"

Lugege seda kõigepealt siit, inimesed.

Ükski vestlusbot pole täiuslik

Leidsime, et kuigi kõigil kolmel suurel keelemudelil on oma eelised ja puudused, ei saa ükski neist asendada inimese tegelikku asjatundlikkust eriteadmistega.

Kuigi nii Bard kui ka ChatGPT andsid meie kodeerimisküsimusele paremaid vastuseid ja neid on väga lihtne kasutada, suure keelemudeli lokaalne kasutamine tähendab, et te ei pea muretsema privaatsuse ega tsensuur.

Kui soovite luua suurepärast AI-kunsti, muretsemata, et keegi vaatab üle teie õla, on lihtne käivitada ka kohalikus masinas tehisintellekti kunstimudel.

About Technology - denizatm.com

Bard vs. ChatGPT vs. Võrguühenduseta Alpaca: milline on parim LLM?

Mida peate AI vestlusrobotite kohta teadma

Millist suure keele mudelit on kõige lihtsam kasutada?

Milline on kõige privaatsem suure keele mudel?

Millisel LLM-il on parimad üldteadmised?

Milline LLM sobib tehniliste juhiste jaoks?

Milline LLM sobib koodi kirjutamiseks?

Milline LLM räägib parimaid nalju?

Ükski vestlusbot pole täiuslik

Kategooriad

Recent Post

USA-s asuv nõudmistega arst avab meditsiinilise konsultatsiooniteenuse hinnaga 40 USD / 15 minutit

Square - masside mobiilse krediitkaardi töötlemine

Säästke aega hommikul, saates automatiseeritud ilmateate SMS-teateid