OpenAI GPT mudelid on muutnud loomuliku keele töötlemise (NLP), kuid kui te ei maksa lisatasu juurdepääsu OpenAI teenustele, ei saa te nende GPT-mudeleid peenhäälestada ega integreerida rakendusi. Lisaks on OpenAI-l juurdepääs kõigile teie vestlustele, mis võib olla turvaprobleem, kui kasutate ChatGPT-d äritegevuses ja muudes tundlikumates valdkondades. Kui see teile ei meeldi, võiksite proovida GPT4Alli.

Mis siis täpselt on GPT4All? Kuidas see töötab ja miks seda kasutada ChatGPT kaudu?

Mis on GPT4All?

GPT4All on avatud lähtekoodiga ökosüsteem, mida kasutatakse LLM-ide integreerimiseks rakendustesse ilma platvormi või riistvara tellimuse eest maksmata. Selle lõi teabekartograafiaettevõte Nomic AI, mille eesmärk on parandada juurdepääsu tehisintellekti ressurssidele.

GPT4All on loodud töötama kaasaegsetes kuni suhteliselt kaasaegsetes arvutites, ilma et oleks vaja Interneti-ühendust või isegi GPU-d! See on võimalik, kuna enamik GPT4All'i pakutavaid mudeleid on kvantifitseeritud nii väikeseks kui mõne gigabaidi suurus, mis nõuab töötamiseks vaid 4–16 GB muutmälu.

instagram viewer

See võimaldab väiksematel ettevõtetel, organisatsioonidel ja sõltumatutel teadlastel kasutada ja integreerida LLM-i konkreetsete rakenduste jaoks. Kuna GPT4All on hõlpsasti installitav ühe klõpsuga installeri kaudu, saavad inimesed nüüd kasutada GPT4Alli ja paljud selle LLM-id sisu loomiseks, koodi kirjutamiseks, dokumentide ja teabe mõistmiseks kogunemine.

Miks kasutada GPT4ALL üle ChatGPT?

Pildi krediit: bruce mars/Eemaldage pritsmed

On mitu põhjust, miks võiksite kasutada rakendust GPT4All üle ChatGPT.

  • Kaasaskantavus: GPT4All-i pakutavad mudelid vajavad ainult nelja kuni kaheksa gigabaiti mäluruumi, ei vaja töötamiseks GPU-d ja neid saab GPT4All ühe klõpsuga installijaga hõlpsasti USB-mälupulgale salvestada. See muudab GPT4All ja selle mudelid tõeliselt kaasaskantavaks ja kasutatavaks peaaegu igas kaasaegses arvutis.
  • Privaatsus ja turvalisus: Nagu varem selgitatud, on OpenAI juurdepääs kõigile teie ChatGPT konversioonidele, kui teil pole juurdepääsu ChatGPT Plusile. GPT4All on keskendunud andmete läbipaistvusele ja privaatsusele; teie andmed salvestatakse ainult teie kohalikku riistvarasse, välja arvatud juhul, kui jagate neid tahtlikult ettevõttega GPT4All, et aidata nende mudeleid kasvatada.
  • Võrguühenduseta režiim: GPT on patenteeritud mudel, mis nõuab mudelile päringu või juurdepääsu saamiseks API-juurdepääsu ja pidevat Interneti-ühendust. Kui kaotate Interneti-ühenduse või teil on probleeme serveriga, pole teil juurdepääsu ChatGPT-le. GPT4All puhul see nii ei ole. Kuna kõik andmed on juba salvestatud nelja- kuni kaheksa-gigabaidisesse paketti ja järeldused tehakse kohapeal, ei vaja te GPT4All mudelitele juurdepääsuks Interneti-ühendust. Saate jätkata vestlust ja mudeli peenhäälestamist isegi ilma Interneti-ühenduseta.
  • Tasuta ja avatud lähtekoodiga: Mitmed teenuse GPT4All pakutavad LLM-id on litsentsitud GPL-2 alusel. See võimaldab igaühel oma mudeleid kommertskasutuseks täpsustada ja integreerida, ilma et oleks vaja litsentsimise eest maksta.

Kuidas GPT4All töötab

Nagu varem mainitud, on GPT4All ökosüsteem, mida kasutatakse LLM-ide koolitamiseks ja juurutamiseks teie arvutis, mis on uskumatu saavutus! Tavaliselt kulub standardse 25–30 GB LLM-i laadimiseks 32 GB muutmälu ja ettevõtteklassi GPU.

Võrdluseks vajavad GPT4Alliga kasutatavad LLM-id ainult 3–8 GB salvestusruumi ja võivad töötada 4–16 GB muutmäluga. See muudab kogu LLM-i käitamise servaseadmes võimalikuks ilma GPU-d või välist pilveabi vajamata.

Riistvaranõuded LLM-ide käitamiseks GPT4All-is on tänu närvivõrgu kvantiseerimisele oluliselt vähenenud. Vähendades täppiskaalu ja aktiveerimisi närvivõrgus, saab paljusid GPT4All pakutavaid mudeleid kasutada enamikus suhteliselt kaasaegsetes arvutites.

Mõnedes saadaolevates mudelites kasutatud koolitusandmed koguti "kuhja" kaudu, mis on lihtsalt Internetis avalikult avaldatud sisust kraabitud andmed. Seejärel saadetakse andmed Nomic AI Atlas AI andmebaasi, mida saab näha korrelatsioonide põhjal hõlpsasti nähtaval 2D vektorkaardil (tuntud ka kui AI vektorite andmebaas).

Kui Nomic AI koolitas Groovy mudelit ja kasutas avalikult kättesaadavaid andmeid, suutis Nomic AI mudeli välja anda avatud GPL-litsentsi alusel, mis võimaldab seda kõigil kasutada isegi kommertsrakendustes.

Kuidas installida GPT4All

GPT4All installimine on lihtne ja nüüd, kui GPT4All versioon 2 on välja antud, on see veelgi lihtsam! Parim viis GPT4All 2 installimiseks on alla laadida ühe klõpsuga installiprogramm:

Lae alla:GPT4Kõik Windowsi, macOS-i või Linuxi jaoks (tasuta)

Järgmised juhised on Windowsi jaoks, kuid saate installida GPT4All igasse suuremasse operatsioonisüsteemi.

Pärast allalaadimist topeltklõpsake installiprogrammil ja valige Installige. Windows Defender võib näha installi pahatahtlikuna, kuna Microsofti jaoks kolmanda osapoole rakendustele kehtivate allkirjade andmine võib võtta kaua aega. See tuleks aga peagi parandada. Kui laadisite rakenduse GPT4All ametlikult veebisaidilt alla, peaksite olema kaitstud. Kliki Installi ikkagi GPT4All installimiseks.

Pärast rakenduse avamist peate valima kasutatava mudeli. GPT4ALL pakub teile mitmeid mudeleid, millel kõigil on oma tugevad ja nõrgad küljed. Et teada saada, millist mudelit alla laadida, on siin tabel, mis näitab nende tugevaid ja nõrku külgi.

Mudel

Suurus

Märge

Parameetrid

Tüüp

Kvantimine

Hermes

7,58 GB

  • Juhendipõhine
  • Annab pikki vastuseid
  • Kureeritud 300 000 tsenseerimata juhisega
  • Ei saa kaubanduslikult kasutada

13 miljardit

LLaMA

q4_0

GPT4All Falcon

3,78 GB

  • Kiired vastused
  • Juhendipõhine
  • Litsentsitud äriliseks kasutamiseks

7 miljardit

Pistrik

q4_0

Groovy

8 GB

  • Kiired vastused
  • - Loomingulised vastused
  • Juhendipõhine
  • Litsentsitud äriliseks kasutamiseks

7 miljardit

GPT-J

q4_0

ChatGPT-3.5 Turbo

Minimaalne

  • Nõuab isiklikku API-d
  • Saadab teie vestlused OpenAI-le
  • GPT4Alli kasutatakse ainult OpenAI-ga suhtlemiseks

?

GPT

NA

ChatGPT-4

Minimaalne

  • Nõuab isiklikku API-d
  • Saadab teie vestlused OpenAI-le
  • GPT4Alli kasutatakse ainult OpenAI-ga suhtlemiseks

?

GPT

NA

Udune

7,58 GB

  • Juhendipõhine
  • Aeglasem kui Groovy, kuid kvaliteetsemate vastustega
  • Ei saa kaubanduslikult kasutada

13 miljardit

LLaMA

q4_0

MPT vestlus

4,52 GB

  • Kiired vastused
  • Vestluspõhine
  • Ei saa kaubanduslikult kasutada

7 miljardit

MPT

q4_0

Orca

3,53 GB

  • Juhendipõhine
  • Selgitab häälestatud andmekogumeid
  • Orca Research Paper andmestiku koostamise lähenemisviisid
  • Litsentsitud äriliseks kasutamiseks

7 miljardit

OpenLLaMA

q4_0

Vicuna

3,92 GB

  • Juhendipõhine
  • Ei saa kaubanduslikult kasutada

7 miljardit

LLaMA

q4_2

Nõustaja

3,92 GB

  • Juhendipõhine
  • Ei saa kaubanduslikult kasutada

7 miljardit

LLaMA

q4_2

Nõustaja tsenseerimata

7,58 GB

  • Juhendipõhine
  • Ei saa kaubanduslikult kasutada

13 miljardit

LLaMA

q4_0

Pidage meeles, et pakutavatel mudelitel on erineva tasemega piirangud. Kõiki mudeleid ei saa kaubanduslikult tasuta kasutada; mõned vajavad rohkem riistvararessursse, teised aga API-võtit. Kõige vähem piiravad GPT4All-i mudelid on Groovy, GPT4All Falcon ja Orca.

Kas saate koolitada GPT4All mudeleid?

Jah, kuid mitte kvantiseeritud versioonid. GPT4All mudelite tõhusaks viimistlemiseks peate alla laadima toormudelid ja kasutama ettevõtte tasemel GPU-sid, näiteks AMD instinktide kiirendid või NVIDIA Ampere või Hopper GPU-d. Lisaks peate mudelit koolitama AI koolitusraamistiku (nt LangChain) kaudu, mis nõuab mõningaid tehnilisi teadmisi.

GPT4All mudeli peenhäälestamiseks on vaja rahalisi ressursse ja tehnilist oskusteavet, kuid kui soovite sisestada ainult GPT4All mudeli kohandatud andmeid, saate jätkake mudeli koolitamist otsimise laiendatud genereerimise kaudu (mis aitab keelemudelil pääseda juurde teabele ja sellest aru saada väljaspool baaskoolitust ülesanded). Saate seda teha, paludes GPT4Allil enne küsimuse esitamist teie kohandatud andmed modelleerida. Kohandatud andmed tuleks salvestada kohapeal ja kui seda küsitakse, peaks mudel suutma teile anda teavet, mille te kunagi andsite.

Kas peaksite kasutama GTP4Alli?

GPT4Alli idee on pakkuda tasuta kasutatavat avatud lähtekoodiga platvormi, kus inimesed saavad oma arvutis kasutada suuri keelemudeleid. Praegu on GPT4All ja selle kvantiseeritud mudelid suurepärased katsetamiseks, õppimiseks ja erinevate LLM-ide katsetamiseks turvalises keskkonnas. Professionaalse töökoormuse jaoks soovitame siiski kasutada ChatGPT-d, kuna mudel on oluliselt võimekam.

Üldiselt pole põhjust piirduda ühega. Kuna nende kasutusjuhtumid ei kattu, peaksite proovima kasutada mõlemat.