Saadaval on palju AI-toega vestlusroboteid, kuid mis kasutab parimat LLM-i? Siin saate võrrelda LLM-e, et välja selgitada, milline neist on parim.
Kuna veebis on saadaval mitu vestlusrobot, võib teie vajadustele vastava valimine osutuda äärmiselt keeruliseks. Ehkki saate võrrelda kahte vestlusrobotit käsitsi, võtab see palju aega ja vaeva.
Parem ja lihtsam viis on kasutada Chatbot Arena, et võrrelda erinevaid LLM-e, mis kasutavad populaarseid vestlusroboteid. See pakub paari režiimi erinevate mudelite võrdlemiseks, mida me allpool selgitame.
Mis on Chatbot Arena?
LMSYS Orgi loodud Chatbot Arena on platvorm erinevate LLM-ide võrdlemiseks. See kasutab erinevate mudelite järjestamiseks Elo reitingusüsteemi.
Chatbot Arena pakub kasutajatele paar võimalust LLM-ide võrdlemiseks ja hindamiseks. Saadud tagasiside põhjal järjestab Chatbot Arena erinevad LLM-id avalikus edetabelis. Projekti sponsoreerib HuggingFace, avatud lähtekoodiga alternatiiv ChatGPT-le.
Kuidas võrrelda anonüümseid LLM-e Chatbot Arenaga
Chatbot Arena lahingurežiim võimaldab teil LLM-e anonüümselt võrrelda. Näiteks võite võrrelge ChatGPT-d (GPT 3.5) ja Claude'i. See tähendab, et Chatbot Arena valib ise suvalised kaks keelemudelit ja laseb nende nimesid avaldamata võrrelda.
Esimesele viipale sisenedes hangib Chatbot Arena vastused mõlemalt mudelilt, esitades need kõrvuti. Platvorm võimaldab teil genereerida vastuseid (mõlema LLM-i jaoks) ja kustutada ajalugu, et alustada teistsugust vestlust. Saate jätkata küsimuste esitamist, kuni olete valinud selge võitja.
Seejärel saate valida, kas mudel A on parem või B. Võitja valimisel avaldab Chatbot Arena mõlema roboti nimed. See režiim töötab suurepäraselt, kuna teie otsust ei mõjuta teie eelnev ettekujutus mudelitest ega populaarsus. Chatbot Arena võimaldab teil reguleerida ka selliseid parameetreid nagu temperatuur, Top P ja max väljundmärgid.
Kuidas võrrelda valitud LLM-e Chatbot Arenaga
Kui soovite võrrelda kahte konkreetset LLM-i, võite lülituda Chatbot Arena kõrvutirežiimile. Peale selle, et saate LLM-e ise valida, töötab see režiim peaaegu samamoodi nagu lahingurežiim. Saate kohandada parameetreid, genereerida vastuseid uuesti, kustutada ajalugu ja valida lõpuks võitja.
Selles režiimis saadaolevate LLM-ide arv on aga piiratud. Saate valida Llama 2, Vicuna ja ChatGLM erinevaid versioone. Kuigi populaarsed LLM-id, nagu GPT-4, GPT-3.5, Claude 1, Claude 2 jne, pole praegu selles režiimis saadaval, plaanib Chatbot Arena need lisada.
Võrrelge Chatbot Arena kasutavaid LLM-e
Ükskõik, kas otsite oma vajadustele sobivat vestlusrobotit või soovite lihtsalt testida erinevaid LLM-e, on Chatbot Arena suurepärane platvorm.
See pakub lihtsustatud viisi erinevate keelemudelite kõrvuti võrdlemiseks. Ja kuna see haldab kasutajate tagasiside põhjal edetabelit, saate otse vaadata erinevate mudelite edetabelit ilma ise teste tegemata.