GPT-4 on siin ja need on uued funktsioonid, mida peaksite kontrollima.

OpenAI tõi lõpuks turule oma kauaoodatud GPT värskenduse GPT-4. Large Language Model (LLM) sisaldab mõningaid võimsaid uusi funktsioone ja võimalusi, mis on kasutajaid kogu maailmas juba šokeerinud.

Lisaks sellele, et GPT-4 on märkimisväärselt parem kui GPT-3.5, suudab OpenAI viirusliku vestlusroti ChatGPT toiteallikaks olev LLM mõistab keerukamaid sisendeid, sellel on palju suurem tähemärkide limiit, sellel on multimodaalsed võimalused ja see on väidetavalt turvalisem kasutada.

1. GPT-4 saab aru keerukamatest sisenditest

Üks GPT-4 suurimaid uusi funktsioone on selle võime mõista keerukamaid ja nüansirikkamaid viipasid. Vastavalt OpenAI, GPT-4 "näitab inimtasemel jõudlust erinevatel professionaalsetel ja akadeemilistel võrdlusalustel."

Seda demonstreeris GPT-4 läbiviimine mitmete inimtaseme eksamite ja standardiseeritud testidega, nagu SAT, BAR ja GRE, ilma spetsiaalse koolituseta. GTP-4 mitte ainult ei mõistnud ja lahendas neid teste suhteliselt kõrge skooriga, vaid edestas iga kord ka oma eelkäijat GPT-3.5.

instagram viewer
Pildi krediit: OpenAI

Nüansirikkamate sisestusviipade mõistmisele aitab kaasa ka asjaolu, et GPT-4 sõnalimiit on palju suurem. Uus mudel suudab käsitleda kuni 25 000 sõna sisestusviipasid (konteksti jaoks oli GPT-3.5 piiratud 8000 sõnaga). See mõjutab otseselt üksikasju, mida kasutajad saavad oma viipadesse suruda, andes seega mudelile töötamiseks palju rohkem teavet ja andes pikemaid väljundeid.

GPT-4 toetab ka enam kui 26 keelt, sealhulgas vähese ressursiga keeli, nagu läti, kõmri ja suahiili keel. Kui võrrelda MMLU etaloniga kolme löögi täpsust, ületas GPT-4 ingliskeelse jõudluse poolest 24 keeles GPT-3.5 ja ka teisi juhtivaid LLM-e, nagu PaLM ja Chinchilla.

2. Multimodaalsed võimalused

Eelmine versioon ChatGPT piirdus ainult tekstiviipadega. Seevastu üks GPT-4 uusimaid funktsioone on selle multimodaalsed võimalused. Mudel suudab vastu võtta nii teksti- kui ka pildiviipasid.

See tähendab, et tehisintellekt võib pilti aktsepteerida sisendina ning tõlgendada ja mõista seda nagu tekstiviipa. See võimalus hõlmab igas suuruses ja tüüpi pilte ja teksti, sealhulgas neid kahte kombineerivaid dokumente, käsitsi joonistatud visandeid ja isegi ekraanipilte.

Kuid GPT-4 piltide lugemise võimalused ulatuvad kaugemale lihtsalt nende tõlgendamisest. OpenAI tutvustas seda oma arendajavoos (ülal), kus nad varustasid GPT-4-ga naljaveebisaidi käsitsi joonistatud maketi. Mudelile tehti ülesandeks kirjutada HTML- ja JavaScript-kood, et muuta makett veebisaidiks, asendades samal ajal naljad tegelike naljadega.

GPT-4 kirjutas koodi, kasutades maketis määratud paigutust. Testimisel lõi kood töötava saidi, kus, nagu võite arvata, tegelikud naljad. Kas see tähendab AI edusammud tähendavad programmeerimise lõppu? Mitte päris, kuid see on siiski funktsioon, mis on programmeerijate abistamisel kasulik.

Nii paljutõotav kui see funktsioon ka ei tundu, on see endiselt uurimistöö eelvaates ega ole avalikult saadaval. Lisaks võtab mudel visuaalsete sisendite töötlemiseks palju aega, OpenAI ise väitis, et kiiremaks muutumine võib võtta tööd ja aega.

3. Suurem juhitavus

OpenAI väidab ka, et GPT-4-l on kõrge juhitavus. Samuti on see raskendanud AI-l tegelaskuju murdmist, mis tähendab, et see ebaõnnestub väiksema tõenäosusega, kui see on rakenduses teatud tegelase mängimiseks rakendatud.

Arendajad saavad oma tehisintellekti stiili ja ülesande ette kirjutada, kirjeldades suunda "süsteemi" sõnumis. Need sõnumid võimaldavad API kasutajatel teatud piirides kasutajakogemust tugevalt kohandada. Kuna need sõnumid on ka lihtsaim viis mudeli "vanglamurdmiseks", töötavad nad ka nende turvalisemaks muutmise nimel. GPT-4 demo tõi selle punkti sisse, pannes kasutajad proovima peatada GPT-4 tegutsemist Socraticu juhendajaks ja vastama nende päringule. Modell aga keeldus iseloomu murdmast.

4. Ohutus

OpenAI veetis kuus kuud GPT-4 valmistamisel turvalisemaks ja ühtsemaks. Ettevõte väidab, et on 82% väiksem tõenäosus vastata sobimatu või muul viisil keelatud sisu päringutele ja 29% suurem tõenäosus reageerivad tundlikele päringutele vastavalt OpenAI eeskirjadele ja annavad 40% tõenäolisemalt faktilisi vastuseid võrreldes GPT-3.5.

See ei ole täiuslik ja võite siiski oodata, et see aeg-ajalt "hallutsineerib" ja võib oma ennustustes eksida. Muidugi on GPT-4-l parem taju ja ennustusjõud, kuid siiski ei tohiks tehisintellekti pimesi usaldada.

5. Toimivuse parandamine

Lisaks mudeli jõudluse hindamisele inimeste eksamitel hindas OpenAI robotit ka traditsiooniliste masinõppemudelite jaoks loodud etalonide alusel.

Ta väidab, et GPT-4 "ületab märkimisväärselt" olemasolevaid LLM-e ja "kõige tipptasemel mudeleid". Need võrdlusalused hõlmavad eelnimetatud MMLU, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval ja Drop, mis kõik testivad individuaalseid võimeid.

Sarnaseid tulemusi leiate ka akadeemilise nägemise võrdlusaluste tulemuslikkuse võrdlemisel. Käitavad testid hõlmavad VQAv2, TextVQA, ChartQA, AI2 diagrammi (AI2D), DocVQA, Infographic VQA, TVQA ja LSMDC, mis kõik on GPT-4 tipus. OpenAI on aga väitnud, et GPT-4 tulemused nendes testides "ei kajasta täielikult selle võimekuse ulatust", kuna teadlased leiavad üha uusi ja keerukamaid asju, millega mudel suudab toime tulla.

Väike samm GPT-4 jaoks, hiiglaslik hüpe AI jaoks

Suurema täpsuse, kasutusohutuse ja täiustatud võimalustega GPT-4 on avalikustatud ChatGPT+ igakuise tellimusplaani kaudu, mis maksab 20 eurot kuus. Lisaks on OpenAI teinud koostööd erinevate organisatsioonidega, et hakata GPT-4 abil tarbijatele suunatud tooteid looma. GPT-4 on oma toodetesse juba juurutanud teiste hulgas Microsoft Bing, Duolingo, Stripe, Be My Eyes ja Khan Academy.

GPT-4 võib olla GPT-3.5 järkjärguline värskendus, kuid üldiselt on see AI jaoks tohutu võit. Kuna mudel muutub API kaudu kättesaadavamaks nii tavakasutajale kui ka arendajatele, näib, et see sobib hästi LLM-i rakendamiseks erinevates valdkondades.