På et høyt nivå er ChatGPT en dyp læringsmodell som bruker et nevralt nettverk for å generere menneskelignende tekst. Den spesifikke versjonen av modellen, ChatGPT-3, er basert på en teknikk som kalles transformatorarkitektur. Denne typen arkitektur lar modellen gjenkjenne mønstre og strukturer i språket. Den gjør dette ved å behandle en sekvens av tokens og generere en utdatasekvens.
Modellen tok inn et massivt datasett med tekst, inkludert bøker, artikler, nettsteder og mer. I løpet av opplæringsprosessen tok modellen inn millioner av eksempler på tekst og ba om å forutsi neste ord i hver sekvens.
Måten å samhandle med ChatGPT på er å gi en forespørsel eller et spørsmål. Deretter genererer modellen en respons basert på mønstrene den har lært fra treningsdataene. Resultatet er et svært intelligent verktøy for naturlig språkbehandling (NLP).
Hva betyr GPT (Generative Pre-trained Transformer)?
«Generativ» i GPT representerer dens evne til å generere naturlig menneskelig tekst. «Pre-trained» representerer det faktum at modellen allerede er trent på et begrenset datasett. «Transformer», derimot, representerer den underliggende maskinlæringsarkitekturen som driver GPT.
Hva er årsakene til å bruke ChatGPT?
Som en språkmodell trent av OpenAI , har ChatGPT et bredt spekter av muligheter og kan utføre mange forskjellige oppgaver. Her er noen av tingene som ChatGPT kan gjøre:
- Svar på spørsmål: ChatGPT kan svare på spørsmål på naturlig språk, og gi informasjon om et bredt spekter av emner.
- Generer tekst: Den kan generere menneskelignende tekst i en rekke stiler og toner, noe som gjør den nyttig for innholdsoppretting og tekstgenerering.
- Oppsummer tekst: ChatGPT kan gi en kortfattet oversikt over lange artikler eller dokumenter, noe som gjør det enkelt å raskt forstå hovedideene.
- Oversett tekst: Den har muligheten til å oversette tekst fra ett språk til et annet, noe som gjør det nyttig for å kommunisere med folk som snakker forskjellige språk.
- Generer poesi: ChatGPT kan lage originale dikt i en rekke stiler, og gi inspirasjon og eksempler for poeter og forfattere.
- Gi tilbakemelding: ChatGPT analyserer skriving og gir tilbakemelding på faktorer som grammatikk, stil og tone, og hjelper forfattere med å forbedre håndverket sitt.
Hvordan trenes ChatGPT?
En dyp læringsteknikk kalt transformatorarkitektur-trent chatGPT. Den spesifikke versjonen av modellen, ChatGPT-3, tok inn et massivt datasett på over 45 terabyte med tekst.
Supervised Fine Tuning (SFT) modell
I den innledende utviklingen utviklet GPT-3-modellen seg ved å kontrahere 40 entreprenører for å produsere et overvåket opplæringsdatasett, der input har et kjent resultat som modellen kan lære. Inndata, eller spørsmål, var faktiske brukeroppføringer i Open API.
Belønningsmodell
Det neste trinnet er å bruke en belønningsmodell for å forbedre kvaliteten på de genererte svarene. Belønningsmodellen evaluerer resultatet av SFT-modellen. Deretter tildeler den en poengsum basert på hvor godt den samsvarer med ønsket utgang.
Forsterkende læringsmodell
Det siste trinnet er å bruke en forsterkende læringstilnærming for å forbedre GPTs ytelse ytterligere. Algoritmen for proksimal policyoptimalisering innebærer at AI-chatboten samhandler med brukere i et simulert miljø. Deretter mottar den et belønningssignal basert på hvor godt den presterer.
Evaluering av framføring
Innspillet fra menneskelige arbeidere trener modellen. Det er derfor kjernedelen av evalueringen lever av menneskelig tilbakemelding, noe som fører til at etikettere vurderer kvaliteten på modellutdataene.
Tre kriterier på høyt nivå evaluerer modellen:
- Hjelpsomhet : Vurdere modellens evne til å følge og utlede brukerinstruksjoner.
- Sannferdighet: På oppgaver i lukket domene, vurdere modellens tilbøyelighet til hallusinasjoner (finner opp fakta). Modellen er testet ved hjelp av TruthfulQA-datasettet.
- Harmløshet: Vurdere om modellens utdata er passende, nedvurderer en beskyttet klasse eller inneholder nedsettende innhold.
- Velg en ChatGPT API eller bibliotek : Det finnes forskjellige APIer og biblioteker tilgjengelig for bruk av ChatGPT. Velg den som best passer dine behov og programmeringsopplevelse.
- Opprett en konto og få en API-nøkkel (hvis aktuelt) : Ved bruk av en API vil det være nødvendig å opprette en konto og få en API-nøkkel for å bruke ChatGPT. Følg instruksjonene fra API-leverandøren.
- Installer nødvendige biblioteker (hvis du bruker et bibliotek) : Ved bruk av et bibliotek som Hugging Face Transformers, vil det være nødvendig å installere de nødvendige bibliotekene i programmeringsmiljøet.
- Initialiser ChatGPT : Når du har de nødvendige bibliotekene eller API-nøklene, initialiser ChatGPT-modellen i programmet.
- Skriv inn ledeteksten : For å bruke ChatGPT, er det nødvendig å gi en ledetekst som beskriver konteksten eller emnet for samtalen hvis du vil generere et svar.
- Generer svar : Når du har gitt ledeteksten, genererer ChatGPT-modellen et svar basert på inndatameldingen og konteksten til treningsdataene.
- Evaluer og avgrens responsen : Kvaliteten på den genererte responsen kan variere avhengig av inndatameldingen og andre faktorer. Sjekk svaret siden det fortsatt trenger hjelp til å skille fakta fra feilinformasjon.
- Gjenta : Gjenta trinn 5-7 så mange ganger som nødvendig for å generere en samtale eller en rekke svar som oppfyller dine behov.