Hvordan fungerer ChatGPT?

En visuell representasjon av ChatGPTs arkitektur, med transformatormodellen som muliggjør språkforståelse og generasjonsevner

På et høyt nivå er ChatGPT en dyp læringsmodell som bruker et nevralt nettverk for å generere menneskelignende tekst. Den spesifikke versjonen av modellen, ChatGPT-3, er basert på en teknikk som kalles transformatorarkitektur. Denne typen arkitektur lar modellen gjenkjenne mønstre og strukturer i språket. Den gjør dette ved å behandle en sekvens av tokens og generere en utdatasekvens.

Modellen tok inn et massivt datasett med tekst, inkludert bøker, artikler, nettsteder og mer. I løpet av opplæringsprosessen tok modellen inn millioner av eksempler på tekst og ba om å forutsi neste ord i hver sekvens.

Måten å samhandle med ChatGPT på er å gi en forespørsel eller et spørsmål. Deretter genererer modellen en respons basert på mønstrene den har lært fra treningsdataene. Resultatet er et svært intelligent verktøy for naturlig språkbehandling (NLP).

Hva betyr GPT (Generative Pre-trained Transformer)?

«Generativ» i GPT representerer dens evne til å generere naturlig menneskelig tekst. «Pre-trained» representerer det faktum at modellen allerede er trent på et begrenset datasett. «Transformer», derimot, representerer den underliggende maskinlæringsarkitekturen som driver GPT.

Hva er årsakene til å bruke ChatGPT?

Som en språkmodell trent av OpenAI , har ChatGPT et bredt spekter av muligheter og kan utføre mange forskjellige oppgaver. Her er noen av tingene som ChatGPT kan gjøre:

  1. Svar på spørsmål: ChatGPT kan svare på spørsmål på naturlig språk, og gi informasjon om et bredt spekter av emner.
  2. Generer tekst: Den kan generere menneskelignende tekst i en rekke stiler og toner, noe som gjør den nyttig for innholdsoppretting og tekstgenerering.
  3. Oppsummer tekst: ChatGPT kan gi en kortfattet oversikt over lange artikler eller dokumenter, noe som gjør det enkelt å raskt forstå hovedideene.
  4. Oversett tekst: Den har muligheten til å oversette tekst fra ett språk til et annet, noe som gjør det nyttig for å kommunisere med folk som snakker forskjellige språk.
  5. Generer poesi: ChatGPT kan lage originale dikt i en rekke stiler, og gi inspirasjon og eksempler for poeter og forfattere.
  6. Gi tilbakemelding: ChatGPT analyserer skriving og gir tilbakemelding på faktorer som grammatikk, stil og tone, og hjelper forfattere med å forbedre håndverket sitt.

Hvordan trenes ChatGPT?

En dyp læringsteknikk kalt transformatorarkitektur-trent chatGPT. Den spesifikke versjonen av modellen, ChatGPT-3, tok inn et massivt datasett på over 45 terabyte med tekst.

Supervised Fine Tuning (SFT) modell

I den innledende utviklingen utviklet GPT-3-modellen seg ved å kontrahere 40 entreprenører for å produsere et overvåket opplæringsdatasett, der input har et kjent resultat som modellen kan lære. Inndata, eller spørsmål, var faktiske brukeroppføringer i Open API.

Belønningsmodell

Det neste trinnet er å bruke en belønningsmodell for å forbedre kvaliteten på de genererte svarene. Belønningsmodellen evaluerer resultatet av SFT-modellen. Deretter tildeler den en poengsum basert på hvor godt den samsvarer med ønsket utgang.

Forsterkende læringsmodell

Det siste trinnet er å bruke en forsterkende læringstilnærming for å forbedre GPTs ytelse ytterligere. Algoritmen for proksimal policyoptimalisering innebærer at AI-chatboten samhandler med brukere i et simulert miljø. Deretter mottar den et belønningssignal basert på hvor godt den presterer.

Evaluering av framføring

Innspillet fra menneskelige arbeidere trener modellen. Det er derfor kjernedelen av evalueringen lever av menneskelig tilbakemelding, noe som fører til at etikettere vurderer kvaliteten på modellutdataene.

Tre kriterier på høyt nivå evaluerer modellen:

  • Hjelpsomhet : Vurdere modellens evne til å følge og utlede brukerinstruksjoner.
  • Sannferdighet: På oppgaver i lukket domene, vurdere modellens tilbøyelighet til hallusinasjoner (finner opp fakta). Modellen er testet ved hjelp av TruthfulQA-datasettet.
  • Harmløshet: Vurdere om modellens utdata er passende, nedvurderer en beskyttet klasse eller inneholder nedsettende innhold.

Hvordan bruke ChatGPT?

  1. Velg en ChatGPT API eller bibliotek : Det finnes forskjellige APIer og biblioteker tilgjengelig for bruk av ChatGPT. Velg den som best passer dine behov og programmeringsopplevelse.
  2. Opprett en konto og få en API-nøkkel (hvis aktuelt) : Ved bruk av en API vil det være nødvendig å opprette en konto og få en API-nøkkel for å bruke ChatGPT. Følg instruksjonene fra API-leverandøren.
  3. Installer nødvendige biblioteker (hvis du bruker et bibliotek) : Ved bruk av et bibliotek som Hugging Face Transformers, vil det være nødvendig å installere de nødvendige bibliotekene i programmeringsmiljøet.
  4. Initialiser ChatGPT : Når du har de nødvendige bibliotekene eller API-nøklene, initialiser ChatGPT-modellen i programmet.
  5. Skriv inn ledeteksten : For å bruke ChatGPT, er det nødvendig å gi en ledetekst som beskriver konteksten eller emnet for samtalen hvis du vil generere et svar.
  6. Generer svar : Når du har gitt ledeteksten, genererer ChatGPT-modellen et svar basert på inndatameldingen og konteksten til treningsdataene.
  7. Evaluer og avgrens responsen : Kvaliteten på den genererte responsen kan variere avhengig av inndatameldingen og andre faktorer. Sjekk svaret siden det fortsatt trenger hjelp til å skille fakta fra feilinformasjon.
  8. Gjenta : Gjenta trinn 5-7 så mange ganger som nødvendig for å generere en samtale eller en rekke svar som oppfyller dine behov.

ofte stilte spørsmål

Hva er OpenAI?

OpenAI er et nonprofit forskningsselskap som har som mål å utvikle og styre kunstig intelligens (AI) på måter som gagner menneskeheten som helhet. Selskapet ble grunnlagt av Elon Musk og Sam Altman i 2015 og har hovedkontor i San Francisco, California, og støttet av milliarder i finansiering fra Microsoft.

Hva er ChatGPT?

ChatGPT er et AI-verktøy av OpenAIs nyeste språkmodell, og det representerer en betydelig forbedring i forhold til GPT-3.5. Som mange store språkmodeller genererer den tekst i en rekke stiler og for en rekke formål, men med langt større presisjon, detaljer og sammenheng. Det er neste generasjon i OpenAIs serie av store språkmodeller, med stor vekt på interaktive samtaler. ChatGPT er det siste trinnet i OpenAIs iterative distribusjon av stadig sikrere og nyttige generative AI-systemer.

Del innlegget:

State of the art AI

Kom i gang med Eskritor nå!

relaterte artikler

Et bilde av en dataskjerm som viser en samtale med GPT-3, overlagt med diagrammer som illustrerer AIs språkbehandlingstrinn
Eskritor

Hvordan fungerer GPT-3?

Trinnene nedenfor forklarer hvordan GPT-3 fungerer for å generere svar: Hvorfor er GPT-3 nyttig? Her er en liste over grunner til at GPT-3 er nyttig: Hva er historien til GPT-3?

Et visuelt diagram som viser data relatert til AIs innvirkning på arbeidsmarkedet for innholdsforfattere
Eskritor

Vil AI erstatte innholdsforfattere?

Ja, AI-forfattere kan erstatte noen forfattere, men de kan aldri erstatte gode forfattere. Det vil erstatte visse typer skrivejobber. AI-innholdsgeneratorer kan generere grunnleggende innhold som ikke krever original forskning eller

En visuell representasjon av ChatGPTs arkitektur, med transformatormodellen som muliggjør språkforståelse og generasjonsevner
Eskritor

Hvordan fungerer ChatGPT?

På et høyt nivå er ChatGPT en dyp læringsmodell som bruker et nevralt nettverk for å generere menneskelignende tekst. Den spesifikke versjonen av modellen, ChatGPT-3, er basert på en teknikk