På et højt niveau er ChatGPT en deep learning-model, der bruger et neuralt netværk til at generere menneskelignende tekst. Den specifikke version af modellen, ChatGPT-3, er baseret på en teknik, der kaldes transformerarkitektur. Denne type arkitektur gør det muligt for modellen at genkende mønstre og strukturer i sproget. Det gør den ved at behandle en sekvens af tokens og generere en outputsekvens.
Modellen indgik et massivt datasæt af tekst, herunder bøger, artikler, websteder og meget mere. I løbet af træningsprocessen modtog modellen millioner af eksempler på tekst og blev bedt om at forudsige det næste ord i hver sekvens.
Måden, man interagerer med ChatGPT på, er ved at stille en prompt eller et spørgsmål. Derefter genererer modellen et svar baseret på de mønstre, den har lært fra træningsdataene. Resultatet er et meget intelligent værktøj til behandling af naturligt sprog (NLP).
Hvad betyder GPT (Generative Pre-trained Transformer)?
“Generativ” i GPT repræsenterer dens evne til at generere naturlig menneskesproglig tekst. “Pre-trained” betyder, at modellen allerede er blevet trænet på et begrænset datasæt. “Transformer”, på den anden side, repræsenterer den underliggende maskinlæringsarkitektur, der driver GPT.
Hvad er grundene til at bruge ChatGPT?
Som en sprogmodel, der er trænet af OpenAI , har ChatGPT en bred vifte af muligheder og kan udføre mange forskellige opgaver. Her er nogle af de ting, som ChatGPT kan gøre:
- Svar på spørgsmål: ChatGPT kan svare på spørgsmål i naturligt sprog og give oplysninger om en lang række forskellige emner.
- Generer tekst: Det kan generere menneskelignende tekst i en række forskellige stilarter og toner, hvilket gør det nyttigt til indholdsoprettelse og tekstgenerering.
- Sammenfatning af teksten: ChatGPT kan give et kortfattet overblik over lange artikler eller dokumenter, så det er nemt at forstå hovedidéerne hurtigt.
- Oversæt tekst: Den har evnen til at oversætte tekst fra et sprog til et andet, hvilket gør den nyttig til at kommunikere med folk, der taler forskellige sprog.
- Skab poesi: ChatGPT kan skabe originale digte i en række forskellige stilarter og give inspiration og eksempler til digtere og forfattere.
- Giv feedback på det, du skriver: ChatGPT analyserer tekster og giver feedback på faktorer som grammatik, stil og tone, hvilket hjælper skribenter med at forbedre deres håndværk.
Hvordan er ChatGPT uddannet?
En dyb indlæringsteknik kaldet transformerarkitektur trænede chatGPT. Den specifikke version af modellen, ChatGPT-3, indhentede et massivt datasæt på over 45 terabyte tekst.
Supervised Fine Tuning-model (SFT)
I den indledende udvikling udviklede GPT-3-modellen sig ved at indgå kontrakt med 40 entreprenører om at producere et overvåget træningsdatasæt, hvor input har et kendt resultat, som modellen kan lære. Indtastninger, eller opfordringer, var faktiske brugerindtastninger i Open API’et.
Belønningsmodel
Det næste skridt er at bruge en belønningsmodel til at forbedre kvaliteten af de genererede svar. Belønningsmodellen evaluerer resultatet af SFT-modellen. Derefter tildeles der en score baseret på, hvor godt den matcher det ønskede output.
Model for forstærkningsindlæring
Det sidste skridt er at anvende en forstærkende indlæringsmetode til yderligere at forbedre GPT’s ydeevne. Algoritmen Proximal Policy Optimization indebærer, at AI-chatbotten interagerer med brugere i et simuleret miljø. Derefter modtager den et belønningssignal baseret på, hvor godt den klarer sig.
Evaluering af præstationer
Input fra menneskelige arbejdere træner modellen. Derfor er den centrale del af evalueringen baseret på menneskelig feedback, der får mærkere til at bedømme kvaliteten af modeloutputtene.
Modellen evalueres ud fra tre overordnede kriterier:
- Hjælpsomhed : Vurdering af modellens evne til at følge og udlede brugerens instruktioner.
- Sandfærdighed: I opgaver med lukkede domæner vurderes modellens tilbøjelighed til hallucinationer (opdigtede fakta). Modellen er testet ved hjælp af datasættet TruthfulQA.
- Harmløshed: Vurdering af, om modellens output er passende, nedgør en beskyttet klasse eller indeholder nedsættende indhold.
- Vælg et ChatGPT API eller bibliotek : Der er forskellige API’er og biblioteker til rådighed til brug af ChatGPT. Vælg den, der passer bedst til dine behov og din programmeringserfaring.
- Opret en konto og få en API-nøgle (hvis relevant) : I tilfælde af brug af en API er det nødvendigt at oprette en konto og få en API-nøgle for at bruge ChatGPT. Følg vejledningen fra API-udbyderen.
- Installer påkrævede biblioteker (hvis du bruger et bibliotek) : Hvis du bruger et bibliotek som Hugging Face Transformers, er det nødvendigt at installere de nødvendige biblioteker i programmeringsmiljøet.
- Initialiser ChatGPT : Når du har de nødvendige biblioteker eller API-nøgler, skal du initialisere ChatGPT-modellen i programmet.
- Indtast prompten: For at bruge ChatGPT er det nødvendigt at angive en prompt, der beskriver konteksten eller emnet for samtalen, hvis du vil generere et svar.
- Generer svar: Når prompten er givet, genererer ChatGPT-modellen et svar baseret på input-prompten og konteksten i dens træningsdata.
- Evaluér og finpuds svaret : Kvaliteten af det genererede svar kan variere afhængigt af inputprompten og andre faktorer. Tjek svaret, da det stadig har brug for hjælp til at skelne fakta fra misinformation.
- Gentag : Gentag trin 5-7 så mange gange som nødvendigt for at skabe en samtale eller en række svar, der opfylder dine behov.