Kako deluje ChatGPT?

Vizualni prikaz arhitekture ChatGPT z modelom transformatorja, ki omogoča razumevanje jezika in generiranje.
Vizualni prikaz arhitekture ChatGPT z modelom transformatorja, ki omogoča razumevanje jezika in generiranje.

Eskritor 2023-07-10

Na visoki ravni je ChatGPT model globokega učenja, ki z nevronsko mrežo ustvarja človeku podobno besedilo. Posebna različica modela, ChatGPT-3, temelji na tehniki, imenovani transformatorska arhitektura. Ta vrsta arhitekture omogoča modelu, da prepozna vzorce in strukture v jeziku. To stori tako, da obdela zaporedje žetonov in ustvari izhodno zaporedje.

Model je uporabil obsežen nabor podatkov o besedilih, vključno s knjigami, članki, spletnimi mesti in drugimi podatki. Med postopkom usposabljanja je model prejel na milijone primerov besedila in moral napovedati naslednjo besedo v vsakem zaporedju.

S ChatGPT lahko komunicirate tako, da posredujete poziv ali vprašanje. Nato model ustvari odziv na podlagi vzorcev, ki se jih je naučil iz podatkov za usposabljanje. Rezultat je zelo inteligentno orodje za obdelavo naravnega jezika (NLP).

Kaj pomeni GPT (Generative Pre-trained Transformer)?

“Generativni” v GPT pomeni sposobnost ustvarjanja naravnega besedila v človeškem jeziku. “Pre-trained” pomeni, da je bil model že treniran na določenem končnem naboru podatkov. “Transformer” pa predstavlja osnovno arhitekturo strojnega učenja, ki poganja GPT.

Kakšni so razlogi za uporabo ChatGPT?

ChatGPT ima kot jezikovni model, ki ga je usposobila organizacija OpenAI , širok spekter zmogljivosti in lahko opravlja veliko različnih nalog. Tukaj je nekaj stvari, ki jih lahko stori ChatGPT:

  1. Odgovorite na vprašanja: ChatGPT lahko odgovarja na vprašanja v naravnem jeziku in zagotavlja informacije o najrazličnejših temah.
  2. Ustvari besedilo: Ustvari lahko človeku podobno besedilo v različnih slogih in tonih, zato je uporaben za ustvarjanje vsebine in generiranje besedila.
  3. Povzemanje besedila: ChatGPT lahko zagotovi kratek pregled dolgih člankov ali dokumentov, kar olajša hitro razumevanje glavnih idej.
  4. Prevedi besedilo: To omogoča prevajanje besedila iz enega jezika v drugega, zato je uporaben za komunikacijo z ljudmi, ki govorijo različne jezike.
  5. Ustvarjajte poezijo: ChatGPT lahko ustvari izvirne pesmi v različnih slogih ter tako zagotovi navdih in primere za pesnike in pisatelje.
  6. Zagotovite povratne informacije o pisanju: ChatGPT analizira pisanje in zagotavlja povratne informacije o dejavnikih, kot so slovnica, slog in ton, ter tako pomaga piscem izboljšati njihovo znanje.

Kako je ChatGPT usposobljen?

S tehniko globokega učenja, imenovano arhitektura transformatorja, je bil usposobljen ChatGPT. Posebna različica modela, ChatGPT-3, je zajemala obsežen nabor podatkov z več kot 45 terabajti besedila.

Model nadzorovanega natančnega uglaševanja (SFT)

Na začetku razvoja se je model GPT-3 razvijal tako, da je 40 izvajalcev sklenilo pogodbo za pripravo nadzorovanega nabora podatkov za usposabljanje, pri katerem je vhodni podatek imel znan rezultat, ki se ga je model lahko naučil. Vnosi ali pozivi so bili dejanski vnosi uporabnikov v odprti vmesnik API.

Model nagrajevanja

Naslednji korak je uporaba modela nagrajevanja za izboljšanje kakovosti ustvarjenih odgovorov. Model nagrajevanja ovrednoti rezultate modela SFT. Nato dodeli oceno glede na to, kako dobro se ujema z želenim rezultatom.

Model učenja z okrepitvijo

Zadnji korak je uporaba pristopa učenja z ojačitvijo za nadaljnje izboljšanje učinkovitosti GPT. Algoritem optimizacije bližnje politike vključuje interakcijo klepetalnega robota z umetno inteligenco z uporabniki v simuliranem okolju. Nato prejme signal za nagrado, ki temelji na tem, kako dobro deluje.

Vrednotenje uspešnosti

Vnos človeških delavcev usposablja model. Zato je osrednji del ocenjevanja odvisen od povratnih informacij ljudi, ki ocenjujejo kakovost rezultatov modela.

Model je ocenjen na podlagi treh meril na visoki ravni:

  • Koristnost : Ocenjevanje sposobnosti modela, da sledi navodilom uporabnika in jih sklepa.
  • Resnicoljubnost: Pri nalogah zaprtega tipa se ocenjuje nagnjenost modela k halucinacijam (izmišljanju dejstev). Model je preizkušen z uporabo nabora podatkov TruthfulQA.
  • Neškodljivost: Ocenjevanje, ali je rezultat modela primeren, ali zaničuje zaščiteni razred ali vsebuje žaljivo vsebino.
  1. Izberite API ali knjižnico ChatGPT : Za uporabo ChatGPT so na voljo različni API-ji in knjižnice. Izberite tisto, ki najbolj ustreza vašim potrebam in izkušnjam s programiranjem.
  2. Ustvarite račun in pridobite ključ API (če je primerno ): Če uporabljate API, je za uporabo ChatGPT potrebno ustvariti račun in pridobiti ključ API. Sledite navodilom ponudnika API.
  3. Namestite zahtevane knjižnice (če uporabljate knjižnico ): Če uporabljate knjižnico, kot je Hugging Face Transformers, je treba v programsko okolje namestiti zahtevane knjižnice.
  4. Inicializirajte ChatGPT : Po pridobitvi potrebnih knjižnic ali ključev API v programu inicializirajte model ChatGPT.
  5. Vnesite poziv: Če želite uporabiti ChatGPT, je treba navesti poziv, ki opisuje kontekst ali temo pogovora, če želite ustvariti odgovor.
  6. Ustvari odziv : Model ChatGPT po posredovanju poziva ustvari odziv na podlagi vhodnega poziva in konteksta svojih podatkov za usposabljanje.
  7. Vrednotenje in izpopolnjevanje odziva : Kakovost ustvarjenega odgovora se lahko razlikuje glede na vhodno pobudo in druge dejavnike. Preverite odziv, saj še vedno potrebuje pomoč pri razločevanju dejstev od napačnih informacij.
  8. Ponovite : Korake od 5 do 7 ponovite tolikokrat, da ustvarite pogovor ali niz odgovorov, ki ustrezajo vašim potrebam.

Deli objavo

AI pisatelj

img

Eskritor

Ustvarjanje AI ustvarjene vsebine