Bagaimanakah ChatGPT Berfungsi?

Perwakilan visual seni bina ChatGPT , menampilkan model pengubah yang membolehkan pemahaman bahasa dan keupayaan penjanaannya
Perwakilan visual seni bina ChatGPT , menampilkan model pengubah yang membolehkan pemahaman bahasa dan keupayaan penjanaannya

Eskritor 2023-07-10

Pada tahap yang tinggi, ChatGPT ialah model pembelajaran mendalam yang menggunakan rangkaian saraf untuk menjana teks seperti manusia. Versi khusus model, ChatGPT-3, adalah berdasarkan teknik yang dipanggil seni bina transformer. Seni bina jenis ini membolehkan model mengenali corak dan struktur dalam bahasa. Ia melakukan ini dengan memproses urutan token dan menjana urutan output.

Model ini mengambil set data teks yang besar, termasuk buku, artikel, tapak web dan banyak lagi. Semasa proses latihan, model mengambil berjuta-juta contoh teks dan meminta untuk meramalkan perkataan seterusnya dalam setiap urutan.

Cara berinteraksi dengan ChatGPT adalah dengan memberikan gesaan atau soalan. Kemudian, model menjana respons berdasarkan corak yang telah dipelajari daripada data latihan. Hasilnya ialah alat pemprosesan bahasa semula jadi (NLP) yang sangat pintar.

Apakah Maksud GPT (Generative Pra-trained Transformer)?

“Generatif” dalam GPT mewakili keupayaannya untuk menjana teks bahasa manusia semula jadi. “Pra-terlatih” mewakili fakta bahawa model itu telah dilatih pada beberapa set data terhingga. Sebaliknya, “Transformer”, mewakili seni bina pembelajaran mesin asas yang menguasai GPT.

Apakah Sebab Menggunakan ChatGPT?

Sebagai model bahasa yang dilatih oleh OpenAI , ChatGPT mempunyai pelbagai keupayaan dan boleh melaksanakan banyak tugas yang berbeza. Berikut ialah beberapa perkara yang boleh dilakukan oleh ChatGPT:

  1. Jawab soalan: ChatGPT boleh menjawab soalan dalam bahasa semula jadi, memberikan maklumat tentang pelbagai topik.
  2. Jana teks: Ia boleh menjana teks seperti manusia dalam pelbagai gaya dan nada, menjadikannya berguna untuk penciptaan kandungan dan penjanaan teks.
  3. Ringkaskan teks: ChatGPT boleh memberikan gambaran ringkas tentang artikel atau dokumen yang panjang, menjadikannya mudah untuk memahami idea utama dengan cepat.
  4. Terjemah teks: Ia mempunyai keupayaan untuk menterjemah teks daripada satu bahasa ke bahasa lain, menjadikannya berguna untuk berkomunikasi dengan orang yang bercakap bahasa yang berbeza.
  5. Hasilkan puisi: ChatGPT boleh mencipta puisi asli dalam pelbagai gaya, memberikan inspirasi dan contoh untuk penyair dan penulis.
  6. Berikan maklum balas penulisan: ChatGPT menganalisis penulisan dan memberikan maklum balas tentang faktor seperti tatabahasa, gaya dan nada, membantu penulis meningkatkan kemahiran mereka.

Bagaimanakah ChatGPT Dilatih?

Teknik pembelajaran mendalam yang dipanggil seni bina transformer chatGPT terlatih. Versi khusus model, ChatGPT-3, mengambil set data besar-besaran lebih 45 terabait teks.

Model Penalaan Halus (SFT) yang diselia

Dalam pembangunan awal, model GPT-3 berkembang dengan mengontrak 40 kontraktor untuk menghasilkan set data latihan yang diselia, di mana input mempunyai hasil yang diketahui yang model boleh pelajari. Input, atau gesaan, ialah entri pengguna sebenar ke dalam Open API.

Model Ganjaran

Langkah seterusnya ialah menggunakan model ganjaran untuk meningkatkan kualiti respons yang dihasilkan. Model ganjaran menilai output model SFT. Kemudian ia memberikan skor berdasarkan sejauh mana ia sepadan dengan output yang diingini.

Model Pembelajaran Pengukuhan

Langkah terakhir ialah menggunakan pendekatan pembelajaran pengukuhan untuk meningkatkan lagi prestasi GPT. Algoritma Pengoptimuman Dasar Proksimal melibatkan penggunaan chatbot AI berinteraksi dengan pengguna dalam persekitaran simulasi. Kemudian ia menerima isyarat ganjaran berdasarkan prestasinya.

Penilaian prestasi

Input pelukis manusia melatih model. Itulah sebabnya bahagian teras penilaian memberi maklum balas manusia, mengetuai pelabel untuk menilai kualiti output model.

Tiga kriteria peringkat tinggi menilai model:

  • Kebergunaan : Menilai keupayaan model untuk mengikuti dan membuat kesimpulan arahan pengguna.
  • Kejujuran: Mengenai tugas domain tertutup, menilai kecenderungan model untuk halusinasi (membuat fakta). Model ini diuji menggunakan dataset TruthfulQA.
  • Ketidakmudaratan: Menilai sama ada output model adalah sesuai, memperlekehkan kelas yang dilindungi atau mengandungi kandungan yang menghina.
  1. Pilih API atau Pustaka ChatGPT : Terdapat pelbagai API dan perpustakaan tersedia untuk menggunakan ChatGPT. Pilih yang paling sesuai dengan keperluan dan pengalaman pengaturcaraan anda.
  2. Cipta Akaun dan Dapatkan Kunci API (jika berkenaan) : Dalam kes menggunakan API, membuat akaun dan mendapatkan kunci API diperlukan untuk menggunakan ChatGPT. Ikut arahan yang diberikan oleh pembekal API.
  3. Pasang Perpustakaan Diperlukan (jika menggunakan Perpustakaan) : Dalam kes menggunakan perpustakaan seperti Hugging Face Transformers, pemasangan perpustakaan yang diperlukan dalam persekitaran pengaturcaraan akan diperlukan.
  4. Mulakan ChatGPT : Setelah mempunyai perpustakaan atau kunci API yang diperlukan, mulakan model ChatGPT dalam program.
  5. Masukkan Prompt : Untuk menggunakan ChatGPT, anda perlu menyediakan gesaan yang menerangkan konteks atau topik perbualan jika anda ingin menjana respons.
  6. Jana Respons : Setelah memberikan gesaan, model ChatGPT menjana respons berdasarkan gesaan input dan konteks data latihannya.
  7. Nilai dan Perhalusi Respons : Kualiti respons yang dihasilkan boleh berbeza-beza bergantung pada gesaan input dan faktor lain. Semak respons kerana ia masih memerlukan bantuan untuk membezakan fakta daripada maklumat yang salah.
  8. Ulang : Ulang langkah 5-7 seberapa banyak yang perlu untuk menjana perbualan atau satu siri respons yang memenuhi keperluan anda.

Kongsi Siaran

AI Penulis

img

Eskritor

Mencipta kandungan AI dijana