ChatGPT ทำงานอย่างไร

การแสดงภาพสถาปัตยกรรมของ ChatGPT ซึ่งมีโมเดลทรานส์ฟอร์มที่ช่วยให้เข้าใจภาษาและความสามารถในการสร้าง
การแสดงภาพสถาปัตยกรรมของ ChatGPT ซึ่งมีโมเดลทรานส์ฟอร์มที่ช่วยให้เข้าใจภาษาและความสามารถในการสร้าง

Eskritor 2023-07-10

ในระดับสูง ChatGPT เป็นโมเดลการเรียนรู้เชิงลึกที่ใช้โครงข่ายประสาทเทียมเพื่อสร้างข้อความที่เหมือนมนุษย์ รุ่นเฉพาะของรุ่น ChatGPT-3 ใช้เทคนิคที่เรียกว่าสถาปัตยกรรมหม้อแปลงไฟฟ้า สถาปัตยกรรมประเภทนี้ช่วยให้แบบจำลองสามารถจดจำรูปแบบและโครงสร้างในภาษาได้ ทำสิ่งนี้โดยการประมวลผลลำดับของโทเค็นและสร้างลำดับเอาต์พุต

แบบจำลองนี้ใช้ชุดข้อมูลขนาดใหญ่ซึ่งประกอบด้วยหนังสือ บทความ เว็บไซต์ และอื่นๆ ในระหว่างขั้นตอนการฝึกอบรม แบบจำลองใช้ตัวอย่างข้อความนับล้านและขอให้ทำนายคำถัดไปในแต่ละลำดับ

วิธีการโต้ตอบกับ ChatGPT คือการแจ้งหรือถามคำถาม จากนั้น โมเดลจะสร้างการตอบสนองตามรูปแบบที่ได้เรียนรู้จากข้อมูลการฝึกอบรม ผลลัพธ์ที่ได้คือเครื่องมือประมวลผลภาษาธรรมชาติ (NLP) ที่ชาญฉลาดอย่างยิ่ง

GPT (Generative Pre-trained Transformer) หมายถึงอะไร?

“สร้างสรรค์” ใน GPT แสดงถึงความสามารถในการสร้างข้อความภาษามนุษย์ที่เป็นธรรมชาติ “การฝึกอบรมล่วงหน้า” หมายถึงข้อเท็จจริงที่ว่าแบบจำลองได้รับการฝึกอบรมแล้วในชุดข้อมูลที่มีขอบเขตจำกัด ในทางกลับกัน “Transformer” เป็นตัวแทนของสถาปัตยกรรมแมชชีนเลิร์นนิงที่สนับสนุน GPT

เหตุผลในการใช้ ChatGPT คืออะไร

ในฐานะโมเดลภาษาที่ฝึกฝนโดย OpenAI ChatGPT มีความสามารถที่หลากหลายและสามารถทำงานต่างๆ ได้มากมาย นี่คือบางสิ่งที่ ChatGPT สามารถทำได้:

  1. ตอบคำถาม: ChatGPT สามารถตอบคำถามในภาษาธรรมชาติ โดยให้ข้อมูลในหัวข้อที่หลากหลาย
  2. สร้างข้อความ: สามารถสร้างข้อความเหมือนมนุษย์ได้หลากหลายสไตล์และโทนสี ทำให้มีประโยชน์สำหรับ การสร้างเนื้อหา และการสร้างข้อความ
  3. ข้อความสรุป: ChatGPT สามารถให้ภาพรวมที่กระชับของบทความหรือเอกสารขนาดยาว ทำให้เข้าใจแนวคิดหลักได้อย่างรวดเร็ว
  4. แปลข้อความ: มีความสามารถในการแปลข้อความจากภาษาหนึ่งเป็นอีกภาษาหนึ่ง ทำให้มีประโยชน์ในการสื่อสารกับคนที่พูดภาษาต่างๆ
  5. สร้างบทกวี: ChatGPT สามารถสร้างบทกวีต้นฉบับในหลากหลายสไตล์ โดยเป็นแรงบันดาลใจและตัวอย่างสำหรับกวีและนักเขียน
  6. แสดงความคิดเห็นในการเขียน: ChatGPT วิเคราะห์งานเขียนและให้ข้อเสนอแนะเกี่ยวกับปัจจัยต่างๆ เช่น ไวยากรณ์ สไตล์ และน้ำเสียง ซึ่งช่วยให้ผู้เขียนปรับปรุงฝีมือของตน

ChatGPT ได้รับการฝึกฝนอย่างไร

เทคนิคการเรียนรู้เชิงลึกที่เรียกว่าสถาปัตยกรรมหม้อแปลงที่ฝึกฝนโดย chatGPT ChatGPT-3 รุ่นเฉพาะของรุ่นนั้นใช้ชุดข้อมูลขนาดใหญ่ที่มีข้อความมากกว่า 45 เทราไบต์

แบบจำลองการปรับแต่งอย่างละเอียดภายใต้การดูแล (SFT)

ในการพัฒนาเบื้องต้น โมเดล GPT-3 พัฒนาขึ้นโดยการทำสัญญากับผู้รับเหมา 40 รายเพื่อสร้างชุดข้อมูลการฝึกอบรมภายใต้การดูแล ซึ่งข้อมูลที่ป้อนมีผลที่ทราบแล้วว่าโมเดลสามารถเรียนรู้ได้ อินพุตหรือพรอมต์คือรายการของผู้ใช้จริงใน Open API

โมเดลรางวัล

ขั้นตอนต่อไปคือการใช้แบบจำลองรางวัลเพื่อปรับปรุงคุณภาพของคำตอบที่สร้างขึ้น โมเดลรางวัลประเมินผลลัพธ์ของโมเดล SFT จากนั้นจะให้คะแนนโดยพิจารณาว่าตรงกับผลลัพธ์ที่ต้องการมากน้อยเพียงใด

โมเดลการเรียนรู้เสริมแรง

ขั้นตอนสุดท้ายคือการใช้วิธีการเรียนรู้แบบเสริมกำลังเพื่อปรับปรุงประสิทธิภาพของ GPT ต่อไป อัลกอริทึม Proximal Policy Optimization เกี่ยวข้องกับการให้ AI chatbot โต้ตอบกับผู้ใช้ในสภาพแวดล้อมจำลอง จากนั้นจะรับสัญญาณรางวัลตามประสิทธิภาพ

การประเมินผลการปฏิบัติงาน

การป้อนข้อมูลของผู้ติดฉลากของมนุษย์จะฝึกโมเดล นั่นเป็นเหตุผลที่ส่วนหลักของการประเมินฟีดบนความคิดเห็นของมนุษย์ ซึ่งเป็นผู้นำในการให้คะแนนคุณภาพของผลลัพธ์ของโมเดล

เกณฑ์ระดับสูงสามเกณฑ์ประเมินแบบจำลอง:

  • ความเป็นประโยชน์ : การประเมินความสามารถของแบบจำลองในการปฏิบัติตามและอนุมานคำแนะนำของผู้ใช้
  • ความจริง: ในงานโดเมนปิด การประเมินแนวโน้มของแบบจำลองสำหรับอาการประสาทหลอน (สร้างข้อเท็จจริง) โมเดลได้รับการทดสอบโดยใช้ชุดข้อมูล TruthfulQA
  • ความไม่เป็นอันตราย: การประเมินว่าเอาต์พุตของโมเดลนั้นเหมาะสม ดูหมิ่นคลาสที่ได้รับการคุ้มครอง หรือมีเนื้อหาที่ทำให้เสื่อมเสีย
  1. เลือก ChatGPT API หรือไลบรารี : มี API และไลบรารีต่างๆ ให้เลือกใช้งาน ChatGPT เลือกรายการที่เหมาะกับความต้องการและประสบการณ์ในการเขียนโปรแกรมของคุณมากที่สุด
  2. สร้างบัญชีและรับรหัส API (ถ้ามี) : ในกรณีของการใช้ API การสร้างบัญชีและรับรหัส API จะจำเป็นเพื่อใช้ ChatGPT ทำตามคำแนะนำของผู้ให้บริการ API
  3. ติดตั้งไลบรารีที่จำเป็น (หากใช้ไลบรารี) : ในกรณีที่ใช้ไลบรารี เช่น Hugging Face Transformers จำเป็นต้องติดตั้งไลบรารีที่จำเป็นในสภาพแวดล้อมการเขียนโปรแกรม
  4. เริ่มต้น ChatGPT : เมื่อมีไลบรารีหรือคีย์ API ที่จำเป็นแล้ว ให้เริ่มต้นโมเดล ChatGPT ในโปรแกรม
  5. ป้อนข้อความแจ้ง : ในการใช้ ChatGPT จำเป็นต้องมีข้อความแจ้งที่อธิบายบริบทหรือหัวข้อของการสนทนา หากคุณต้องการสร้างข้อความตอบกลับ
  6. สร้างการตอบ สนอง : เมื่อแจ้งพร้อมท์ โมเดล ChatGPT จะสร้างการตอบสนองตามพร้อมท์อินพุตและบริบทของข้อมูลการฝึกอบรม
  7. ประเมินและปรับแต่งการตอบกลับ : คุณภาพของการตอบกลับที่สร้างขึ้นอาจแตกต่างกันไปขึ้นอยู่กับการป้อนข้อมูลและปัจจัยอื่นๆ ตรวจสอบการตอบกลับเนื่องจากยังต้องการความช่วยเหลือในการแยกแยะข้อเท็จจริงจากข้อมูลที่ผิด
  8. ทำซ้ำ : ทำซ้ำขั้นตอนที่ 5-7 หลายครั้งเท่าที่จำเป็นเพื่อสร้างการสนทนาหรือชุดคำตอบที่ตรงกับความต้องการของคุณ

แชร์โพสต์

นักเขียน AI

img

Eskritor

สร้างเนื้อหาที่ AI สร้างขึ้น