OpenAI is a nonprofit research company that aims to develop and direct artificial intelligence (AI) in ways that benefit humanity as a whole. The company was founded by Elon Musk and Sam Altman in 2015 and is headquartered in San Francisco, California, and backed by billions in funding from Microsoft.

ChatGPT is an AI tool of OpenAI's most recent language model, and it represents a significant improvement over GPT-3.5. Like many Large Language Models, it generates text in a variety of styles and for a variety of purposes, but with far greater precision, detail, and coherence. It is the next generation in OpenAI's line of Large Language Models, with a strong emphasis on interactive conversations. ChatGPT is the latest step in OpenAI’s iterative deployment of increasingly safe and useful generative AI systems.

ChatGPT ทำงานอย่างไร

Eskritor
กุมภาพันธ์ 27, 2023

ในระดับสูง ChatGPT เป็นโมเดลการเรียนรู้เชิงลึกที่ใช้โครงข่ายประสาทเทียมเพื่อสร้างข้อความที่เหมือนมนุษย์ รุ่นเฉพาะของรุ่น ChatGPT-3 ใช้เทคนิคที่เรียกว่าสถาปัตยกรรมหม้อแปลงไฟฟ้า สถาปัตยกรรมประเภทนี้ช่วยให้แบบจำลองสามารถจดจำรูปแบบและโครงสร้างในภาษาได้ ทำสิ่งนี้โดยการประมวลผลลำดับของโทเค็นและสร้างลำดับเอาต์พุต

แบบจำลองนี้ใช้ชุดข้อมูลขนาดใหญ่ซึ่งประกอบด้วยหนังสือ บทความ เว็บไซต์ และอื่นๆ ในระหว่างขั้นตอนการฝึกอบรม แบบจำลองใช้ตัวอย่างข้อความนับล้านและขอให้ทำนายคำถัดไปในแต่ละลำดับ

วิธีการโต้ตอบกับ ChatGPT คือการแจ้งหรือถามคำถาม จากนั้น โมเดลจะสร้างการตอบสนองตามรูปแบบที่ได้เรียนรู้จากข้อมูลการฝึกอบรม ผลลัพธ์ที่ได้คือเครื่องมือประมวลผลภาษาธรรมชาติ (NLP) ที่ชาญฉลาดอย่างยิ่ง

GPT (Generative Pre-trained Transformer) หมายถึงอะไร?

“สร้างสรรค์” ใน GPT แสดงถึงความสามารถในการสร้างข้อความภาษามนุษย์ที่เป็นธรรมชาติ “การฝึกอบรมล่วงหน้า” หมายถึงข้อเท็จจริงที่ว่าแบบจำลองได้รับการฝึกอบรมแล้วในชุดข้อมูลที่มีขอบเขตจำกัด ในทางกลับกัน “Transformer” เป็นตัวแทนของสถาปัตยกรรมแมชชีนเลิร์นนิงที่สนับสนุน GPT

เหตุผลในการใช้ ChatGPT คืออะไร

ในฐานะโมเดลภาษาที่ฝึกฝนโดย OpenAI ChatGPT มีความสามารถที่หลากหลายและสามารถทำงานต่างๆ ได้มากมาย นี่คือบางสิ่งที่ ChatGPT สามารถทำได้:

ตอบคำถาม: ChatGPT สามารถตอบคำถามในภาษาธรรมชาติ โดยให้ข้อมูลในหัวข้อที่หลากหลาย
สร้างข้อความ: สามารถสร้างข้อความเหมือนมนุษย์ได้หลากหลายสไตล์และโทนสี ทำให้มีประโยชน์สำหรับ การสร้างเนื้อหา และการสร้างข้อความ
ข้อความสรุป: ChatGPT สามารถให้ภาพรวมที่กระชับของบทความหรือเอกสารขนาดยาว ทำให้เข้าใจแนวคิดหลักได้อย่างรวดเร็ว
แปลข้อความ: มีความสามารถในการแปลข้อความจากภาษาหนึ่งเป็นอีกภาษาหนึ่ง ทำให้มีประโยชน์ในการสื่อสารกับคนที่พูดภาษาต่างๆ
สร้างบทกวี: ChatGPT สามารถสร้างบทกวีต้นฉบับในหลากหลายสไตล์ โดยเป็นแรงบันดาลใจและตัวอย่างสำหรับกวีและนักเขียน
แสดงความคิดเห็นในการเขียน: ChatGPT วิเคราะห์งานเขียนและให้ข้อเสนอแนะเกี่ยวกับปัจจัยต่างๆ เช่น ไวยากรณ์ สไตล์ และน้ำเสียง ซึ่งช่วยให้ผู้เขียนปรับปรุงฝีมือของตน

ChatGPT ได้รับการฝึกฝนอย่างไร

เทคนิคการเรียนรู้เชิงลึกที่เรียกว่าสถาปัตยกรรมหม้อแปลงที่ฝึกฝนโดย chatGPT ChatGPT-3 รุ่นเฉพาะของรุ่นนั้นใช้ชุดข้อมูลขนาดใหญ่ที่มีข้อความมากกว่า 45 เทราไบต์

แบบจำลองการปรับแต่งอย่างละเอียดภายใต้การดูแล (SFT)

ในการพัฒนาเบื้องต้น โมเดล GPT-3 พัฒนาขึ้นโดยการทำสัญญากับผู้รับเหมา 40 รายเพื่อสร้างชุดข้อมูลการฝึกอบรมภายใต้การดูแล ซึ่งข้อมูลที่ป้อนมีผลที่ทราบแล้วว่าโมเดลสามารถเรียนรู้ได้ อินพุตหรือพรอมต์คือรายการของผู้ใช้จริงใน Open API

โมเดลรางวัล

ขั้นตอนต่อไปคือการใช้แบบจำลองรางวัลเพื่อปรับปรุงคุณภาพของคำตอบที่สร้างขึ้น โมเดลรางวัลประเมินผลลัพธ์ของโมเดล SFT จากนั้นจะให้คะแนนโดยพิจารณาว่าตรงกับผลลัพธ์ที่ต้องการมากน้อยเพียงใด

โมเดลการเรียนรู้เสริมแรง

ขั้นตอนสุดท้ายคือการใช้วิธีการเรียนรู้แบบเสริมกำลังเพื่อปรับปรุงประสิทธิภาพของ GPT ต่อไป อัลกอริทึม Proximal Policy Optimization เกี่ยวข้องกับการให้ AI chatbot โต้ตอบกับผู้ใช้ในสภาพแวดล้อมจำลอง จากนั้นจะรับสัญญาณรางวัลตามประสิทธิภาพ

การประเมินผลการปฏิบัติงาน

การป้อนข้อมูลของผู้ติดฉลากของมนุษย์จะฝึกโมเดล นั่นเป็นเหตุผลที่ส่วนหลักของการประเมินฟีดบนความคิดเห็นของมนุษย์ ซึ่งเป็นผู้นำในการให้คะแนนคุณภาพของผลลัพธ์ของโมเดล

เกณฑ์ระดับสูงสามเกณฑ์ประเมินแบบจำลอง:

ความเป็นประโยชน์ : การประเมินความสามารถของแบบจำลองในการปฏิบัติตามและอนุมานคำแนะนำของผู้ใช้
ความจริง: ในงานโดเมนปิด การประเมินแนวโน้มของแบบจำลองสำหรับอาการประสาทหลอน (สร้างข้อเท็จจริง) โมเดลได้รับการทดสอบโดยใช้ชุดข้อมูล TruthfulQA
ความไม่เป็นอันตราย: การประเมินว่าเอาต์พุตของโมเดลนั้นเหมาะสม ดูหมิ่นคลาสที่ได้รับการคุ้มครอง หรือมีเนื้อหาที่ทำให้เสื่อมเสีย

จะใช้ ChatGPT ได้อย่างไร?

เลือก ChatGPT API หรือไลบรารี : มี API และไลบรารีต่างๆ ให้เลือกใช้งาน ChatGPT เลือกรายการที่เหมาะกับความต้องการและประสบการณ์ในการเขียนโปรแกรมของคุณมากที่สุด
สร้างบัญชีและรับรหัส API (ถ้ามี) : ในกรณีของการใช้ API การสร้างบัญชีและรับรหัส API จะจำเป็นเพื่อใช้ ChatGPT ทำตามคำแนะนำของผู้ให้บริการ API
ติดตั้งไลบรารีที่จำเป็น (หากใช้ไลบรารี) : ในกรณีที่ใช้ไลบรารี เช่น Hugging Face Transformers จำเป็นต้องติดตั้งไลบรารีที่จำเป็นในสภาพแวดล้อมการเขียนโปรแกรม
เริ่มต้น ChatGPT : เมื่อมีไลบรารีหรือคีย์ API ที่จำเป็นแล้ว ให้เริ่มต้นโมเดล ChatGPT ในโปรแกรม
ป้อนข้อความแจ้ง : ในการใช้ ChatGPT จำเป็นต้องมีข้อความแจ้งที่อธิบายบริบทหรือหัวข้อของการสนทนา หากคุณต้องการสร้างข้อความตอบกลับ
สร้างการตอบ สนอง : เมื่อแจ้งพร้อมท์ โมเดล ChatGPT จะสร้างการตอบสนองตามพร้อมท์อินพุตและบริบทของข้อมูลการฝึกอบรม
ประเมินและปรับแต่งการตอบกลับ : คุณภาพของการตอบกลับที่สร้างขึ้นอาจแตกต่างกันไปขึ้นอยู่กับการป้อนข้อมูลและปัจจัยอื่นๆ ตรวจสอบการตอบกลับเนื่องจากยังต้องการความช่วยเหลือในการแยกแยะข้อเท็จจริงจากข้อมูลที่ผิด
ทำซ้ำ : ทำซ้ำขั้นตอนที่ 5-7 หลายครั้งเท่าที่จำเป็นเพื่อสร้างการสนทนาหรือชุดคำตอบที่ตรงกับความต้องการของคุณ

คำถามที่พบบ่อย

OpenAI คืออะไร?

OpenAI เป็นบริษัทวิจัยที่ไม่แสวงหาผลกำไรที่มุ่งพัฒนาและกำกับปัญญาประดิษฐ์ (AI) ในรูปแบบที่เป็นประโยชน์ต่อมนุษยชาติโดยรวม บริษัทก่อตั้งโดย Elon Musk และ Sam Altman ในปี 2015 และมีสำนักงานใหญ่ในซานฟรานซิสโก แคลิฟอร์เนีย และได้รับการสนับสนุนจาก Microsoft ในด้านเงินทุนนับพันล้าน

ChatGPT คืออะไร?

ChatGPT เป็นเครื่องมือ AI ของรูปแบบภาษาล่าสุดของ OpenAI และแสดงถึงการปรับปรุงที่สำคัญเหนือ GPT-3.5 เช่นเดียวกับโมเดลภาษาขนาดใหญ่อื่นๆ โปรแกรมจะสร้างข้อความในรูปแบบต่างๆ และสำหรับวัตถุประสงค์ที่หลากหลาย แต่มีความแม่นยำ รายละเอียด และการเชื่อมโยงที่เหนือกว่ามาก มันเป็นรุ่นต่อไปในสายโมเดลภาษาขนาดใหญ่ของ OpenAI โดยเน้นที่การสนทนาแบบโต้ตอบ ChatGPT เป็นขั้นตอนล่าสุดในการปรับใช้ซ้ำๆ ของระบบ AI กำเนิดที่ปลอดภัยและมีประโยชน์มากขึ้นของ OpenAI

แบ่งปันโพสต์: