ChatGPT hoạt động như thế nào?

Một bản trình bày trực quan về kiến ​​trúc của ChatGPT, có mô hình máy biến áp cho phép khả năng hiểu và tạo ngôn ngữ của nó
Một bản trình bày trực quan về kiến ​​trúc của ChatGPT, có mô hình máy biến áp cho phép khả năng hiểu và tạo ngôn ngữ của nó

Eskritor 2023-07-10

Ở cấp độ cao, ChatGPT là một mô hình học sâu sử dụng mạng thần kinh để tạo văn bản giống con người. Phiên bản cụ thể của mô hình, ChatGPT-3, dựa trên một kỹ thuật gọi là kiến trúc máy biến áp. Kiểu kiến trúc này cho phép mô hình nhận ra các mẫu và cấu trúc trong ngôn ngữ. Nó thực hiện điều này bằng cách xử lý một chuỗi mã thông báo và tạo ra một chuỗi đầu ra.

Mô hình đã lấy một tập dữ liệu văn bản khổng lồ, bao gồm sách, bài báo, trang web, v.v. Trong quá trình đào tạo, mô hình đã lấy hàng triệu ví dụ về văn bản và yêu cầu dự đoán từ tiếp theo trong mỗi chuỗi.

Cách tương tác với ChatGPT là đưa ra lời nhắc hoặc câu hỏi. Sau đó, mô hình tạo ra phản hồi dựa trên các mẫu mà nó đã học được từ dữ liệu huấn luyện. Kết quả là một công cụ xử lý ngôn ngữ tự nhiên (NLP) rất thông minh.

GPT (Máy biến áp được đào tạo trước) có nghĩa là gì?

“Tạo” trong GPT thể hiện khả năng tạo văn bản ngôn ngữ tự nhiên của con người. “Được đào tạo trước” thể hiện thực tế là mô hình đã được đào tạo trên một số tập dữ liệu hữu hạn. Mặt khác, “Transformer” đại diện cho kiến ​​trúc máy học cơ bản cung cấp năng lượng cho GPT.

Lý do sử dụng ChatGPT là gì?

Là một mô hình ngôn ngữ do OpenAI đào tạo, ChatGPT có nhiều khả năng và có thể thực hiện nhiều tác vụ khác nhau. Dưới đây là một số điều mà ChatGPT có thể làm:

  1. Trả lời câu hỏi: ChatGPT có thể trả lời các câu hỏi bằng ngôn ngữ tự nhiên, cung cấp thông tin về nhiều chủ đề khác nhau.
  2. Tạo văn bản: Nó có thể tạo văn bản giống con người theo nhiều phong cách và tông màu khác nhau, rất hữu ích cho việc tạo nội dung và tạo văn bản.
  3. Tóm tắt văn bản: ChatGPT có thể cung cấp tổng quan ngắn gọn về các bài viết hoặc tài liệu dài, giúp bạn dễ dàng hiểu nhanh các ý chính.
  4. Dịch văn bản: Nó có khả năng dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác, rất hữu ích khi giao tiếp với những người nói các ngôn ngữ khác nhau.
  5. Tạo thơ: ChatGPT có thể tạo các bài thơ gốc theo nhiều phong cách khác nhau, mang đến nguồn cảm hứng và ví dụ cho các nhà thơ và nhà văn.
  6. Cung cấp phản hồi về cách viết: ChatGPT phân tích cách viết và cung cấp phản hồi về các yếu tố như ngữ pháp, văn phong và giọng điệu, giúp người viết cải thiện kỹ năng của họ.

ChatGPT được đào tạo như thế nào?

Một kỹ thuật học sâu được gọi là chatGPT được đào tạo về kiến trúc máy biến áp. Phiên bản cụ thể của mô hình, ChatGPT-3, đã sử dụng một bộ dữ liệu khổng lồ hơn 45 terabyte văn bản.

Mô hình tinh chỉnh có giám sát (SFT)

Trong quá trình phát triển ban đầu, mô hình GPT-3 đã phát triển bằng cách ký hợp đồng với 40 nhà thầu để tạo ra tập dữ liệu đào tạo được giám sát, trong đó đầu vào có kết quả đã biết mà mô hình có thể học. Đầu vào hoặc lời nhắc là các mục nhập thực tế của người dùng vào Open API.

Mô hình phần thưởng

Bước tiếp theo là sử dụng mô hình phần thưởng để cải thiện chất lượng của các phản hồi được tạo. Mô hình phần thưởng đánh giá đầu ra của mô hình SFT. Sau đó, nó chỉ định một số điểm dựa trên mức độ phù hợp với đầu ra mong muốn.

Mô hình học tăng cường

Bước cuối cùng là sử dụng phương pháp học tăng cường để cải thiện hơn nữa hiệu suất của GPT. Thuật toán Tối ưu hóa chính sách gần nhất liên quan đến việc để chatbot AI tương tác với người dùng trong môi trường mô phỏng. Sau đó, nó nhận được tín hiệu phần thưởng dựa trên hiệu quả hoạt động của nó.

Đánh giá hiệu suất

Đầu vào của người lao động đào tạo mô hình. Đó là lý do tại sao phần cốt lõi của quá trình đánh giá dựa trên phản hồi của con người, khiến những người gắn nhãn đánh giá chất lượng của kết quả đầu ra của mô hình.

Ba tiêu chí cấp cao đánh giá mô hình:

  • Tính hữu ích : Đánh giá khả năng làm theo và suy luận hướng dẫn của người dùng của mô hình.
  • Tính trung thực: Trong các nhiệm vụ miền đóng, đánh giá xu hướng ảo giác của mô hình (tạo nên sự thật). Mô hình được thử nghiệm bằng bộ dữ liệu TruthfulQA.
  • Tính vô hại: Đánh giá xem đầu ra của mô hình có phù hợp hay không, làm mất uy tín của một lớp được bảo vệ hoặc chứa nội dung xúc phạm.
  1. Chọn Thư viện hoặc API ChatGPT : Có sẵn nhiều API và thư viện khác nhau để sử dụng ChatGPT. Chọn một trong những phù hợp nhất với nhu cầu và kinh nghiệm lập trình của bạn.
  2. Tạo tài khoản và lấy khóa API (nếu có) : Trong trường hợp sử dụng API, việc tạo tài khoản và nhận khóa API là cần thiết để sử dụng ChatGPT. Thực hiện theo các hướng dẫn được cung cấp bởi nhà cung cấp API.
  3. Cài đặt các thư viện cần thiết (nếu sử dụng Thư viện) : Trong trường hợp sử dụng thư viện như Máy biến áp ôm mặt, việc cài đặt các thư viện cần thiết trong môi trường lập trình là cần thiết.
  4. Khởi tạo ChatGPT : Sau khi có các thư viện hoặc khóa API cần thiết, hãy khởi tạo mô hình ChatGPT trong chương trình.
  5. Nhập lời nhắc : Để sử dụng ChatGPT, bạn cần cung cấp lời nhắc mô tả ngữ cảnh hoặc chủ đề của cuộc trò chuyện nếu bạn muốn tạo phản hồi.
  6. Tạo phản hồi : Sau khi cung cấp lời nhắc, mô hình ChatGPT sẽ tạo phản hồi dựa trên lời nhắc đầu vào và ngữ cảnh của dữ liệu đào tạo.
  7. Đánh giá và tinh chỉnh phản hồi : Chất lượng của phản hồi được tạo có thể khác nhau tùy thuộc vào lời nhắc đầu vào và các yếu tố khác. Kiểm tra phản hồi vì nó vẫn cần trợ giúp để phân biệt sự thật với thông tin sai lệch.
  8. Lặp lại : Lặp lại các bước 5-7 nhiều lần nếu cần để tạo một cuộc trò chuyện hoặc một loạt phản hồi đáp ứng nhu cầu của bạn.

Chia sẻ bài viết

Nhà văn AI

img

Eskritor

Tạo nội dung AI tạo