À un niveau élevé, ChatGPT est un modèle d’apprentissage profond qui utilise un réseau neuronal pour générer un texte de type humain. La version spécifique du modèle, ChatGPT-3, est basée sur une technique appelée architecture transformatrice. Ce type d’architecture permet au modèle de reconnaître des modèles et des structures dans le langage. Pour ce faire, il traite une séquence de jetons et génère une séquence de sortie.
Le modèle a pris en compte un ensemble massif de textes, y compris des livres, des articles, des sites web et bien d’autres choses encore. Au cours du processus de formation, le modèle a pris en compte des millions d’exemples de textes et a été invité à prédire le mot suivant dans chaque séquence.
La façon d’interagir avec ChatGPT est de fournir une invite ou une question. Ensuite, le modèle génère une réponse basée sur les modèles qu’il a appris à partir des données d’apprentissage. Le résultat est un outil de traitement du langage naturel (NLP) très intelligent.
Que signifie GPT (Generative Pre-trained Transformer) ?
Le terme « génératif » dans GPT représente sa capacité à générer des textes en langage humain naturel. Le terme « pré-entraîné » signifie que le modèle a déjà été entraîné sur un ensemble fini de données. « Transformer », quant à lui, représente l’architecture sous-jacente d’apprentissage automatique qui alimente GPT.
Quelles sont les raisons d’utiliser ChatGPT ?
En tant que modèle linguistique formé par OpenAI , ChatGPT dispose d’un large éventail de capacités et peut effectuer de nombreuses tâches différentes. Voici quelques exemples de ce que ChatGPT peut faire :
- Répondre à des questions : ChatGPT peut répondre à des questions en langage naturel et fournir des informations sur une grande variété de sujets.
- Générer du texte : Il peut générer du texte semblable à celui d’un être humain dans une variété de styles et de tons, ce qui le rend utile pour la création de contenu et la génération de texte.
- Résumer un texte : ChatGPT peut fournir une vue d’ensemble concise de longs articles ou documents, ce qui permet de comprendre rapidement les idées principales.
- Traduire du texte : Il permet de traduire du texte d’une langue à l’autre, ce qui le rend utile pour communiquer avec des personnes parlant des langues différentes.
- Générer de la poésie : ChatGPT peut créer des poèmes originaux dans une variété de styles, fournissant inspiration et exemples aux poètes et écrivains.
- Fournir un retour d’information sur l’écriture : ChatGPT analyse l’écriture et fournit des commentaires sur des facteurs tels que la grammaire, le style et le ton, aidant ainsi les écrivains à améliorer leur travail.
Comment ChatGPT est-il formé ?
Une technique d’apprentissage profond appelée architecture transformatrice a formé chatGPT. La version spécifique du modèle, ChatGPT-3, a pris en compte un ensemble massif de données de plus de 45 téraoctets de texte.
Modèle de réglage fin supervisé (SFT)
Lors du développement initial, le modèle GPT-3 a évolué en engageant 40 contractants pour produire un ensemble de données d’apprentissage supervisé, dans lequel l’entrée a un résultat connu que le modèle peut apprendre. Les entrées, ou invites, étaient les entrées réelles des utilisateurs dans l’API ouverte.
Modèle de récompense
L’étape suivante consiste à utiliser un modèle de récompense pour améliorer la qualité des réponses générées. Le modèle de récompense évalue les résultats du modèle SFT. Il attribue ensuite une note en fonction du degré de correspondance avec le résultat souhaité.
Modèle d’apprentissage par renforcement
La dernière étape consiste à utiliser une approche d’apprentissage par renforcement pour améliorer encore les performances du GPT. L’algorithme d’ optimisation de la politique proximale consiste à faire interagir le chatbot IA avec des utilisateurs dans un environnement simulé. Il reçoit ensuite un signal de récompense en fonction de ses performances.
Évaluation des performances
Les données fournies par les travailleurs humains permettent de former le modèle. C’est pourquoi la partie centrale de l’évaluation repose sur le retour d’information humain, qui amène les étiqueteurs à évaluer la qualité des résultats du modèle.
Trois critères de haut niveau permettent d’évaluer le modèle :
- Utilité : Évaluation de la capacité du modèle à suivre et à déduire les instructions de l’utilisateur.
- La véracité : Dans les tâches à domaine fermé, évaluation de la propension du modèle à avoir des hallucinations (inventer des faits). Le modèle est testé à l’aide de l’ensemble de données TruthfulQA.
- L’innocuité : Évaluer si le résultat du modèle est approprié, s’il dénigre une classe protégée ou s’il contient un contenu désobligeant.
- Choisissez une API ou une bibliothèque ChatGPT : Il existe plusieurs API et bibliothèques disponibles pour utiliser ChatGPT. Choisissez celui qui correspond le mieux à vos besoins et à votre expérience de la programmation.
- Créer un compte et obtenir une clé API (si applicable) : Dans le cas de l’utilisation d’une API, la création d’un compte et l’obtention d’une clé API seront nécessaires pour utiliser ChatGPT. Suivez les instructions fournies par le fournisseur d’API.
- Installer les bibliothèques requises (en cas d’utilisation d’une bibliothèque) : Dans le cas de l’utilisation d’une bibliothèque telle que Hugging Face Transformers, il est nécessaire d’installer les bibliothèques requises dans l’environnement de programmation.
- Initialiser ChatGPT : Une fois que vous avez les bibliothèques ou les clés API nécessaires, initialisez le modèle ChatGPT dans le programme.
- Saisir l’invite : Pour utiliser ChatGPT, il est nécessaire de fournir une invite qui décrit le contexte ou le sujet de la conversation si vous voulez générer une réponse.
- Générer une réponse : Une fois l’invite fournie, le modèle ChatGPT génère une réponse basée sur l’invite d’entrée et le contexte de ses données d’apprentissage.
- Évaluer et affiner la réponse : La qualité de la réponse générée peut varier en fonction de l’invite d’entrée et d’autres facteurs. Vérifiez la réponse, car elle a encore besoin d’aide pour discerner les faits de la désinformation.
- Répétition : Répétez les étapes 5 à 7 autant de fois que nécessaire pour générer une conversation ou une série de réponses qui répondent à vos besoins.