Como é que o ChatGPT funciona?

Uma representação visual da arquitetura do ChatGPT, com o modelo de transformação que permite a sua compreensão da linguagem e capacidades de geração

A um nível elevado, ChatGPT é um modelo de aprendizagem profunda que utiliza uma rede neural para gerar texto de tipo humano. A versão específica do modelo, ChatGPT-3, é baseada numa técnica chamada arquitectura transformadora. Este tipo de arquitectura permite que o modelo reconheça padrões e estruturas na linguagem. Faz isto processando uma sequência de fichas e gerando uma sequência de saída.

O modelo incluiu um enorme conjunto de dados de texto, incluindo livros, artigos, websites, e muito mais. Durante o processo de formação, o modelo acolheu milhões de exemplos de texto e pediu para prever a palavra seguinte em cada sequência.

A forma de interagir com o ChatGPT consiste em fornecer um aviso ou uma pergunta. Em seguida, o modelo gera uma resposta com base nos padrões que aprendeu com os dados de treino. O resultado é uma ferramenta de processamento de linguagem natural (PNL) altamente inteligente.

O que significa GPT (Generative Pre-trained Transformer)?

“Generativa” em GPT representa a sua capacidade de gerar texto em linguagem humana natural. O “Pré-formado” representa o facto de o modelo já ter sido treinado em alguns conjuntos de dados finitos. O “Transformer”, por outro lado, representa a arquitetura subjacente de aprendizagem automática que alimenta o GPT.

Quais são as razões para utilizar o ChatGPT?

Como modelo linguístico formado pelo OpenAI, ChatGPT tem uma vasta gama de capacidades e pode realizar muitas tarefas diferentes. Aqui estão algumas das coisas que o ChatGPT pode fazer:

  1. Responder a perguntas: ChatGPT pode responder a perguntas em linguagem natural, fornecendo informação sobre uma grande variedade de tópicos.
  2. Gerar texto: Pode gerar texto de tipo humano numa variedade de estilos e tons, tornando-o útil para a criação de conteúdo e geração de texto.
  3. Resumir texto: ChatGPT pode fornecer uma visão geral concisa de artigos ou documentos longos, facilitando a rápida compreensão das ideias principais.
  4. Traduzir texto: Tem a capacidade de traduzir texto de uma língua para outra, o que o torna útil para comunicar com pessoas que falam línguas diferentes.
  5. Gerar poesia: ChatGPT pode criar poemas originais numa variedade de estilos, fornecendo inspiração e exemplos para poetas e escritores.
  6. Fornecer feedback sobre a escrita: O ChatGPT analisa a escrita e fornece feedback sobre factores como a gramática, o estilo e o tom, ajudando os escritores a melhorar a sua arte.

Como é que o ChatGPT é treinado?

Uma técnica de aprendizagem profunda denominada arquitectura de transformador treinou o chatGPT. A versão específica do modelo, ChatGPT-3, recebeu um enorme conjunto de dados com mais de 45 terabytes de texto.

Modelo SFT (Fine Tuning supervisionado)

No desenvolvimento inicial, o modelo GPT-3 evoluiu através da contratação de 40 contratantes para produzir um conjunto de dados de formação supervisionada, em que a entrada tem um resultado conhecido que o modelo pode aprender. As entradas, ou prompts, eram entradas reais do utilizador na API Aberta.

Modelo de Recompensa

O passo seguinte é utilizar um modelo de recompensa para melhorar a qualidade das respostas geradas. O modelo de recompensa avalia o resultado do modelo SFT. Em seguida, atribui uma pontuação com base no grau de correspondência com o resultado pretendido.

Modelo de Aprendizagem de Reforço

O passo final é utilizar uma abordagem de aprendizagem reforçada para melhorar ainda mais o desempenho do GPT. O algoritmo de Otimização da Política Proximal implica que o chatbot de IA interaja com os utilizadores num ambiente simulado. Depois, recebe um sinal de recompensa com base no seu desempenho.

Avaliação de Desempenho

A entrada de trabalhadores humanos treinam o modelo. É por isso que a parte principal da avaliação se baseia no feedback humano, levando os etiquetadores a classificar a qualidade dos resultados do modelo.

Três critérios de alto nível avaliam o modelo:

  • Utilidade: Avaliar a capacidade do modelo para seguir e inferir instruções do utilizador.
  • Veracidade: Em tarefas de domínio fechado, avaliar a propensão do modelo para alucinações (inventar factos). O modelo é testado utilizando o conjunto de dados TruthfulQA.
  • Inofensividade: Avaliar se o resultado do modelo é adequado, se deprecia uma classe protegida ou se contém conteúdo depreciativo.

Como utilizar o ChatGPT?

  1. Escolha uma API ou biblioteca do ChatGPT: Existem várias APIs e bibliotecas disponíveis para usar o ChatGPT. Escolha a que melhor se adapta às suas necessidades e experiência de programação.
  2. Criar uma conta e obter uma chave de API (se aplicável): No caso de utilização de uma API, será necessário criar uma conta e obter uma chave de API para utilizar o ChatGPT. Seguir as instruções fornecidas pelo fornecedor do API.
  3. Instalar as bibliotecas necessárias (se estiver usando uma biblioteca): No caso de utilizar uma biblioteca como a Hugging Face Transformers, será necessário instalar as bibliotecas necessárias no ambiente de programação.
  4. Inicializar o ChatGPT: Depois de ter as bibliotecas ou chaves API necessárias, inicialize o modelo ChatGPT no programa.
  5. Introduzir o prompt: Para utilizar o ChatGPT, é necessário fornecer um prompt que descreva o contexto ou o tópico da conversa, caso pretenda gerar uma resposta.
  6. Gerar resposta: Depois de fornecer o comando, o modelo ChatGPT gera uma resposta com base no comando de entrada e no contexto dos seus dados de treino.
  7. Avaliar e refinar a resposta: A qualidade da resposta gerada pode variar consoante a pergunta de entrada e outros factores. Verifique a resposta, uma vez que ainda precisa de ajuda para discernir os factos a partir da desinformação.
  8. Repetir: Repita os passos 5-7 tantas vezes quantas as necessárias para gerar uma conversa ou uma série de respostas que satisfaçam as suas necessidades.

Perguntas Mais Frequentes

O que é o OpenAI?

OpenAI é uma empresa de investigação sem fins lucrativos que visa desenvolver e dirigir a inteligência artificial (IA) de forma a beneficiar a humanidade como um todo. A empresa foi fundada por Elon Musk e Sam Altman em 2015 e está sediada em São Francisco, Califórnia, e apoiada por milhares de milhões em financiamento da Microsoft.

O que é o ChatGPT?

O ChatGPT é uma ferramenta de IA do modelo de linguagem mais recente da OpenAI e representa uma melhoria significativa em relação ao GPT-3.5. Tal como muitos modelos linguísticos de grande dimensão, gera texto numa variedade de estilos e para uma variedade de objectivos, mas com muito maior precisão, detalhe e coerência. É a próxima geração da linha de modelos de linguagem de grande dimensão da OpenAI, com uma forte ênfase nas conversas interactivas. ChatGPT é o último passo na implementação iterativa do OpenAI de sistemas de IA generativos cada vez mais seguros e úteis.

Partilhar a publicação:

I.A. de última geração

Comece a usar o Eskritor agora!

Artigos relacionados

Uma imagem de um ecrã de computador que mostra uma conversa com a GPT-3, sobreposta a diagramas que ilustram as etapas de processamento da linguagem da AI
Eskritor

Como funciona o GPT-3?

As etapas abaixo explicam como a GPT-3 funciona para gerar respostas: Porque é que o GPT-3 é útil? Aqui está uma lista de razões pelas quais o GPT-3 é útil:

Um gráfico visual que apresenta dados relacionados com o impacto da AI no mercado de trabalho dos redactores de conteúdos
Eskritor

A IA Substituirá os Escritores de Conteúdos?

Sim, os escritores de IA podem substituir alguns escritores, mas nunca podem substituir os bons escritores. Irá substituir certos tipos de trabalhos de escrita. Os geradores de conteúdos de IA

Uma representação visual da arquitetura do ChatGPT, com o modelo de transformação que permite a sua compreensão da linguagem e capacidades de geração
Eskritor

Como é que o ChatGPT funciona?

A um nível elevado, ChatGPT é um modelo de aprendizagem profunda que utiliza uma rede neural para gerar texto de tipo humano. A versão específica do modelo, ChatGPT-3, é baseada