Como criar uma instância ChatGPT personalizada com seus dados privados

Ao fornecer a tecnologia GPT em um bot de bate-papo poderoso e fácil de usar, o ChatGPT se tornou o modelo de IA mais popular do mundo. Muitas pessoas o usam para iniciar conversas envolventes, responder perguntas, fazer sugestões criativas e ajudar na programação e redação. No entanto, o ChatGPT é limitado porque você não pode armazenar seus dados para uso pessoal a longo prazo, e a principal desvantagem é que ele possui dados de conhecimento até setembro de 2021.

Como alternativa, uma API da OpenAI e LangChain pode ser usada para fornecer ao ChatGPT dados e informações personalizados atualizados após 2021 para criar uma instância ChatGPT personalizada. Verificar Comparação entre ChatGPT e Google Gemini: qual modelo é melhor para programação?

Por que você deseja criar o ChatGPT com dados personalizados?

Alimentar o ChatGPT com dados personalizados e fornecer informações atualizadas além da data de expiração do conhecimento oferece muitos benefícios além de apenas usar o ChatGPT como de costume. Aqui estão apenas alguns deles:

  1. Interações específicas: Ao fornecer dados personalizados ao ChatGPT, os usuários podem criar uma experiência mais personalizada. O modelo pode ser treinado em conjuntos de dados específicos relevantes para usuários ou organizações individuais, resultando em respostas personalizadas para suas necessidades e preferências exclusivas.
  2. Experiência em campo: A integração personalizada de dados permite que o ChatGPT se especialize em áreas ou setores específicos. Ele pode ser treinado em conhecimento, terminologia e tendências específicas do setor, permitindo respostas mais precisas e detalhadas nessas áreas específicas.
  3. Informações atuais e precisas: O acesso a informações atualizadas garante que o ChatGPT se mantenha atualizado com os últimos desenvolvimentos e conhecimentos. Ele pode fornecer respostas precisas com base em eventos, notícias ou pesquisas recentes, tornando-o uma fonte de informações mais confiável.

Agora que você entendeu a importância de provisionar dados customizados para o ChatGPT, aqui vai um passo a passo de como fazer isso no seu computador local.

Etapa 1: instalar e baixar aplicativos e scripts pré-criados

Observe que as instruções a seguir são para um dispositivo Windows 10 ou Windows 11.

Para fornecer dados personalizados ao ChatGPT, você precisará instalar e baixar a versão mais recente do Python3, Git, Microsoft C++ e o script de recuperação ChatGPT do GitHub. Se você já possui alguns aplicativos instalados em seu computador, certifique-se de atualizá-los com a versão mais recente para evitar soluços durante o processo.

Comece com a instalação:

Baixar: Python3 (Livre)

Baixar: Git (Livre)

Baixar: Ferramentas de compilação do Microsoft Visual (Livre)

Notas sobre a instalação do Python3 e do Microsoft C++

Ao instalar o Python3, certifique-se de selecionar uma opção Adicionar python.exe ao PATH antes de clicar Instale agora. Isso é importante porque permite acessar o Python em qualquer diretório do seu computador.

Ao instalar o Microsoft C++, você precisará primeiro instalar o Microsoft Visual Studio Build Tools. Depois de instalado, você pode selecionar a opção Desenvolvimento de desktop com C++ e clicar em Instalar com todas as ferramentas opcionais selecionadas automaticamente na barra lateral direita.

Agora que você tem as versões mais recentes do Python3, Git e Microsoft C++ instaladas, pode baixar um script Python para consultar facilmente dados locais personalizados.

Baixar: Script de recuperação do ChatGPT (Livre)

Para baixar o script, clique Code , Então selecione Baixar ZIP. Isso deve baixar o script Python no diretório padrão ou especificado.

Uma vez baixado, agora podemos configurar um ambiente local. Verificar Como usar o ChatGPT para dominar a arte de contar histórias.

Etapa 2: configurar o ambiente local

Para configurar o ambiente, você precisará abrir o Terminal na pasta chatgpt-recovery-main que você baixou. Para fazer isso, abra a pasta chatgpt-recovery-main, clique com o botão direito do mouse e selecione Abrir no Terminal.

Quando o Terminal abrir, copie e cole este comando:

pip install langchain openai chromadb tiktoken unstructured

Este comando usa o gerenciador de pacotes Python para criar e gerenciar o ambiente Python virtual necessário.

Depois de criar o ambiente virtual, precisamos fornecer uma chave de API da OpenAI para acessar seus serviços. Primeiro, precisaremos gerar uma chave de API no site Keys API OpenAI Clicando Criar uma nova chave secreta , adicione um nome à chave e pressione o botão Criar uma chave secreta.

Você será presenteado com uma sequência de caracteres. Esta é a sua chave de API OpenAI. Copie-o clicando no ícone de cópia ao lado da chave de API. Observe que a chave da API deve ser mantida em segredo. Não o compartilhe com outras pessoas, a menos que realmente pretenda que o usem com você.

Uma vez copiado, volte para a pasta chatgpt-recovery-main e abra o arquivo Constants com o Bloco de Notas. Agora substitua o espaço reservado pela sua chave de API. Lembre-se de salvar o arquivo!

Agora que você configurou com sucesso seu ambiente padrão e adicionou sua chave de API OpenAI como uma variável de ambiente. Agora você pode enviar seus dados personalizados para ChatGPT.

Etapa 3: adicionar os dados personalizados

Para adicionar dados personalizados, coloque todos os seus dados de texto personalizados na pasta Dados dentro do chatgpt-recovery-main. O formato de dados de texto pode estar no formato PDF, TXT ou DOC.

Como você pode ver na captura de tela acima, adicionei um arquivo de texto com uma tabela pessoal configurada e um artigo que escrevi sobre Aceleradores de instinto da AMD , e um documento PDF.

Etapa 4: consultar informações usando o ChatGPT por meio do Terminal

O script Python permite consultar informações dos dados personalizados que adicionamos à pasta Dados e Internet. Em outras palavras, você terá acesso ao backend usual do ChatGPT e a todos os dados armazenados localmente na pasta de dados.

Para usar o script, execute chatgpt.py Em seguida, adicione sua pergunta ou consulta como um argumento.

python chatgpt.py “YOUR QUESTION”

Certifique-se de colocar suas perguntas entre aspas.

Para testar se alimentamos com sucesso nossos dados do ChatGPT, vou fazer uma pergunta pessoal sobre o perfil Sched.txt.

O modelo funcionou! Isso significa que o ChatGPT conseguiu ler o perfil provisionado anteriormente. Agora vamos ver se conseguimos alimentar o ChatGPT com informações que ele não conhece por causa da data desatualizada da base de conhecimento.

Como você pode ver, ele descreveu corretamente o AMD Instinct MI250x, que foi lançado após a data de descontinuação da Base de Conhecimento para ChatGPT -3.

Limites de instância personalizada do ChatGPT

Embora a alimentação de dados personalizados GPT-3.5 abra mais maneiras de implementar e usar o LLM, existem algumas desvantagens e limitações.

Primeiro, você precisa fornecer todos os dados sozinho. Você ainda pode acessar todo o conhecimento para GPT-3.5 até a data final do conhecimento; No entanto, você deve fornecer todos os dados adicionais. Isso significa que, se você deseja que seu modelo local esteja ciente de um tópico específico na Internet que o GPT-3.5 ainda não conhece, você terá que acessar a Internet, coletar os dados e salvá-los como texto no chatgpt- pasta de dados principais de recuperação.

Outro problema é que uma consulta personalizada no ChatGPT leva mais tempo para carregar quando comparada a uma consulta direta do ChatGPT.

Finalmente, o único modelo atualmente disponível é o GPT-3.5 Turbo. Portanto, mesmo que você tenha acesso GPT-4, não poderá usá-lo para executar sua própria instância ChatGPT dedicada. Verificar Aplicativos que integraram o modelo GPT-4 em seu núcleo, mas como eles funcionam?

O chat dedicado é ótimo, mas é limitado

Fornecer dados personalizados ao ChatGPT é uma maneira eficiente de aproveitar ao máximo seu formulário. Com esse método, você pode alimentar o formulário com qualquer dado de texto que desejar e reivindicá-lo como o ChatGPT normal, embora com algumas limitações. No entanto, isso mudará no futuro, pois ficará mais fácil integrar nossos dados ao LLM, juntamente com o acesso ao modelo GPT-4 mais recente. Você pode ver agora Sinais de que você está falando com um bot de IA.

Ir para o botão superior