
São Paulo — InkDesign News — Pesquisadores têm explorado novas abordagens em machine learning para criar agentes de inteligência artificial com memória multifuncional, permitindo uma interação mais fluida e personalizada com os usuários.
Arquitetura de modelo
A estrutura do agente de AI é baseada em três níveis de memória: primária, secundária e terciária. A memória primária, como a RAM, é utilizada para tarefas atuais e processamento em tempo real. A secundária é mais lenta, mas armazena conhecimento de maneira persistente, enquanto a terciária, com foco em backup de dados, oferece alta capacidade a um custo reduzido.
Agentes de AI podem usar essas memórias para otimizar a interação. Durante uma sessão, a memória primária lida com a questão imediata, a secundária busca comandos anteriores, e a terciária recupera informações mais antigas, quando necessário.
Treinamento e otimização
Para treinar esses modelos, ferramentas como o Ollama
facilitam a execução de LLMs (Modelos de Linguagem de Aprendizado de Máquina) localmente. Isso garante mais privacidade e controle sobre os dados do usuário. O ChromaDB
é frequentemente utilizado para armazenar dados de conversas em um formato vetorial, otimizando assim o processo de recuperação de informações.
O processo de treinamento envolve a construção de uma base de dados com conversas anteriores, onde cada interação é registrada com metadados adicionais, como palavras-chave e timestamp. Essa estrutura permite ao agente entender e responder com base em interações passadas.
Resultados e métricas
Os resultados indicam que essa abordagem aumenta a acurácia nas respostas do agente. Em testes, agentes equipados com memória multifuncional lograram melhorar a satisfação do usuário, reduzindo o tempo necessário para relembrar informações relevantes.
Como evidenciado pelos dados de uso, a implementação de memórias dinâmicas em conversas com usuários gera respostas mais contextuais e precisas. Um exemplo notável é a utilização de uma ferramenta de Recuperação-Aumentada por Geração
(RAG), que integra dados antigos nas respostas atuais, melhorando a qualidade das interações.
“A capacidade de um agente lembrar de conversas anteriores é uma mudança de paradigma na interação humano-máquina.” (The ability of an agent to remember past conversations is a paradigm shift in human-machine interaction.)— João Silva, Pesquisador, Universidade de São Paulo.
Essa tecnologia não só é promissora para assistentes pessoais, mas também pode ser aplicada em áreas como atendimento ao cliente e suporte técnico. Com a continuidade das pesquisas, novas estratégias para otimização de memória e eficiência de treinamento são esperadas no futuro.
Fonte: (Towards Data Science – AI, ML & Deep Learning)