
São Paulo — InkDesign News — Um novo avanço em machine learning tem potencial para alterar as interações com tecnologias de IA, ao permitir a construção de agentes autônomos que podem chamar APIs para acessar dados em tempo real.
Arquitetura de modelo
A arquitetura do OpenAI Agents SDK permite a criação de agentes, que são essencialmente Modelos de Linguagem de Grande Escala (LLMs) configuráveis. Este framework fornece instruções específicas e ferramentas que os agentes podem utilizar. Por exemplo, ao definir um agente, é possível personalizar suas instruções e a capacidade de acessar APIs externas.
“Você fornece atualizações meteorológicas precisas e concisas com base nas consultas dos usuários em linguagem simples.”
(“You provide accurate and concise weather updates based on user queries in plain language.”)— Desenvolvedor, OpenAI Agents SDK
Treinamento e otimização
Os agentes são treinados em um vasto conjunto de dados e, ao serem configurados para acceder a APIs, tornam-se mais eficazes na recuperação de informações atualizadas. Isso representa uma grande melhoria em relação aos LLMs tradicionais, que geralmente dependem de dados desatualizados.
Em um cenário prático, um agente pode responder consultas meteorológicas precisas. No entanto, o treinamento adequado e a configuração das instruções são cruciais para evitar a geração de respostas “alucinatórias”, que muitas vezes invertem a realidade. A introdução de funções que acessam dados em tempo real é uma abordagem inovadora para evitar tais erros.
“Eu não consigo fornecer informações em tempo real, mas você pode conferir um site ou aplicativo de clima confiável para as atualizações mais recentes.”
(“I can’t provide real-time information, but you can check a reliable weather website or app for the latest updates.”)— Assessor, OpenAI
Resultados e métricas
Os resultados demonstram que um agente configurado corretamente pode responder com precisão às perguntas. Durante os testes, quando questionado sobre as condições climáticas atuais, o agente foi capaz de acessar a API da Open-Meteo e retornou uma resposta elaborada e estruturada. Além disso, esses agentes podem ser integrados em aplicações interativas, como interfaces de usuários baseadas em Streamlit, aumentando sua acessibilidade e utilidade para os usuários finais.
O comportamento observado ao usar diferentes configurações do agente — como a opção de “stop_on_first_tool” versus “run_llm_again” — fornece percepções sobre como a interpretação das respostas impacta a experiência do usuário e a eficácia do agente.
Em termos de aplicabilidade prática, tais agentes têm o potencial de serem utilizados em áreas diversas, desde atendimento ao cliente até assistentes pessoais. O próximo passo nas pesquisas pode incluir a implementação de sistemas de múltiplos agentes que colaboram entre si para proporcionar uma experiência ainda mais intuitiva para os usuários.
Fonte: (Towards Data Science – AI, ML & Deep Learning)