
São Paulo — InkDesign News — O recente avanço em machine learning se destaca ao integrar mecanismos “human-in-the-loop” em agentes de pesquisa autônomos, permitindo que a inteligência artificial trabalhe em colaboração com a supervisão humana.
Arquitetura de modelo
O modelo baseia-se na utilização de LangGraph, que representa fluxos de trabalho como grafos direcionados. Cada passo é tratado como um nó, permitindo uma estrutura modular que facilita a inclusão de intervenções humanas. Isso transforma um agente de pesquisa totalmente autônomo em um sistema colaborativo que incorpora feedback humano.
A ideia aqui é que o usuário possa revisar as consultas iniciais propostas pelo LLM e decidir se deseja editar ou aprovar a saída do LLM.
(“The idea here is that the user can review the initial queries proposed by the LLM and decide if they want to edit/approve the LLM’s output.”)— Autor, Cargo, Instituição
Treinamento e otimização
Na implementação, dois pontos de verificação foram adicionados para permitir a supervisão humana. Um exemplo é o nó responsável pela geração de consultas, que utiliza um modelo de linguagem generativa. O treinamento se concentra em otimizar a precisão e a utilização de dados relevantes ao longo do fluxo de trabalho do agente.
Esses pontos de verificação garantem que o agente não se desvie do objetivo, mantendo a eficiência da pesquisa.
(“These checkpoints ensure that the agent does not deviate from the goal, maintaining the efficiency of the research.”)— Autor, Cargo, Instituição
Resultados e métricas
Os resultados demonstraram que a inclusão de feedback humano melhora a qualidade das respostas geradas pelo agente de pesquisa. Métricas de precisão e relevância foram elevadas com essa abordagem, com uma melhoria significativa na coleta e síntese de informações da web.
Agora, temos um mecanismo embutido para evitar que o agente se desvie do caminho enquanto aproveitamos a eficiência da pesquisa automatizada.
(“Now we have a built-in mechanism to prevent the agent from going off-track while enjoying the efficiency of automated research.”)— Autor, Cargo, Instituição
O sistema está em vias de ser ampliado para aplicações práticas em diversos setores, desde acadêmicos até empresariais, onde a combinação de AI com controle humano pode redefinir a forma como gerenciamos e acessamos a informação.
Fonte: (Towards Data Science – AI, ML & Deep Learning)