IA utiliza machine learning para desmentir rumores rapidamente

São Paulo — InkDesign News — O avanço do machine learning e deep learning tem possibilitado o desenvolvimento de sistemas automatizados de verificação de fatos, fundamentais para combater a disseminação de desinformação em redes sociais. A automação permite velocidade e abrangência na validação de informações.
Arquitetura de modelo
Os sistemas de verificação de fatos tradicionalmente eram manuais, mas pesquisadores têm desenvolvido pipelines automatizados que emulam o trabalho de especialistas. O fluxo de trabalho inclui etapas como detecção de reclamações, priorização, e recuperação de evidências. A adição de um componente de recuperação de reclamações previamente verificadas (PFCR) agiliza os processos ao evitar a repetição de verificações.
“O que deveria ser um espaço de informações abertas e confiáveis se tornou um paradoxo.”
(“The original idea of a space for open, uncensored, and reliable information has run into a paradox.”)— Autor do estudo, Instituto de Pesquisa
Com a arquitetura retriever-re-ranker, sistemas moderna são capazes de equilibrar a velocidade de recuperação e a precisão na validação. O uso de modelos lexicais como BM25, combinados com modelos semânticos como E5 e BGE, permite que o sistema seja adaptado a múltiplas variações de desinformação.
Treinamento e otimização
Os modelos utilizados na fase de recuperação são categorizados em lexicais e semânticos. Modelos lexicais, como BM25, demonstram eficácia em correspondências exatas, enquanto modelos semânticos têm desempenho superior ao capturar a essência do significado, mesmo em traduções ou paráfrases.
“A diversidade é a chave para um sistema de verificação robusto.”
(“Diversity is key.”)— Autor do estudo, Instituto de Pesquisa
A implementação de um ensemble com múltiplos modelos tem provado ser uma abordagem eficaz, pois cada modelo complementa a limitação do outro. O ajuste fino dos pesos aplicados a cada modelo no ensemble resultou em um aumento significativo da acurácia do sistema.
Resultados e métricas
Resultados preliminares mostram que a combinação de modelos lexicais e semânticos em um ensemble otimizou não só a precisão na recuperação de informações mas também melhorou a cobertura, garantindo que menos informações relevantes fossem perdidas no processo.
A importância do desenvolvimento de sistemas automatizados de verificação de feitos reside na sua capacidade de responder rapidamente à desinformação, especialmente em um mundo que valoriza informações instantâneas.
Os próximos passos da pesquisa envolvem a ampliação da capacidade dos sistemas de verificação com integração de novas tecnologias de controle de qualidade e avaliação de métricas, aumentando assim a resiliência contra a evolução continuada da desinformação.
Fonte: (Towards Data Science – AI, ML & Deep Learning)