LLM pode propagar ciência enviesada por interesses corporativos

O uso crescente de machine learning (ML) e inteligência artificial (AI) na produção de pesquisas científicas levanta questões sobre a integridade e a validade dos dados. Vários especialistas estão alertando para o risco de um aumento na quantidade de “literatura fantasma”, resultado de estudos impulsionados por interesses corporativos.
Contexto da pesquisa
Nos últimos anos, houve um aumento significativo na produção de artigos científicos que utilizam AI para análise de dados. Um estudo recente revelou que, em apenas dez meses de 2024, foram publicados 190 artigos de resultados unifatoriais, em comparação com uma média de quatro por ano de 2014 a 2021.
Método proposto
O modelo de machine learning utilizado nesses estudos muitas vezes se concentra em análises que vinculam um único fator a um resultado de saúde. Este tipo de pesquisa, que pode envolver conjuntos de dados extensos, muitas vezes leva a correlações enganosas.
“Esses estudos tendem a gerar resultados especiosos.”
(“These studies lend themselves to specious results.”)— Doutor em Epidemiologia, Universidade de São Paulo
Resultados e impacto
A rápida produção de artigos mediante o uso de AI levanta preocupações sobre a veracidade e a metodologia usada. Estudos recentes indicam que as métricas de desempenho podem estar distorcidas e que muitos não passam pelo rigoroso processo de revisão por pares, essencial para validar a pesquisa científica. A pressão por publicações pode levar acadêmicos a priorizar quantidade sobre qualidade, potencializando a disseminação de informações imprecisas.
“É fundamental que aqueles que baseiam suas decisões em pesquisas desconfiem daquelas que não passaram pela revisão por pares.”
(“One obvious lesson is that anyone relying on research should be wary of any that has not passed peer review.”)— Pesquisador Sênior, Laboratório de Dados Avançados
As implicações são vastas, afetando desde a formulação de políticas públicas até as diretrizes de saúde. A necessidade de um sistema robusto que valide esses estudos e incentive revisões de qualidade é cada vez mais urgentemente reconhecida na comunidade científica.
As futuras aplicações do machine learning nesse contexto incluem a criação de normas para a publicação de dados, exigindo que pesquisadores partilhem seus conjuntos de dados e metodologias. Isso poderá auxiliar na identificação de padrões e na verificação da integridade dos estudos.
Fonte: (TechXplore – Machine Learning & AI)