
Pesquisadores estão explorando o uso de modelos de machine learning para simular dados humanos na pesquisa científica, possibilitando avanços significativos na compreensão do comportamento humano e na execução de experimentos antes dispendiosos em tempo e recursos.
Contexto da pesquisa
Em um recente estudo, cientistas sociais avaliaram a eficácia de modelos de linguagem de grande escala (LLMs) para emular respostas humanas em experimentos de pesquisa. Esses LLMs têm o potencial de potencializar pesquisas em ciências sociais, proporcionando uma alternativa mais barata e acessível às abordagens tradicionais que envolvem sujeitos humanos. Jacy Anthis, do Stanford Institute for Human-Centered AI, aponta que essa técnica pode ajudar na execução de estudos complexos e em larga escala.
Método proposto
Os pesquisadores utilizaram o modelo de linguagem GPT-4 para simular as respostas de uma amostra representativa de americanos. Este modelo foi testado em 476 diferentes tratamentos previamente estudados, comparando os resultados gerados por ele com aqueles obtidos através de ensaios controlados randomizados (RCTs). Os LLMs foram utilizados para prever a reação dos participantes a diversos estímulos, como leituras ou vídeos sobre temas atuais, permitindo assim uma análise inicial da eficácia do tratamento.
Resultados e impacto
Os resultados mostraram que as previsões feitas pelos LLMs estavam em forte correlação (0,85) com os efeitos de tratamento efetivamente medidos em estudos anteriores. Apesar dos avanços, Anthis e seus colegas destacam a necessidade de manter a coleta de dados humanos, já que os LLMs muitas vezes apresentam respostas menos variadas e sujeitas a viés. A melhoria na precisão das simulações requer enfrentar desafios como a alteração da distribuição de respostas e a consideração de vieses inerentes nos dados utilizados nos modelos.
“Ainda temos que considerar se o uso do LLM é apropriado para nosso caso, uma vez que os resultados podem não ser generalizáveis a novas populações.”
(“We still have to consider whether using the LLM is appropriate for our case, as the results may not be generalizable to new populations.”)— Jacy Anthis, Pesquisador Visitante, Stanford Institute for Human-Centered AI
As aplicações potenciais dessa pesquisa incluem não apenas o design de experimentos mais rápidos e baratos, mas também uma maior compreensão de como comportamento humano pode ser simulado e avaliado, impactando áreas como marketing, políticas públicas e saúde.
Fonte: (TechXplore – Machine Learning & AI)