
São Paulo — InkDesign News —
Uma recente pesquisa trouxe à tona a capacidade de modelos de linguagem de grande escala (LLMs) em raciocinar por analogia, um aspecto crítico do aprendizado de máquina e da inteligência artificial (AI).
Contexto da pesquisa
Pesquisadores propuseram que alguns dos resultados positivos em raciocínio analógico por parte dos LLMs podem ser meramente reflexos de imitação das informações presentes nos dados de treinamento. Para testar essa hipótese, modelos foram desafiados com problemas contrafactuais.
Método proposto
O estudo, conduzido por Taylor W. Webb e colaboradores, focou no uso do GPT-4, um dos modelos mais avançados, que possui a capacidade de escrever e executar código. Isso permitiu que o modelo desenvolvesse um algoritmo para contagem, essencial para resolver problemas baseados em sequências de letras.
A pesquisa revelou que o GPT-4 conseguiu resolver analogias de letras contrafactuais com desempenho semelhante ao humano, fornecendo explicações coerentes e precisas sobre as respostas corretas.
(“The research revealed that GPT-4 could solve counterfactual letter analogies with human-like performance, providing coherent and accurate explanations of the correct answers.”)— Taylor W. Webb, Pesquisador, PNAS Nexus
Resultados e impacto
A execução correta das tarefas de analogia de letras demonstrou que o GPT-4 possui a capacidade de raciocinar por analogia, suportada por operações estruturadas e representações relacionais emergentes. No entanto, modelos anteriores apresentaram dificuldades significativas em ativar essas habilidades, destacando a importância da contagem em problemas complexos.
As métricas de desempenho indicam que o modelo alcançou resultados que podem ser comparados aos de humanos, sublinhando um avanço significativo na compreensão e na aplicação de LLMs em tarefas complexas.
Futuras aplicações incluem potencial uso em áreas como educação, onde a capacidade de raciocínio por analogia poderia ser utilizada para melhorar o aprendizado e a resolução de problemas.
Fonte: (TechXplore – Machine Learning & AI)