
Machine Learning e suas aplicações têm avançado rapidamente nas ciências cognitivas, possibilitando novas compreensões sobre como humanos e modelos de linguagem se relacionam à estrutura da linguagem.
São Paulo — InkDesign News — Pesquisadores da Universidade de Zhejiang descobriram que humanos e modelos de linguagem de grande porte (LLMs), como o ChatGPT, apresentam similaridades notáveis na forma como representam sentenças. Os resultados foram publicados na revista Nature Human Behavior.
Contexto da pesquisa
O estudo busca compreender como as pessoas representam, codificam e processam a linguagem. A introdução de LLMs oferece uma nova perspectiva para entender essas questões, especialmente na comparação entre a performance humana e a de máquinas em tarefas linguísticas.
Método proposto
Os pesquisadores desenvolveram uma tarefa que envolveu 372 participantes humanos, incluindo falantes nativos de chinês, nativos de inglês e bilíngues. O experimento pedia aos participantes e ao ChatGPT que deletassem palavras de uma sentença, inferindo regras de exclusão a partir de uma demonstração inicial.
“Os participantes e LLMs foram solicitados a inferir quais palavras deveriam ser deletadas de uma sentença.”
(“Participants and LLMs were asked to infer which words should be deleted from a sentence.”)— Wei Liu, Pesquisador, Universidade de Zhejiang
Resultados e impacto
Os resultados mostraram que tanto humanos quanto LLMs eliminaram unidades constituintes em vez de sequências aleatórias de palavras, de acordo com regras específicas das línguas. Isso sugere que a representação interna de sentenças por LLMs se alinha com teorias linguísticas, permitindo a reconstrução da estrutura de árvore constituinte com base nas palavras deletadas.
O estudo não apenas avança no entendimento sobre a representação de sentenças tanto em humanos quanto em LLMs, mas também indica potenciais aplicações para a melhoria de modelos de linguagem na execução de tarefas linguísticas complexas.
Nos próximos passos, é possível desenvolver novas investigações sobre padrões de representação em diversos contextos linguísticos, expandindo a compreensão sobre as interações entre humanos e inteligência artificial.
Fonte: (TechXplore – Machine Learning & AI)