- Publicidade -
- Publicidade -
- Publicidade -
Machine learning & AI

LLM aprende com exemplos e memórias em vez de regras

- Publicidade -
- Publicidade -

Contexto da pesquisa

Pesquisadores da Universidade de Oxford e do Allen Institute for AI (Ai2) conduziram um estudo sobre como modelos de linguagem amplos (LLMs) geram padrões de linguagem semelhantes aos humanos. A pesquisa, publicada na Proceedings of the National Academy of Sciences, questiona a visão predominante de que LLMs aprendem a gerar linguagem principalmente por meio de regras gramaticais.

Método proposto

O estudo analisou a capacidade do modelo GPT-J, um LLM de código aberto desenvolvido pela EleutherAI em 2021, para transformar adjetivos em substantivos utilizando os sufixos “-ness” e “-ity”. Para isso, foram gerados 200 adjetivos fictícios, como “cormasive” e “friquish”, os quais o modelo deveria converter.

O LLM baseou suas respostas em semelhanças com palavras reais que encontrou durante seu treinamento.
(“The LLM’s behavior resembled human analogical reasoning.”)

— Janet Pierrehumbert, Professora de Modelagem Linguística, Universidade de Oxford

Resultados e impacto

Os resultados mostraram que o GPT-J não utilizava regras, mas sim analogias baseadas em palavras que já conhecia. A pesquisa indicou que o modelo funciona como se tivesse uma “memória” referente a cada palavra encontrada durante o treinamento, tomando decisões linguísticas com base em semelhanças. Isso difere da forma como os humanos formam analogias, que utilizam um dicionário mental, considerando todas as formas de palavras como significativas, independentemente da frequência. O estudo também registrou uma correspondência notável entre as predições do LLM e os padrões estatísticos dos dados de treinamento.

Os achados fornecem uma visão mais clara do funcionamento interno dos LLMs ao gerar linguagem e apoiarão futuros avanços em IA robusta e explicável.
(“This study is a great example of synergy between linguistics and AI as research areas.”)

— Dr. Valentin Hofman, Ai2 e Universidade de Washington

Esse tipo de pesquisa pode abrir caminho para aplicações mais efetivas na área de machine learning, com um foco em uma IA que aprende e interage de forma mais semelhante ao ser humano.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!