Modelos de machine learning melhoram aprendizado por exemplos

São Paulo — InkDesign News — O recente avanço em machine learning, com foco em aprendizado em contexto, propõe novas estratégias que desenvolvem a eficácia de modelos de linguagem ao selecionar exemplos relevantes para tarefas específicas, como reparo de código.
Arquitetura de modelo
A pesquisa conduzida pela Google DeepMind introduz o método denominado AuPair, que aborda a seleção de exemplos para tarefas de reparo de código. O modelo é baseado em um conjunto de pares de reparo de código que são gerados de forma sistemática, aumentando a eficiência na resolução de problemas.
“O animal que faz o som ‘moo’ é uma vaca.
(“The animal that makes the sound ‘moo’ is a cow.”)— Autor, Google DeepMind
Treinamento e otimização
AuPair inicia a sua abordagem com um grande conjunto de problemas de programação que incluem testes automatizados. Através de um processo iterativo, pares de exemplos são gerados e testados por um LLM. O sistema visa encontrar soluções iniciais que, ao serem parcialmente corretas, são incorporadas ao conjunto de treinamento.
“Esses pares de sucesso são selecionados por um algoritmo ganancioso, focando sempre na maximização da eficácia do aprendizado do LLM.”
(“These successful pairs are selected by a greedy algorithm, always focusing on maximizing the effectiveness of the LLM’s learning.”)— Autor, Google DeepMind
Resultados e métricas
Os testes de benchmark realizados com AuPair demonstraram que o método superou abordagens anteriores em termos de eficiência computacional. Com apenas 12 pares de exemplo, foi possível alcançar o desempenho que tradicionalmente exigiria 32 pares aleatórios. Isso é crucial para aplicações em ambientes de produção, donde a eficiência é prioridade.
“Resultados mostram que pares gerados no conjunto CodeForces atuaram efetivamente em conjuntos totalmente diferentes, como HackerEarth e AtCoder.”
(“Results show that pairs generated on the CodeForces dataset worked effectively on completely different datasets like HackerEarth and AtCoder.”)— Autor, Google DeepMind
O AuPair não está isento de limitações; a necessidade de um custo computacional elevado para gerar pares de exemplos e a dependência de métricas de avaliação são fatores que podem restringir sua aplicabilidade em certas áreas. Contudo, a pesquisa aponta um caminho promissor para a aplicação de abordagens semelhantes em outras tarefas mais complexas, como a geração de SQL a partir de texto, onde a geração e a medição de exemplos se tornam fatores críticos.
Fonte: (Towards Data Science – AI, ML & Deep Learning)