- Publicidade -
- Publicidade -
- Publicidade -
AI, ML & Deep Learning

Prompt learning otimiza sistemas de LLM com feedback em inglês

- Publicidade -
- Publicidade -

São Paulo — InkDesign News —

A nova abordagem de “Prompt Learning” (PL) visa otimizar a interação com modelos de machine learning ao utilizar feedback em linguagem natural. A técnica se destaca por permitir melhorias pelo uso de explicações em inglês, conforme revelado em estudos recentes.

Arquitetura de modelo

A técnica de Prompt Learning é inspirada no trabalho da equipe de Jim Fan da NVIDIA, que explorou o conceito em sua pesquisa sobre agentes autônomos. O sistema é projetado para operar continuamente, incorporando feedback direto nas instruções do prompt, ao invés de realizar ajustes nas weights tradicionais, que requerem grandes quantidades de exemplos. Essa abordagem tem como objetivo resolver problemas complexos que não se traduzem facilmente em métricas quantitativas.

“O termo de erro em inglês permite um feedback que é utilizado diretamente para ajustar instruções.”
(“The English error term allows for English feedback that is used directly to tune instructions.”)

— Autor da pesquisa

Treinamento e otimização

O Prompt Learning difere significativamente da otimização de prompt convencional, pois não depende de valores numéricos para propagar os erros. Em vez disso, utiliza explicações textuais que informam como corrigir falhas especificamente. O sistema é capaz de realizar ajustes significativos com uma fração do número de exemplos rotulados que seriam necessários por técnicas tradicionais, como as baseadas em gradient descent.

“A aprendizagem por prompt pode realizar mudanças poderosas usando exemplos individuais.”
(“Prompt learning allows you to make powerful changes using individual examples.”)

— Especialista em IA

Resultados e métricas

Os experimentos mostraram que o Prompt Learning foi capaz de melhorar o desempenho significativamente, mesmo quando confrontado com regras sutis no conjunto de dados testado — alcançando uma precisão de 100% em múltiplas iterações. Os dados coletados revelam que as abordagens de ajuste tradicionais enfrentam dificuldades ao tentar integrar feedback complexo em atualizações de modelo.

“Nos testes, a técnica identificou e abordou a maioria das regras latentes no intervalo de 5-25 regras.”
(“In testing, the technique was able to uncover and address the majority of latent rules within the 5-25 ruleset range.”)

— Analista de pesquisa

Esses resultados destacam a eficácia do Prompt Learning para uso prático em aplicações de IA onde o feedback humano é escasso. As implicações futuras dessa pesquisa poderão transformar a forma como modelos de deep learning são ajustados, favorecendo uma adaptação que priorize a inteligência coletiva e a interação contínua com usuários.

Fonte: (Towards Data Science – AI, ML & Deep Learning)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!