
São Paulo — InkDesign News — Pesquisadores do MIT desenvolveram o SEAL, um framework inovador para modelos de linguagem que permite a adaptação contínua e autoatualização dos parâmetros internos, fundamental para a inteligência artificial em ambientes dinâmicos.
Tecnologia e abordagem
O SEAL, que significa Self-Adapting Language Models, aplica um algoritmo de aprendizado por reforço (RL) para ensinar LLMs a gerar suas próprias instruções e dados de treinamento. Essa abordagem permite que o modelo não apenas absorva novos conhecimentos, mas também desenvolva estratégias personalizadas para integrar informações recentes. O SEAL opera em um sistema de duas camadas: um “loop interno” no qual o modelo faz atualizações temporárias em seus pesos, e um “loop externo” que avalia a eficácia dessas mudanças em tarefas específicas.
Aplicação e desempenho
Os pesquisadores testaram o SEAL em integrar conhecimentos e aprendizado com poucos exemplos. Na tarefa de incorporação de conhecimento, a precisão do modelo aumentou para 47% ao gerar “autoedições” e treinar-se com dados sintéticos, superando resultados de modelos maiores, como o GPT-4.1. Para aprendizado com poucos exemplos, o SEAL alcançou uma taxa de sucesso de 72,5%, uma melhoria significativa em relação aos 20% de modelos sem treinamento baseado em RL.
“Para muitas aplicações empresariais, é necessário mais do que apenas recall factual; é essencial uma adaptação mais profunda e persistente.”
(“Many enterprise use cases demand more than just factual recall—they require deeper, persistent adaptation.”)— Jyo Pari, Estudante de Doutorado, MIT
Impacto e mercado
Com a potencial escassez de dados de treinamento de alta qualidade, a capacidade de um modelo de gerar seus próprios dados se torna crucial. O SEAL segue como uma esperança para a evolução dos sistemas de IA, permitindo que modelos absorvam continuamente novos conhecimentos e intervenham em ambientes variados com maior eficiência. A implementação do SEAL pode ser escalonada, embora exija tempo para ajustes e treinamento. Os pesquisadores sugerem que um sistema pode coletar dados por várias horas antes de realizar atualizações programadas.
As implicações estratégicas desse avanço são vastas, permitindo a criação de agentes de IA que podem aprender e se adaptar com base em interações anteriores, reduzindo a dependência de supervisão externa.
Fonte: (VentureBeat – AI)