
O recente avanço em machine learning promete revolucionar a interação com sistemas de diálogo, permitindo que esses sistemas aprendam novas palavras a partir de conversas através de um novo método desenvolvido na Universidade de Osaka.
Contexto da pesquisa
Sistemas de diálogo tradicionais frequentemente falham em reconhecer palavras que não estão em seus dados de treinamento, incluindo gírias locais e termos recém-criados. Pesquisadores da Universidade de Osaka, liderados pela equipe do laboratório Sanken, desenvolveram uma abordagem inovadora que possibilita a esses sistemas aprenderem com intervenções mínimas, mantendo a fluidez da conversa.
Método proposto
Os pesquisadores formulam o processo de aprendizado como um problema de aprendizado ativo baseado em streams. O sistema utiliza técnicas de reinforcement learning (aprendizado por reforço), incluindo auto-marcadores (pseudo-labeling) e tomada de decisão ciente de recursos (budget-aware decision-making), para atualizar seu vocabulário com menos perguntas aos usuários. Assim, ele pode decidir quando é apropriado solicitar confirmação sobre novas palavras, aumentando a eficiência na aquisição de conhecimento.
Resultados e impacto
Experimentos de simulação demonstraram que com essa abordagem, o desempenho na segmentação de palavras melhorou significativamente, enquanto o número de perguntas feitas aos usuários foi reduzido. Essa inovação pode transformar a interatividade entre humanos e máquinas, permitindo que sistemas como assistentes pessoais aprendam expressões únicas de cada família, tornando-se companhias mais familiares e confiáveis do que ferramentas intrusivas.
“Modelos de linguagem grandes são treinados em vastos dados de texto, mas não podem se adaptar às palavras e expressões únicas de cada lar por meio da interação”, esclarece o Professor Kazunori Komatani. “Nosso trabalho avança na direção de sistemas de diálogo que aprendem de forma pessoal, tornando-se companheiros mais próximos na vida cotidiana.”
(“Large language models are trained on massive text data, but they cannot adapt to the unique words and expressions of each household through interaction,” explains Professor Kazunori Komatani.)— Professor Kazunori Komatani, Universidade de Osaka
Essa pesquisa abre novas possibilidades para a evolução dos sistemas de diálogo, que, no futuro, poderão aprender não apenas os termos comuns, mas também formações únicas de linguagem em ambientes familiares.
Fonte: (TechXplore – Machine Learning & AI)