
São Paulo — InkDesign News — Pesquisas recentes em machine learning estão revolucionando a forma como avaliamos habilidades de comunicação, especialmente em inglês, proporcionando sistemas automatizados mais precisos e abrangentes.
Contexto da pesquisa
A comunicação eficaz em inglês é um fator determinante para o sucesso acadêmico e profissional. Tradicionalmente, as avaliações de fluência eram feitas através de testes presenciais, consumindo tempo e recursos. Recentemente, a ascensão da inteligência artificial (AI) e do machine learning trouxe uma nova perspectiva, permitindo testes automatizados que são mais acessíveis e menos onerosos.
Método proposto
Uma equipe de pesquisadores da Japan Advanced Institute of Science and Technology (JAIST), liderada pelo Professor Shogo Okada e incluindo a Professora Assistente Candy-Olivia Mawalim, desenvolveu uma abordagem de aprendizado multioutput para avaliar simultaneamente múltiplas facetas da proficiência em inglês falado. Esta pesquisa utiliza um conjunto de dados inovador chamado Spoken English Evaluation (SEE), que consiste em áudio, vídeo e transcrições textuais sincronizadas de entrevistas de alta tensão com adolescentes entre 9 e 16 anos.
“Nosso modelo permite a modelagem e integração de diferentes aspectos da proficiência em fala, melhorando nossa compreensão dos vários fatores subjacentes.”
(“Our framework allows for the modeling and integration of different aspects of speaking proficiency, thereby improving our understanding of the various underlying factors.”)— Candy-Olivia Mawalim, Professora Assistente, JAIST
Resultados e impacto
O modelo implementa características acústicas, como prosódia, e sinais visuais, como unidades de ação facial, em combinação com padrões linguísticos. O uso do algoritmo Light Gradient Boosting Machine (LightGBM) resultou em uma acurácia de previsão de cerca de 83% na avaliação SEE, uma melhoria significativa em comparação com abordagens unimodais.
Além disso, a pesquisa também considera a importância da sequência de pronunciamentos na proficiência oral, utilizando o modelo BERT (Bidirectional Encoder Representations from Transformers) para identificar que o primeiro pronunciamento tem grande relevância na previsão da proficiência falada. Características como o comportamento do entrevistador e o ambiente da entrevista também foram analisadas, mostrando um impacto significativo na coerência das respostas dos entrevistados.
“Com o rápido crescimento das tecnologias impulsionadas por AI, as avaliações multimodais podem se tornar padrão nos ambientes educacionais em um futuro próximo.”
(“With the rapid growth of AI-driven technologies and their expanding integration into our daily lives, multimodal assessments could become standard in educational settings in the near future.”)— Candy-Olivia Mawalim, Professora Assistente, JAIST
Os resultados apresentam implicações valiosas para educadores, proporcionando ferramentas que podem ser utilizadas para personalizar o ensino e melhorar habilidades interpessoais e de comunicação, essenciais no mercado de trabalho atual.
Fonte: (TechXplore – Machine Learning & AI)