- Publicidade -
- Publicidade -
- Publicidade -
Machine learning & AI

IA ignora falantes não ingleses em machine learning

- Publicidade -
- Publicidade -

São Paulo — InkDesign News —

A pesquisa recente aponta que os modelos de machine learning, particularmente as LLMs (Large Language Models), têm deixado de fora muitas comunidades e culturas, aumentando o risco de desinformação e viés para as falantes de línguas de menor recurso.

Contexto da pesquisa

Um estudo da Universidade de Stanford revela que as LLMs, como ChatGPT e Gemini, apresentam um desempenho muito inferior para falantes de idiomas como o vietnamita e o nahuatl, resultando em uma divisão digital que afeta 97 milhões e 1,5 milhão de pessoas, respectivamente. Este fenômeno é decorrente da escassez de dados, que limita a eficácia dos modelos nessas línguas.

Método proposto

A investigação foca na eficiência de modelos de machine learning ao lidar com idiomas menos documentados. Alta performance é observada quando os modelos têm acesso a dados abundantes, enquanto a falta de dados adequados resulta em desempenho insatisfatório. “Modelos tendem a se sair bem quando as tarefas são semelhantes aos dados de treinamento que receberam” (“Models do really well when the tasks they are asked to solve are similar to their training data”), afirma Sanmi Koyejo, professor assistente da Stanford School of Engineering.

Resultados e impacto

O impacto da exclusão digital não é apenas uma questão de conveniência, mas também um fator de exclusão sistemática. Comunidades que dependem de tecnologias em sua língua nativa perdem oportunidades econômicas e educacionais, além de enfrentar o risco de desinformação gerada por IA. Koyejo enfatiza a importância de modelos que respeitem a diversidade cultural, afirmando, “modelos fora da caixa muitas vezes não capturam valores culturais apropriadamente” (“out of the box models often don’t capture cultural values appropriately”).

Os próximos passos sugerem a necessidade de dados mais substantivos e de abordagem colaborativa para o desenvolvimento de modelos de IA que incluam as línguas menos representadas. O estudo é um claro indicativo de que, sem medidas adequadas, as lacunas na tecnologia continuarão a se ampliar.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!