LLM enfrenta desafio com inglês não global na AI

- Publicidade -

Tiago F Santiago 06/05/2025Última Atualização 06/05/2025

0 50 2 minutos de leitura

LLM enfrenta desafio com inglês não global na AI — Credit: Reihaneh Golpayegani / Better Images of AI, CC BY

- Publicidade -

São Paulo — InkDesign News — Pesquisas recentes destacam que sistemas de inteligência artificial (AI) baseiam-se majoritariamente no inglês americano padrão, negligenciando variações linguísticas globais e evidenciando desafios para machine learning em contextos multiculturais.

Contexto da pesquisa

Estudos recentes indicam que cerca de 90% dos dados usados para treinar sistemas de AI generativa provêm do inglês, especificamente da variante mainstream americana. Tal hegemonia linguística se deve a fatores históricos, econômicos e tecnológicos, visto que a internet e grandes empresas de tecnologia como Google, Meta, Microsoft e OpenAI estão sediadas nos Estados Unidos. Isso implica em um modelo monolítico que elimina variações linguísticas regionais e minoritárias, prejudicando o reconhecimento e a produção de outras formas de inglês faladas globalmente.

Método proposto

A crítica principal é que as técnicas de machine learning aplicadas às linguagens naturais utilizam conjuntos de dados predominantemente coletados de mídias, fóruns e plataformas norte-americanas, o que exclui variações de gramática, sintaxe e vocabulário de outras regiões ou grupos sociais. Os sistemas tradicionais são treinados em datasets desbalanceados e avaliados por benchmarks que reforçam esta centralização linguística. Pesquisadores defendem abordagens que incluam esforços colaborativos entre linguistas, tecnólogos e comunidades para documentar e digitalizar variedades linguísticas, integrando-as em modelos de AI. Este movimento visa a criação de sistemas mais inclusivos que respeitem a diversidade linguística, modificando a tecnologia em vez de tentar “corrigir” o usuário.

Resultados e impacto

Um estudo recente identificou o descontentamento de usuários cuja fala não corresponde ao padrão mainstream do inglês, evidenciando problemas em tecnologias como autocorrect e geração de voz, que reproduzem sotaques limitados. Isso afeta diretamente o acesso a serviços, a avaliação por sistemas automatizados e a preservação de saberes culturais em transcrições orais. A incorporação de múltiplas variantes linguísticas pode melhorar a precisão e a justiça algorítmica em sistemas de machine learning, ampliando seu impacto.

“Os sistemas foram construídos considerando outras pessoas.”
(“the technologies had been built ‘with some other people in mind.’”)

— Participante do estudo sobre sotaques e AI

O avanço para modelos que reconhecem a pluralidade linguística implica adaptação dos datasets, atualização dos critérios de anotação e avaliação qualitativa de métricas. A inclusão de diferentes formas do inglês, como o inglês indiano, singlish e inglês aborígene, demonstra o potencial de AI mais representativa e funcional.

Sistemas futuros deverão integrar linguagens diversas como parte central no treinamento e validação, promovendo maior equidade e melhor desempenho em aplicações globais de AI.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -

Etiquetas

Tiago F Santiago 06/05/2025Última Atualização 06/05/2025

0 50 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

LLM enfrenta desafio com inglês não global na AI

Contexto da pesquisa

Método proposto

Resultados e impacto

Tiago F Santiago

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Contexto da pesquisa

Método proposto

Resultados e impacto

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

León perde vaga no Mundial de Clubes após decisão do CAS

Cnaught facilita créditos de carbono para empresas na economia-verde

Artigos relacionados

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Adblock detectado