Inteligência artificial e Wikipedia afundam línguas vulneráveis

São Paulo — InkDesign News —
A crescente utilização da inteligência artificial na tradução de línguas minoritárias, como Igbo e Havaiano, levanta preocupações sobre a qualidade do conteúdo gerado e seu impacto em comunidades linguísticas vulneráveis.
Contexto da pesquisa
A preocupação com a tradução automática e seus efeitos prejudiciais em línguas em perigo é expressa por profissionais como Iwuala, tradutora entre o inglês e o Igbo, e Noah Ha‘alilio Solomon, professor assistente de língua havaiana na Universidade do Havai. Ambos relatam que traduções geradas por máquinas, frequentemente feitas por editores inexperientes, podem comprometer a qualidade e a integridade dessas línguas. Iwuala destaca que o uso indevido dessas traduções pode afastar usuários da Wikipedia em línguas minoritárias, fazendo com que retornem à versão em inglês, enquanto Solomon ressalta que a incompreensibilidade de 35% de alguns textos na Wikipedia hawaiana prejudica esforços de revitalização linguística.
Método e resultados
Modelos de tradução automática, como GPT-4 e outras arquiteturas baseadas em Transformer, são frequentemente utilizados para gerar conteúdo linguístico. No entanto, quando alimentados por páginas da Wikipedia que contêm erros, essas ferramentas produzem textos repletos de imprecisões, o que pode levar à divulgação de materiais errôneos, como livros de frases para ensinamento de línguas como o Inuktitut, encontrados em plataformas como Amazon. Richard Compton, linguista da Universidade de Quebec em Montreal, ilustra essa questão ao afirmar que um manual que revisou se revelou “um completo nonsense” em relação ao Inuktitut.
Implicações e próximos passos
As consequências dessas falhas em traduções automáticas são amplas e incluem a desinformação sobre línguas minoritárias. O desafio ético é significativo, uma vez que a inclusão de erros em linguagens pode perpetuar estereótipos e desrepresentar culturas. Runa Bhattacharjee, diretora sênior da Wikimedia Foundation, afirma que a responsabilidade deveria estar nas comunidades para garantir que o conteúdo seja preciso e livre de vandalismo. Contudo, a questão se intensifica quando não há comunidades ativas para supervisionar e corrigir essa produção textual, o que pode resultar na permanência de informações incorretas.
O impacto potencial dessa situação é preocupante. Com um idioma se tornando extinto a cada duas semanas, destacam-se interrogantes sobre o papel das plataformas digitais na preservação de línguas ameaçadas. O caminho à frente exigirá colaborações entre comunidades linguísticas e especialistas em tecnologia para garantir que as tradições culturais e linguísticas não sejam apenas preservadas, mas também revitalizadas.
Fonte: (MIT Technology Review – Artificial Intelligence)