- Publicidade -
- Publicidade -
- Publicidade -
Machine learning & AI

LLM amplia multiculturalidade em benchmarks de IA

- Publicidade -
- Publicidade -

Contexto da pesquisa

Pesquisadores do Laboratório de Processamento de Linguagem Natural da EPFL, em colaboração com a Cohere Labs e outros parceiros, desenvolveram uma nova ferramenta chamada INCLUDE, que busca melhorar a compreensão da inteligência artificial (AI) em contextos regionais e culturais, além de linguísticos. A falha dos modelos atuais de linguagem em entender nuances regionais, especialmente em questões legais e culturais, torna este estudo relevante.

Método proposto

O INCLUDE é um benchmark que avalia se um modelo de linguagem grande (LLM) é não apenas preciso em um determinado idioma, mas também capaz de integrar a cultura e as realidades socioculturais associadas a ele. Em vez de depender de traduções, como muitos benchmarks existentes, a equipe coletou mais de 197.000 perguntas em múltipla escolha de exames acadêmicos, profissionais e ocupacionais de várias instituições autênticas. As perguntas foram redigidas em 44 idiomas e 15 scripts diferentes, permitindo uma avaliação robusta das capacidades dos modelos.

Resultados e impacto

O desempenho de modelos como GPT-4, LLaMA-3 e Aya-expanse foi avaliado em várias categorias temáticas. O GPT-4 obteve a melhor média de acurácia, aproximadamente 77%. No entanto, dificuldades foram observadas em idiomas como armênio, grego e urdu, especialmente em tópicos culturalmente ou profissionalmente fundamentados. Frequentemente, os modelos basearam-se em suposições ocidentais, levando a respostas confiantes, mas incorretas.

“Para serem relevantes e relacionáveis, os LLMs precisam conhecer nuances culturais e regionais. Não é apenas sobre conhecimento global; é sobre atender às necessidades dos usuários onde eles estão.”
(“To be relevant and relatable, LLMs need to know cultural and regional nuances. It’s not just global knowledge; it’s about meeting user needs where they are.”)

— Angelika Romanou, Assistente de doutorado, EPFL

Com a democratização da AI, modelos como INCLUDE estão se tornando ferramentas valiosas para a avaliação e o treinamento de modelos de AI com mais equidade e inclusão. A equipe já está trabalhando em uma nova versão do benchmark, abrangendo cerca de 100 idiomas, incluindo variedades regionais. Isso poderá ajudar a moldar padrões internacionais—e até mesmo estruturas regulatórias—para uma AI responsável.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!