Novos modelos de LLM igualam desempenho em português e inglês

- Publicidade -

Tiago F Santiago 23/07/2025Última Atualização 23/07/2025

0 3 1 minuto de leitura

Novos modelos de LLM igualam desempenho em português e inglês — Credit: Unsplash/CC0 Public Domain

- Publicidade -

O avanço em machine learning e inteligência artificial (AI) tem sido marcado por desafios em diferentes idiomas, especialmente no que diz respeito à língua portuguesa. Recentemente, pesquisadores da Universidade de Bonn apresentaram o projeto “GigaVerbo”, que busca minimizar essa disparidade em capacidades de processamento de linguagem natural.

Contexto da pesquisa

Embora a língua portuguesa seja amplamente falada, modelos de linguagem, como os LLMs, têm desempenho inferior em comparação ao inglês. Neste cenário, o projeto “Tucano: Avançando a Geração Neural de Texto para o Português” visa preencher a lacuna de recursos nessa área.

Método proposto

Os pesquisadores desenvolveram um novo conjunto de dados, denominado GigaVerbo, que contém 200 bilhões de tokens deduplicados. Esse conjunto foi fundamental para o treinamento de vários modelos de decodificação utilizando o supercomputador Marvin da Universidade de Bonn. Os dados foram coletados de várias fontes para garantir diversidade linguística e alta qualidade.

“Através do GigaVerbo, esperamos promover o acesso equitativo ao processamento de linguagem natural em línguas menos favorecidas”
(“Through GigaVerbo, we hope to promote equitable access to natural language processing in underrepresented languages.”)

— Nicholas Kluge Corrêa, Pesquisador, Universidade de Bonn

Resultados e impacto

A pesquisa aborda duas lacunas principais: a escassez de recursos abertos para o português e a deficiência no desenvolvimento de LLMs open-source. Os pesquisadores utilizaram rigorosos ciclos de avaliação e otimização para garantir a eficácia dos modelos. A abordagem busca não apenas melhorar o desempenho em português, mas também estender pesquisa a línguas com poucos recursos, como o bengali e o hindi.

Com a liberação do corpus e os desenvolvimentos previstos, espera-se um impacto significativo no avanço da AI em português, oferecendo novos recursos e ferramentas para pesquisadores e desenvolvedores.

As possíveis aplicações para essa pesquisa incluem o aprimoramento de assistentes virtuais, ferramentas de tradução automática e sistemas de recomendação, todos otimizados para o português.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -

Etiquetas

Tiago F Santiago 23/07/2025Última Atualização 23/07/2025

0 3 1 minuto de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Novos modelos de LLM igualam desempenho em português e inglês

Contexto da pesquisa

Método proposto

Resultados e impacto

Tiago F Santiago

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Contexto da pesquisa

Método proposto

Resultados e impacto

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Lumma Stealer retorna mais discreto e ameaça novos dados

Myntra enfrenta processo de R$ 1 bi na Índia por e-commerce

Artigos relacionados

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Adblock detectado