LLM precisam de mais livros para aprender, bibliotecas colaboram

- Publicidade -

Tiago F Santiago 12/06/2025Última Atualização 12/06/2025

0 53 2 minutos de leitura

LLM precisam de mais livros para aprender, bibliotecas colaboram — Books rest on a shelves at Langdell Hall, which houses the Harvard Law School library, Wednesday, Feb. 26, 2025, in Cambridge, Mass. Credit: AP Photo/Charles Krupa

- Publicidade -

São Paulo — InkDesign News —

A crescente utilização de machine learning e inteligência artificial (IA) tem impulsionado a demanda por campanhas de pesquisas mais abrangentes. Recentemente, bibliotecas, como a da Universidade Harvard, começaram a abrir suas coleções de livros antigos para treinar algoritmos de IA.

Contexto da pesquisa

Um projeto inovador liderado pela Harvard University visa disponibilizar ao público, incluindo desenvolvedores de IA, um acervo de quase um milhão de livros, abrangendo desde o século XV até o século XIX. Essa coleção possui mais de 394 milhões de páginas digitalizadas, contendo textos em 254 idiomas. O foco em dados de domínio público é considerado uma alternativa menos controversa em comparação a conteúdos protegidos por direitos autorais.

Método proposto

O modelo de aprendizagem empregado na iniciativa se baseia em algoritmos de Large Language Models (LLM), projetados para melhorar a precisão e a integridade das respostas geradas. Segundo Greg Leppert, diretor executivo da iniciativa, “muito dos dados utilizados no treinamento de IA não vieram de fontes originais” (

“much of the data that’s been used in AI training has not come from original sources”
(“muito dos dados utilizados no treinamento de IA não vieram de fontes originais”)

— Greg Leppert, Diretor Executivo, Iniciativa de Dados Institucionais

). Essas informações são essenciais para o desenvolvimento de sistemas de IA que podem raciocinar de maneira mais precisa e confiável.

Resultados e impacto

Com a liberação do acervo na plataforma Hugging Face, espera-se que o acesso a essa base de dados linguística diversa—incluindo obras significativas de diversas culturas—possa enriquecer o aprendizado de máquinas. Harvard afirma ter uma coleção que pode gerar cerca de 242 bilhões de tokens, um número que, comparativamente, ainda é uma fração dos dados utilizados por gigantes como a Meta, que afirmam ter treinado suas últimas versões de modelos de IA com mais de 30 trilhões de tokens. Como ressaltou Aristana Scourtas, “estamos tentando transferir parte do poder deste momento de IA de volta para essas instituições” (

“we’re trying to move some of the power from this current AI moment back to these institutions”
(“estamos tentando transferir parte do poder deste momento de IA de volta para essas instituições”)

— Aristana Scourtas, Gerente de Pesquisa, Harvard Law School

). Esta abordagem não apenas promete fortalecer a IA, mas também contribui para a preservação e acesso a conhecimentos históricos que já se perderam na era digital.

As aplicações em potencial dessa nova coleção de dados são vastas, incluindo o aprimoramento de modelos de chatbots, sistemas de recomendação e avanços em diversas áreas de pesquisa. O próximo passo envolve a análise do impacto dessas novas bases de dados na eficácia de modelos de IA em diferentes contextos sociais e culturais.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -

Etiquetas

Tiago F Santiago 12/06/2025Última Atualização 12/06/2025

0 53 2 minutos de leitura

Ler o Próximo

Deixe um comentário Cancelar resposta

Where To Buy Proxies
I used to be recommended this web site through my cousin. I'...
Edenilsa
Que interessante essa matéria que acabei de ler, até compart...
Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...

LLM precisam de mais livros para aprender, bibliotecas colaboram

São Paulo — InkDesign News —

Contexto da pesquisa

Método proposto

Resultados e impacto

Tiago F Santiago

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Deixe um comentário Cancelar resposta

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Corinthians busca vitória sobre Santos em clássico do Brasileirão

NASA oferece desconto em câmera Canon e lente grande angular

Wearables inovadores e design inteligente para 2025

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

Uerj revoga título a Médici em ação contra governo militar

São Paulo — InkDesign News —

Contexto da pesquisa

Método proposto

Resultados e impacto

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Satélites mostram queda na população de pinguins imperadores

NASA prevê tempestade geomagnética que pode iluminar céu

Artigos relacionados

Deixe um comentário Cancelar resposta

Corinthians busca vitória sobre Santos em clássico do Brasileirão

NASA oferece desconto em câmera Canon e lente grande angular

Wearables inovadores e design inteligente para 2025

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

Uerj revoga título a Médici em ação contra governo militar

Adblock detectado