OpenAI apresenta RAG: da API a Tolstoy com machine learning

- Publicidade -

Tiago F Santiago 11/07/2025Última Atualização 11/07/2025

0 43 2 minutos de leitura

OpenAI apresenta RAG: da API a Tolstoy com machine learning — Hanna Barakat & Archival Images of AI + AIxDESIGN / https://betterimagesofai.org / https://creativecommons.org/licenses/by/4.0/

- Publicidade -

São Paulo — InkDesign News — Pesquisadores têm explorado a criação de pipelines de Recuperação Aumentada por Geração (RAG) utilizando técnicas de deep learning e bibliotecas como LangChain e a API da OpenAI. O objetivo é otimizar o processamento de grandes documentos para gerar respostas relevantes através de *embeddings*.

Arquitetura de modelo

O modelo baseia-se em uma combinação de técnicas de *machine learning*, onde o texto é dividido em chunks para melhor processamento. O uso de *embeddings* facilita a criação de representações vetoriais para pequenos trechos de texto, permitindo que o modelo compreenda melhor o contexto.

“Achunking refere-se ao processo de parsing de um texto em peças menores.”
(“Chunking refers to the process of parsing a text into smaller pieces of text.”)

— Autor Desconhecido, Texto Original

Treinamento e otimização

A implementação do RAG envolve a utilização do *RecursiveCharacterTextSplitter* para segmentar textos em *chunks* de tamanho controlado. Este método considera o tamanho do chunk e o overlap entre chunks, parâmetros cruciais que influenciam a qualidade das respostas geradas. Um chunk pequeno demais pode resultar em perda de contexto, enquanto um chunk muito grande pode exceder os limites do modelo escolhido, como o caso de *embeddings* que suportam até 300.000 tokens por solicitação.

“A escolha da abordagem de chunking se adapta ao tamanho e à complexidade dos documentos que alimentamos em nossa pipeline de RAG.”
(“Choosing a chunking approach that fits the size and complexity of the documents we want to feed into our RAG pipeline is crucial for the quality of the responses we’ll be receiving.”)

— Autor Desconhecido, Texto Original

Resultados e métricas

Após a segmentação, as respostas geradas demonstraram uma melhoria significativa na relevância e contextualidade, com métricas de acurácia aumentando em relação ao uso de documentos não segmentados. A abordagem de chunking permite que o modelo compreenda melhor as referências intertextuais, especialmente em obras complexas, maximizando o uso de informações nos *embeddings*.

“Por exemplo, vamos considerar que o texto fornecido não atende aos limites de tamanho … será truncado.”
(“If we provide a chunk that is larger than the chunk size limit, in most cases, it will be silently truncated.”)

— Autor Desconhecido, Texto Original

As aplicações práticas deste sistema incluem a capacidade de processar textos extensos como *War and Peace* de Tolstói, permitindo que pesquisadores e desenvolvedores aproveitem informações complexas em suas implementações de IA. Os próximos passos envolvem a exploração de metodologias de aprendizado por reforço para otimizar ainda mais a performance de RAG em diferentes domínios.

Fonte: (Towards Data Science – AI, ML & Deep Learning)

- Publicidade -

Etiquetas

Tiago F Santiago 11/07/2025Última Atualização 11/07/2025

0 43 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

OpenAI apresenta RAG: da API a Tolstoy com machine learning

Arquitetura de modelo

Treinamento e otimização

Resultados e métricas

Tiago F Santiago

Ler o Próximo

Triton otimiza multiplicação de matrizes para deep learning

AI ainda não substitui analistas em manutenção preditiva

Machine learning fortalece relações com stakeholders

Python permanece essencial em projetos de machine learning

Cookiecutter facilita estrutura de projetos em machine learning

Machine learning fortalece relações com stakeholders

Modelos de deep learning mostram tendências para 2025

Modelagem de AI transforma Minecraft com MineWorld

Conversational analytics transforma trabalho com machine learning

Machine learning: dicas essenciais sobre carreiras e ferramentas

Triton otimiza multiplicação de matrizes para deep learning

AI ainda não substitui analistas em manutenção preditiva

Machine learning fortalece relações com stakeholders

Python permanece essencial em projetos de machine learning

Cookiecutter facilita estrutura de projetos em machine learning

Machine learning fortalece relações com stakeholders

Modelos de deep learning mostram tendências para 2025

Modelagem de AI transforma Minecraft com MineWorld

Conversational analytics transforma trabalho com machine learning

Machine learning: dicas essenciais sobre carreiras e ferramentas

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

LIGO revela 10 descobertas sobre ondas gravitacionais

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Uerj revoga título a Médici em ação contra governo militar

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

Design inova com o cartão rastreador mais fino do mundo

Aura lança digital frame Aspen com recursos inteligentes por US$229

Arquitetura de modelo

Treinamento e otimização

Resultados e métricas

Ler o Próximo

Triton otimiza multiplicação de matrizes para deep learning

AI ainda não substitui analistas em manutenção preditiva

Machine learning fortalece relações com stakeholders

Python permanece essencial em projetos de machine learning

Cookiecutter facilita estrutura de projetos em machine learning

Machine learning fortalece relações com stakeholders

Modelos de deep learning mostram tendências para 2025

Modelagem de AI transforma Minecraft com MineWorld

Conversational analytics transforma trabalho com machine learning

Machine learning: dicas essenciais sobre carreiras e ferramentas

Google rastreia usuários mesmo com ferramentas de privacidade

Tesla inicia era Grok com foco em veículos autônomos

Artigos relacionados

Uerj revoga título a Médici em ação contra governo militar

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

Design inova com o cartão rastreador mais fino do mundo

Aura lança digital frame Aspen com recursos inteligentes por US$229

Adblock detectado