LLMs constroem e consultam knowledge graphs em machine learning

- Publicidade -

Tiago F Santiago 03/05/2025Última Atualização 03/05/2025

0 24 2 minutos de leitura

LLMs constroem e consultam knowledge graphs em machine learning — Image generated via ChatGPT, prompted by author

- Publicidade -

São Paulo — InkDesign News —

Um avanço significativo em machine learning traz novas estratégias para integrar grafos de conhecimento e grandes modelos de linguagem (LLMs), ampliando a capacidade de recuperação e geração de informações estruturadas e contextuais.

Arquitetura de modelo

O uso de Grafos de Conhecimento (Knowledge Graphs) permite representar informações de forma estruturada, conectando conceitos, entidades e relacionamentos, facilitando o raciocínio e a inferência automática. Em projetos atuais, bancos de dados como o Neo4j são híbridos, integrando vetores de embedding para buscas semânticas, além de armazenar as relações e propriedades dos dados. O framework LangChain é utilizado para coordenar as interações entre LLMs e as ferramentas de consulta, incorporando agentes customizados que aproveitam a ontologia do domínio para extrair grafos conceituais validados por modelos robustos.

“Um Ontologia pode ser descrita como a especificação formal dos tipos de entidades e relacionamentos que podem existir no grafo — é, essencialmente, sua planta baixa.”
(“An ontology can be described as the formal specification of the types of entities and relationships that can exist in the graph — it is, essentially, its blueprint.”)

— Dylan Tartarini, Engenheiro de Dados, Projeto Knowledge Graphs

Tais estruturas são alimentadas por documentos de um mesmo domínio — como materiais da Comissão Europeia — processados em etapas de ingestão que incluem limpeza, chunking e embedding dos textos. A combinação entre grafos e técnicas de vetorização evidencia melhorias na organização e recuperação contextualizada dos dados.

Treinamento e otimização

O pipeline de ingestão contempla a segmentação dos documentos em chunks, a extração estruturada de conceitos via LLMs com saída validada, e a indexação híbrida que conecta esses chunks em um grafo com relações explícitas, como “PART_OF” e “MENTIONS”. Além disso, são empregadas técnicas de clusterização hierárquica (Leiden, Louvain) para formar comunidades de nós, cujos resumos são gerados por LLMs e armazenados também como embeddings.

“O uso de busca híbrida combinando embeddings e filtros semânticos enriquecidos com vizinhança no grafo pode desbloquear novas possibilidades para fornecer respostas detalhadas e contextualizadas.”
(“Querying for similarity on embeddings and then enriching the context with neighbouring chunks might unlock new possibilities when it comes to level of details provided in the answer.”)

— Dylan Tartarini, Engenheiro de Dados, Projeto Knowledge Graphs

Esse modelo híbrido permite múltiplas estratégias de busca: desde a similaridade vetorial pura, passando pela consulta via linguagem Cypher para navegação no grafo, até abordagens combinadas que integram grafo e RAG (Retrieval Augmented Generation), equilibrando precisão e eficiência computacional.

Resultados e métricas

Comparativos entre essas abordagens indicam trade-offs entre uso de tokens, latência e performance na geração de respostas. A consulta por Cypher é eficiente para respostas objetivas e esquemas de grafo bem definidos, enquanto a busca aumentada pelo grafo aborda melhor questões que envolvem múltiplas fontes e contextos multi-hop. A geração de relatórios comunitários agrega um nível extra de síntese contextual, embora ainda esteja em aprimoramento devido à complexidade do contexto reunido.

“Quando se constrói aplicações reais, é crítico ponderar estratégias não apenas pela acurácia, mas também pelo custo, velocidade e escalabilidade.”
(“When building real-world applications, it’s critical to weight answering strategies not just by accuracy, but also by cost, speed, and scalability.”)

— Dylan Tartarini, Engenheiro de Dados, Projeto Knowledge Graphs

Vislumbram-se avanços no desenvolvimento de sistemas inteligentes que valorizam a estruturação semântica do conhecimento, combinando grafos e LLMs para respostas mais fundamentadas e contextualizadas. A continuidade da pesquisa deve focar na otimização dessas técnicas para cenários de larga escala e diversidade documental.

Para entender mais sobre o tema e acessar código e exemplos práticos, o projeto está disponível no repositório público no GitHub do autor.

Fonte: (Towards Data Science – AI, ML & Deep Learning)

- Publicidade -

Etiquetas

Tiago F Santiago 03/05/2025Última Atualização 03/05/2025

0 24 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

LLMs constroem e consultam knowledge graphs em machine learning

Arquitetura de modelo

Treinamento e otimização

Resultados e métricas

Tiago F Santiago

Ler o Próximo

Python verifica representatividade de dados em machine learning

Federated Learning combate ataques com técnicas de ML

Redes neurais melhoram acurácia em modelos de ML

Avaliações baseadas em tarefas impulsionam a modelagem em ML

LangGraph otimiza planejamento orçamentário com AI

Modelos de AI aprimoram processamento de milhões de requisições

Algoritmo húngaro otimiza modelagem em visão computacional

LangGraph 201 adiciona supervisão humana à modelagem de AI

Python explora Merit Order e curva de custo de abate com ML

Implementando o desafio Gaussiano com machine learning

Python verifica representatividade de dados em machine learning

Federated Learning combate ataques com técnicas de ML

Redes neurais melhoram acurácia em modelos de ML

Avaliações baseadas em tarefas impulsionam a modelagem em ML

LangGraph otimiza planejamento orçamentário com AI

Modelos de AI aprimoram processamento de milhões de requisições

Algoritmo húngaro otimiza modelagem em visão computacional

LangGraph 201 adiciona supervisão humana à modelagem de AI

Python explora Merit Order e curva de custo de abate com ML

Implementando o desafio Gaussiano com machine learning

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Arquitetura de modelo

Treinamento e otimização

Resultados e métricas

Ler o Próximo

Python verifica representatividade de dados em machine learning

Federated Learning combate ataques com técnicas de ML

Redes neurais melhoram acurácia em modelos de ML

Avaliações baseadas em tarefas impulsionam a modelagem em ML

LangGraph otimiza planejamento orçamentário com AI

Modelos de AI aprimoram processamento de milhões de requisições

Algoritmo húngaro otimiza modelagem em visão computacional

LangGraph 201 adiciona supervisão humana à modelagem de AI

Python explora Merit Order e curva de custo de abate com ML

Implementando o desafio Gaussiano com machine learning

Sessions: AI oferece 50% off em rodada de investimento por 6 dias

Apple recebe instruções DMA da UE para apps e gadgets conectados

Artigos relacionados

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Adblock detectado