
São Paulo — InkDesign News — O avanço em técnicas de “machine learning” e “deep learning” propicia a criação de sistemas robustos para análise financeira, especialmente no combate à lavagem de dinheiro (AML) e na verificação de clientes (KYC).
Arquitetura de modelo
A proposta recente de um agente KYC utiliza a base de dados de grafos da Neo4j, permitindo que investigadores analisem relações complexas entre clientes e transações. O sistema integra técnicas de Recuperação de Dados Baseada em Grafos (GraphRAG) para descobrir padrões de fraudes, explorando conexões como contas, endereços IP e dispositivos associados. Essa abordagem transforma os dados em uma rede dinâmico, onde cada cliente e transação é uma entidade, propiciando interações mais fluídas e eficientes, favorecendo investigações alternativas.
Treinamento e otimização
A implementação se destaca pela utilização do OpenAI Agents SDK e modelos de linguagem que traduzem perguntas naturais em consultas Cypher. Um exemplo prático é a detecção de “transações circulares”, caracterizando potenciais esquemas de lavagem de dinheiro, que utiliza algoritmos de detecção de ciclos em grafos transacionais. O agente processa a consulta em um loop, utilizando o conhecimento adquirido para aprimorar suas respostas e sugestões.
"Se um cliente compartilha um endereço IP com alguém em uma lista de vigilância?" (“Does this customer share an IP address with someone on a watchlist?”) — Analista de KYC.
Resultados e métricas
A eficácia do agente é medida pela capacidade de identificar um número significativo de "clientes em risco", analisando suas transações em tempo real. Benchmarking com dados sintéticos demonstrou uma taxa de acerto superior a 90% na detecção de padrões anômalos. Essa abordagem não só melhora a precisão das investigações, mas também reduz o tempo gasto em tarefas repetitivas.
O campo de KYC e AML continua a evoluir, potencializando a aplicação de tecnologias emergentes. O crescente interesse por grafos de conhecimento abre novas avenues para pesquisas em eficiência de sistema e reuso de dados em setores como “supply chain” e gerenciamento de dados em saúde.
Fonte: (Towards Data Science – AI, ML & Deep Learning)