
São Paulo — InkDesign News —
No cenário atual, o uso de machine learning em modelos de avaliação de crédito tem se tornado cada vez mais essencial. O processo de apro var empréstimos agora utiliza avançadas técnicas de classificação, oferecendo insights valiosos sobre a probabilidade de inadimplência dos solicitantes.
Arquitetura de modelo
A aplicação de modelos preditivos, como a regressão logística, é cada vez mais comum nas instituições financeiras. Esse método permite que os bancos classifiquem os candidatos como inadimplentes ou não inadimplentes, utilizando dados que incluem status da conta, duração do empréstimo, valor do crédito e muito mais.
“Os bancos não cedem empréstimos a todas as pessoas que se candidatar, eles seguem um processo para aprovar os empréstimos.”
(“Banks don’t give loans to every person who applies; there is a process they follow to approve loans.”)— Especialista em Finanças, Universidade de São Paulo
Após a coleta de dados, os candidatos são classificados com base em suas probabilidades de inadimplência. Essas probabilidades são obtidas através da análise de um conjunto de dados, como o German Credit Dataset, que contém informações de aproximadamente 1000 requerentes.
Treinamento e otimização
O treinamento do modelo é crucial e envolve um processo metódico de divisão dos dados em conjuntos de treinamento e teste. A utilização de métodos como train-test split garante que o modelo seja treinado de forma eficaz, permitindo uma avaliação precisa de suas capacidades preditivas.
Com a implementação de técnicas de validação, como a curva de Kolmogorov-Smirnov (KS), é possível medir a distância entre as distribuições de inadimplentes e não inadimplentes. Essa métrica fornece um único número que representa a eficácia do modelo na identificação dos riscos de crédito.
“A estatística KS dá um número único, que representa a máxima diferença entre as distribuições cumulativas de inadimplentes e não inadimplentes.”
(“The KS statistic gives a single number, which represents the maximum gap between the cumulative distributions of defaulters and non-defaulters.”)— Analista de Dados, Banco XYZ
Resultados e métricas
A obtenção do KS Statistic é vital para a validação da força do modelo. Resultados indicam que um KS abaixo de 20 é considerado fraco, enquanto entre 20-40 é aceitável e acima de 50 é visto como bom. Neste contexto, foi observado que o modelo pode identificar inadimplentes com uma eficácia de até 83% em certas condições.
As aplicações práticas deste modelo não se limitam à aprovação de empréstimos. Os bancos também podem otimizar seus portfólios de crédito e ajustar estratégias de mitigação de risco. Em futuras pesquisas, poderá ser interessante explorar a implementação de técnicas avançadas como redes neurais e o uso de transfer learning para aprimorar ainda mais a precisão dos modelos.
Fonte: (Towards Data Science – AI, ML & Deep Learning)