
São Paulo — InkDesign News — Com o avanço das técnicas de machine learning, a necessidade de interpretar e entender os resultados de modelos se torna essencial. A transparência em algoritmos como o RuleFit promete revolucionar a explicação de anomalias detectadas.
Arquitetura de modelo
O RuleFit se baseia em um método que combina regras de decisão e regressão linear. A primeira etapa consiste em gerar “regras IF-THEN” a partir de árvores de decisão, proporcionando uma forma de caracterizar comportamentos anômalos em dados. Com várias árvores de decisão em rotação, o algoritmo extrai condições significativas que guiam os resultados. Como se explica, “As regras são um caminho específico dentro de uma árvore de decisão” (The rules are just one specific path through a decision tree) — Jerome H. Friedman, Pesquisador.
Treinamento e otimização
Uma vez que as regras são geradas, estas são transformadas em features binárias. Na sequência, aplica-se uma regressão linear esparsa através do método Lasso. Isso permite identificar quais regras são mais influentes. “O Lasso consegue forçar coeficientes de variáveis irrelevantes a serem exatamente zero” (Lasso can effectively force the coefficients of unimportant features to be exactly zero) — Friedman. Esse processo assegura que apenas as regras significativas permaneçam, permitindo uma melhor interpretação dos dados.
Resultados e métricas
Na implementação do RuleFit utilizando o conjunto de dados Iris, foi feita a detecção de anomalias com o algoritmo Local Outlier Factor (LOF). A performance foi avaliada mediante a acurácia, onde o RuleFit obteve precisão total na predição. “Com esse modelo, podemos entender por que uma determinada amostra é classificada como anômala” (With this model, we can understand why a certain sample is classified as anomalous) — Nome, Cargo, Instituição. Essa caracterização é vital para a aplicação em setores como a segurança de dados e monitoramento de fraudes.
As implicações do RuleFit na análise de anomalias são vastas. As regras geradas não apenas melhoram a compreensibilidade, mas também possibilitam a construção de regras de negócios futuras. As pesquisas seguintes poderão explorar o uso de RuleFit em diferentes domínios, como detecção de fraudes financeiras e manutenção preditiva.
Fonte: (Towards Data Science – AI, ML & Deep Learning)