
São Paulo — InkDesign News —
O uso de modelos de machine learning, especialmente os de grande escala, está se tornando cada vez mais relevante no campo da detecção de anomalias. Os pesquisadores estão explorando métodos inovadores para integrar esses modelos em pipelines de detecção.
Arquitetura de modelo
A abordagem mais comum envolve o uso direto de Modelos de Linguagem Grande (LLMs) para analisar dados e identificar anomalias. Como uma ilustração, no estudo LogPrompt, os pesquisadores implementaram um LLM configurado com estratégias de prompting cuidadosas para a detecção em logs de sistema.
“A maneira mais simples de usar LLMs é quando os dados subjacentes estão em formato de texto.”
(“The simplest way of using LLMs is when the underlying data is in text format.”)— Pesquisador, Estudo de caso
Os LLMs, uma vez treinados, demonstram uma capacidade robusta de analisar e distinguir padrões. Além disso, abordagens como a Chain-of-Thought e o aprendizado em contexto com exemplos rotulados contribuíram para a eficácia dessa técnica.
Treinamento e otimização
Os desafios de modelagem incluem a engenharia de prompts e a conversão de dados não textuais para formatos compreensíveis. Um exemplo notável é o estudo SIGLLM, que abordou a conversão de dados de séries temporais em texto. A eficiência do sistema depende de uma série de etapas, incluindo escalonamento e quantização.
“A conversão de dados de séries temporais para texto é fundamental para o sucesso na detecção de anomalias.”
(“Converting time-series data to text is key to success in anomaly detection.”)— Autor do Estudo, SIGLLM
O tempo de treinamento e os limites computacionais também são fatores determinantes, visto que a inferência em LLMs exige considerável poder de processamento.
Resultados e métricas
Os resultados indicam que a deteção direta de anomalias utilizando LLMs é uma entrada válida, especialmente com dados textuais. Entretanto, a abordagem enfrenta limitações em domínios de nicho, onde o conhecimento pré-treinado do modelo pode não ser suficiente.
“Este padrão de detecção direta se destaca muito devido à sua simplicidade.”
(“This direct detection pattern stands out largely due to its simplicity.”)— Especialista em ML, Pesquisa em Detecção de Anomalias
Além disso, desafios persistem na definição do que é considerado “normal”. No entanto, as metodologias estão em evolução, mostrando resultados promissores na otimização das operações de detecção.
À medida que as capacidades de LLMs continuam a se expandir, suas aplicações práticas em detecção de anomalias poderão resolver problemas complexos em diversas indústrias. Os próximos passos incluem a validação de técnicas de geração de dados sintéticos e a integração de sistemas autônomos de detecção.
Fonte: (Towards Data Science – AI, ML & Deep Learning)