
São Paulo — InkDesign News — Em um cenário onde decisões baseadas em dados se tornam cada vez mais cruciais, a análise de séries temporais com machine learning e deep learning ganha destaque ao lidar com eventos extremos, os quais podem impactar significativamente diversos setores.
Arquitetura do modelo
Na análise de séries temporais, a categorização de dados em eventos extremos é fundamental. Esses dados podem ser desafiadores, mas oferecem insights valiosos sobre padrões e anomalias. Uma abordagem comum é a definição de um Peak Over Threshold (POT), onde valores acima de um limite preestabelecido são considerados extremos.
“O que queremos dizer com modelar os máximos e mínimos?”
(“What do we mean by modelling the maxima and minima?”)— Piero Paialunga, Ph.D. Candidato, Universidade de Cincinnati
Além disso, a utilização de distribuições como a Generalized Extreme Value (GEV) e Weibull permite entender e projetar as propriedades dessas ocorrências, proporcionando uma base sólida para a modelagem preditiva.
Treinamento e otimização
O treinamento de modelos baseados em dados históricos de temperatura, como demonstrado em pesquisas, utiliza métricas como Log-Likelihood, Akaike Information Criterion (AIC) e Bayesian Information Criterion (BIC) para validar ajustes e melhorar a acurácia.
“Tratar extremos como sinais de primeira classe é essencial.”
(“Treating extremes as first-class signals is essential.”)— Piero Paialunga, Ph.D. Candidato, Universidade de Cincinnati
O uso de janelas de tempo variáveis para a detecção de extremos, como diárias ou mensais, permite a extração de informações significativas sobre tendências e anomalias. Essa flexibilidade é crucial para a adaptação de modelos a contextos específicos.
Resultados e métricas
Analises indicam que a melhor distribuição varia entre locais, como Dallas, Pittsburgh e Kansas City que tendem a GEV, enquanto Nova York favorece a Weibull. O ajuste das distribuições foi verificado através de gráficos de Q-Q, mostrando a compatibilidade entre os dados e os modelos.
Esses resultados reforçam a importância de uma abordagem metódica na modelagem de eventos extremos, especialmente em contextos onde esses dados são críticos, como na previsão de desastres naturais ou gestão de recursos energéticos.
O próximo passo envolve expandir essa análise para outros conjuntos de dados, garantindo um entendimento abrangente das dinâmicas subjacentes aos eventos extremos e suas implicações em várias áreas.
Fonte: (Towards Data Science – AI, ML & Deep Learning)