
São Paulo — InkDesign News —
Recentemente, estudos têm destacado avanços significativos em algoritmos de “machine learning” e “deep learning” para resolver problemas complexos em ambientes incertos. Pesquisadores têm explorado abordagens inovadoras, como o Modelo de Newsvendor, que otimiza decisões de estoque sob incertezas de demanda, proporcionando insights valiosos para empresas.
Arquitetura de modelo
O modelo proposto, inspirado no trabalho de Warren B. Powell, utiliza uma distribuição de probabilidade exponencial para modelar a demanda. A incerteza é abordada por meio de um modelo bayesiano, onde a taxa de demanda é atualizada continuamente com base em observações. A abordagem envolve o uso de uma distribuição gamma como prior, que se ajusta conforme novas informações são adquiridas, refletindo a mudança nas crenças sobre a demanda.
"Podemos observar que a distribuição gamma se adapta de maneira flexível às informações que recebemos ao longo do tempo” (We can observe that the gamma distribution adapts flexibly to the information we receive over time)— Nome, Cargo, Instituição.
Treinamento e otimização
Durante o treinamento do modelo, foi utilizada uma função de transição que atualiza as crenças sobre a taxa de demanda, influenciando diretamente as decisões de estoque. O treinamento focou na maximização do lucro esperado ao longo de um horizonte de tempo, considerando tanto a imediata receita gerada quanto o valor da informação futura.
"Nosso objetivo é maximizar o lucro total esperado, integrando a incerteza de demanda nas decisões de estoque” (Our objective is to maximize total expected profit by integrating demand uncertainty into stocking decisions)— Nome, Cargo, Instituição.
Resultados e métricas
Os resultados das simulações mostraram que o modelo de Knowledge Gradient (KG) superou outras abordagens, como a Política de Estimativa de Ponto e a Política de Distribuição. O KG não apenas maximiza os lucros imediatos, mas também considera o valor da informação futura. As métricas de desempenho indicaram uma convergência gradual em direção à demanda verdadeira, resultando em melhores decisões ao longo do tempo.
"Observamos que a política de KG utiliza potencial de aprendizado futuro, apresentando um desempenho superior a outras metodologias” (We observed that the KG policy utilizes future learning potential, showing superior performance to other methodologies)— Nome, Cargo, Instituição.
A relevância prática deste modelo reside na sua aplicabilidade em setores que lidam com estoques, como o varejo e a manufatura. Com as constantes mudanças na demanda do consumidor, esse tipo de abordagem pode oferecer uma vantagem competitiva significativa.
Fonte: (Towards Data Science – AI, ML & Deep Learning)