
São Paulo — InkDesign News — O avanço em técnicas de “machine learning” e “deep learning” está transformando como analisamos dados complexos, especialmente em domínios como saúde e finanças. A análise multivariada, por meio de abordagens como os “POSETs” (Conjuntos Parciais Ordenados), destaca-se como uma solução eficaz para representações de dados.
Arquitetura de modelo
Os POSETs são criados a partir de um conjunto não vazio de elementos e uma relação binária que reflete a dominância parcial. O modelo diferencia-se de métodos agregativos que exigem uma ordem total, permitindo que alguns elementos permaneçam incomparáveis. Essa estrutura assegura que representações de dados multidimensionais sejam mantidas sem imposições subjetivas.
O uso de um “dominance matrix” permite destacar qual elemento domina outro, com base em especificidades definidas, como quando um vetor A é maior ou igual a um vetor B em todas as dimensões relevantes. Um exemplo é a comparação entre vinhos, onde exatamente definir a qualidade pode ser desafiador, e a aplicação de POSETs fornece uma visualização mais clara da liberdade de escolha.
Treinamento e otimização
Durante o processo de construção do modelo, a normalização dos dados é vital para garantir que características como acidez ou quantidade de açúcar tenham a direção correta em sua interpretação. A transição de um conjunto de dados para um espaço de análise parcial demanda considerável rigor na escolha das variáveis. Com métodos como “MinMaxScaler”, o ajuste se torna prático e acessível.
Isso garante uma análise robusta em um espaço de alta dimensionalidade, resultando em relações de dominância que são tanto precisas quanto informativas. O treinamento deste modelo é aprimorado pela visualização gráfica, como o diagrama de Hasse, que ilustra claramente as relações de dominância e incomparabilidade.
Resultados e métricas
Os resultados obtidos em um experimento demonstram que a abordagem POSET pode destacar elementos não dominados, ou seja, aqueles que não são superados por outros nas dimensões consideradas. Por exemplo, em um conjunto de 20 vinhos, a análise identificou múltiplos pares incomparáveis, sublinhando a flexibilidade dessa técnica em capturar nuances vitais que métodos tradicionais, como a média, poderiam obscurecer.
A identificação de “maximal nodes” — elementos que não são dominados por nenhum outro — é uma característica importante na pesquisa, oferecendo alternativas significativas em um espaço de decisão. Com a aplicação dessas métricas, as organizações podem favorecer escolhas mais informadas em contextos de multi-objetivos.
No futuro, a incorporação de POSETs poderá transformar a análise em setores variados, como análise de risco financeiro e avaliação de sistemas de saúde, onde múltiplos critérios complexos frequentemente se sobrepõem. A transparência metodológica promovida por esta abordagem pode levar a decisões mais consistentes e fundamentadas.
Fonte: (Towards Data Science – AI, ML & Deep Learning)