
São Paulo — InkDesign News — Um novo avanço em técnicas de machine learning propõe uma estrutura de otimização bilevel, que permite o equilíbrio entre objetivos conflitantes, como precisão e justiça. Essa estratégia agora é aplicada em modelos de redes neurais, incluindo a arquitetura FairBiNN.
Arquitetura de modelo
A arquitetura proposta do FairBiNN organiza dois conjuntos de parâmetros: um dedicado à precisão e outro à justiça. Isso permite que cada objetivo seja otimizado de forma independente, ao invés de fundidos em uma única função de perda.
A implementação divide a rede em duas partes: a rede de precisão, que gera a previsão principal, e a rede de justiça, que influencia o modelo para promover resultados justos. Essa divisão modular facilita o entendimento do desempenho do modelo em cada um dos objetivos.
“Esta abordagem modular melhora a transparência no design do modelo, permitindo uma melhor interpretação dos resultados.” (“This modularity improves transparency in the model’s design.”) — Mehdi Yazdani-Jahromi, Pesquisador, NeurIPS 2024.
Treinamento e otimização
O treinamento do FairBiNN ocorre em duas fases: primeiro, os parâmetros da rede de precisão são atualizados, enquanto os da rede de justiça são mantidos fixos. Em seguida, o processo é invertido. Essa alternância permite que cada conjunto de parâmetros reaja às mudanças do outro, buscando um estado ótimo de equilíbrio entre precisão e justiça.
“A separação de parâmetros permite um treinamento mais estável e um progresso mais claro em cada objetivo.” (“The decoupling means each objective can make progress on its own terms.”) — Ali Khodabandeh Yalabadi, Pesquisador, NeurIPS 2024.
Resultados e métricas
Os resultados da arquitetura FairBiNN demonstraram melhor equilíbrio nas métricas de precisão e justiça em comparação com abordagens tradicionais. Os pesquisadores notaram que a abordagem bilevel não apenas equaliza a justiça entre grupos demográficos, mas também maximiza a precisão preditiva.
Os experimentos indicam que o modelo FairBiNN supera as limitações de métodos convencionais, como a penalização baseada em peso na função de perda, levando a soluções que são, em alguns casos, estritamente melhores. “As soluções do nosso método não resultarão em perda superior à abordagem Lagrangiana.” (“A solution from our method will not incur higher loss than the corresponding Lagrangian solution.”) — Aida Tayebi, Pesquisadora, NeurIPS 2024.
As aplicações práticas deste modelo são vastas e incluem áreas como bioinformática, onde a precisão da previsão e a conformidade com o conhecimento biológico são críticas, e em robótica, onde segurança e eficiência energética são necessárias para a operação segura de sistemas autônomos.
“Ao aproveitar a otimização bilevel, podemos aprimorar as interações entre objetivos em sistemas de aprendizado de máquina, promovendo soluções mais eficazes para problemas complexos.” (“By leveraging bilevel optimization, we can enhance the interactions between objectives in machine learning systems.”) — Özlem Ozmen Garibay, Pesquisadora, NeurIPS 2024.
O futuro da pesquisa pode explorar mais características de múltiplos objetivos, potencialmente permitindo que o FairBiNN e estruturas semelhantes sejam aplicados em configurações de aprendizado de máquina mais complexas.
Fonte: (Towards Data Science – AI, ML & Deep Learning)