- Publicidade -
- Publicidade -
- Publicidade -
AI, ML & Deep Learning

Redes neurais melhoram treinamento com duas funções úteis

- Publicidade -
- Publicidade -

São Paulo — InkDesign News — Um novo avanço em técnicas de machine learning propõe uma estrutura de otimização bilevel, que permite o equilíbrio entre objetivos conflitantes, como precisão e justiça. Essa estratégia agora é aplicada em modelos de redes neurais, incluindo a arquitetura FairBiNN.

Arquitetura de modelo

A arquitetura proposta do FairBiNN organiza dois conjuntos de parâmetros: um dedicado à precisão e outro à justiça. Isso permite que cada objetivo seja otimizado de forma independente, ao invés de fundidos em uma única função de perda.

A implementação divide a rede em duas partes: a rede de precisão, que gera a previsão principal, e a rede de justiça, que influencia o modelo para promover resultados justos. Essa divisão modular facilita o entendimento do desempenho do modelo em cada um dos objetivos.

“Esta abordagem modular melhora a transparência no design do modelo, permitindo uma melhor interpretação dos resultados.” (“This modularity improves transparency in the model’s design.”) — Mehdi Yazdani-Jahromi, Pesquisador, NeurIPS 2024.

Treinamento e otimização

O treinamento do FairBiNN ocorre em duas fases: primeiro, os parâmetros da rede de precisão são atualizados, enquanto os da rede de justiça são mantidos fixos. Em seguida, o processo é invertido. Essa alternância permite que cada conjunto de parâmetros reaja às mudanças do outro, buscando um estado ótimo de equilíbrio entre precisão e justiça.

“A separação de parâmetros permite um treinamento mais estável e um progresso mais claro em cada objetivo.” (“The decoupling means each objective can make progress on its own terms.”) — Ali Khodabandeh Yalabadi, Pesquisador, NeurIPS 2024.

Resultados e métricas

Os resultados da arquitetura FairBiNN demonstraram melhor equilíbrio nas métricas de precisão e justiça em comparação com abordagens tradicionais. Os pesquisadores notaram que a abordagem bilevel não apenas equaliza a justiça entre grupos demográficos, mas também maximiza a precisão preditiva.

Os experimentos indicam que o modelo FairBiNN supera as limitações de métodos convencionais, como a penalização baseada em peso na função de perda, levando a soluções que são, em alguns casos, estritamente melhores. “As soluções do nosso método não resultarão em perda superior à abordagem Lagrangiana.” (“A solution from our method will not incur higher loss than the corresponding Lagrangian solution.”) — Aida Tayebi, Pesquisadora, NeurIPS 2024.

As aplicações práticas deste modelo são vastas e incluem áreas como bioinformática, onde a precisão da previsão e a conformidade com o conhecimento biológico são críticas, e em robótica, onde segurança e eficiência energética são necessárias para a operação segura de sistemas autônomos.

“Ao aproveitar a otimização bilevel, podemos aprimorar as interações entre objetivos em sistemas de aprendizado de máquina, promovendo soluções mais eficazes para problemas complexos.” (“By leveraging bilevel optimization, we can enhance the interactions between objectives in machine learning systems.”) — Özlem Ozmen Garibay, Pesquisadora, NeurIPS 2024.

O futuro da pesquisa pode explorar mais características de múltiplos objetivos, potencialmente permitindo que o FairBiNN e estruturas semelhantes sejam aplicados em configurações de aprendizado de máquina mais complexas.

Fonte: (Towards Data Science – AI, ML & Deep Learning)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!