
São Paulo — InkDesign News — A pesquisa em machine learning e deep learning está avançando rapidamente, especialmente em áreas como Federated Learning, onde customização de esquemas de agregação torna-se crucial para a performance em ambientes distribuídos.
Arquitetura de modelo
Federated Learning (FL) propõe um modelo descentralizado onde os dados permanecem em suas origens, evitando a centralização que pode levar a problemas de privacidade e compliance. A arquitetura do Scaleout Edge AI platform permite a implementação de funções de servidor personalizadas, chamadas de Custom Aggregators, que gerenciam como as atualizações dos modelos dos clientes são processadas. Esses aggregators são fundamentais para garantir a precisão e robustez do modelo, especialmente em cenários com dados heterogêneos e comportamento adversarial.
“A compreensão e o design de esquemas de agregação personalizados é importante. A agregação eficaz não só influencia a precisão do modelo, mas também lida com questões como heterogeneidade de dados, confiabilidade do cliente e comportamento adversarial.”
(“Effective aggregation not only influences model accuracy but also handles issues such as data heterogeneity, client reliability, and adversarial behavior.”)— Autor Desconhecido
Treinamento e otimização
O artigo descreve um experimento onde um ataque de Label-Flipping foi simulado. Neste cenário, um cliente malicioso altera os rótulos em seu conjunto de dados local, prejudicando o treinamento do modelo global. O modelo foi dividido entre seis clientes, sendo que o cliente malicioso obteve um desempenho inferior, demonstrando a importância de estratégias de mitigação de ataque.
As funções de servidor foram ativadas através de um processo de configuração no Scaleout Studio, que incluiu a conexão de clientes e a execução de scripts específicos para o treinamento e agregação dos modelos. O resultado foi uma implementação bem-sucedida da filtragem de outliers usando a similaridade cosseno, que excluiu a contribuição do cliente potencialmente malicioso.
“O uso de uma abordagem baseada em similaridade cosseno permite identificar contribuições suspeitas e melhorar a robustez do modelo compartilhado.”
(“The use of a cosine similarity-based approach allows detecting suspicious contributions and enhancing the robustness of the shared model.”)— Autor Desconhecido
Resultados e métricas
Os resultados demonstraram que manter clientes maliciosos fora do processo de agregação teve um impacto positivo nas métricas de acurácia do modelo global. O log de execução apresentou dados detalhados sobre a similaridade média dos clientes, permitindo uma análise precisa do impacto nas contribuições individuais. A análise do desempenho reforçou a necessidade de esquemas de agregação robustos e adaptáveis em cenários distribuídos.
Com insights valiosos obtidos através da execução do Scaleout Studio, a pesquisa continua a explorar métodos para mitigar ataques e melhorar a precisão, destacando a eficácia de agregar múltiplas funções customizadas. Essa estratégia assegura que as implementações de machine learning em ambientes sensíveis mantenham a integridade dos dados e a confiança do modelo.
O Federated Learning avança para um futuro onde técnicas de agregação personalizadas são cruciais para desenvolver modelos de alta precisão em ambientes desafiadores, abrindo caminho para aplicações práticas em indústrias como saúde, finanças e segurança.
Fonte: (Towards Data Science – AI, ML & Deep Learning)