One-shot federated learning alia proteção de dados e eficiência

Contexto da pesquisa
A pesquisa sobre técnicas de machine learning, especialmente em ambientes onde a privacidade é crucial, tem evoluído significativamente nos últimos anos. Uma equipe de pesquisadores da Daegu Gyeongbuk Institute of Science and Technology (DGIST) e da Universidade de Stanford desenvolveu uma nova técnica de aprendizado federado em um único passo que visa treinar modelos de forma eficiente sem o compartilhamento de informações pessoais.
Método proposto
A abordagem inclui a adição de ruído estrutural a imagens sintéticas e a aplicação da técnica de mix-up para gerar amostras intermediárias virtuais. Essa metodologia não apenas aumenta a diversidade dos dados de treinamento, mas também reutiliza imagens sintéticas para eliminar cálculos desnecessários, otimizando assim a eficiência computacional.
Os pesquisadores aplicaram essa técnica a diversos conjuntos de dados de imagens médicas, incluindo imagens radiográficas, patológicas, dermatoscópicas e de fundo ocular. O método utiliza a aprendizagem federada (FL), onde modelos treinados são compartilhados em vez de dados brutos de pacientes, abordando as limitações da transmissão repetida de modelos que trazem altos custos de tempo e recursos.
Resultados e impacto
Com a nova técnica, a equipe obteve precisão superior com menor quantidade de computações em comparação com abordagens existentes de FL em um único passo. Os resultados indicam que a diversidade de dados durante o treinamento reduz o overfitting, um problema comum em modelos tradicionais de aprendizado de máquina.
“Essa pesquisa é significativa ao mostrar que, mesmo sob restrições realistas como proteção à privacidade e limitações de comunicação, é possível treinar modelos amplamente aplicáveis na área de imagens médicas.
(“This research is meaningful in showing that even under realistic constraints such as privacy protection and communication limitations, it is possible to train broadly applicable models in the field of medical imaging.”)— Professor Sang-hyun Park, Departamento de Engenharia de Robótica e Mecatrônica, DGIST
O progresso dessa pesquisa poderá facilitar a criação de sistemas de diagnóstico mais precisos e confiáveis, possibilitando o desenvolvimento de modelos de inteligência artificial que abrangem populações de pacientes diversas, garantindo a privacidade dos dados. Os próximos passos incluem o refinamento dessa técnica para aumentar ainda mais a eficácia na análise de imagens médicas.
Fonte: (TechXplore – Machine Learning & AI)