
São Paulo — InkDesign News —
A pesquisa sobre machine learning está avançando com o desenvolvimento de métodos que asseguram a qualidade de dados sintéticos, essenciais para o treinamento de modelos de inteligência artificial (AI). A necessidade de dados de alta qualidade se torna mais premente à medida que a disponibilidade de dados do mundo real se esgota.
Contexto da pesquisa
Wei Gao, professor associado de engenharia elétrica e de computadores na Universidade de Pittsburgh, junto a pesquisadores da Universidade de Pequim, elaborou métricas analíticas para avaliar qualitativamente a qualidade de dados sintéticos em aplicações wireless. A pesquisa, publicada recentemente no servidor arXiv, aborda as limitações da qualidade dos dados sintéticos gerados para treinar modelos de AI.
Método proposto
Os pesquisadores desenvolveram uma abordagem usando aprendizado semi-supervisionado, incorporando dados sintéticos filtrados e marcados de acordo com suas características. “Dados gerados não podem ser aleatórios,” disse Gao, “você precisa garantir que as imagens representem rostos reais e não tenham características irreais.” (
“Synthetic data is vital for training AI models, but for modalities such as images, video, or sound, and especially wireless signals, generating good data can be difficult.”
(“Dados sintéticos são vitais para o treinamento de modelos de IA, mas para modalidades como imagens, vídeo ou som, e especialmente sinais sem fio, gerar bons dados pode ser difícil.”)— Wei Gao, Professor Associado, Universidade de Pittsburgh
)
Resultados e impacto
A implementação deste novo método resultou em uma melhoria de 4,3% na performance dos modelos treinados, em contrapartida ao uso não seletivo de dados sintéticos, que levaria a uma degradação de 13,4% no desempenho. Os resultados indicam que a abordagem pode oferecer avanços significativos na utilização de dados sintéticos para tecnologias que vão de monitoramento de saúde a jogos interativos. “Nosso sistema melhora a performance do modelo através da filtragem de amostras”, afirmou Gao.
As futuras aplicações desse estudo incluem avanços em tecnologias de reconhecimento de padrões humanos a partir de sinais wireless, abrindo caminho para modelos de AI mais robustos e eficazes.
Fonte: (TechXplore – Machine Learning & AI)