
Machine Learning e a Revolução da Inteligência Artificial
A pesquisa em machine learning (aprendizado de máquina) tem se intensificado, especialmente no uso de dados sintéticos como insumo para o desenvolvimento de modelos de inteligência artificial (AI). Estas inovações prometem acelerar processos e preservar a privacidade de informações sensíveis.
Contexto da pesquisa
São Paulo — InkDesign News — Pesquisadores estão explorando o uso de dados sintéticos, que são gerados por algoritmos para imitar propriedades estatísticas de dados reais, mas sem conter informações identificáveis. Segundo estimativas, mais de 60% dos dados usados em aplicações de AI em 2024 foram sintéticos, com tendência de crescimento em diversos setores.
Método proposto
Os dados sintéticos são criados a partir de modelos gerativos que capturam padrões e regras subjacentes presentes nos dados reais. Entre os métodos utilizados, incluem-se as Redes Neurais Generativas Adversariais (GANs) e os Modelos de Linguagem de Grande Escala (LLMs). “A geração de dados sintéticos preserva a privacidade e reduz custos, facilitando o treinamento de modelos de machine learning”, afirma Kalyan Veeramachaneni, cientista principal no Laboratório de Sistemas de Informação e Decisão.
Resultados e impacto
A aplicabilidade dos dados sintéticos se evidencia em testes de software e na formação de modelos de machine learning, principalmente em contextos onde eventos são raros, como transações fraudulentas. Os dados sintéticos possibilitam a criação de conjuntos de dados variados que melhoram a acurácia dos modelos. “No passado, gerava-se dados manualmente, mas agora podemos criar quantidades imensas com precisão”, ressalta Veeramachaneni.
“Embora os dados sintéticos permitam inovações, a qualidade e a confiança desses dados devem ser sempre avaliadas.”
(“While synthetic data allow for innovations, the quality and trust of these data must always be evaluated.”)— Kalyan Veeramachaneni, Cientista Principal, MIT
O futuro da aplicação de dados sintéticos é promissor, com potencial em áreas como a saúde, segurança financeira e desenvolvimento de software. À medida que as metodologias evoluem, a confiança nos dados gerados continuará sendo um foco crítico.
Fonte: (TechXplore – Machine Learning & AI)