Técnica de machine learning limpa dados e potencializa AI

- Publicidade -

Tiago F Santiago 12/06/2025Última Atualização 12/06/2025

0 50 2 minutos de leitura

Técnica de machine learning limpa dados e potencializa AI — Credit: Unsplash/CC0 Public Domain

- Publicidade -

Em um cenário onde o potencial do machine learning e da inteligência artificial (AI) se expande, a qualidade dos dados se torna crucial. Um novo estudo de pesquisadores da Universidade Atlantic Florida destaca um método inovador para detectar e remover rótulos errôneos.

Contexto da pesquisa

Modelos de machine learning, como as Máquinas de Vetores de Suporte (SVM), são amplamente utilizados em tarefas que vão desde o reconhecimento de imagens até diagnósticos médicos. Esses modelos dependem de um subconjunto crítico de dados, os support vectors, cuja rotulagem correta é vital. Um rótulo incorreto pode comprometer a eficácia do modelo, levando a diagnósticos errados e falhas em sistemas de segurança. A pesquisa foi conduzida pelo Center for Connected Autonomy and Artificial Intelligence (CA-AI) da Universidade Florida Atlantic.

Método proposto

O estudo introduz uma abordagem que utiliza a análise de componentes principais com a norma L1, permitindo a identificação automática de dados anômalos. Essa técnica visa detectar outliers que não se encaixam nos padrões do conjunto de dados, removendo ou sinalizando esses pontos antes que o modelo seja treinado. Diferentemente de métodos convencionais, que permitem ajustes manuais, essa abordagem é escalável e prática, sendo capaz de intervir sem intervenção do usuário.

Resultados e impacto

A técnica foi testada em conjuntos de dados reais e sintéticos com diferentes níveis de contaminação de rótulos. Os resultados mostraram melhorias consistentes na acurácia das classificações. Segundo Dimitris Pados, um dos pesquisadores envolvidos, “dados que se afastam significativamente do restante, muitas vezes devido a erros de rotulagem, são identificados e removidos” (

“Data points that appear to deviate significantly from the rest—often due to label errors—are flagged and removed.”

— Dimitris Pados, Ph.D., FAU

Os testes realizados, incluindo benchmarks como o conjunto de dados de Câncer de Mama de Wisconsin, confirmaram que o novo método pode ser uma etapa padrão de pré-processamento para a criação de sistemas de machine learning de alta performance, elevando a precisão na classificação mesmo em dados que pareciam limpos.

Com a crescente integração do machine learning em áreas críticas, como cuidados de saúde e justiça, a pesquisa propõe um caminho para uma melhor qualidade de dados, essencial para garantir resultados eficazes e éticos.

“Ao melhorar a qualidade dos dados na origem, antes mesmo do modelo ser treinado, não estamos apenas aumentando a precisão da AI; estamos tornando-a mais responsável” (

“By improving data quality at the source—before the model is even trained—we’re not just making AI more accurate; we’re making it more responsible.”

— Stella Batalama, Ph.D., FAU

O futuro do método desenvolvido abre novas possibilidades na busca por reduzir preconceitos e melhorar a integridade dos conjuntos de dados em ciência de dados.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -

Etiquetas

Tiago F Santiago 12/06/2025Última Atualização 12/06/2025

0 50 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Técnica de machine learning limpa dados e potencializa AI

Contexto da pesquisa

Método proposto

Resultados e impacto

Tiago F Santiago

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Contexto da pesquisa

Método proposto

Resultados e impacto

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Apple apresenta interface que simula materiais físicos

Chime supera crise e abre capital a US$ 14,5 bi em fintech

Artigos relacionados

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Adblock detectado