Modelos causais melhoram generalização em offline reinforcement learning

- Publicidade -

Tiago F Santiago 04/05/2025Última Atualização 04/05/2025

0 70 2 minutos de leitura

Modelos causais melhoram generalização em offline reinforcement learning — The heat map of the three offline data sets in the car driving model. Credit: *Frontiers of Computer Science* (2024). DOI: 10.1007/s11704-024-3946-y

- Publicidade -

Nanjing — InkDesign News — Pesquisadores da Universidade de Nanjing e da Carnegie Mellon University desenvolveram uma abordagem inovadora em machine learning que melhora o aprendizado de máquinas a partir de dados históricos, um avanço significativo em offline reinforcement learning (RL).

Contexto da pesquisa

O offline reinforcement learning é essencial para sistemas que tomam decisões baseadas apenas em dados passados, sem necessidade de interação em tempo real com o ambiente. No entanto, uma grande dificuldade dessa área é que modelos tradicionais frequentemente aprendem relações espúrias, confundindo correlações com causalidade. Por exemplo, um sistema pode erradamente associar o acionamento do limpador de para-brisa à desaceleração do veículo, quando na verdade o que causa a desaceleração é o ato de frear.

Método proposto

A nova técnica desenvolvida pelos pesquisadores utiliza modelos causais estruturados para discernir relações genuínas de causa e efeito em dados históricos sequenciais e contínuos. Utilizando testes estatísticos especializados, o método reduz a complexidade computacional e aprimora a capacidade de o sistema identificar corretamente as causas reais por trás das ações observadas, superando modelos tradicionais como MOPO, MOReL, COMBO e LNCM.

O modelo empregado é baseado em aprendizado por reforço offline com estrutura causal, que combina análise estatística de dados sequenciais com a construção de um modelo do mundo que respeita as relações causais.

Resultados e impacto

Nos testes realizados, o método provou reduzir drasticamente os erros decorrentes de relações espúrias e apresentou desempenho superior aos benchmarks convencionais em termos de segurança e confiabilidade das decisões tomadas. O modelo foi validado em ambientes de condução autônoma e outras aplicações autônomas, mostrando maior precisão na generalização de políticas aprendidas a partir de dados offline.

“Nosso estudo aproveita o poder do raciocínio causal para eliminar ruídos nos dados históricos, possibilitando que sistemas tomem decisões mais precisas e seguras—um avanço que pode melhorar a implementação da tecnologia autônoma em diversos setores.”
(“Our study harnesses the power of causal reasoning to cut through the noise in historical data, enabling systems to make decisions that are both more accurate and safer—an advancement that could improve how autonomous technology is deployed across industries.”)

— Prof. Yang Yu, Universidade de Nanjing

Este avanço tem implicações diretas para a segurança em veículos autônomos, sistemas médicos de suporte à decisão e robótica, onde a precisão nas decisões é crítica. Também pode influenciar futuras regulações e aumentar a confiança pública em sistemas automatizados. Pesquisas futuras poderão expandir a aplicação da causalidade em outras áreas do machine learning.

Leia mais em Machine Learning e Deep Learning.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -

Etiquetas

Tiago F Santiago 04/05/2025Última Atualização 04/05/2025

0 70 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Modelos causais melhoram generalização em offline reinforcement learning

Contexto da pesquisa

Método proposto

Resultados e impacto

Tiago F Santiago

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Contexto da pesquisa

Método proposto

Resultados e impacto

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Sam Altman's World lança dispositivo móvel de verificação para startups

Artigos relacionados

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Adblock detectado