Deep learning enfrenta desafios na detecção 3D humana

- Publicidade -

Tiago F Santiago 12/08/2025Última Atualização 12/08/2025

0 2 1 minuto de leitura

Deep learning enfrenta desafios na detecção 3D humana — Motivation: Comparison of different token scanning methods. (a) Cross Attention acts on all image tokens. (b) Projective Attention obtains anchors with perspective projection and selectively attends to sample tokens surrounding the anchor points. (c) The proposed Grid Token-guided Bidirectional Scanning (GTBS) encodes the local context and the joint spatial sequence at the visual feature and person keypoint levels. Credit: The authors

- Publicidade -

Nos últimos anos, a pesquisa em machine learning e inteligência artificial (AI) tem evoluído rapidamente, especialmente no que diz respeito à estimativa de poses humanas em 3D. Recentemente, uma nova abordagem promissora foi apresentada, destacando-se pela sua capacidade de integrar dados de múltiplas câmaras de forma mais eficiente.

Contexto da pesquisa

Estimar com precisão a pose humana em 3D tem sido um desafio crescente no campo de AI. Os métodos anteriores, como OpenPose e Mediapipe, focavam na localização de articulações humanas como pontos-chaves em 2D. No entanto, a transição para a estimativa em 3D, que prevê as localizações (x, y, z) de articulações, ainda se mostrava complexa, mesmo com múltiplas câmaras disponíveis.

Método proposto

Um novo modelo, denominado MV-SSM (Multi-View State Space Modeling), foi apresentado por Aviral Chharia e colegas na Conferência IEEE/CVF sobre Visão Computacional e Padrões de Reconhecimento (CVPR) 2025. Este modelo utiliza blocos de espaço-estado projetivo (PSS) e um novo método de varredura bidirecional guiada por tokens de grade (GTBS) para aprender representações generalizadas das articulações. Assim, ele processa entradas de múltiplas imagens de forma end-to-end, que contrasta com abordagens anteriores que dependiam de etapas intermediárias, otimizando o desempenho na triangulação geométrica.

Resultados e impacto

Os experimentos demonstraram que o MV-SSM superou outros modelos líderes, apresentando uma melhora de +24% em configurações desafiadoras com três câmaras no benchmark CMU Panoptic e +38% em avaliações inter-datasets. O professor enfatiza que “a generalização do modelo é uma preocupação central, especialmente quando ele foi testado em diferentes arranjos de câmaras” (“the model’s generalization is a central concern, especially when tested in different camera arrangements”).
— Aviral Chharia, Pesquisador, Carnegie Mellon University

Com um futuro promissor, a pesquisa em poses humanas 3D ainda enfrenta desafios, como a suposição de que os parâmetros da câmara são conhecidos. Resolver essas limitações poderá ter um impacto significativo em diversas aplicações, desde a realidade aumentada até a análise de comportamento humano.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -

Etiquetas

Tiago F Santiago 12/08/2025Última Atualização 12/08/2025

0 2 1 minuto de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Deep learning enfrenta desafios na detecção 3D humana

Contexto da pesquisa

Método proposto

Resultados e impacto

Tiago F Santiago

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Contexto da pesquisa

Método proposto

Resultados e impacto

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Palworld chega ao Nintendo Switch em meio a processo judicial

Uno Platform foca em desenvolvedores B2B no Brasil

Artigos relacionados

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Adblock detectado