Machine learning aprimora compreensão 3D com harmônicos esféricos

São Paulo — InkDesign News —
A pesquisa recente em inteligência artificial (AI) mostra avanços significativos em machine learning, especialmente na extração de informações 3D em ambientes internos a partir de fotografias panorâmicas de 360 graus. Essa inovação, chamada HUSH, promete impactar diversas áreas, como realidade aumentada (AR) e gêmeos digitais.
Contexto da pesquisa
O estudo liderado pelo Professor Kyungdon Joo, na UNIST (Ulsan National Institute of Science and Technology), apresenta um modelo capaz de extrair configurações espaciais e detalhes de objetos de uma única imagem panorâmica com alta precisão, superando a necessidade de múltiplas capturas e equipamentos caros.
Método proposto
O modelo HUSH (Holistic Panoramic 3D Scene Understanding using Spherical Harmonics) utiliza a técnica matemática de Harmônicos Esféricos (SH) para lidar com a distorção das imagens panorâmicas. O método decompõe a cena em componentes de frequência, onde os componentes de baixa frequência representam áreas amplas e os de alta frequência capturam detalhes, como móveis e objetos. Essa abordagem melhora a análise e a eficiência computacional ao extrair informações espaciais de imagens esféricas.
“Os Harmônicos Esféricos são tradicionalmente usados em síntese de visualização virtual para representar cor e iluminação de objetos ou cenas. Reconhecendo sua capacidade de analisar dados em superfícies esféricas, aplicamos inovadoramente SH na reconstrução espacial baseada em imagens panorâmicas pela primeira vez.”
(“Spherical Harmonics are traditionally used in virtual view synthesis for representing color and lighting of objects or scenes. Recognizing their capacity to analyze data on a spherical surface, we innovatively applied SH to panoramic image-based spatial reconstruction for the first time.”)— Jongsung Lee, Primeiro Autor, UNIST
Resultados e impacto
O modelo HUSH demonstrou melhor precisão em tarefas de predição de profundidade em comparação com modelos de reconstrução 3D existentes. Com capacidade de inferir múltiplos detalhes espaciais a partir de uma única imagem, ele se destaca em performance e eficiência computacional. Professor Joo destacou que essa tecnologia tem potencial em cenários do mundo real onde uma compreensão precisa dos espaços internos é essencial, como em ambientes de AR e MR.
Com a pesquisa apresentada na CVPR 2025, espera-se que o HUSH transforme a forma como interagimos com espaços físicos, possibilitando experiências imersivas a partir de uma única imagem.
Fonte: (TechXplore – Machine Learning & AI)