Modelos de linguagem AI descrevem vídeos para usuários cegos

- Publicidade -

Tiago F Santiago 30/06/2025Última Atualização 30/06/2025

0 47 2 minutos de leitura

Modelos de linguagem AI descrevem vídeos para usuários cegos — Blind and low-vision people request descriptions of videos on YouDescribe, but only 7% are completed. AI is speeding up the process. Credit: Matthew Modoono/Northeastern University

- Publicidade -

São Paulo — InkDesign News —

A utilização de modelos de aprendizagem de máquina (machine learning), em especial os modelos de linguagem visual (VLM), tem avançado na criação de descrições de vídeos para usuários cegos ou com baixa visão. Pesquisadores da Universidade Northeastern estão inovando na acessibilidade desse tipo de conteúdo, especialmente em plataformas de vídeo como YouTube e TikTok.

Contexto da pesquisa

Neste cenário, a dificuldade de se obter descrições de vídeos gerados por usuários se revela crítica. Apenas 7% dos vídeos solicitados na plataforma YouDescribe recebem essas descrições. A iniciativa, que visa preencher essa lacuna, foi intensificada por novas tecnologias de inteligência artificial que melhoram a qualidade das descrições.

Método proposto

O método de pesquisa utiliza modelos de linguagem visual (VLM) que analisam e descrevem ações em vídeos. Como mencionado por Lana Do, “é compreensível que um vídeo de 20 segundos no TikTok de alguém dançando pode não receber uma descrição profissional” (“It’s understandable that a 20-second video on TikTok of somebody dancing may not get a professional description”). A pesquisa também inclui um fluxo de trabalho com intervenção humana, onde os usuários podem corrigir erros nas descrições geradas pela AI, utilizando uma interface colaborativa.

Resultados e impacto

Os resultados mostram um aumento significativo na eficiência da criação de descrições com a ajuda da AI, reduzindo o tempo necessário para a conclusão das tarefas. As métricas de desempenho incluem uma comparação entre as descrições geradas automaticamente e as feitas por humanos, permitindo ajustes nos algoritmos treinados. Adicionalmente, a plataforma conta com 3.000 voluntários que ajudam a descrever vídeos, mas ainda há uma longa lista de pedidos pendentes.

“Os usuários cegos não querem ser distraídos com muita descrição verbal. É uma arte editorial verbalizar as informações mais importantes de forma concisa.”
(“Blind users don’t want to get distracted with too much verbal description. It’s an editorial art to verbalize the most important information in a concise way.”)

— Ilmi Yoon, Professor de Ciência da Computação, Universidade Northeastern

O avanço nas tecnologias de AI espera melhorar a acessibilidade em larga escala, potencialmente beneficiando milhões que dependem de descrições para entender melhor o conteúdo visual. O próximo passo envolve a contínua refinamento dos algoritmos e a ampliação dos recursos da plataforma YouDescribe, visando oferecer uma experiência mais rica e informativa.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -

Etiquetas

Tiago F Santiago 30/06/2025Última Atualização 30/06/2025

0 47 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Modelos de linguagem AI descrevem vídeos para usuários cegos

São Paulo — InkDesign News —

Contexto da pesquisa

Método proposto

Resultados e impacto

Tiago F Santiago

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

São Paulo — InkDesign News —

Contexto da pesquisa

Método proposto

Resultados e impacto

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Kristen Craft investe em nova estratégia de fundraising para TC All Stage

Anker retira power banks perigosos do mercado para gamers

Artigos relacionados

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Adblock detectado