- Publicidade -
- Publicidade -
- Publicidade -
AI, ML & Deep Learning

SyncNet proporciona avanço em modelagem de deep learning

- Publicidade -
- Publicidade -

São Paulo — InkDesign News —
A tecnologia de machine learning avançou significativamente na correção de problemas de sincronização de áudio e vídeo, oferecendo soluções automatizadas que economizam tempo na produção de conteúdo multimídia.

Arquitetura de modelo

O modelo apresentado no artigo “Syncnet” utiliza uma arquitetura de rede neural convolucional (CNN) de dois fluxos: um para o áudio e outro para o vídeo. Ambos os ramos consomem 0,2 segundos de entrada, permitindo a comparação entre amostras de áudio e vídeo. O pré-processamento dos dados é essencial, sendo o áudio representado por uma matriz MFCC de 13 x 20, enquanto o vídeo é transformado em imagens em escala de cinza 111 x 111.

“A rede aprende um espaço de incorporação conjunto, onde os embeddings de áudio e vídeo sincronizados se agrupam próximos entre si.”
(“The network learns a joint embedding space, where synced audio and video embeddings cluster close to each other.”)

— Pesquisador do Syncnet

Treinamento e otimização

O método de treinamento auto-supervisionado permite a utilização de grandes quantidades de dados sem necessidade de anotações manuais, proporcionando pares positivos e negativos ao gerar exemplos de áudio e vídeo em sincronia e fora de sincronia. A perda contrastiva é utilizada para otimizar o modelo e refinar a precisão dos dados. Isso é alcançado ao minimizar a distância euclidiana entre embeddings sincronizados e maximizar essa distância entre pares negativos.

“A beleza está em sua simplicidade: treinar duas CNNs para criar embeddings onde pares de áudio e vídeo sincronizados se agrupam naturalmente.”
(“The beauty lies in its simplicity: train two CNNs to create embeddings where synced audio-video pairs naturally cluster together.”)

— Pesquisador do Syncnet

Resultados e métricas

Os resultados mostram que o modelo alcança até 99% de precisão ao calcular offsets de sincronização usando a média de várias amostras. A confiabilidade do modelo é acentuada pela capacidade de lidar com diferentes cenários, desde transmissões de TV até vídeos de plataformas como o YouTube.

“A média, se realizada corretamente, elimina amostras enganosas, levando a resultados mais estáveis.”
(“The averaging, if done correctly, eliminates misleading samples, leading to more stable results.”)

— Pesquisador do Syncnet

As aplicações práticas do Syncnet são vastas, incluindo correção de problemas de sincronização em pós-produção e identificação de oradores em cenas com múltiplas pessoas. O próximo passo envolve aprimorar a precisão do modelo em contextos mais variados.

Fonte: (Towards Data Science – AI, ML & Deep Learning)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!