
São Paulo — InkDesign News — O uso de machine learning na detecção e rastreamento de múltiplos objetos em vídeos tem se tornado cada vez mais comum. Com o crescimento de algoritmos como o YOLO, a eficiência e precisão em aplicações de rastreamento aumentaram significativamente.
Arquitetura de modelo
O algoritmo de rastreamento de múltiplos objetos (MOT) utiliza detectores de imagens para processar quadros consecutivos de vídeo. A metodologia básica envolve aplicar um detector em cada quadro e, em seguida, corresponder as caixas delimitadoras que representam os mesmos objetos entre os quadros. O método depende de uma série de fatores, como a posição das caixas delimitadoras, a oclusão (quando caixas de diferentes objetos se sobrepõem) e o movimento dos objetos.
“Esses valores são calculados para todos os pares de caixas delimitadoras em quadros A e B.”
(“These values are calculated for all pairs of bounding boxes in frames A and B.”)— Autor, Especialista em Algoritmos
Treinamento e otimização
Os algoritmos de MOT precisam otimizar a correspondência de um número n de caixas delimitadoras em dois quadros, garantindo que cada caixa seja utilizada apenas uma vez. A aplicação do algoritmo Hungrarian, frequentemente utilizado em problemas de atribuição, tem revelado resultados promissores. Este algoritmo transforma a matriz de custos inicial em uma forma que facilita a busca pela solução ideal, minimizando assim o custo total sem alterar a natureza do problema.
“A ideia do passo de ajuste consiste em identificar o elemento mínimo entre os não cobertos e subtraí-lo de todos os elementos não cobertos.”
(“The idea of the adjustment step consists of identifying the minimal element among uncovered elements and subtracting it from all uncovered elements.”)— Autor, Especialista em Algoritmos
Resultados e métricas
Após a aplicação do algoritmo Hungrarian, é possível obter um mapeamento ótimo para as caixas delimitadoras. Os resultados demonstraram que a soma total dos custos de correspondência foi minimizada, atingindo investimentos consideráveis de tempo e recursos. Essa abordagem também permite considerar fatores adicionais, como a análise de trajetórias e a semelhança física dos objetos.
“Certamente, algoritmos modernos consideram fatores adicionais ao corresponder caixas delimitadoras.”
(“Certainly, modern MOT algorithms consider additional factors when matching bounding boxes.”)— Autor, Especialista em Algoritmos
A implementação desse tipo de tecnologia não apenas melhora a eficiência dos sistemas de vigilância, mas também pavimenta o caminho para inovações em áreas como direção autônoma e monitoramento de atividades. Com os avanços contínuos em deep learning, futuros estudos prometem expandir ainda mais essas aplicações práticas.
Fonte: (Towards Data Science – AI, ML & Deep Learning)