CNN melhora detecção de anomalias em imagens em escala de cinza

São Paulo — InkDesign News — A utilização de imagens em tons de cinza em modelos de anomaly detection (detecção de anomalias) pode impactar significativamente tanto o desempenho quanto a velocidade de inferência em aplicativos de machine learning.
Arquitetura de modelo
Modelos de anomalia, como PatchCore, Reverse Distillation, FastFlow e GLASS, são projetados para detectar padrões incomuns em imagens, normalmente treinados exclusivamente com imagens sem defeitos. No entanto, a escolha entre imagens coloridas e em tons de cinza levanta questões sobre a relevância dos recursos extraídos. Na ausência de dados coloridos, a capacidade de esses modelos de funcionarem adequadamente pode ser afetada.
“Esses modelos não requerem ajuste fino, mas usam modelos de classificação pré-treinados como extratores de características.”
(“These models do not require fine-tuning, but they use pre-trained classification models as feature extractors.”)— Autor anônimo, Texto do estudo
Treinamento e otimização
A pesquisa utiliza o conjunto de dados VisA, que contém 12 categorias de objetos sem defeitos dependentes de cor, testando tanto imagens RGB quanto convertidas para cinza em uma e três camadas. Medidas de desempenho como AUROC (Área sob a curva de operação do receptor) e AUPRO (Área sob a precisão de pixel) foram empregadas para avaliação. Resultados indicam uma qualidade de detecção inferior ao usar imagens em tons de cinza, especialmente com menos canais.
“O impacto varia dependendo do modelo e dos dados.”
(“The impact varies depending on the model and data.”)— Autor anônimo, Texto do estudo
Resultados e métricas
Os experimentos mostraram que tanto PatchCore quanto Reverse Distillation mantiveram desempenho aceitável ao trabalhar com entradas em tons de cinza, enquanto FastFlow e GLASS apresentaram quedas mais acentuadas nas métricas. Resultados por categoria demonstraram variações, com algumas categorias mostrando desempenho consistentemente pior sob conversão para tons de cinza.
“Se você quiser usar entrada em tons de cinza, precisa testar e comparar com RGB em seus dados específicos.”
(“If you want to use grayscale input, you need to test and compare it with RGB on your specific data.”)— Autor anônimo, Texto do estudo
Enquanto a melhora na velocidade de inferência foi observada em alguns modelos ao usar uma única camada, os resultados indicam que a troca pode não ser ideal se a precisão das detecções for comprometida.
Com a crescente necessidade de automação em setores industriais, a pesquisa reforça a importância de escolher o tipo de imagem adequado para aplicações de deep learning.
Fonte: (Towards Data Science – AI, ML & Deep Learning)