
São Paulo — InkDesign News — A crescente demanda por inteligência artificial (IA) e modelos de linguagem avançados (LLMs) está moldando o mercado, com diversas inovações em deep learning. Com a introdução do modelo "Command A Vision", a Cohere se destaca ao oferecer uma solução multimodal otimizada para aplicações empresariais.
Tecnologia e abordagem
O modelo Command A Vision da Cohere, que conta com 112 bilhões de parâmetros, é projetado para extrair insights valiosos de dados visuais, utilizando reconhecimento óptico de caracteres (OCR) e análise de imagens. Baseado na arquitetura Llava, o modelo transforma recursos visuais em tokens que são processados em uma torre de texto. Este fluxo de trabalho permite que imagens complexas consumam até 3.328 tokens, otimizando o desempenho e a eficiência em ambientes corporativos.
Aplicação e desempenho
O Command A Vision é capaz de interpretar manuais de produtos complexos, analisar fotos reais e lidar com os desafios visuais mais exigentes do ambiente empresarial. Em comparação com outros modelos, como o GPT-4.1 da OpenAI e o Llama 4 Maverick da Meta, o desempenho do modelo de Cohere foi notável em diversos benchmarks, culminando em uma pontuação média de 83,1%, superando seus concorrentes que variaram entre 78,3% e 80,5%.
“Command A Vision é eficaz em ler e analisar os tipos mais comuns de imagens empresariais: gráficos, tabelas, diagramas, documentos escaneados e PDFs.”
(“Command A Vision can read and analyze the most common types of images enterprises need: graphs, charts, diagrams, scanned documents and PDFs.”)— Cohere
Impacto e mercado
A Cohere também enfatiza que o Command A Vision diminui o custo total de propriedade para empresas, ao requerer apenas duas GPUs, o que representa um passo à frente na acessibilidade de tecnologias de IA. A solução é oferecida em um sistema de pesos abertos, visando atrair empresas que buscam alternativas a modelos fechados e proprietários. As aplicações desse modelo podem revolucionar a maneira como as empresas manejam tarefas frequentemente laboriosas, como a automação de processos que envolvem documentos gráficos.
As expectativas para o impacto desse modelo no setor são elevadas, especialmente com a contínua evolução da pesquisa em inteligência artificial e o aumento do uso de dados não estruturados, que frequentemente desafiam as organizações na extração de informações úteis.
À medida que as aplicações de IA se expandem, o interesse dos desenvolvedores por soluções acessíveis e eficientes está crescendo, colocando a Cohere em uma posição vantajosa neste mercado competitivo.
Fonte: (VentureBeat – AI)