Claude models elevam custo de AI em empresas até 30% maior que GPT

- Publicidade -

Tiago F Santiago 03/05/2025Última Atualização 03/05/2025

0 35 2 minutos de leitura

Claude models elevam custo de AI em empresas até 30% maior que GPT — Hidden costs in AI deployment: Why Claude models may be 20-30% more expensive than GPT in enterprise settings

- Publicidade -

São Paulo — InkDesign News —

A inteligência artificial baseada em grandes modelos de linguagem (LLM) segue ganhando complexidade, evidenciando que detalhes técnicos como a tokenização afetam não só a performance, mas também os custos práticos das soluções. Estudos recentes mostram que diferentes famílias de modelos, como a OpenAI e a Anthropic, utilizam tokenizadores distintos, com impacto direto na quantidade de tokens gerados para o mesmo texto de entrada.

Tecnologia e abordagem

Os modelos GPT da OpenAI empregam tokenização via Byte Pair Encoding (BPE), em particular o tokenizer open-source o200k_base, que agrupa pares de caracteres frequentes em tokens. Por outro lado, a Anthropic utiliza um tokenizador próprio, menos acessível e com cerca de 65 mil variações de tokens, inferior aos 100.261 do GPT-4. Essa diferença em tokenização explica variações na contagem de tokens, uma métrica crucial para operações com LLMs.

“A Anthropic emprega um tokenizador único com apenas 65.000 variações de token, em comparação com as 100.261 do GPT-4 da OpenAI.”
(“Anthropic uses a unique tokenizer with only 65,000 token variations, compared to OpenAI’s 100,261 token variations for GPT-4.”)

— Latenode, Análise Técnica

Aplicação e desempenho

Testes comparativos entre o Claude 3.5 Sonnet da Anthropic e o GPT-4o da OpenAI indicam que o primeiro gera 16% a 30% mais tokens para um mesmo input, dependendo do domínio do texto. Em artigos em inglês, o excesso é de 16%; em códigos Python, sobe para 30%; em equações matemáticas, atinge 21%. Esses números evidenciam ineficiências na tokenização da Anthropic, que fragmenta conteúdos técnicos e estruturados em mais tokens.

Essa tokenização excessiva impacta diretamente os custos e a utilização da janela de contexto, mesmo com Anthropic anunciando uma janela maior (200 mil tokens contra 128 mil da OpenAI). Na prática, o uso mais verbose dos tokens pode reduzir o espaço efetivo de contexto disponível.

Impacto e mercado

No âmbito do mercado e custos, apesar do Claude 3.5 Sonnet oferecer preço até 40% menor por token de entrada, o aumento na quantidade de tokens torna a implementação mais cara em comparação ao GPT-4o. O custo prático para empresas que processam grandes volumes de dados pode ser até 20-30% superior. Isso destaca a importância da análise de tokenização para decisões de custo-benefício em implantação de IA.

“Enquanto o custo por token de entrada do Claude 3.5 Sonnet é 40% menor, a tokenização mais verbosa pode elevar o custo total, tornando o uso prático mais caro.”
(“While Claude 3.5 Sonnet’s input token cost is 40% lower, the more verbose tokenization can increase total cost, making practical use more expensive.”)

— Lavanya Gupta, Pesquisadora em IA

Além disso, empresas devem avaliar o tipo de conteúdo a ser processado para escolher a solução mais eficiente. Textos naturais podem apresentar custo semelhante entre os modelos, enquanto conteúdos técnicos demandam maior dedicação à escolha do modelo, dada a maior ineficiência dos tokenizadores específicos.

Os próximos passos envolvem a transparência e otimização na tokenização para equilibrar custo, desempenho e escalabilidade, assim como o desenvolvimento de métricas padronizadas para comparação entre modelos em diferentes domínios. A capacidade de prever com precisão a contagem de tokens é estratégica para o planejamento financeiro e operacional em IA.

Para mais informações técnicas e discussões sobre IA generativa: /tag/inteligencia-artificial/ e /tag/ia-generativa/.

Fonte: (VentureBeat – AI)

- Publicidade -

Etiquetas

Tiago F Santiago 03/05/2025Última Atualização 03/05/2025

0 35 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Claude models elevam custo de AI em empresas até 30% maior que GPT

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Tiago F Santiago

Ler o Próximo

Investigadores dos EUA usam IA para detectar imagens de abuso infantil

Drones da polícia usam inteligência artificial para perseguir furtos

Inteligência artificial e Wikipedia afundam línguas vulneráveis

OpenAI desvenda o código dos chatbots com inteligência artificial

AI pode facilitar relações inesperadas com chatbots

Modelos de IA utilizam dados de artigos retratados

Startup médica utiliza inteligência artificial para diagnósticos

Investidores redefinem estratégias em inteligência artificial

Reguladores avaliam impacto da inteligência artificial em relacionamentos

Modelos de IA geram vídeos com redes neurais avançadas

Investigadores dos EUA usam IA para detectar imagens de abuso infantil

Drones da polícia usam inteligência artificial para perseguir furtos

Inteligência artificial e Wikipedia afundam línguas vulneráveis

OpenAI desvenda o código dos chatbots com inteligência artificial

AI pode facilitar relações inesperadas com chatbots

Modelos de IA utilizam dados de artigos retratados

Startup médica utiliza inteligência artificial para diagnósticos

Investidores redefinem estratégias em inteligência artificial

Reguladores avaliam impacto da inteligência artificial em relacionamentos

Modelos de IA geram vídeos com redes neurais avançadas

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

LIGO revela 10 descobertas sobre ondas gravitacionais

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Uerj revoga título a Médici em ação contra governo militar

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

Estudo revela por que remédios têm gosto amargo

Aura lança digital frame Aspen com recursos inteligentes por US$229

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Ler o Próximo

Investigadores dos EUA usam IA para detectar imagens de abuso infantil

Drones da polícia usam inteligência artificial para perseguir furtos

Inteligência artificial e Wikipedia afundam línguas vulneráveis

OpenAI desvenda o código dos chatbots com inteligência artificial

AI pode facilitar relações inesperadas com chatbots

Modelos de IA utilizam dados de artigos retratados

Startup médica utiliza inteligência artificial para diagnósticos

Investidores redefinem estratégias em inteligência artificial

Reguladores avaliam impacto da inteligência artificial em relacionamentos

Modelos de IA geram vídeos com redes neurais avançadas

Robôs em órbita exploram tecnologia espacial com Jeremy Hadall

Linktree lança recursos de monetização para creators no e-commerce

Artigos relacionados

Uerj revoga título a Médici em ação contra governo militar

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

Estudo revela por que remédios têm gosto amargo

Aura lança digital frame Aspen com recursos inteligentes por US$229

Adblock detectado