Modelos generativos afetam margens de AI em provedores de nuvem

- Publicidade -

Tiago F Santiago 27/06/2025Última Atualização 27/06/2025

0 44 2 minutos de leitura

Modelos generativos afetam margens de AI em provedores de nuvem — The inference trap: How cloud providers are eating your AI margins

- Publicidade -

São Paulo — InkDesign News — O panorama da inteligência artificial (IA) está em constante evolução, com empresas adotando modelos de deep learning, incluindo grandes modelos de linguagem (LLM) e abordagens de aprendizado por reforço, para automatizar processos e aumentar a eficiência operacional.

Tecnologia e abordagem

As soluções baseadas em IA nos dias de hoje abrangem desde serviços ao cliente até manutenção de pipelines. Entretanto, com a transição de projetos de fase experimental para produção, as organizações enfrentam custos de nuvem que podem corroer suas margens. O gerenciamento de infraestrutura em nuvens públicas se assemelha ao uso de transporte público, onde a tarifa pode parecer acessível inicialmente, mas os custos podem disparar, especialmente durante picos de demanda de inferência.

“Você faz uma conta, clica em alguns botões e tem acesso a servidores. Se precisar de um tamanho de GPU diferente, você desliga e reinicia a instância com as novas especificações, o que leva minutos. Na fase inicial, o foco está em validar ideias rapidamente.”
(“You make an account, click a few buttons, and get access to servers. If you need a different GPU size, you shut down and restart the instance with the new specs, which takes minutes. In the early stages, the focus is on validating ideas quickly.”)

— Rohan Sarin, Líder de Produto AI, Speechmatics

Aplicação e desempenho

O aumento dos custos geralmente se torna insustentável quando os modelos de inferência precisam operar 24 horas por dia, especialmente em períodos de alta demanda. Christian Khoury, CEO da EasyAudit AI, mencionou que algumas empresas viram seus gastos com inferência saltar de $5 mil para $50 mil mensalmente, evidenciando a necessidade urgente de uma estratégia otimizada.

“A demanda de inferência é o novo ‘imposto da nuvem’. Aumento exponencial de custos se torna comum à medida que as empresas ainda tentam escalar e garantir a latência necessária.”
(“Inference demand is the new ‘cloud tax.’ Exponential cost increases become common as companies still try to scale and ensure the necessary latency.”)

— Christian Khoury, CEO, EasyAudit AI

Impacto e mercado

Empresas estão recorrendo a uma abordagem híbrida, transferindo cargas de trabalho de inferência para servidores dedicados em colocation ou na infraestrutura local, enquanto mantém o treinamento nas nuvens. Este modelo não apenas reduz custos em até 80%, mas também melhora a previsibilidade e controle sobre a capacidade de recursos.

“Temos ajudado equipes a mudar para colocation para inferência, usando servidores GPU dedicados que eles controlam. Não é glamouroso, mas reduz gastos mensais em 60-80%.”
(“We’ve helped teams shift to colocation for inference using dedicated GPU servers that they control. It’s not sexy, but it cuts monthly infra spend by 60–80%.”)

— Christian Khoury, CEO, EasyAudit AI

A crescente complexidade na transferência para um modelo híbrido não deve ser um obstáculo. Comumente, empresas gastam menos ao longo do tempo ao investir em hardware próprio ou em estruturas de colocation, ao invés de depender apenas de provedores de nuvem.

Os próximos passos para empresas e startups devem incluir uma avaliação cuidadosa das cargas de trabalho de IA, mantendo um equilíbrio entre investimento em nuvem e recursos locais, para garantir eficiência e redução nos gastos.

Fonte: (VentureBeat – AI)

- Publicidade -

Etiquetas

Tiago F Santiago 27/06/2025Última Atualização 27/06/2025

0 44 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Modelos generativos afetam margens de AI em provedores de nuvem

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Tiago F Santiago

Ler o Próximo

Terapia com ChatGPT: como a inteligência artificial influencia clientes

Desafios da inteligência artificial na eficiência energética

Peak Ji impulsiona aplicações globais de inteligência artificial

Inteligência artificial transforma o futuro dos bancos

Synthesia aprimora IA que pode interagir de forma expressiva

Inteligência artificial transforma o futuro das empresas

MIT desenvolve algoritmos para engajar o cliente conectado

Inteligência artificial melhora eficiência em provedores de saúde

Therapeutas usam GPT em consultas, clientes se sentem impactados

AI doppelgänger auxilia na otimização de tarefas profissionais

Terapia com ChatGPT: como a inteligência artificial influencia clientes

Desafios da inteligência artificial na eficiência energética

Peak Ji impulsiona aplicações globais de inteligência artificial

Inteligência artificial transforma o futuro dos bancos

Synthesia aprimora IA que pode interagir de forma expressiva

Inteligência artificial transforma o futuro das empresas

MIT desenvolve algoritmos para engajar o cliente conectado

Inteligência artificial melhora eficiência em provedores de saúde

Therapeutas usam GPT em consultas, clientes se sentem impactados

AI doppelgänger auxilia na otimização de tarefas profissionais

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Ler o Próximo

Terapia com ChatGPT: como a inteligência artificial influencia clientes

Desafios da inteligência artificial na eficiência energética

Peak Ji impulsiona aplicações globais de inteligência artificial

Inteligência artificial transforma o futuro dos bancos

Synthesia aprimora IA que pode interagir de forma expressiva

Inteligência artificial transforma o futuro das empresas

MIT desenvolve algoritmos para engajar o cliente conectado

Inteligência artificial melhora eficiência em provedores de saúde

Therapeutas usam GPT em consultas, clientes se sentem impactados

AI doppelgänger auxilia na otimização de tarefas profissionais

Prompt ops ajudam a reduzir custos ocultos da AI

STF marca depoimentos de testemunhas do núcleo 2

Artigos relacionados

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Adblock detectado