
São Paulo — InkDesign News — A dominar o discurso da inteligência artificial (IA) e das arquiteturas de deep learning, a recente discussão no evento VB Transform trouxe à tona críticas contundentes sobre a narrativa dominante de que a inferência em IA é um processo padronizado e de baixo custo.
Tecnologia e abordagem
Durante um painel no evento, líderes de empresas emergentes de chips questionaram a mensagem de domínio da Nvidia, destacando que a visão de “fábrica de IA” pode ser mais marketing do que realidade. Jonathan Ross, CEO da Groq, afirmou:
“A fábrica de IA é apenas uma forma de marketing para fazer a IA parecer menos assustadora.”
(“AI factory is just a marketing way to make AI sound less scary.”)— Jonathan Ross, CEO, Groq
A ideia de uma produção em massa eficiente contrasta com a realidade das limitações de capacidade no fornecimento de tokens e GPUs, que frequentemente não atendem à demanda crescente.
Aplicação e desempenho
A dificuldade em atender à demanda das grandes empresas por capacidade de inferência foi destacada por Dylan Patel, fundador da SemiAnalysis, que explicou que
“Qualquer um que seja um grande usuário desses modelos de IA sabe que você pode ir até a OpenAI e não conseguirá a quantidade de tokens que precisa.”
(“Anyone who’s actually a big user of these gen AI models knows that you can go to OpenAI, or whoever it is, and they won’t actually be able to serve you enough tokens.”)— Dylan Patel, fundador, SemiAnalysis
A escassez de tokens resulta em desafios críticos para a implementação de soluções de IA em larga escala.
Impacto e mercado
A pressão por padrões de qualidade e capacidade revelou a fragilidade do modelo de economia de IA. Ross observa que as variações na qualidade da inferência tornam-se comparáveis às dificuldades que a Standard Oil enfrentou no passado com a variação da qualidade do petróleo. Ele ressalta:
“A diferença entre 95% e 100% de precisão é crucial para o sucesso de aplicações de IA.”
(“The difference between 95% and 100% accuracy determines whether your AI applications succeed or catastrophically fail.”)— Jonathan Ross, CEO, Groq
Este contexto destaca a necessidade de abordagens de capacidade mais robustas e flexíveis.
Os desafios de infraestrutura e de fornecimento exigem que empresas ajustem suas estratégias de IA, priorizando a qualidade e a performance em vez de buscar soluções que pretendem ser um “tamanho único”. O cenário competitivo indica que a capacidade será um ativo estratégico crítico na próxima década, limitando ainda mais a expansão das iniciativas de IA a menos que abordagens inovadoras de arquitetura e infraestrutura sejam adotadas.
Próximos passos estratégicos exigirão que líderes empresariais alinhem suas capacidades com demandas específicas, em tempos de escassez e crescente complexidade do mercado.
Fonte: (VentureBeat – AI)