
São Paulo — InkDesign News — A recente ascensão de startups de chips focadas em inteligência artificial (IA) promete transformar o mercado de inference em deep learning. Com um investimento significativo, a Positron desenvolve hardware otimizado para executar grandes modelos de IA de forma mais eficiente, criando um novo padrão para operações em data centers.
Tecnologia e abordagem
A Positron, uma startup de chips, apresenta a Atlas, sua primeira geração de aceleradores de inferência. Este hardware foi projetado especificamente para atender às demandas de modelos de transformação, como os LLMs (large language models). Ao contrário das GPUs convencionais, Atlas é otimizado para as necessidades de memória e largura de banda que as tarefas de inferência modernam requerem. A empresa alega que a Atlas entrega desempenho de 3,5 vezes melhor por dólar investido e até 66% menos consumo de energia em comparação com a H100 da Nvidia.
“Um diferenciador chave é nossa capacidade de rodar modelos de IA de forma mais eficiente — alcançando 2x a 5x de desempenho por watt e dólar em comparação com a Nvidia.”
(“A key differentiator is our ability to run frontier AI models with better efficiency—achieving 2x to 5x performance per watt and dollar compared to Nvidia.”)— Thomas Sohmers, Co-fundador e CTO, Positron
Aplicação e desempenho
Atlas tem como foco a inferência, um estágio crítico onde os modelos geram resultados. Os fundadores da Positron afirmam que essa área é a mais sub-otimizada no espectro da IA, especialmente para cargas de trabalho generativas. A Atlas já está disponível para uso em diversos setores, incluindo redes, jogos e moderação de conteúdo, onde altas taxas de transferência e redução do consumo de energia são cruciais.
Os chips da Positron evitam a necessidade de refrigeração líquida, permitindo uma instalação mais simples em centros de dados existentes. A abordagem pragmática da empresa, focando na compatibilidade com modelos treinados pela Nvidia, facilita a adoção sem reestruturações significativas de infraestrutura.
Impacto e mercado
Recentemente, a Positron anunciou uma rodada de financiamento de $51,6 milhões, o que indica a confiança do mercado em seu potencial disruptivo. Apesar de entrar em um cenário competitivo, onde modelos de IA tendem a se tornar mais leves e eficientes, a liderança da Positron acredita que tanto o uso local de modelos como a demanda por processamento em infraestrutura centralizada continuarão a crescer.
“Acreditamos que haverá um futuro onde cada pessoa poderia ter um modelo capaz em seu telefone, mas isso ainda dependerá de grandes modelos em data centers para gerar insights mais profundos.”
(“We see a future where every person might have a capable model on their phone, but those will still rely on large models in data centers to generate deeper insights.”)— Thomas Sohmers, Co-fundador e CTO, Positron
A Positron está posicionada para capitalizar sobre a crescente demanda por soluções de hardware de inferência, especialmente devido a seu compromisso com a fabricação doméstica e a resistência política, aumentando sua atratividade para clientes preocupados com a estabilidade da cadeia de suprimentos.
Os próximos passos para a Positron incluem o lançamento da plataforma Titan em 2026, que promete suporte para modelos ainda mais expansivos e um foco contínuo em eficiência energética e compatibilidade em ambientes de data center.
Fonte: (VentureBeat – AI)