Novo modelo de AI entrega raciocínio 100x mais rápido que LLMs

São Paulo — InkDesign News — A startup de inteligência artificial com sede em Cingapura, Sapient Intelligence, anunciou o desenvolvimento de uma nova arquitetura de IA chamada Hierarchical Reasoning Model (HRM), que promete igualar e, em alguns casos, superar modelos de linguagem de grande escala (LLMs) em tarefas de raciocínio complexo, utilizando uma fração dos recursos de dados e processamento.
Tecnologia e abordagem
O HRM é inspirado na estrutura do cérebro humano, utilizando sistemas distintos para planejamento lento e deliberado, além de computações rápidas e intuitivas. O modelo oferece resultados impressionantes com uma eficiência significativamente maior em comparação aos LLMs atuais. O foco é superar as limitações do método de “chain-of-thought” (CoT), que fragmenta problemas em etapas textuais, exigindo grandes quantidades de dados e resultando em respostas longas e lentas.
Os pesquisadores da Sapient Intelligence afirmam que "o CoT para raciocínio é uma muleta, não uma solução satisfatória" (”CoT for reasoning is a crutch, not a satisfactory solution”). A nova abordagem propõe um raciocínio latente, em que o modelo opera internamente sem a necessidade de articular constantemente os pensamentos em linguagem.
Aplicação e desempenho
O HRM foi testado em benchmarks exigentes como o Abstraction and Reasoning Corpus (ARC-AGI) e complexos quebra-cabeças de Sudoku, onde superou os luminários do CoT completamente. No benchmark de Sudoku extremo, modelos de CoT não conseguiram alcançar precisão, enquanto o HRM obteve quase 100% de acertos após apenas 1.000 exemplos de treinamento.
No ARC-AGI, o HRM de 27 milhões de parâmetros alcançou 40,3%, superando modelos CoT muito mais robustos, como o o3-mini-high, que obteve 34,5%. Esse desempenho ressalta a eficácia e a capacidade de aprender rapidamente com um volume reduzido de dados.
Impacto e mercado
O impacto do HRM no mercado é significativo, especialmente em cenários onde dados são escassos e os recursos computacionais são limitados. Segundo Guan Wang, fundador e CEO da Sapient Intelligence, "HRM oferece um desempenho superior com menos alucinações" em "tarefas complexas ou determinísticas" (”complex or deterministic tasks”).
Além disso, Wang estima que a arquitetura pode proporcionar um "aumento de 100x na velocidade de conclusão das tarefas", resultando em uma redução substancial da latência da inferência. Comparado aos grandes modelos de API que são custosos e intensivos em latência, o HRM se destaca como uma alternativa promissora para resolver problemas complexos em áreas como otimização logística e diagnósticos de sistemas.
Nos próximos passos, a Sapient Intelligence está focada em desenvolver modelos inspirados no HRM que sejam mais versáteis e aplicáveis a outras áreas, incluindo saúde e previsão climática. O avanço sugere que, para problemas que desafiam as atuais gigantes da IA, o caminho adiante pode não ser a criação de modelos maiores, mas sim arquiteturas mais inteligentes e estruturadas.
Fonte: (VentureBeat – AI)