
São Paulo — InkDesign News — A Nous Research, uma startup de inteligência artificial focada em modelos de linguagem de código aberto, lançou recentemente o Hermes 4, uma nova família de LLMs (Modelos de Linguagem de Grande Escala). A empresa afirma que esses modelos rivalizam o desempenho de sistemas proprietários líderes, oferecendo controle inédito aos usuários e reduzindo restrições de conteúdo.
Tecnologia e abordagem
O Hermes 4 introduz um modo de raciocínio híbrido, permitindo que os usuários alternem entre respostas rápidas e processos de pensamento mais profundos. Quando ativado, o modelo exibe seu raciocínio interno em tags especiais antes de apresentar a resposta final. Essa abordagem é semelhante aos modelos de raciocínio o1 da OpenAI, mas com uma transparência total sobre o processo de pensamento da IA.
"O Hermes 4 constrói sobre nosso legado de modelos alinhados aos usuários, com capacidades expandidas em tempo de teste," afirma a Nous Research. Os novos modelos são descritos como criativos e interessantes, não sobrecarregados por censura e alinhados de forma neutra, mantendo um nível de desempenho superior em matemática, programação e raciocínio.
Aplicação e desempenho
Testes com o modelo maior, composto por 405 bilhões de parâmetros, revelaram uma taxa de 96,3% no benchmark MATH-500 em modo de raciocínio e 81,9% na competição de matemática AIME’24. O Hermes 4 também se destacou no “RefusalBench”, uma nova métrica que avalia a frequência com que sistemas de IA se recusam a responder perguntas, obtendo 57,1%, muito acima dos concorrentes GPT-4o (17,67%) e Claude Sonnet 4 (17%).
“O desafio é tornar os rastros de pensamento úteis e verificáveis sem raciocínios descontrolados.”
(“The challenge is making thinking traces useful and verifiable without runaway reasoning.”)— Rohan Paul, Pesquisador de IA
A implementação da infraestrutura de treinamento da Nous Research é baseada em dois sistemas inovadores: o DataForge, um gerador de dados sintéticos baseado em grafos, e o Atropos, um framework de aprendizado por reforço de código aberto. Essa combinação permite a geração de dados de treinamento que se transformam em exemplos complexos de seguir instruções.
Impacto e mercado
A Nous Research visa desafiar as limitações do controle corporativo sobre a IA, defendendo a acessibilidade e a transparência em oposição às diretrizes de segurança rígidas que caracterizam modelos comerciais. “O Hermes 4 não está preso a avisos e regras excessivas, o que é irritante e prejudica a inovação e a usabilidade,” declara Tommy Shaughnessy, investidor da Delphi Ventures.
Apesar de suas conquistas, o Hermes 4 enfrenta limitações típicas de modelos de código aberto. Embora a performance em benchmarks seja impressionante, os modelos exigem recursos computacionais significativos, o que pode limitar o acesso e a escalabilidade em aplicações práticas.
Os próximos passos para a Nous Research incluem a exploração de parcerias com provedores de inferência e a continuação do desenvolvimento do Psyche Network, um sistema de treinamento distribuído que busca coordenar o treinamento de IA em computadores conectados pela internet.
Fonte: (VentureBeat – AI)