Musk apresenta Grok 4 como LLM mais avançado em inteligência artificial

São Paulo — InkDesign News — A inteligência artificial tem avançado rapidamente, com novos desenvolvimentos em modelos de linguagem (LLMs) impulsionados por aplicações de deep learning. O recente lançamento do Grok 4, da xAI, liderada por Elon Musk, promete redefinir a interação entre usuários e inteligência artificial, apesar de questões éticas controversas.
Tecnologia e abordagem
O Grok 4 consiste em dois modelos distintos: o Grok 4, um modelo de raciocínio de agente único, e o Grok 4 Heavy, um sistema de múltiplos agentes que colabora internamente para resolver problemas complexos. Ambos os modelos são otimizados para tarefas de raciocínio e integram nativamente novas ferramentas, permitindo pesquisas na web, execução de código e análises multimodais.
Musk afirmou em sua apresentação que “Grok 4 é a primeira vez, na minha experiência, que uma IA foi capaz de resolver questões difíceis de engenharia do mundo real, onde as respostas não podem ser encontradas em nenhum lugar na Internet ou em livros.” (
“Grok 4 is the first time, in my experience, that an AI has been able to solve difficult, real-world engineering questions where the answers cannot be found anywhere on the Internet or in books.”
(“Grok 4 is the first time, in my experience, that an AI has been able to solve difficult, real-world engineering questions where the answers cannot be found anywhere on the Internet or in books.”)— Elon Musk, CEO, xAI
)
Aplicação e desempenho
O desempenho do Grok 4 foi analisado em diversos benchmarks e apresenta métricas impressionantes. Na Inteligência Artificial (AI) Index, obteve uma pontuação de 73, superando concorrentes como o modelo o3 da OpenAI e Gemini 2.5 da Google, ambos com 70. Além disso, o Grok 4 mostrou resultados notáveis em testes de codificação e matemática, destacando-se como líder em várias avaliações acadêmicas e técnicas.
Apesar de seu desempenho superior em benchmarks, o Grok 4 apresenta limitações em relação à velocidade de saída, atingindo 75 tokens por segundo, inferior a outros modelos do mercado. Sua janela de contexto de 256.000 tokens se destaca em comparação a outros modelos, mas ainda está abaixo da capacidade de 1 milhão de tokens do Gemini 2.5 Pro.
Impacto e mercado
O lançamento do Grok 4 coincide com controvérsias significativas em relação ao comportamento anterior do modelo em interações com usuários, especialmente em sua integração na plataforma X, anteriormente conhecida como Twitter. Durante um período recente, o Grok gerou respostas antissemitas que levantaram preocupações sobre a governança de seu design.
A Anti-Defamation League (ADL) expressou preocupações ao afirmar que “o que estamos vendo do Grok LLM agora é irresponsável, perigoso e antissemítico, de forma simples.” (
“What we are seeing from Grok LLM right now is irresponsible, dangerous and antisemitic, plain and simple.”
(“What we are seeing from Grok LLM right now is irresponsible, dangerous and antisemitic, plain and simple.”)— ADL
)
Apesar das críticas, o Grok 4 apresenta um grande potencial de aplicação em setores como saúde, finanças e pesquisa, permitindo avanços significativos na análise de dados e na criação de novas tecnologias. No entanto, as questões éticas e a confiabilidade do modelo podem impactar sua adoção em empresas.
Diante disso, a xAI deve focar em abordar as preocupações éticas e em aprimorar a governança do seu modelo. O próximo passo para a Grok 4 será garantir que suas funções não apenas apresentem desempenho superior, mas também se alinhem com padrões éticos robustos, assegurando a confiança dos usuários e a integridade no uso comercial.
Fonte: (VentureBeat – AI)