Pesquisador transforma GPT-OSS-20B em modelo de IA sem raciocínio

- Publicidade -

Tiago F Santiago 15/08/2025Última Atualização 15/08/2025

0 0 2 minutos de leitura

Pesquisador transforma GPT-OSS-20B em modelo de IA sem raciocínio — Researcher turns gpt-oss-20b into a non-reasoning base model

- Publicidade -

São Paulo — InkDesign News — A recente liberação do modelo de inteligência artificial GPT-OSS pela OpenAI trouxe à tona novos avanços na área de modelos de linguagem de grande escala (LLM). Este lançamento marca a primeira vez que a empresa disponibiliza um modelo com pesos abertos desde o GPT-2, em 2019, permitindo que desenvolvedores fora da organização explorem e reconfigurem o modelo para diversas aplicações.

Tecnologia e abordagem

O modelo GPT-OSS é construído em uma arquitetura de transformadores com mistura de especialistas, permitindo que ele incorpore múltiplas funcionalidades em uma única estrutura, aumentando sua eficiência e capacidade de processamento. Jack Morris, um pesquisador da Cornell Tech, apresentou uma variante chamada gpt-oss-20b-base, que reverteu o modelo para uma versão pré-treinada. Segundo Morris, “nós basicamente reverteram a parte de alinhamento do treinamento de LLM, então temos algo que produz texto com aparência natural novamente” (

“We basically reversed the alignment part of LLM training, so we have something that produces natural-looking text again.”

— Jack Morris, Pesquisador, Cornell Tech

Este modelo é caracterizado por menos restrições e uma produção textual mais ampla, sem as limitações impostas por modelos otimizados para raciocínio. A abordagem de Morris, que utilizou uma atualização de baixo escopo (LoRA), permitiu ajustar apenas uma pequena parte do modelo, mantendo sua estrutura essencial.

Aplicação e desempenho

O gpt-oss-20b-base oferece resultados competentes em várias tarefas textuais, mas notavelmente se destaca em liberdade de expressão e diversidade textual. Durante os testes, o modelo demonstrou capacidade de reproduzir trechos de obras protegidas por direitos autorais, o que evidencia a acessibilidade de informações memorizadas. Em conversas estruturadas, o modelo poderia ainda se comportar como um chatbot educado, mas a eliminação do raciocínio em cadeia leva a respostas mais variadas em contextos livres.

Morris utilizou cerca de 20.000 documentos do dataset FineWeb para treinar o modelo por quatro dias em oito GPUs NVIDIA H200, buscando garantir que o formato fosse o mais próximo possível do pré-treinamento original.

Impacto e mercado

A liberação do gpt-oss e sua reconfiguração por Morris vem em um momento crítico, onde desenvolvedores e pesquisadores se movem em direção a soluções open source. O feedback inicial sobre o modelo original da OpenAI foi misto, com elogios à licença permissiva e críticas a limitações de dados sintéticos. No entanto, a resposta positiva ao gpt-oss-20b-base destaca um forte interesse pelo potencial de modelos base em pesquisa e aplicação, mesmo com o aumento de riscos à segurança.

Morris afirmou que continuará sua pesquisa em modelos que não empregam raciocínio, explorando a extração em modelos instruct como os da Qwen. Essa exploração poderá abrir caminho para uma nova geração de sistemas de IA com menos alinhamento e mais liberdade, cada vez mais integrados a aplicações práticas.

Fonte: (VentureBeat – AI)

- Publicidade -

Etiquetas

Tiago F Santiago 15/08/2025Última Atualização 15/08/2025

0 0 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Pesquisador transforma GPT-OSS-20B em modelo de IA sem raciocínio

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Tiago F Santiago

Ler o Próximo

Terapia com ChatGPT: como a inteligência artificial influencia clientes

Desafios da inteligência artificial na eficiência energética

Peak Ji impulsiona aplicações globais de inteligência artificial

Inteligência artificial transforma o futuro dos bancos

Synthesia aprimora IA que pode interagir de forma expressiva

Inteligência artificial transforma o futuro das empresas

MIT desenvolve algoritmos para engajar o cliente conectado

Inteligência artificial melhora eficiência em provedores de saúde

Therapeutas usam GPT em consultas, clientes se sentem impactados

AI doppelgänger auxilia na otimização de tarefas profissionais

Terapia com ChatGPT: como a inteligência artificial influencia clientes

Desafios da inteligência artificial na eficiência energética

Peak Ji impulsiona aplicações globais de inteligência artificial

Inteligência artificial transforma o futuro dos bancos

Synthesia aprimora IA que pode interagir de forma expressiva

Inteligência artificial transforma o futuro das empresas

MIT desenvolve algoritmos para engajar o cliente conectado

Inteligência artificial melhora eficiência em provedores de saúde

Therapeutas usam GPT em consultas, clientes se sentem impactados

AI doppelgänger auxilia na otimização de tarefas profissionais

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Ler o Próximo

Terapia com ChatGPT: como a inteligência artificial influencia clientes

Desafios da inteligência artificial na eficiência energética

Peak Ji impulsiona aplicações globais de inteligência artificial

Inteligência artificial transforma o futuro dos bancos

Synthesia aprimora IA que pode interagir de forma expressiva

Inteligência artificial transforma o futuro das empresas

MIT desenvolve algoritmos para engajar o cliente conectado

Inteligência artificial melhora eficiência em provedores de saúde

Therapeutas usam GPT em consultas, clientes se sentem impactados

AI doppelgänger auxilia na otimização de tarefas profissionais

RealDefense lança fundo de US$ 10 milhões contra ransomware

Boar's Head reabre após surto de listeria e impacto na cultura

Artigos relacionados

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Adblock detectado