- Publicidade -
- Publicidade -
- Publicidade -
Inteligência Artificial

Modelo de rede neural atinge 93% de acurácia sem retraining

- Publicidade -
- Publicidade -

São Paulo — InkDesign News — A introdução do modelo Arch-Router pela Katanemo Labs promete revolucionar a forma como sistemas de inteligência artificial, especialmente os modelos de linguagem de grande porte (LLMs), gerenciam consultas de usuários em ambientes empresariais multifuncionais. Este framework visa otimizar a alocação de tarefas a modelos específicos, utilizando uma abordagem mais flexível e alinhada às preferências humanas.

Tecnologia e abordagem

O Arch-Router é um modelo de roteamento baseado em LLMs, projetado para mapear consultas a modelos apropriados sem a necessidade de lógica rígida ou re-treinamento caro a cada mudança. A proposta é construir um “roteamento alinhado a preferências”, onde usuários definem políticas de roteamento em linguagem natural através de uma "Taxonomia Domínio-Ação". Essa hierarquia de dois níveis reflete como os usuários descreveriam naturalmente suas tarefas, facilitando a escolha do modelo ideal.

“Essa taxonomia serve como um modelo mental para ajudar os usuários a definir políticas de roteamento claras e estruturadas.”
(“This taxonomy serves as a mental model to help users define clear and structured routing policies.”)

— Pesquisadores da Katanemo Labs

Aplicação e desempenho

O modelo foi ajustado a partir da versão de 1,5 bilhão de parâmetros do modelo Qwen 2.5, utilizando um conjunto de dados curado com 43.000 exemplos. Durante testes de desempenho com modelos proprietários da OpenAI e Google, o Arch-Router atingiu uma pontuação de roteamento de 93,17%, superando concorrentes em média em 7,71%. Este desempenho se destaca ainda mais em conversas mais longas, mostrando uma habilidade superior de rastrear contexto ao longo de múltiplas interações.

“Embora o comprimento das políticas de roteamento possa ser longo, podemos aumentar facilmente a janela de contexto do Arch-Router com impacto mínimo na latência.”
(“While the length of routing policies can get long, we can easily increase the context window of Arch-Router with minimal impact on latency.”)

— Salman Paracha, CEO da Katanemo Labs

Impacto e mercado

O Arch-Router se posiciona como uma solução ideal para a criação de assistentes pessoais e ferramentas de codificação de código aberto, conforme mencionado por Paracha. Além disso, a integração com o proxy de IA da Katanemo permite a implementação de regras sofisticadas de controle de tráfego, possibilitando que novos modelos sejam testados em partes controladas do fluxo de trabalho.

A demanda crescente por sistemas de IA que atuam de forma coesa e inteligente em ambientes de negócios indica um futuro promissor para soluções como o Arch-Router. Este modelo não só almeja unificar implementações fragmentadas de LLM, mas também apresenta uma abordagem flexível e adaptável para desvendar o potencial das LLMs na prática.

Os próximos passos incluem fortalecer a integração do Arch com plataformas de avaliação, facilitando a adoção por desenvolvedores de empresas, promovendo um ecossistema de IA mais integrado e eficiente.

Fonte: (VentureBeat – AI)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!