
São Paulo — InkDesign News — A startup americana Hume lançou seu novo modelo de inteligência artificial, o Empathic Voice Interface (EVI) 3, que visa transformar a interação entre humanos e máquinas por meio de um sistema de voz mais natural e expressivo. Este modelo aproveita técnicas de deep learning para oferecer uma experiência de conversação que simula a empatia humana.
Tecnologia e abordagem
O EVI 3 usa um sistema de conversação voice-to-voice, permitindo que os usuários criem vozes personalizadas ao interagir com o modelo. Essa abordagem se destaca pela capacidade de entender e reproduzir nuances emocionais da fala, focando em prosódia e expressividade. Por exemplo, usuários podem especificar características como "caloroso e confiante" para criar suas vozes únicas. Hume enfatiza que a adaptação em tempo real às emoções do usuário é um diferencial em comparação com assistentes de voz tradicionais.
Aplicação e desempenho
O modelo é projetado para várias aplicações, incluindo suporte ao cliente, narração de audiolivros e criação de personagens interativos em jogos. Em testes com 1.720 usuários, o EVI 3 superou outros modelos em categorias como naturalidade, expressividade e capacidade de compreender emoções. “EVI 3 foi preferido em todos os aspectos avaliados, como a qualidade do áudio e a velocidade de resposta”, afirma a empresa.
Além disso, o EVI 3 oferece latência baixa de cerca de 300 milissegundos, suporte multilíngue (incluindo inglês e espanhol) e uma flexibilidade sem precedentes na personalização de vozes. Contudo, ainda não possui a funcionalidade de clonagem de voz, que está prevista para lançamentos futuros.
Impacto e mercado
A proposta de Hume gira em torno de criar uma interação mais humanizada com a tecnologia. O modelo foi desenvolvido com base em uma grande quantidade de dados, incluindo expressões faciais e entonações, visando promover uma inteligência emocional nas interações. A empresa está priorizando a ética na implementação de recursos, como a clonagem de vozes.
O acesso para desenvolvedores por meio de uma API será disponibilizado em breve, a um custo ainda não definido, o que possibilitará a integração desse modelo em diversas plataformas comerciais. Com planos de preços baseados em uso, Hume busca alcançar não apenas grandes empresas, mas também criadores independentes e projetos de menor escala.
Avançar com a implementação dessas tecnologias pode alterar significativamente a forma como se estruturam as interações digitais, trazendo um novo patamar de comunicação entre usuários e sistemas de inteligência artificial.
Fonte: (VentureBeat – AI)