Axio News Logo

Startup Lança Modelo de IA para Criação de Vozes Sintéticas Personalizáveis

Publicado em: 22/04/2025 13:16 | Categoria: Tecnologia e Inovação

Uma dupla de estudantes universitários na Coreia do Sul anunciou o lançamento de um modelo de inteligência artificial chamado Dia, capaz de gerar clipes de áudio no estilo de podcasts. Desenvolvido pela Nari Labs, o modelo se destaca por permitir maior controle sobre as vozes geradas e incluir elementos como risadas, tosses e pausas no discurso.

O modelo, com 1,6 bilhão de parâmetros, foi treinado usando o programa Google TPU Research Cloud, que oferece acesso gratuito a chips de IA da empresa. Disponível nas plataformas Hugging Face e GitHub, o Dia pode ser executado em PCs modernos com pelo menos 10GB de VRAM. Ele gera vozes aleatórias, mas também pode imitar vozes de pessoas específicas.

Durante os testes, o modelo demonstrou alta qualidade na criação de diálogos e facilidade de uso, sendo uma alternativa competitiva a outras ferramentas de síntese de voz no mercado. Entretanto, especialistas apontam que o modelo carece de salvaguardas contra possíveis usos indevidos, como a criação de desinformação ou gravações fraudulentas. A Nari Labs desaconselha abusos, mas afirma que não se responsabiliza por usos impróprios da tecnologia.

A origem dos dados utilizados no treinamento do modelo não foi divulgada, levantando preocupações sobre o uso de conteúdos protegidos por direitos autorais. Apesar disso, os criadores planejam expandir a funcionalidade do Dia para novos idiomas e lançar relatórios técnicos sobre o modelo. A empresa também pretende criar uma plataforma com elementos sociais para ampliar o uso da tecnologia.

Reportagem – Equipe de Jornalismo da Axio News – Subsidiária da Axio Investments.

Texto que relata acontecimentos, baseado em fatos e dados observados ou verificados diretamente pelo jornalista ou obtidos pelo acesso a fontes jornalísticas reconhecidas e confiáveis.

Espaço para Anúncio 1
Espaço para Anúncio 2