Inteligência artificial imita voz humana com amostra de apenas 1 minuto

Se você viu a apresentação do Google, na qual o Assistente fez chamadas de voz para pessoas reais, sabe que isso pode causar polêmica

São Paulo – Baseada no Canadá, a Lyrebird é uma startup de inteligência artificial que desenvolveu um algoritmo capaz de imitar a voz humana com amostras breves da voz de uma pessoa. Um minuto já pode ser o suficiente para que uma simulação seja criada–ainda que áudios de algumas horas gerem resultados mais eficazes.

Se você viu a apresentação do Google, na qual o Google Assistente fez chamadas de voz para pessoas sem se identificar como um recurso artificial, sabe que isso pode causar polêmica. A primeira coisa que vem à mente, provavelmente, é o uso indiscriminado dessa tecnologia, que poderia fazer você falar com robôs ao telefone sem saber que não há uma pessoa real do outro lado da linha.

Porém, a startup diz que o recurso pode ser usado para a criação de vozes para chatbots de atendimento ao cliente ou até para dar vozes a personagens de videogame. A companhia tem até uma parceria com a ALS Association, organização sem fins lucrativos que arrecada fundos para pacientes com ELA (esclerose múltipla amiotrófica), para ajudar pessoas com a doença a se comunicar.

Para demonstrar sua tecnologia, a Lyrebird divulgou um áudio com vozes simuladas de Donald Trump, Barack Obama e Hillary Clinton conversando sobre a tecnologia da empresa. Ouça-o a seguir.

Em vídeo da Bloomberg, o jornalista Ashlee Vance tem sua voz copiada e realiza uma ligação para sua mãe, que não percebe estar falando com um robô. Veja-o a seguir. A reportagem continua em seguida.

Os fundadores da Lyrebird, três estudantes da Universidade de Montreal, afirmam que sua tecnologia levanta pontos importantes para a sociedade, incluindo questionamentos sobre a autenticidade de áudios usados como provas judiciais. A solução que a empresa propõe é tornar sua tecnologia “acessível a todos”. Como um Photoshop para voz, os fundadores esperam que, assim como sabemos que pode acontecer hoje com as fotos, as pessoas saberão que áudios também podem ser falsificados.

O número de idiomas disponíveis ainda é limitado. Nem mesmo o francês, falado no Canadá, está disponível na plataforma da Lyrebird. O algoritmo só lida bem com o inglês americano no momento.

A tendência de usar inteligência artificial para voz já é um caminho sem volta. Além de Google e de startups, a Adobe também conta com uma solução para isso. O projeto é chamado Project VoCo e permite editar vozes humanas como editamos imagens no Photoshop. Ainda assim, a amostra necessária de áudio é de 20 minutos, que mostra potencial do algoritmo da startup canadense–apesar de que alguns exemplos soem ainda um tanto robóticos. Outro exemplo dessa tendência da voz entre as empresas de tecnologia é o recurso de guia curva a curva no Waze que usa a voz do próprio usuário, algo que já foi descrito como uma selfie para os seus ouvidos.

A Lyrebird garante, em seu site oficial, que a sua voz digital é somente sua e ninguém mais pode usá-la sem seu consentimento. De qualquer forma, você pode gravar seu um minuto de áudio no site, após um login com e-mail comercial, e ouvir sua voz robótica. Todos os dados podem ser apagados depois que você fizer o teste. Se quiser ouvir sua voz imitada pelo algoritmo da Lyrebird, é possível fazer isso neste link.

Comentários
Deixe um comentário

Olá, ( log out )

* A Abril não detém qualquer responsabilidade sobre os comentários postados abaixo, sendo certo que tais comentários não representam a opinião da Abril. Referidos comentários são de integral e exclusiva responsabilidade dos usuários que escreveram os respectivos comentários.

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

w

Conectando a %s

  1. Lissandro Bassani

    Ou seja, o futuro é terra sem lei onde nada é o que parece, como nunca antes… E assim caminha a humanidade.