OpenAI annonce Voice Engine, un nouvel outil capable d'imiter la voix de n'importe qui

👨 Julien Russo
Il y a 2 ans (Màj il y a 2 ans)
💬 13 coms

Il y a quelques années, quand on nous disait "intelligence artificielle", cela paraissait comme quelque chose de futuriste et inaccessible. Aujourd'hui, l'IA est dans le quotidien de milliards de personnes à travers le monde, elle est présente sous forme de chatbot, de créatrice d'image et bientôt... en imitation de voix très réaliste. OpenAI, l'un des leaders dans l'IA en 2024 vient de dévoiler "Voice Engine", un nouvel outil capable d'imiter la voix de n'importe quel humain d'une précision déconcertante.

OpenAI impressionne
(encore une fois)

Alors qu'OpenAI a choqué le monde entier récemment avec la sortie de Sora, une nouveauté capable de créer une vidéo incroyablement fidèle à la réalité par un simple prompt, l'entreprise nous surprend encore aujourd'hui avec l'annonce officielle de "Voice Engine". Comme l'a révélé OpenAI, ce projet a commencé il y a 2 ans, la direction d'OpenAI souhaitait offrir à l'époque un outil capable de reproduire la voix de n'importe quel humain à partir d'un court échantillon.

Cette idée n'a jamais eu pour objectif d'encourager l'usurpation d'identité par l'audio, mais plutôt d'aider les personnes handicapées qui ne peuvent plus communiquer comme avant. Avec Voice Engine, elles pourront continuer à parler avec leurs proches avec la voix qu'ils ont toujours connue. C'est un exemple parmi tant d'autres...

Comment ça fonctionne ?

Le fonctionnement de Voice Engine est simple, l'outil a besoin d'entendre la voix d'une personne pendant 15 secondes, cet échantillon est ensuite analysé par l'intelligence artificielle qui va être capable de produire une copie synthétique de cette voix. Une fois cette copie crée, vous pouvez faire dire ce que vous voulez à la voix numérisée. Ce qui est surprenant, c'est qu'OpenAI assure que ce court échantillon de 15 secondes est capable d'aider à créer une voix numérique naturelle et émotive, vous pourrez apporter de la joie, de la tristesse ou encore de l'énervement à la voix.

Pour montrer que le projet est très sérieux, OpenAI a partagé quelques audios comparatifs sur son site, on peut vérifier la voix originale et la copie synthétique de cette même voix. Le résultat est extrêmement bluffant, il est quasiment impossible de faire la différence. On comprend rapidement qu'on est face à une "avancée majeure" encore une fois dans le domaine de l'intelligence artificielle chez OpenAI.

Pour l'instant, OpenAI ne prévoit pas de donner l'accès à Voice Engine immédiatement aux utilisateurs de ChatGPT, l'entreprise explique qu'elle est toujours dans une phase de test. Des expérimentations ont actuellement lieu avec un petit groupe de partenaires pour des activités ciblées comme le soutien aux personnes handicapées, la traduction de contenu ou encore l'aide à la lecture.

Et les risques d'abus ?

OpenAI s'y attend, il y aura forcément des risques d'abus, aucune personnalité n'y échappera, que ce soit des politiques, des artistes ou encore des sportifs, il y aura des vidéos qui circuleront partout sur internet pour semer la confusion dans l'esprit des internautes. On peut se demander si, à l'approche des élections présidentielles américaines, il est raisonnable de rendre disponible Voice Engine, maintenant ?

OpenAI assure dans une déclaration que la collaboration avec les acteurs potentiellement impactés sera maximale et que tous les commentaires seront pris en compte :

Nous reconnaissons que générer un discours qui ressemble à la voix des gens comporte de graves risques, qui sont particulièrement importants au cours d'une année électorale. Nous nous engageons avec des partenaires américains et internationaux du gouvernement, des médias, du divertissement, de l'éducation, de la société civile et au-delà pour nous assurer que nous intégrons leurs commentaires au fur et à mesure que nous construisons.

Les partenaires qui testent Voice Engine aujourd'hui ont accepté nos politiques d'utilisation, qui interdisent l'usurpation d'identité d'une autre personne ou organisation sans consentement ou droit légal.

À la question quand est-ce que Voice Engine sera disponible ?
Pour l'instant, le créateur de ChatGPT n'a pas communiqué de date officielle, l'entreprise n'a pas non plus mentionné si l'accès sera exclusif aux abonnés à ChatGPT Plus ou sera payant pour tout le monde.

Apple propose déjà cette fonctionnalité

Le saviez-vous ? Depuis iOS 17, l'iPhone est capable de proposer la même chose que Voice Engine. Dans les réglages de votre iPhone, puis dans "Accessibiité" et "Voix personnelle", vous pouvez reproduire votre voix numériquement. Cependant, il y a un énorme point faible... la création de la voix est très compliquée.

En effet, quand il faut seulement 15 secondes d'échantillon à OpenAI pour reproduire une voix à l'identique avec des émotions, Apple demande la lecture de 150 phrases à voix haute. Il faut compter environ 10 à 15 minutes. Autrement dit, avec le système d'Apple, il est impossible de reproduire la voix d'une personne tierce sans son consentement !

Télécharger l'app gratuite ChatGPT

OpenAI annonce Voice Engine, un nouvel outil capable d'imiter la voix de n'importe qui

OpenAI impressionne (encore une fois)

Comment ça fonctionne ?

Et les risques d'abus ?

Apple propose déjà cette fonctionnalité

OpenAI impressionne
(encore une fois)