OpenAI permet à ChatGPT de parler et d’interpréter une image
- 👨 Julien Russo
- Il y a 1 an (Màj il y a 1 an)
- 💬 2 coms
ChatGPT évolue
La barre est de nouveau placée très haute par OpenAI, l'entreprise vient d'annoncer l'intégration de nouvelles capacités à son outil phare, ChatGPT : la reconnaissance vocale et la capacité d'interaction avec des images. Depuis son introduction il y a environ 10 mois, ChatGPT s'est rapidement distingué dans le domaine de la génération de textes, offrant la possibilité de composer des essais, des poèmes et bien d'autres types de contenus. Aujourd'hui, avec le souci de fournir une expérience encore plus immersive, OpenAI permet à ChatGPT de s'engager dans des interactions vocales.
Cet enrichissement de ChatGPT arrive à un moment où le marché de l'IA générative est en pleine effervescence. Amazon, par exemple, a investi massivement, à hauteur de 4 milliards de dollars, dans OpenAI Anthropic, le concurrent direct de ChatGPT. Des géants comme Google, Meta et Microsoft sont aussi dans la course, cherchant à repousser les limites de l'IA.
OpenAI, désormais concurrent de Siri
OpenAI a annoncé avoir intégré des capacités d'assistants vocaux à ses modèles linguistiques. Ainsi, ChatGPT pourra désormais narrer des histoires, répondre à des requêtes et bien plus encore, simplement à la demande vocale des utilisateurs. Cette prouesse est rendue possible grâce au système Whisper d'OpenAI, spécialisé dans la reconnaissance vocale.
Mais ce n'est pas tout. OpenAI a introduit un système innovant de synthèse vocale capable de reproduire des voix humaines de manière bluffante. En collaboration avec des professionnels du doublage, OpenAI offre à ses utilisateurs un choix de cinq voix distinctes, permettant une expérience d'écoute variée et agréable.
OpenAI x Spotify
Spotify, le géant du streaming musical, s'est associé à OpenAI pour proposer une fonctionnalité des plus intrigantes : la traduction de podcasts tout en préservant la voix authentique. Pour marquer ce lancement, seuls des podcasteurs renommés bénéficieront de cette exclusivité. L'objectif est bien évidemment à court terme de rendre cette incroyable fonctionnalité accessible à tous les podcasteurs qui publie leurs épisodes sur Spotify.
De l'image dans l'interaction avec ChatGPT
ChatGPT ne se limite pas à l'audible. Une nouvelle fonctionnalité permet aux utilisateurs de faire des requêtes basées sur des images. Cette recherche visuelle sera accessible à tous, faisant de ChatGPT un outil encore plus polyvalent.
Voici comment OpenAI dévoile le potentiel des photos avec son intelligence artificielle :
Prenez une photo d'un point de repère en voyage et ayez une conversation en direct sur ce qui est intéressant à ce sujet. Lorsque vous êtes à la maison, prenez des photos de votre réfrigérateur et de votre garde-manger pour savoir ce qu'il y a pour le dîner (et posez des questions de suivi pour une recette étape par étape). Après le dîner, aidez votre enfant à résoudre un problème de mathématiques en prenant une photo, en faisant le tour de l'ensemble des problèmes et en lui faisant partager des indices avec vous deux.
Sans grande surprise, l'interaction vocale et par photo sera uniquement réservée aux entreprises et aux particuliers qui souscrivent à ChatGPT Plus depuis le web ou depuis l'application disponible sur l'App Store. À noter que le déploiement est en cours, si vous êtes un utilisateur payant, les fonctionnalités devraient arriver dans peu de temps.
Télécharger l'app gratuite ChatGPT