Grok fait peau neuve : la vision et la voix débarquent sur iOS
- 👨 Nadim Lefebvre
- Hier à 15:06 (Màj hier à 15:11)
- 💬 4 coms
Des yeux pour voir, une voix pour s'exprimer
La dernière mise à jour de Grok introduit deux fonctionnalités majeures sur iOS : Grok Vision et un mode vocal amélioré. Désormais, l'assistant peut accéder à la caméra de votre iPhone pour analyser en temps réel ce que vous lui montrez. Le principe est simple : vous pointez votre appareil vers un objet, un texte ou un environnement, et Grok tente de les identifier et de les commenter à voix haute, à la manière de Visual Intelligence sur iPhone.
Introducing Grok Vision, multilingual audio, and realtime search in Voice Mode. Available now.
— Ebby Amir (@ebbyamir) April 22, 2025
Grok habla español
Grok parle français
Grok Türkçe konuşuyor
グロクは日本語を話す
ग्रोक हिंदी बोलता है pic.twitter.com/lcaSyty2n5
Cette fonctionnalité, similaire à ce que proposent déjà ChatGPT Vision et Google Gemini, permet à Grok de reconnaître des objets du quotidien comme une assiette, un livre, une carte de visite ou même une montre. Cependant, ses capacités d'analyse restent basiques pour le moment. Si l'IA peut identifier ce qu'elle voit, sa compréhension demeure superficielle et contextuelle, loin d'une véritable compréhension visuelle intelligente.
Du côté vocal, Grok propose désormais trois styles de voix différents : "Unhinged" (déraisonné), "Romantic" (romantique) et "Genius" (génie). Une offre qui paraît limitée face aux dix voix disponibles sur ChatGPT, d'autant plus qu'aucune personnalisation n'est possible concernant le contenu des réponses.
Une évolution progressive mais encore limitée
Si ces ajouts marquent une étape importante dans le développement de Grok, ils illustrent aussi son retard par rapport à la concurrence. L'assistant d'Elon Musk progresse, mais à petits pas. La semaine dernière, xAI avait déjà déployé une fonctionnalité de mémoire permettant à Grok de se souvenir des conversations précédentes, une caractéristique désormais standard chez les modèles d'IA avancés.
L'application propose également désormais un espace de travail appelé "Studio", similaire au Canvas de ChatGPT, offrant un environnement dédié à la création de documents et de code. Et pour les utilisateurs payants du forfait SuperGrok à 30 dollars par mois, le support audio multilingue est disponible, permettant d'interagir avec l'assistant dans plusieurs langues, y compris le français.
Ces nouveautés sont disponibles gratuitement sur iOS, mais les utilisateurs Android devront patienter encore un peu pour en profiter. Pour le moment, aucun calendrier n'a été communiqué concernant des améliorations futures de ces fonctionnalités sensorielles.
En résumé, Grok s'enrichit progressivement de capacités qui le rapprochent des leaders du marché, mais sa marge de progression reste considérable. L'IA du patron de Tesla (et du DOGE) apprend à voir et à parler, mais elle n'a pas encore appris à comprendre véritablement ce qu'elle observe.
Télécharger l'app gratuite Grok