Google I/O 2024 : une conférence interminable autour de l'IA
- 👨 Alexandre Godard
- Il y a 6 mois (Màj il y a 6 mois)
- 💬 3 coms
Google I/O 2024 : IA, IA, IA et encore IA
Comme chaque année, Google tient une conférence nommée Google I/O dans laquelle on découvre de nombreuses nouveautés à venir. Sans suspens, cette édition 2024 tourne exclusivement autour de l'intelligence artificielle. Au vu du nombre conséquent d'informations, nous avons décidé de vous faire un article dédié aux principales nouveautés, autrement dit les plus marquantes. À noter que Gemini sera bientôt embarqué au cœur d’Android.
AI Overview
AI Overview a pour objectif de révolutionner la recherche en ligne. Disponible en tête de liste sur une recherche Google, ce nouvel espace affichera une réponse rapide et concrète à la requête initiale en piochant directement les infos sur les sites affichés en dessous grâce à Gemini.
Une nouvelle méthode qui a pour objectif de rivaliser avec la démocratisation des IA qui fait chuter la bonne vieille recherche en ligne à l'écrit via Google. Bien que très pratique pour les utilisateurs, elle pourrait néanmoins causer du tort à de nombreux sites. Ceux qui n'auront pas la chance d'être cité dans l'encadré AI Overview verront sûrement arriver une baisse de trafic conséquente.
Comme bien d'autres, AI Overview reste pour le moment exclusive aux États-Unis. Ça coince encore avec les règles plus strictes de l'Union européenne, mais cela devrait tout de même finir par arriver chez nous dans les mois à venir.
Ask Photos
Ask Photos est une nouvelle fonctionnalité qui va encore plus loin dans la recherche de photos via l'application Google Photos. À l'aide de Gemini, bien entendu, il sera possible de retrouver n'importe quelle image dans sa galerie avec un simple mot. La recherche sera également plus précise et minutieuse.
Ask Photos sera intégré à Google Photos d'ici cet été. Un abonnement payant au service sera forcément nécessaire, mais Sundar Pichai, PDG de Google, promet que d'autres nouveautés liées à l'IA seront aussi de la partie. À voir si la France sera dans les premières à en bénéficier.
Gmail
Gemini 1.5 Pro va vous faciliter la vie dans Gmail. Résumer correctement un mail, rechercher des infos dans différents mails pour les assembler, rédiger un mail… Vous connaissez la musique, tout est mieux que maintenant.
Cela peut s'avérer pratique pour les plus bordéliques. La plupart des humains n'ont pas le temps de trier leurs emails. Il suffira donc de demander à l'IA de faire un résumé sur un sujet en particulier et elle se chargera de retrouver toutes les infos dans les différents mails liés entre eux. À noter que cette version de Gemini est payante.
Veo
Google Veo est un nouveau générateur de vidéos. Il est capable de créer des vidéos de plus d'une minute en 1080p. Il suffit d'envoyer du texte, une image ou même une vidéo pour que le générateur se mette à l'œuvre. Plus qu'à tester pour voir s'il est plus performant que les Sora, DALL·E 3 ou autre Midjourney.
Fort heureusement, Google a pensé à la partie sécurité. Toutes les vidéos possèderont la mention SynthID afin d'indiquer aux lecteurs que c'est une vidéo IA, autrement dit une fausse vidéo. Il serait d'ailleurs intelligent que les gouvernements commencent à réfléchir à une loi pour obliger les sociétés à apposer une mention universelle sur toutes les vidéos de ce type pour déceler rapidement les vidéos créées à l'aide de l'IA. Les réseaux sociaux y gagneront en cohérence.
Veo sera dans un premier temps réservée à un petit nombre de testeurs. Elle sera par la suite déployée à grande échelle et s'installera même dans les Shorts sur YouTube. Pas sûr que ce soit l'idée du siècle, mais bon que voulez-vous.
Imagen 3
Imagen 3 est l'équivalent de Veo pour les photos. Une nouvelle version de son générateur d'images plus rapide et plus performante. Des images réalistes et la capacité de dessiner du texte, telle est la promesse de cette troisième édition.
Une fois de plus, la France n'est pas encore au programme. Imagen 3 est uniquement disponible en anglais à certains endroits. Dommage sachant que Microsoft est déjà bien implanté par chez nous avec Copilot. Sans parler de tous les autres générateurs d'images disponibles sur le marché.
Project Astra
À l'instar de ce qu'a présenté OpenAI hier avec GPT-4o, Google a créé son propre assistant vocal multimodal. Fini de répondre à une seule question, il est désormais capable de discuter avec l'humain et de réagir à ce qu'on lui montre via la caméra du téléphone.
Pour l'instant, le projet n'en est qu'au stade alpha. Google a fait une jolie démonstration, mais préparée. Il faudra patienter encore un bon moment avant d'espérer échanger avec Project Astra. OpenAI à de l'avance, mais Google n'a pas dit son dernier mot.
Gemini 1.5 Flash
C'est tout simplement le LLM le plus équilibré de Google jusqu'à maintenant. Plus léger que Gemini 1.5 Pro, il est presque aussi affûté. Cependant, il n'est pas vraiment destiné au grand public. Les entreprises ayant besoin d'une IA conçue pour les lourdes tâches à grande échelle devraient y trouver leur compte tant sur le plan pratique que financier, selon Google. Les développeurs sont aussi concernés.
Gemini Nano
Gemini Nano est une nouvelle fonctionnalité qui écoute les conversations téléphoniques de l'utilisateur pour déceler un potentiel danger, ou plutôt une fraude. Ainsi, si un escroc se fait par exemple passer pour votre banque ou autre, l'IA sera capable de vous alerter via un message sur l'écran du smartphone. Tout le monde peut se faire avoir, même les plus aguerris.
À noter que cela fonctionne en local, sous-entendu aucune donnée ne remonte aux oreilles de Google via les serveurs et le cloud. À vour de voir si vous avez confiance ou non. De toute façon, elle est encore en phase de test et nul doute que les USA seront les premiers servis comme d'habitude.
Conclusion
Après Samsung en début d'année, c'est au tour de Google de montrer ce qu'elle a dans le ventre. Malgré une liste de nouveautés pléthorique, on regrette le peu d'impact immédiat pour le grand public, surtout hors des États-Unis.
Ne manque plus qu'Apple pour qui la prise de parole est prévue le 10 juin prochain lors de la WWDC. Faisons confiance à Apple pour nous faire rêver, et si possible dès le mois de septembre avec l'arrivée d'iOS 18 et de l'iPhone 16.