L'IA Gemini 1.5 Pro de Google a la capacité d'entendre

Alban Martin
Il y a 1 an (Màj il y a 1 an)
💬 1 com
🔈 Écouter

Google

La mise à jour de Gemini 1.5 Pro donne des oreilles au grand modèle de langage (LLM) de Google. Désormais, Gemini peut écouter les fichiers audio que l'on lui propose et répondre sans avoir besoin de se référer à une transcription écrite. En clair, vous pouvez lui demander de traduire une conversation ou résumer un discours, par exemple.

Gemini Pro est très rapide

Lors de son événement Google Next, la firme de Mountain View a annoncé qu'il mettrait Gemini 1.5 Pro à la disposition du public pour la première fois par l'intermédiaire de sa plateforme Vertex AI. Il faut rappeler que Gemini 1.5 Pro a été annoncé pour la première fois en février.

Cette nouvelle version, la milieu de gamme de la bande, surpasse déjà le modèle le plus grand et le plus puissant, Gemini Ultra, en termes de performances. Gemini 1.5 Pro peut comprendre des instructions compliquées et élimine la nécessité d'affiner les modèles, affirme Google.

Gemini 1.5 Pro n'est disponible que pour les personnes qui ont accès à Vertex AI. Pour l'instant, la plupart des gens découvrent les modèles de langage Gemini par l'intermédiaire du chatbot éponyme. Gemini Ultra alimente le chatbot Gemini Advanced et, bien qu'il soit puissant et capable de comprendre de longues commandes, il n'est pas aussi rapide que Gemini 1.5 Pro. Ce n'est qu'une question de temps avant de voir naître Gemini 1.5 Ultra, une version qui se frottera à GPT-5 d'OpenAI.

http://gemini.google.com/

Les autres annonces IA de Google

Google a également présenté Imagen 2, le modèle de génération de texte à partir d'images qui alimente les capacités de génération d'images de Gemini, ajoutera également l'inpainting et l'outpainting, qui permettent aux utilisateurs d'ajouter ou de supprimer des éléments dans les images. Google a également mis à disposition sa fonction de filigrane numérique SynthID pour toutes les images créées à l'aide des modèles Imagen. SynthID ajoute un filigrane invisible à l'observateur sur les images qui marque leur provenance lorsqu'elles sont visualisées à l'aide d'un outil de détection.

Imagen rattrape ainsi des outils comme Stability AI's Stable Cascade et Getty's Generative AI by iStock.

Google indique qu'il est également en train de tester en avant-première un moyen d'ancrer les réponses de l'IA pour l'actualité dans son moteur de recherche.