MGIE : la nouvelle IA d'Apple concurrente de DALL-E d'Open AI
- Alexandre Godard
- Il y a 9 mois
- 💬 Réagir
- 🔈 Écouter
MGIE est un nouveau modèle d'IA appartenant à Apple qui permet de modifier des images à l'aide de commandes textuelles. Il suffit d'écrire sa demande et une nouvelle version de la photo prenant en compte la demande est publiée.
MGIE : encore de l'IA pour Apple
Apple vient de mettre en ligne un nouveau modèle d'IA open source consacré à l'édition de photos via des commandes textuelles. Nommé MGIE (MLLM-Guided Image Editing), il a pour objectif de modifier une image à la suite d'instructions écrites par un utilisateur.
Ajuster la luminosité, le contraste et la netteté, recadrer l'image, la faire pivoter, la redimensionner ou encore appliquer un filtre sont les possibilités les plus basiques. On peut également modifier la taille, l'emplacement, la forme ou la couleur d'un objet ou d'un paysage dans une image.
Des fonctionnalités que l'on retrouve déjà chez de nombreux concurrents. Néanmoins, cela confirme une fois de plus qu'Apple s'apprête à se lancer dans l'IA générative en 2024 et a bien l'intention de rattraper son retard, voir, comme à son habitude, prendre la place de leader. Pourquoi pas l'implanter dans l'application Photos de l'iPhone sur iOS 18.
Pour sa création, Apple a travaillé en étroite collaboration avec de nombreux chercheurs de l'Université de Californie. MGIE est entièrement disponible via GitHub avec le code source, les données et les modèles d'utilisation. Une version de démonstration permet de l'essayer avec ses propres images.
Apple a récemment mis en libre accès Ferret, son propre modèle d'IA multimodale d'analyse d'images, ainsi que Pkl, un mélange entre langage statique et langage de programmation.
Via