Pico-Banana-400K : Apple travaille sur la retouche photo par IA
Alexandre Godard- Il y a 3 heures
- 💬 Réagir
- 🔈 Écouter
Apple poursuit son engagement dans la recherche en intelligence artificielle avec la publication d’un jeu de données inédit destiné à améliorer les modèles d’édition photo guidés par texte. Baptisé Pico-Banana-400K, ce projet marque une nouvelle étape dans l’intégration de l’IA chez Apple.
Apple dévoile un vaste jeu de données pour améliorer l’édition photo par intelligence artificielle
Apple vient de présenter Pico-Banana-400K, un nouveau jeu de données contenant plus de 400 000 images soigneusement sélectionnées afin d’entraîner et d’évaluer des modèles d’édition photo assistée par IA. Ce projet vise à perfectionner les outils capables de modifier des images à partir d’instructions textuelles, comme « retirer les nuages dans le ciel » ou « transformer l'image en style cartoon ».
Le jeu de données comprend 35 types de modifications répartis en 8 grandes catégories, allant des ajustements simples tels que la luminosité, le contraste ou la couleur, jusqu’à des transformations créatives plus complexes comme changer le style d’une image ou ajouter des éléments visuels. Chaque photo est accompagnée d’une description textuelle détaillant la retouche à effectuer, ce qui en fait une ressource idéale pour entraîner des modèles capables de comprendre et d’appliquer des instructions humaines.
Apple a structuré Pico-Banana-400K en plusieurs sous-ensembles destinés à des usages spécifiques. On y trouve 258 000 exemples de modifications simples pour l’entraînement de base, 56 000 paires de préférences permettant de comparer des résultats jugés plus ou moins réussis, ainsi que 72 000 séquences multi-étapes simulant une série de retouches successives sur une même image.
Pour évaluer la qualité du dataset, Apple a fait appel à Gemini-2.5-Pro, le modèle d’IA de Google, utilisé ici comme outil d’analyse et de notation. Selon les résultats, les modifications globales de style réussissent dans près de 93 % des cas, mais certaines tâches précises, comme le déplacement d’objets ou la modification de texte dans l’image, restent encore complexes et échouent environ 40 % du temps.
Ce jeu de données, disponible gratuitement sur GitHub pour un usage de recherche non commercial, illustre la volonté d’Apple de contribuer activement au progrès de l’intelligence artificielle visuelle. Au-delà de ses produits, la firme de Cupertino renforce ainsi son rôle dans la recherche scientifique et le développement de modèles IA dédiés à la création et à l’édition d’images.

Apple travaille sur un capteur photo aussi performant que l’œil humain















