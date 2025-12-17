Apple vient de publier SHARP, un modèle d’intelligence artificielle open source capable de reconstruire une scène 3D photoréaliste à partir d’une seule image 2D en moins d’une seconde.

Apple SHARP : le modèle IA open source qui transforme vos photos 2D en 3D en moins d’une seconde

Dans une étude intitulée “Sharp Monocular View Synthesis in Less Than a Second”, les chercheurs d’Apple détaillent comment ils ont entraîné un modèle capable de reconstruire une scène 3D à partir d’une simple photo 2D, tout en maintenant les distances et l’échelle cohérentes en termes réels. Cette prouesse technique permet de créer des vues 3D photoréalistes depuis des angles de vue proches de la photo originale.

Contrairement aux méthodes traditionnelles de “Gaussian splatting” qui nécessitent des dizaines, voire des centaines d’images de la même scène prises sous différents angles, SHARP est capable de prédire une représentation 3D complète à partir d’une seule photo en une seule passe dans un réseau neuronal. Le modèle utilise des millions de “gaussiennes 3D”, de petites taches floues de couleur et de lumière positionnées dans l’espace, qui, combinées ensemble, recréent une scène 3D.



Pour atteindre ce résultat impressionnant, Apple a entraîné SHARP sur d’importantes quantités de données synthétiques et réelles, permettant au modèle d’apprendre les motifs communs de profondeur et de géométrie à travers de multiples scènes. Lorsqu’une nouvelle photo lui est présentée, le modèle estime la profondeur, la raffine en utilisant ce qu’il a appris, puis prédit la position et l’apparence de millions de gaussiennes 3D en une seule passe.

Il existe toutefois un compromis : SHARP génère précisément les points de vue proches de l’angle original, mais ne synthétise pas les parties totalement invisibles de la scène. Cela signifie que les utilisateurs ne peuvent pas s’éloigner trop du point de vue d’où la photo a été prise. C’est ce qui permet à SHARP de rester suffisamment rapide pour générer le résultat en moins d’une seconde et suffisamment stable pour créer un résultat crédible.



Apple a rendu SHARP disponible sur GitHub, et les utilisateurs ont déjà commencé à partager leurs résultats impressionnants sur les réseaux sociaux. Les premiers tests montrent que le modèle fonctionne remarquablement bien, nécessitant seulement une dizaine de secondes sur un MacBook Pro pour générer une représentation 3D complète.



L’expérience devient encore plus spectaculaire sur le Vision Pro d’Apple, où il est possible d’entrer complètement dans la scène 3D générée et littéralement “marcher” dans la photo transformée. Contrairement à la fonctionnalité actuelle de photos spatiales qui offre une vue statique en profondeur, SHARP permet une immersion totale dans le souvenir capturé, offrant une nouvelle dimension aux photos personnelles et ouvrant la voie à des applications révolutionnaires en réalité mixte.