OpenAI dévoile "Sora" : une IA texte-vidéo impressionnante !

chatgpt icone app ipa iphone ipadCette nuit, OpenAI, la société derrière ChatGPT, a dévoilé Sora, un modèle texte-vidéo conçu pour simuler le monde physique en mouvement à partir d'une phrase, marquant ainsi une avancée significative dans la capacité de l'IA à se fondre dans la réalité. Produire des vidéos sans acteur ni décor n'est plus réservé à Pixar ou Disney, tout un chacun peut s'y mettre.

Sora est une claque

En fait, il suffit d'écrire un texte pour que la vidéo soit créée par l'IA, à l'instar de DALL-E pour la génération d'images, mais cette fois pour les vidéos. Ce n'est pas la première intelligence artificielle à le proposer, Runway peut par exemple animer une image avec un texte, mais c'est clairement d'un tout autre niveau.

sora openai

© OpenAI Sora

Sora peut réaliser des vidéos d'une durée maximale d'une minute, en maintenant une qualité visuelle élevée et en respectant scrupuleusement les instructions de l'utilisateur. Pour tout artiste, cinéaste ou étudiant qui doit créer une vidéo, cela ouvre de nombreuses possibilités. Le gain de temps est considérable, ce qui permet de tester ses idées en un claquement de doigt, avant d'approfondir une fois le choix fait en revenant aux méthodes traditionnelles. Les entrepreneurs voulant par exemple faire un POC y trouveront un allié de poids.

OpenAI précise que Sora a été mis à la disposition des membres de l'équipe rouge (Red Team par opposition à Blue Team) pour évaluer les dommages ou les risques potentiels, ainsi qu'à un groupe sélectionné de professionnels de la création pour obtenir un retour d'information sur son utilité dans le cadre professionnel. OpenAI prévoit d'affiner Sora sur la base de ces commentaires, afin de s'assurer qu'il répond efficacement aux besoins de ses utilisateurs. Les vidéos de démonstration sont en tout bluffantes, pour ne pas dire surréalistes.

Sora peut créer des scènes complexes avec des détails hallucinants comprenant plusieurs personnes, des mouvements naturels et des environnements criants de vérité. Par exemple, Sora peut créer des vidéos représentant une femme élégante marchant dans une rue de Tokyo éclairée au néon, des mammouths laineux géants dans une prairie enneigée, un musée plein de tableaux ou encore une bande-annonce de film présentant les aventures d'un homme de l'espace.

Les limites de l'IA Sora

En tant que première version, Sora présente évidemment plusieurs limites. L'IA peut s'emmêler les pinceaux sur la simulation de la physique de scènes complexes et la compréhension de scénarios spécifiques de cause à effet. Selon OpenAI, Sora peut également confondre des détails spatiaux et éprouver des difficultés à décrire des événements précis dans le temps.

Du côté de la sécurité, OpenAI travaille avec des experts du domaine pour tester le modèle afin de détecter les informations erronées, les contenus haineux et les préjugés, ainsi que pour développer des outils permettant de détecter les contenus trompeurs. L'entreprise prévoit également d'intégrer les métadonnées C2PA dans les prochaines versions afin de garantir l'authenticité du contenu. Les deepfakes sont déjà compliqués à repérer, alors avec Sora...

D'autres fonctionnalités utiles

Sora a été créé sur la base de recherches antérieures des modèles DALL-E et GPT. La fonction peut également transformer une image et en faire une vidéo, comme Runway. Les vidéos existantes peuvent également être prolongées ou les images manquantes complétées. Assez incroyable.

En outre, sachez qu'Apple y travaille aussi avec Keyframer, mais nous n'avons pas encore eu de démonstration à son sujet. La WWDC 24 devrait être très intéressante de ce point de vue...

Vous aimerez peut-être

Nos derniers articles

Suivez-nous avec notre app iSoft
Articles populaires
Donner votre avis

 





Les réactions

3 bod - iPhone premium

19/02/2024 à 07h51 :

la femme à Tokyo ne marche pas tout à fait, elle glisse sur la chaussée. Regardez ses pieds.

2 X2Stone - iPhone

17/02/2024 à 16h18 :

J’ai vu toutes ces vidéos, toutes bluffantes effectivement (en même temps c’est le principe d’une démo technique…), c’est à se demander si ces prompts, finalement très simples, produisent vraiment les résultats montrés sans aucune retouches (c’est ce que OpenAi affirme)… Si c’est vraiment le cas c’est flippant et ça va vite devenir dangereux… Je vois bien ce genre d’outil massivement utilisé par des personnes peu scrupuleuses (pour rester poli) pour arnaquer le monde entier.

1 Kaboola - iPhone premium

16/02/2024 à 12h08 :

Les équipes rouge et bleu ont interet a faire leur boulot car ce genre d'IA est extrêmement dangereuse.