OpenAI lance o1, un modèle IA capable de "raisonner" comme un humain

Nadim Lefebvre
Il y a 12 mois
💬 5 coms
🔈 Écouter

OpenAI, le créateur de ChatGPT, vient de dévoiler sa prochaine grande avancée : un modèle d'IA générative baptisé o1. Plus précisément, o1 est une famille de modèles, dont deux versions sont disponibles dès aujourd'hui dans ChatGPT et via l'API d'OpenAI : o1-preview et o1-mini, une version plus petite et efficace destinée à la génération de code.

Un bond en avant vers une IA de niveau humain

Pour OpenAI, o1 représente une étape importante vers son objectif d'une intelligence artificielle au niveau humain. Concrètement, ce nouveau modèle est bien meilleur que ses prédécesseurs comme GPT-4 pour écrire du code et résoudre des problèmes complexes en plusieurs étapes, plus rapidement qu'un humain.

Mais cette puissance a un coût : o1 est plus lent et bien plus cher à utiliser que GPT-4. Dans l'API, o1-preview coûte 15$ par million de tokens d'entrée et 60$ par million de tokens de sortie, soit 3 à 4 fois plus cher que GPT-4. C'est pourquoi OpenAI considère cette première version d'o1 comme une "preview" expérimentale.

Une méthode d'entraînement révolutionnaire

Ce qui rend o1 si différent des autres modèles d'IA générative, c'est sa capacité à "réfléchir" avant de répondre aux requêtes, explique OpenAI. La clé ? Une toute nouvelle méthode d'entraînement basée sur l'apprentissage par renforcement.

Alors que les modèles GPT précédents étaient entraînés à imiter des schémas à partir de données, o1 a appris à résoudre des problèmes de manière autonome. Le système est récompensé quand il trouve la bonne réponse et pénalisé quand il se trompe. Résultat, quand on lui laisse plus de temps pour "réfléchir", o1 peut raisonner de bout en bout sur une tâche, en planifiant et en effectuant une série d'actions sur une longue période pour arriver à une réponse.

Pour y parvenir, les chercheurs d'OpenAI ont utilisé un nouvel algorithme d'optimisation et un jeu de données d'entraînement contenant des "données de raisonnement" et de la littérature scientifique. "Plus o1 réfléchit longtemps, mieux il s'en sort", résume Noam Brown, chercheur chez OpenAI.

Des capacités de raisonnement impressionnantes

Grâce à cette approche, o1 surpasse largement GPT-4 sur les tâches nécessitant d'analyser et de synthétiser plusieurs sous-tâches, comme détecter des emails confidentiels ou élaborer une stratégie marketing.

Lors d'un examen de qualification pour les Olympiades Internationales de Mathématiques, o1 a résolu correctement 83% des problèmes contre seulement 13% pour GPT-4. Sur les concours de programmation Codeforces, o1 se classe dans le 89ème percentile des participants. Mieux que le système phare AlphaCode 2 de DeepMind (Google) !

D'après les tests d'OpenAI, o1 devrait aussi être plus performant que GPT-4 en analyse de données, en sciences et en programmation. GitHub (qui appartient à Microsoft), qui a testé o1 avec son assistant de codage Copilot, confirme que le modèle excelle pour optimiser des algorithmes et du code d'application.

OpenAI promet aussi des progrès dans les capacités multilingues d'o1, notamment en arabe et en coréen. La prochaine mise à jour devrait même atteindre le niveau de doctorants sur des tâches difficiles en physique, chimie et biologie !

Des limites à dépasser

Bien sûr, o1 n'est pas parfait. Il peut être lent sur certaines requêtes, mettant parfois plus de 10 secondes à répondre. Il lui arrive aussi d'halluciner des réponses et d'admettre moins souvent que GPT-4 quand il ne connaît pas la réponse. OpenAI reconnaît qu'il reste du travail pour fiabiliser le modèle.

Par ailleurs, o1 n'a pas encore toutes les capacités de ChatGPT comme la navigation web ou l'analyse de fichiers et d'images. Son interface est assez rudimentaire pour l'instant. Et il est limité à 30 messages par semaine pour o1-preview et 50 pour o1-mini dans ChatGPT, uniquement pour les abonnés.

Mais OpenAI promet d'ouvrir rapidement o1-mini gratuitement à tous les utilisateurs de ChatGPT et d'ajouter de nouvelles fonctionnalités au fil des mises à jour pour rendre o1 plus utile au quotidien.

Vers des agents autonomes

Pour les chercheurs en IA, maîtriser le raisonnement est une étape clé vers une intelligence de niveau humain. L'idée est que si un modèle est capable de plus que de la reconnaissance de patterns, cela pourrait débloquer des avancées majeures en médecine, en ingénierie...

OpenAI voit dans o1 un premier pas vers des systèmes autonomes, ou "agents", capables de prendre des décisions et d'agir à notre place. "Nous pensons que c'est la percée critique pour progresser vers une intelligence au niveau humain", affirme Bob McGrew, directeur de la recherche d'OpenAI.

Bien sûr, les capacités de raisonnement d'o1 restent relativement lentes et coûteuses pour l'instant. Mais gageons que la course à l'IA générative entre OpenAI, Google, Meta, Microsoft et autres ne fait que commencer. o1 pourrait bien ouvrir la voie à une nouvelle génération d'IA plus "intelligentes" !

Source

Télécharger l'app gratuite ChatGPT