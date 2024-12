Le 26 décembre 2024, l'entreprise chinoise DeepSeek a créé la surprise en dévoilant son nouveau modèle d'intelligence artificielle DeepSeek V3. Cette annonce marque un tournant significatif dans la course à l'IA entre la Chine et les États-Unis, notamment par ses performances impressionnantes et son approche open source. Fondée en 2023, DeepSeek s'est rapidement imposée comme un acteur majeur du secteur, développant plusieurs modèles performants en moins d'un an.

Une prouesse technique et économique

DeepSeek V3 se distingue par des caractéristiques techniques exceptionnelles. Avec ses 671 milliards de paramètres (soit 1,6 fois plus que le Llama 3.1 de Meta), le modèle a été entraîné sur un impressionnant jeu de données de 14,8 billions de tokens. Les performances sont au rendez-vous : le modèle surpasse la concurrence dans plusieurs domaines, particulièrement en programmation où il obtient de meilleurs résultats que GPT-4o sur la plateforme Codeforces.



L'aspect le plus remarquable reste son coût de développement : seulement 5,5 millions de dollars, une somme dérisoire comparée aux centaines de millions habituellement nécessaires pour ce type de projet. Cette prouesse a été réalisée grâce à l'utilisation d'un centre de données équipé de GPU Nvidia H800 pendant environ deux mois, et ce malgré les restrictions américaines sur l'exportation de ces composants vers la Chine. La vitesse d'exécution est également impressionnante, avec une capacité de traitement de 60 tokens par seconde, soit trois fois plus rapide que la version précédente.

Une alternative accessible avec des spécificités chinoises

L'approche open source de DeepSeek permet une grande flexibilité d'utilisation. Le modèle est accessible de plusieurs manières :

L'interface web officielle sur chat.deepseek.com, qui inclut même un moteur de recherche intégré

La plateforme HuggingFace pour les développeurs

Une API aux tarifs très compétitifs (0,27$/million de tokens en entrée, 1,10$/million en sortie)

Le code source complet sur GitHub avec une documentation technique détaillée

DeepSeek V3 présente néanmoins certaines limitations. Son utilisation nécessite une infrastructure conséquente en raison de sa taille importante. De plus, étant une entreprise chinoise soutenue par le fonds High-Flyer Capital Management, DeepSeek doit se conformer aux régulations locales strictes. Le modèle évite ainsi certains sujets sensibles et ses réponses "incarnent les valeurs socialistes fondamentales" selon les exigences du régulateur internet chinois. N'espérez pas lui demander si la Chine est un régime autoritaire, il vous répondra très vaguement.

Cette avancée technologique s'inscrit dans un contexte plus large de montée en puissance de la Chine dans le domaine de l'IA. D'autres acteurs chinois comme Alibaba (Qwen) ou Tencent (HunyuanVideo) développent également des modèles prometteurs, tous en open source. Cette approche, différente de celle des États-Unis, permet aux chercheurs d'avancer plus rapidement et d'accéder à davantage de données. La question se pose désormais de la réaction américaine face à cette concurrence technologique croissante, particulièrement dans le contexte des élections à venir et d'une possible présidence Trump, qui pourrait envisager des mesures restrictives similaires à celles prises contre Huawei.