DeepSeek revient à Nvidia après l’échec des puces de Huawei

DeepSeek se tourne à nouveau vers Nvidia après l’échec des puces IA de Huawei
DeepSeek abandonne les puces IA de Huawei et revient à Nvidia pour son modèle R2
Le projet de DeepSeek visant à entraîner son nouveau modèle d'intelligence artificielle, R2, sur les puces Ascend de Huawei a échoué, obligeant l'entreprise à revenir aux systèmes de Nvidia. Cette décision a entraîné un important retard dans le lancement du modèle.
Un revers pour l’autonomie technologique promue par Pékin
Depuis plusieurs mois, la Chine met en avant son ambition de devenir autonome technologiquement, particulièrement dans le secteur de l’intelligence artificielle. Cependant, la réalité a rattrapé ces ambitions. DeepSeek, acteur majeur de l’IA en Chine, en est le parfait exemple.
Suite au succès du modèle R1 lancé en janvier, DeepSeek a subi des pressions pour adopter des technologies nationales. Des sources proches du dossier, citées par le Financial Times, indiquent que le gouvernement chinois a fortement encouragé l’utilisation des puces de Huawei au détriment de celles de Nvidia.
Des problèmes techniques majeurs avec les puces de Huawei
Lors de la phase d'entraînement du modèle R2, l’équipe de DeepSeek a rencontré des problèmes persistants avec les puces IA de Huawei. Ces obstacles techniques ont interrompu totalement le développement du projet.
Un expert proche du dossier a confirmé que cet échec est la principale cause de l’annulation du lancement initial prévu en mai, un retard qui fragilise la position de DeepSeek sur un marché en constante évolution.
Entraînement vs inférence : pourquoi cela fait toute la différence
Pour mieux comprendre la situation, il faut différencier deux phases du cycle de vie d’un modèle d’IA :
- Entraînement : Très exigeant en ressources, similaire à des années d’études intensives pour un étudiant.
- Inférence : Moins exigeant, correspondant à l'application des connaissances acquises.
Huawei pourrait être apte à gérer la phase d’inférence, mais ses puces ne sont pas encore à la hauteur pour l'entraînement. Face au blocage, DeepSeek a été contraint de revenir aux puissantes solutions Nvidia pour poursuivre le développement de R2.
Une intervention directe de Huawei, sans succès
Huawei a même envoyé une équipe d'ingénieurs dans les locaux de DeepSeek pour accélérer les choses. Malgré cela, aucune session d'entraînement réussie n’a pu être réalisée sur les puces Ascend.
Un aveu indirect de Huawei sur ses limites
Cette impasse n’est pas surprenante pour les experts du secteur. Le PDG de Huawei, Ren Zhengfei, a lui-même reconnu plus tôt cette année que les capacités de sa société ont été « surévaluées » et que les meilleures puces de Huawei restent « une génération en retard ».
Une politique qui freine la performance
Bien que le gouvernement chinois pousse à adopter du matériel national, cela peut entraîner des compromis techniques. Selon le Financial Times, les entreprises doivent aujourd’hui justifier l’achat des puces Nvidia H20, compatibles avec les réglementations américaines.
Cette stratégie vise à créer des champions nationaux, mais elle oblige parfois les acteurs à faire des choix sous-optimaux d’un point de vue technique.
DeepSeek vise plus haut
Malgré les obstacles, le PDG de DeepSeek, Liang Wenfeng, ne baisse pas les bras. Il aurait exprimé son insatisfaction quant aux progrès réalisés sur le modèle R2 et exhorte ses équipes à viser l’excellence pour rester compétitifs au niveau mondial.
Conclusion : pas de raccourcis dans la course mondiale à l’IA
Malgré les ambitions patriotiques et les injonctions venues d'en haut, les lois de l'ingénierie restent les mêmes. Le parcours de DeepSeek rappelle qu’il n’existe pas de raccourci vers la suprématie en intelligence artificielle. La Chine joue sur le long terme, mais aujourd’hui, Nvidia reste le leader incontesté en matière de performance.
À lire aussi : Ren Zhengfei : l’avenir de l’IA en Chine et la vision long terme de Huawei
Vous souhaitez en savoir plus sur l’IA et le big data ? Ne manquez pas les événements AI & Big Data Expo, organisés à Amsterdam, en Californie et à Londres. Ces événements sont couplés à des conférences majeures telles que l'Intelligent Automation Conference, BlockX, Digital Transformation Week et le Cyber Security & Cloud Expo.
Consultez également d'autres événements et webinaires technologiques sur TechForge.
@ReservoirLive
Comments ()