Comment l’entraînement de DeepSeek sur Blackwell met à l’épreuve l’embargo américain sur les puces
Les États-Unis veulent empêcher, grâce à des contrôles d’exportation stricts, les entreprises chinoises d’accéder au matériel d’IA le plus avancé. Le cas de DeepSeek montre toutefois à quel point ce système est devenu poreux. Le prochain modèle de la startup aurait été entraîné sur l’actuelle génération Blackwell de Nvidia, alors même que ces processeurs ne peuvent officiellement pas être livrés en Chine.
Pourquoi Blackwell de Nvidia est si central pour le paysage de l’IA
La famille Blackwell représente le sommet de performance actuel de Nvidia pour les applications d’IA. Les puces concentrent une forte puissance de calcul dans des clusters compacts et sont idéales pour entraîner de grands modèles et pour des charges d’inférence exigeantes. Qui veut rester à la pointe du développement de modèles mise généralement sur ce matériel précis.
Pour Washington, les processeurs Blackwell constituent donc un bien stratégique. Les restrictions à l’exportation visent à empêcher des acteurs en Chine d’entraîner leurs systèmes avec un matériel équivalent à celui des laboratoires américains. Si une entreprise chinoise parvient malgré tout à accéder à ces puces, cela représente un défi non seulement technique mais surtout politique.
Comment DeepSeek obtient des clusters Blackwell malgré l’embargo
Selon plusieurs sources, DeepSeek exploite un centre de données sécurisé en Mongolie-Intérieure dans lequel se trouveraient les clusters Blackwell. Les services de renseignement américains supposent que l’entreprise tente d’effacer les traces techniques de cette infrastructure. Cela inclut les profils de performance typiques, les données de télémétrie ou d’autres indices qui pointeraient clairement vers des puces américaines.
La question reste ouverte de savoir par quels canaux les processeurs sont arrivés en Chine. Sont possibles des intermédiaires, des montages de leasing, des réexportations via des pays tiers ou des marchés entièrement parallèles. Le dénominateur commun de toutes ces voies est un fort intérêt économique et politique pour les puces haute performance. Plus une puce traverse d’étapes entre le fabricant et le centre de données, plus il est difficile de surveiller ces flux de manière exhaustive.
Le rôle de la distillation entre modèles américains et systèmes chinois
Sur le plan technique, DeepSeek mise pour la nouvelle génération sur la distillation. Un modèle interne apprend de manière systématique à partir des systèmes existants de fournisseurs américains comme OpenAI ou Google. Les réponses de ces modèles servent de signal d’entraînement sans que leurs poids internes soient directement copiés. Les connaissances et schémas de comportement sont transférés de façon condensée, pas l’architecture elle-même.
Combiné aux clusters Blackwell, on obtient un mélange de comportement de modèles américains et de matériel américain dans un système chinois. D’un côté une chaîne d’approvisionnement strictement régulée, de l’autre un processus d’entraînement orienté précisément vers ces modèles que l’on cherchait à protéger. Pour les partisans de règles d’exportation strictes, c’est un scénario qui met en évidence les limites de l’approche actuelle.
Entre dépendance technique et essor propre
L’utilisation de processeurs obtenus en contournant les sanctions montre que la Chine reste tributaire de la technologie américaine pour les puces haute performance. Sans ce retard, il n’y aurait pas de raison de chercher à obtenir des clusters Blackwell sous restrictions d’exportation. En même temps, chaque obstacle supplémentaire renforce l’incitation à développer des alternatives propres. Les entreprises locales de semi-conducteurs et les startups de puces IA y trouvent un argument supplémentaire pour investir.
Le cas DeepSeek illustre ainsi deux dynamiques parallèles. À court terme, l’accès au matériel américain reste essentiel pour les modèles chinois. À long terme, les mesures restrictives pourraient déclencher précisément la dynamique qu’elles devaient freiner. Le nouveau modèle devient ainsi le symbole de l’imbrication étroite entre performance technologique de pointe, chaînes d’approvisionnement mondiales et tentatives géopolitiques de pilotage.

