DeepSeek V4 : nouvelle génération avec 1M de contexte et puces Huawei

DeepSeek a présenté le 24 avril 2026 – exactement un an après le coup de tonnerre initial avec R1 – la nouvelle génération de modèles V4. Avec deux variantes, une énorme fenêtre de contexte, de nouveaux mécanismes d’attention et des prix d’API drastiquement plus bas que ceux de la concurrence américaine, la startup chinoise fait à nouveau parler d’elle dans le monde de l’IA.

Sortie et modèles
Innovations techniques
Performances et comparaison de prix
Puces Huawei : indépendance vis-à-vis de NVIDIA ?
Open source et licence
Voix de la recherche et de l’industrie
Critiques et questions ouvertes
Portée géopolitique

Sortie et modèles

DeepSeek lance avec V4 deux variantes : DeepSeek V4-Pro et DeepSeek V4-Flash. Le constructeur les présente toutes deux comme « la plateforme d’IA open source la plus performante au monde ».

Pro mise sur la qualité maximale en reasoning, tâches d’agents et programmation complexe ; Flash, sur la grande vitesse et un faible besoin en ressources avec une qualité de reasoning seulement légèrement réduite.

Innovations techniques

1 million de tokens de contexte : les deux modèles peuvent traiter en une fois jusqu’à un million de tokens, soit l’équivalent des œuvres complètes de Tolkien ou d’une dizaine de romans. Des bases de code complètes, des contrats ou de longs rapports peuvent être analysés en un seul passage.
Mixture-of-Experts (MoE) avec 1 600 milliards de paramètres : Pro n’active par requête que les parties pertinentes du réseau, ce qui réduit fortement le coût de calcul. Flash utilise une variante plus compacte de 284 milliards de paramètres.
Mécanismes d’attention optimisés (DeepSeek Sparse Attention) : le système identifie les passages prioritaires plutôt que de traiter tout le contenu à parts égales. C’est ce qui rend les très longs contextes réellement utilisables.
Meilleure continuité conversationnelle : les conclusions sont prises en compte de manière plus fiable au fil de plusieurs messages utilisateur, un point faible jusque-là courant chez les modèles de langage.
Modes Thinking et Non-Thinking : il est possible de décider par requête si le modèle réfléchit en interne ou répond directement.

Performances et comparaison de prix

V4-Pro affronte directement OpenAI GPT-5.4 et Anthropic Claude Opus 4.6. Sur des tests standardisés de programmation, DeepSeek décroche les meilleurs scores et se positionne comme « l’un des meilleurs candidats pour les tâches d’agents », selon Ben Burtenshaw, de Hugging Face.

Sur des raisonnements logiques particulièrement complexes et des examens académiques exigeants, V4 reste cependant, selon les premières évaluations, derrière les leaders absolus.

Deuxième point : le prix. Là où Anthropic facture environ 25 dollars pour un million de tokens de sortie, la variante la plus performante de V4 coûte 3,25 dollars. V4-Flash se situe encore nettement en dessous. Un utilisateur Reddit commentait : « Je ne crois pas qu’il existe un modèle capable de rivaliser sur le rapport qualité-prix. »

Modèle	Fournisseur	Sortie (USD / 1M tokens)
DeepSeek V4-Pro	DeepSeek	~3,25 USD
Claude Opus 4.6	Anthropic	~25 USD
GPT-5.5 (référence)	OpenAI	~30 USD

Puces Huawei : indépendance vis-à-vis de NVIDIA ?

Particularité notable : DeepSeek a optimisé V4 explicitement pour les processeurs chinois de Huawei, une première dans l’industrie de l’IA. Jusqu’ici, les grands modèles de langage tournaient quasi exclusivement sur du matériel NVIDIA.

Les experts soulignent toutefois que cela vaut surtout pour l’inférence (le fonctionnement pour les requêtes des utilisateurs). Liu Zhiyuan, de l’Université Tsinghua, explique que « seules certaines parties du processus d’entraînement ont été adaptées aux puces chinoises » ; pour l’entraînement proprement dit, le matériel NVIDIA devrait rester largement utilisé.

Open source et licence

V4 est publié sous licence MIT et donc disponible en open source : le modèle peut être téléchargé, exécuté et modifié de manière largement libre. Le chercheur de DeepSeek Deli Chen commentait : « Comme toujours, nous restons fidèles à la pensée long terme et au credo ‘open source pour tous’. »

DeepSeek prend ainsi sciemment ses distances avec les modèles fermés d’OpenAI, Anthropic et Google.

Voix de la recherche et de l’industrie

Ben Burtenshaw (Hugging Face) : la véritable innovation tient au traitement efficace des grands contextes ; V4 est « l’un des meilleurs candidats pour les tâches d’agents ».
Liu Zhiyuan (Université Tsinghua) : côté entraînement, seules quelques parties sont pour l’instant adaptées aux puces chinoises.
Christian Mayr (TU Dresde) : l’Europe devrait moins s’accrocher aux systèmes établis et travailler davantage sur les codes et plateformes afin d’exploiter plus efficacement les modèles de langage.

Critiques et questions ouvertes

Malgré la publication open source, les sceptiques mettent en garde : V4 est si complexe et gourmand en calcul qu’une reproduction à l’identique en dehors des grands fournisseurs cloud paraît peu réaliste. Sur le plan de la sécurité, le modèle est aussi observé avec attention : une IA puissante et librement disponible pourrait théoriquement servir aussi bien à la défense qu’à des cyberattaques ciblées.

Par ailleurs, sur les tâches de reasoning les plus exigeantes et certains examens académiques, V4 montre encore des faiblesses face aux modèles de tout premier plan venus des États-Unis.

Portée géopolitique

Avec V4, DeepSeek démontre une seconde fois en douze mois que des architectures innovantes et une efficacité rigoureuse peuvent assouplir la dépendance vis-à-vis de NVIDIA. L’administration américaine avait tenté de sécuriser sa primauté technique par des restrictions à l’exportation des puces NVIDIA ; V4 montre qu’il peut exister un chemin de contournement.

Sur le marché chinois de l’IA, DeepSeek durcit la compétition avec des prix agressifs. Tandis que les fournisseurs américains comme OpenAI misent sur la puissance brute et des tarifs premium, DeepSeek poursuit de manière cohérente la stratégie inverse : bon marché, ouvert et flexible côté matériel.

Le secteur se demande désormais si 2026 sera à nouveau un « moment DeepSeek », avec des effets durables sur le paysage mondial de l’IA.

DeepSeek V4 : nouvelle génération de modèles avec 1M de contexte, puces Huawei et prix cassés