Comme si rien ne s’était passé. Il y a un an pourtant, la presse américaine n’avait pas hésité à évoquer un “moment Spoutnik”¹ pour qualifier l’irruption sur le devant de la scène de la start-up chinoise DeepSeek, dont les avancées avaient ébranlé les certitudes sur le modèle de surinvestissement dans l’intelligence artificielle générative. Passée l’onde de choc, les dépenses dans les infrastructures informatiques ne se sont pas calmées. Bien au contraire. OpenAI, par exemple, prévoit d’investir plus de 1.400 milliards de dollars au cours des prochaines années.
De même, les levées de fonds ne ralentissent pas. Le concepteur de ChatGPT enchaîne les tours de table à neuf voire dix chiffres, tout comme son rival Anthropic. Les start-up Thinking Machines et Safe Superintelligence ont levé des milliards de dollars quelques mois seulement après leur création. La demande pour les GPU de Nvidia reste en forte croissance, ayant permis au groupe de Santa Clara de devenir la première entreprise à franchir la barre des 5.000 milliards de capitalisation boursière. Et les dépenses en capital des géants technologiques n’en finissent plus de grimper.
5,6 millions de dollars ?
Fondé il y a trois ans, DeepSeek sort véritablement de l’ombre en janvier dernier, avec ses modèles V3 et surtout R1. Très vite, ce dernier caracole en tête des modèles open source les plus téléchargés sur la plateforme Hugging Face. Sur l’App Store, son application mobile se hisse aussi à la première place. Comparaisons à l’appui, le laboratoire chinois revendique des performances similaires, voire supérieures, aux modèles équivalents d’OpenAI, Meta ou Anthropic. Et ce, alors même qu’il ne dispose pas des GPU les plus puissants de Nvidia, jusqu’alors considérés comme indispensables.
DeepSeek assure avoir utilisé des puces bridées du groupe américain, conformes aux restrictions d’exportation imposées par Washington. Pour compenser le déficit de puissance de calcul, ses chercheurs ont innové, recourant à différentes techniques d’entraînement. OpenAI l’accuse également de s’être appuyé, de manière illégale, sur ses modèles. Résultat: le développement de V3 n’aurait coûté que 5,6 millions de dollars, une infime fraction des centaines de millions dépensés par les géants américains. Un chiffre, impossibles à vérifier, qui a déclenché un vent de panique.
Bientôt de nouveaux modèles
Depuis ce coup d’éclat, les nouveaux modèles de DeepSeek se font attendre. Initialement prévu en mai, leur lancement a été repoussé à plusieurs reprises. Le laboratoire a notamment été ralenti par sa volonté initiale d’utiliser des puces d’IA conçues par Huawei. Si une mise à jour de V3 a été publiée en décembre, son successeur, V4, pourrait être dévoilé dès février, rapporte The Information. Il afficherait de meilleures performances que ses rivaux d’OpenAI et d’Anthropic, en particulier dans la génération de code informatique – un terrain devenu central dans les usages et la communication.
Pour dépasser les modèles américains, DeepSeek se serait procuré, poursuit le média, les derniers GPU Blackwell de Nvidia, dont l’exportation vers la Chine est interdite. Le laboratoire aurait eu recours à des data centers fantômes installés à l’étranger, utilisés comme simples étapes intermédiaires. Une version contestée par le fabricant américain Parallèlement, l’entreprise a affiné ses techniques d’entraînement. Début janvier, elle a publié un article de recherche présentant une nouvelle méthode pour réduire encore davantage les besoins en puissance de calcul – et donc les coûts.
“La Chine n’est pas en retard”
En attendant, deux grilles de lecture continuent de s’affronter. La première estime que la panique provoquée par DeepSeek – qui avait fait chuter l’action Nvidia de 17% en une seule séance – était largement exagérée. Un an plus tard, les cartes n’ont pas été rebattues comme certains l’anticipaient. Les grands acteurs, majoritairement américains, restent en position de force. Les besoins en calcul, tant pour l’entraînement que pour l’inférence, demeurent immenses. Et les capitaux continuent d’affluer, même si les craintes d’une potentielle bulle ne se sont pas entièrement dissipées.
La seconde grille de lecture voit dans DeepSeek le symbole de la montée en puissance des modèles open source chinois, aussi illustrée par les start-up Minimax, Moonshot AI ou Zhipu. Non seulement ceux-ci ont supplanté leurs équivalents occidentaux, mais ils constituent aussi des alternatives crédibles aux modèles fermés des géants américains. “La Chine n’est pas en retard”, souligne Arthur Mensch, le patron de Mistral AI, interrogé par Bloomberg. Dans ce contexte, le récent assouplissement des restrictions d’exportation représente une “grave erreur”, avertit Dario Amodei, directeur général d’Anthropic.
Pour aller plus loin:
– “L’IA ? La plus grande bulle de tous les temps”
– Dans l’IA, des start-up prometteuses sont devenues des start-up zombies
¹ Référence au lancement du premier satellite par l’URSS en 1957

