Privé depuis quelques semaines des indispensables cartes graphiques (GPU) de Nvidia par les États-Unis, Baidu n’a pas tardé à trouver une alternative… en Chine. Dès le mois d’août, anticipant de nouvelles restrictions d’exportation, le moteur de recherche chinois s’est en effet tourné vers Huawei, lui commandant près de 2.000 unités de sa dernière puce dédiée à l’intelligence artificielle générative, selon des informations de la presse locale, confirmées depuis par l’agence Reuters. Cette puce doit lui permettre d’entraîner puis de faire tourner ses modèles d’IA, alimentant notamment son chatbot Ernie, lancé cet été. Elle représente surtout une nouvelle avancée technologique majeure pour le pays, alors que Washington tente depuis un peu plus d’un an de lui couper l’accès aux composants les plus puissants.
Progrès inattendus – Les mesures américaines laissent désormais le champ libre à Huawei, qui avait déjà lancé une puce d’IA, alors présentée comme la plus puissante du marché, en 2018. Une autre époque, avant l’émergence de l’IA générative. Et surtout avant que le groupe de Shenzhen ne soit placé, à l’automne 2020, sur une liste noire par Washington, l’empêchant d’utiliser les indispensables logiciels de conception, essentiellement américains, et de faire graver ses composants par le taïwanais TSMC, le seul à maîtriser les gravures les plus fines. Baptisée Ascend 910B, la nouvelle puce constitue donc un succès inattendu pour Huawei. Celui-ci a été rendu possible par les progrès de sa filiale HiSilicon et du fondeur chinois SMIC, déjà à l’origine du processeur équipant son premier smartphone 5G depuis trois ans.
“Comparable aux A100” – Les détails techniques sont quasiment inexistants. Et pour cause: l’Ascend 910B n’a jamais été dévoilée publiquement par Huawei, qui ne souhaite pas attirer l’attention de Washington sur ses avancées. D’après Reuters, la carte graphique est gravée en 7 nm, une finesse de gravure que commence à maîtriser SMIC. Ses capacités seraient “comparables avec celles des A100 de Nvidia”, selon le patron d’iFlyTek, une société chinoise spécialisée dans la reconnaissance vocale et dans la traduction instantanée. Les GPU A100 ont longtemps été les plus utilisés dans le secteur, permettant par exemple d’entraîner les premières versions de GPT, le grand modèle de langage qui alimente le robot conversationnel ChatGPT. Ils ont depuis été supplantés par les H100, la nouvelle référence du secteur.
Nvidia s’inquiète – Autrement dit, les puces 910B n’offrent qu’une alternative limitée aux composants de Nvidia, en particulier pour le développement des prochains modèles d’IA. Mais Huawei prévoit de lancer une troisième version en 2024, qui sera notamment utilisée par un laboratoire de recherche pour bâtir un puissant supercalculateur, affirme le média chinois Caixin. Un scénario redouté par Nvidia, vent debout contre les restrictions américaines. Au-delà de l’impact sur son chiffre d’affaires, limité par la forte demande dans les autres pays, ses dirigeants s’inquiètent surtout des conséquences à long terme, craignant une forte accélération des efforts chinois pour développer des puces rivales. C’est pour cela qu’il s’apprête à lancer de nouveaux GPU lui permettant d’échapper aux dernières sanctions.
Pour aller plus loin:
– Les États-Unis interdisent à Nvidia d’exporter ses puces d’IA vers la Chine
– Comment Huawei a pris sa revanche sur les États-Unis