Par , publié le 2 octobre 2023

Tout va très vite pour Mistral AI, le nouveau porte-étendard de la French Tech dans l’intelligence artificielle générative. Moins de quatre mois après une levée de fonds record – menée, elle, à peine un mois après sa création –, la start-up a lancé la semaine dernière son premier grand modèle de langage. Un modèle de petite taille, en open source, comme promis par ses fondateurs, disponible gratuitement et sans restriction pour tous les développeurs. Ce choix, qui détonne, est considéré comme le seul moyen de pouvoir “créer une alternative crédible à l’oligopole émergent de l’IA”, composé de Google, d’OpenAI, soutenu financièrement par Microsoft, de Meta, la maison mère de Facebook, ou encore d’Anthropic, alliée avec Amazon, qui disposent de ressources bien plus considérables.

Anciens de Google et Meta – En juin, Mistral AI a récolté 105 millions d’euros, du jamais vu en France pour une levée en phase d’amorçage. Sa valorisation, elle aussi inédite à ce stade de développement, se chiffre à 240 millions d’euros. De quoi susciter de grandes attentes. Non seulement parce que la start-up semble être le meilleur espoir de voir émerger un acteur français sur un marché, considéré comme la prochaine révolution, pour le moment largement dominé par des acteurs américains. Mais aussi en raison du CV de ses trois créateurs: un ancien de DeepMind et deux anciens de FAIR, les réputés laboratoires de Google et Meta en IA. Depuis, la société a lancé ses recrutements, mais compte encore moins de 20 employés. Elle a notamment débauché des spécialistes chez Meta et la start-up Hugging Face.

Mieux que Meta ? – Baptisé Mistral 7B, le modèle de la start-up est composé de 7,3 milliards de paramètres, l’unité de mesure censée déterminer la puissance d’une IA générative. Ce chiffre est peu élevé. Sorti en 2020, le grand modèle de langage GPT-3 d’OpenAI en comptait 175 milliards. La version GPT-4 en totaliserait dix fois plus – un nombre jamais officialisé. Mistral AI assure que son modèle est plus performant “sur tous les standards” que la version 13B de LLaMA 2, le dernier modèle de Meta, lui aussi (en partie) open source. Il ferait aussi mieux sur “beaucoup de standards” que la version 34B. Dans nos tests, pas nécessairement représentatifs des capacités actuelles et surtout futures, Mistral 7B n’était cependant pas capable de répondre correctement à de nombreuses questions. Ni même à des calculs assez simples.

“Première étape” – En débutant par un petit modèle, qui requiert un entraînement plus court, Mistral AI a voulu rapidement occuper le terrain. Quatre entreprises françaises le testent déjà, par exemple, pour développer des applications de service clients. La start-up promet qu’il ne s’agit que d’une “première étape”. D’autres modèles seront publiés “progressivement”, permettant de “réduire l’écart de performance” avec les IA génératives fermées d’OpenAI ou Google. À terme, elle souhaite offrir une gamme de produits spécialisés et adaptés à différentes utilisations, devant optimiser les coûts de fonctionnement – les petites IA demandent moins de puissance informatique pour générer du texte. Mistral AI devra aussi bâtir son offre commerciale: des services payants accompagnant ses modèles gratuits.

Pour aller plus loin:
– Pour contrer ChatGPT, Amazon parie sur une intelligence artificielle française
– Entre catastrophisme et espoir, la French Tech navigue à vue


No Comments Yet

Comments are closed

Contactez-nous  –  Politique de confidentialité