À l’occasion de son “Ignite conference”, Microsoft a dévoilé ses toutes premières puces électroniques dont une puce dédiée à l’intelligence artificielle.
Pourquoi on en parle ? Avec cette annonce, Microsoft se lance officiellement dans la course des puces IA face à Intel, AMD et le mastodonte du secteur Nvidia.
Dans les faits : Microsoft a présenté deux puces basées sur l’architecture d’ARM.
- Azure Cobalt CPU est conçue notamment pour alimenter les services cloud sur Azure, son infrastructure cloud, et faire tourner les modèles IA.
- Azure Maia 100 est dédiée à l’accélération de l’IA et sera utilisée par OpenAI pour entraîner ChatGPT.
Dans le détail : Avec Maia, Microsoft veut bousculer Nvidia, fabricant référence de puces IA qui a dominé le secteur depuis l’arrivée de ChatGPT.
- Nvidia s’est retrouvé sur le toit du monde grâce à son pari sur la puce GPU (à l’inverse du CPU fait par Intel) qui permet le traitement parallèle, essentiel dans l’IA et l’apprentissage profond. Ce temps d’avance leur a permis de bâtir une base solide et de prendre de l’avance sur les concurrents.
- Boostée par le secteur de l’IA, l’action Nvidia est en hausse de plus de 240% depuis le début de l’année et atteint les 1000 milliards de dollars de capitalisation boursière en mai dernier.
Problème : Les tech bros veulent tous des GPU pour entraîner leur modèle IA qui va changer le monde donc… pénurie : les puces IA les plus performantes de Nvidia sont en rupture de stock depuis août et jusqu’à début 2024 selon l’entreprise. Microsoft a donc suivi sa propre voie en créant Maia 100 pour entraîner les modèles d’IA, et Cobalt 100, pour les faire tourner.
Plus encore : Les produire en interne permet d’améliorer les performances puisque ces puces personnalisées peuvent accélérer certaines tâches d’IA de plus de 50 fois par rapport aux puces classiques.
Un peu de recul : Le hardware, c’est pas facile. Meta a tenté l’aventure en matière de puces d’IA personnalisées mais a dû abandonner une partie de son matériel expérimental à cause de problèmes. Google n’a pas été en mesure de suivre le rythme de la demande pour ses TPU et a rencontré des problèmes de conception avec sa dernière génération de puce.
Bref : Les infos sur les spécificités des puces sont encore très floues. Les puces alimenteront d’abord les propres applications d’IA de Microsoft avant d’être disponibles pour les partenaires et les clients. Suite à l’annonce de Microsoft, l’action Nvidia a chuté de près de 2%.