Nvidia booste l'IA locale sur PC avec ses puces graphiques RTX

Nvidia ne compte pas laisser la vedette à Microsoft et Qualcomm pour l'IA sur PC. Le constructeur américain entend bien démontrer la puissance de ses puces graphiques RTX avec un nouveau pilote qui améliore drastiquement leurs performances dans les applications locales d'IA.

Le monde du PC est en pleine effervescence depuis quelques jours, suite aux récentes annonces de Microsoft qui inaugurent l'ère des "PC IA", sous l'égide de son nouveau label Copilot+. Ces ordinateurs personnels d'un nouveau genre, qui intègrent une multitude de services et de fonctions d'intelligence artificielle au cœur même du système d'exploitation, promettent de révolutionner la façon dont nous utilisons et interagissons avec nos PC. Et que l''on soit un enthousiaste de la première heure, un sceptique endurci ou un simple curieux, la diversité des cas d'usages présentés par Microsoft ne peut pas laisser indifférent.

Pour engager cette révolution, la firme de Redmond a décidé de s'appuyer en premier lieu sur de tous nouveaux processeurs, conçus par l'Américain Qualcomm, les Snapdragon X Elite et X Plus. Ces puces ont deux caractéristiques majeures : elles sont conçues selon une architecture Arm, en lieu et place de la vénérable x86, et elles contiennent une unité spécialisée dans les opérations liées à l'iA, le fameux NPU (Neural Processing Unit ou Unité de traitement neuronal, en français), capable d'offrir une puissance de calcul de 45 TOPS, un niveau jamais atteint jusqu'ici pour un processeur de type tout-en-un (système sur puce, ou SoC pour system-on-chip).

Avec ses annonces et le lancement des PC Copilot+, Microsoft propage donc l'idée que l'intelligence artificielle est étroitement liée à Qualcomm, Arm et aux NPU, au moins dans l'écosystème Windows. Cependant, ce ne sont pas les seuls acteurs ni les seules technologies à même d'offrir des performances de haut vol en matière d'intelligence artificielle. Il faut aussi compter avec Nvidia, qui conçoit et commercialise, depuis des années et bien avant les autres, des composants particulièrement efficaces en la matière, à travers sa plateforme RTX, qui désigne à la fois les cartes graphiques éponymes bien connues des joueurs, des processeurs géants et surpuissants pour les serveurs et un ensemble d'outils logiciels pour le développement.

Nvidia R555 Game Ready : un nouveau pilote pour booster l'exécution locale des fonctions d'IA

C'est le nouveau nerf de la guerre à l'ère des PC IA en train de s'ouvrir. Maintenant que le grand public a découvert et adopté, au moins en partie, les outils d'IA générative, il est temps de faire passer ces services du cloud vers les machines des utilisateurs. C'est tout l'objet du label PC Copilot+ et des processeurs Snapdragon X Series dotés de NPU survitaminés. Mais Nvidia, qui s'est imposé comme le champion actuel en matière de composants matériels dédiés à l'IA, ne semble pas vouloir rester en retrait de cette transition et compte bien revenir sur le devant de la scène.

Dans le cadre de la conférence annuelle de Microsoft dédiée aux développeurs, la Microsoft Build, le constructeur vient donc d'annoncer la sortie du pilote Nvidia Game Ready R555 pour ses cartes graphiques RTX, avec des promesses de gains très significatifs dans les performances liées à l'IA, que ce soit pour les développeurs ou pour les utilisateurs : « Les grands modèles de langage (LLMs) [...] fonctionnent désormais jusqu'à trois fois plus vite [...] en utilisant le nouveau pilote NVIDIA R555 Game Ready ».

Pour offrir ce niveau de performance, le nouveau pilote apporte la prise en charge de deux composants logiciels, ONNX Runtime et DirectML, dont la fonction est double : accélérer la chaîne de traitement des opérations d'iA en confiant le maximum de calculs au GPU plutôt qu'au CPU (ONNX Runtime) et permettre au GPU d'être vu comme une sorte de NPU par le système d'exploitation (DirectML), afin que toutes les applications d'IA puissent s'adresser à lui directement, sans nécessiter une implémentation spécifique des technologies RTX par les développeurs.

L'objectif de ce pilote est donc à la fois d'augmenter drastiquement les performances en matière d'exécution locale d'IA et de rendre la puissance de calcul du GPU beaucoup plus accessibles aux développeurs et aux applications. Pour appuyer ses dires, Nvidia publie un petit graphique montrant les gains de performances obtenus sur l'inférence (l'exécution, par opposition à l'entraînement) de trois Grands Modèles de Langages (LLM), avec le nouveau pilote R555 par rapport au précédent. La progression semble en effet impressionnante, même si les mesures sont effectuées sur un GPU RTX 4090, une carte haut-de-gamme extrêmement cher et peu répandue.

En gardant à l'esprit que ces chiffres sont donnés par l'entreprise elle-même et qu'il faudra donc vérifier ces résultats en situation réelle, avec différents modèles de circuits RTX et des applications d'IA s'appuyant sur différents LLM, cette communication confirme au moins une chose : Nvidia ne veut pas se contenter d'être présent sur le domaine des serveurs et de l'entraînement des modèles d'IA, mais veut s'imposer comme un acteur incontournable sur le volet de l'exécution locale des services d'IA, directement sur les machines des utilisateurs.

Les circuits RTX proposent déjà, et depuis plusieurs années, de nombreuses applications concrètes reposant sur l'IA. Dans les jeux vidéo par exemple, le DLSS regroupe un ensemble de techniques de mise à l'échelle, de génération d'images et d'amélioration du rendu graphique s'appuyant sur l'apprentissage automatique (deep learning). Lancé plus récemment, la technologie Nvidia ACE utilise quant à elle les Grands Modèles de Langages (LLM) pour générer des dialogues interactifs en temps-réel avec les personnages non joueurs dans les jeux. Du côté de la création, les puces RTX accélèrent de nombreux outils d'IA dans des applications très populaires comme Adobe Premiere, DaVinci Resolve ou Blender. Et l'application Nvidia Broadcast offre de nombreux traitements en temps réel pour l'audio et la vidéo – et même des effets bluffants – sur les PC équipés d'une puce RTX.

Il existe donc déjà de nombreux usages concrets de l'IA dans l'écosystème RTX, apparus bien avant l'engouement général pour l'IA générative, et le nouveau pilote Game Ready R555 va donc en améliorer encore le fonctionnement. C'est une perspective intéressante, car les puces de Nvidia vont pouvoir booster un large panel d'applications d'intelligence artificielle, au-delà de celles intégrées dans Windows avec Copilot+. Il faut espérer que les éditeurs et les développeurs s'emparent de de ces outils pour exploiter la puissance des puces RTX dans de nouvelles fonctions reposant sur l'IA, dans le domaine du jeu, comme dans les applications créatives professionnelles, en graphisme, en 3D, en audio et en vidéo.

IA avec RTX : plus puissante que les PC Copilot+ ?

De fait, les circuits graphiques Nvidia RTX offrent des niveaux de performance en matière d'inférence d'IA bien supérieurs à ceux des processeurs dotés de NPU, qu'il s'agisse des Qualcomm Snapdragon X Series ou des futurs Intel Lunar Lake et AMD Strix. Pour se donner un ordre d'idée de cette différence, les Intel Core Ultra actuels atteignent une puissance maximale de 34 trillions d'opérations par seconde (TOPS) et les Snapdragon X Elite et X Plus, de 45 TOPS, là où un GPU RTX 4050 en version laptop, soit le plus petit modèle de la gamme, atteint déjà les 194 TOPS. Et quant à la monstrueuse RTX 4090 en version desktop, elle s'envole jusqu'à 1 300 TOPS !

Ces scores impressionnants sont donc largement supérieurs à l'exigence de 40 TOPS minimum fixée par Microsoft pour prétendre au titre de PC Copilot+. Cependant, cette puissance démesurée ne vient pas sans contrepartie et elle se paie au prix d'une consommation énergétique beaucoup plus importante que celle des processeurs dotés d'un simple NPU. Et cet écart en matière d'efficacité énergétique se creuse encore avec les Snapdragon X Series, des puces sous architectures Arm dont la principale caractéristique est justement leur très faible consommation d'énergie.

Si la puissance de calcul des GPU RTX de Nvidia leur permet donc de s'attaquer sans problème aux applications d'IA les plus lourdes et exigeantes, leur consommation électrique n'en fait pas les meilleurs candidats sur le secteur des PC portables, dans lequel l'efficacité énergétique est une facteur tout aussi important que la puissance.

Un aspect que Microsoft semble bien avoir en tête dans la définition de son label Copilot+ pour PC, et l'une des raisons pour lesquelles l'entreprise réserve pour le moment cette dénomination aux seules machines dotées d'un processeur Snapdragon X Series, comme l'indique cette déclaration dans l'annonce de lundi dernier : « Les premiers Copilot+ PC seront lancés avec les processeurs Snapdragon X Elite et Snapdragon X Plus et présenteront des performances de premier plan par watt grâce au CPU personnalisé Qualcomm Oryon, qui offre des performances et une efficacité de la batterie inégalées. ».

Cependant, la firme ajoute dès le paragraphe suivant : « De nouvelles expériences Copilot+ PC verront le jour prochainement. De nouveaux appareils équipés de ce processeur associé à des cartes graphiques puissantes comme NVIDIA GeForce RTX et AMD Radeon seront bientôt disponibles, rendant accessibles les Copilot+ PC à un public encore plus large ». On comprend donc de manière très claire que le périmètre des PC estampillés Copilot+ est amené à évoluer, et que des machines dotées de cartes graphiques Nvidia RTX pourraient obtenir le fameux sésame, sous réserve d'être associé à un processeur central économie en énergie.

Si les GPU RTX de Nvidia disposent donc largement de la puissance de calcul nécessaire pour exécuter localement les fonctions d'IA Copilot+, l'obtention du label en lui-même échappe à son contrôle et dépend entièrement de Microsoft, pour des considérations certainement plus politiques et commerciales que véritablement techniques.

Mais l'idée à retenir est la suivante : si vous êtes intéressé par les nouveaux usages de l'IA, que vous possédez un ordinateur doté d'une carte graphique Nvidia RTX et que les annonces de Microsoft autour des PC Copilot+ vous ont plongé dans le doute, soyez rassuré. Votre PC est loin d'être obsolète et il n'est pas nécessaire de courir acheter un ordinateur flambant neuf équipé d'un processeur content un NPU pour utiliser localement les nouvelles applications de l'IA générative. Si l'attention médiatique est actuellement focalisée sur certains termes comme Arm et NPU, il existe d'autres voies technologiques tout aussi sérieuses et pertinentes pour propulser ces nouveaux usages et accompagner la transformation en cours de l'informatique personnelle.