Nvidia prépare des humains artificiels avec sa technologie ACE

Nvidia prépare des humains artificiels avec sa technologie ACE

Le champion actuel des puces dédiées à l'intelligence artificielle a fait plusieurs annonces lors du Computex 2024. L'une des plus intéressantes concerne une technologie permettant de créer des "humains numériques".

Le géant technologique Nvidia s'est imposé comme le champion incontesté dans le domaine des puces dédiées à l'intelligence artificielle. Ses circuits électroniques équipent en effet la grande majorité des serveurs et des centres de données utilisés pour entraîner et exécuter des modèles d'IA. Mais si l'entreprise est si puissante sur ce secteur, ce n'est pas uniquement grâce à ses composants matériels, mais également à son vaste écosystème d'outils de développement logiciels.

Auprès du grand public et des joueurs, sa technologie d'IA la plus connue est sans doute le DLSS, une technique d'amélioration et d'accélération du rendu graphique dans les jeux vidéo. Cependant, l'entreprise ne compte pas pas se cantonner au secteur vidéoludique et veut conquérir des pans bien plus larges de l'industrie et des services avec ses produits d'IA. Et l'un des derniers en date, annoncé lors du Computex 2024, se montre aussi fascinant que dérangeant.

Nvidia ACE : des humains numériques animés par l'intelligence artificielle

Des « microservices d'humains numériques », c'est sous cette appellation que l'entreprise dirigée par Jensen Huang présente sa technologie Nvidia ACE, acronyme de Avatar Cloud Engine. Derrière ce nom se cache une suite d'outils logiciels capables d'animer des personnages virtuels, en les dotant de capacités étonnantes : reconnaissance du texte, de la voix et des images, compréhension du langage naturel, génération de réponses textuelles et vocales, animation du visage et synchronisation labiale de modèles en 3D, le tout en temps-réel.

Ces prouesses technologiques sont permises par la conjonction de la puissance de calcul des puces Nvidia RTX d'une part, et par l'émergence des Grands Modèles de Langage d''autre part. La technologie Nvidia ACE n'est pas tout à fait inédite et avait déjà été montrée il y a quelques mois, et l'entreprise la présentait alors comme une solution pour rendre les personnages non-joueurs plus interactifs et plus vivants dans les jeux vidéos. Mais ce que Nvidia propose désormais semble aller beaucoup plus loin.

Dans son communiqué du Computex 2024, l'entreprise annonce en effet « la disponibilité générale des microservices d'IA générative NVIDIA ACE pour accélérer la prochaine vague d'humains numériques » et cite explicitement trois industries en particulier qui devraient profiter de ces outils, le jeu vidéo bien évidemment, mais également le service client et le secteur de la santé.

La proposition de Nvidia ACE pour ces secteurs d'activité est simple : créer de véritables « humains numériques », dotés d'une représentation visuelle en 3D et d'une voix, capables d'interagir naturellement et en temps réel avec les clients et les patients. De quoi ringardiser instantanément les robots conversationnels capricieux auxquels nous sommes régulièrement confrontés sur les sites Web et les boites vocales, comme ChatGPT l'a fait en 2022 mais à un niveau encore supérieur.

Pour donner vie à ces personnages virtuels d'un nouveau genre, Nvidia ACE se compose d'une suite de technologies, dont certaines sont d'ores et déjà disponibles et d'autres devraient bientôt l'être :

  • NVIDIA Riva ASR, TTS et NMT — pour la reconnaissance vocale automatique, la conversion et la traduction de la synthèse vocale
  • NVIDIA Nemotron LLM — pour la compréhension du langage et la génération de réponses contextuelles
  • NVIDIA Audio2Face — pour une animation faciale réaliste basée sur des pistes audio
  • NVIDIA Omniverse RTX — pour une peau et des cheveux réalistes et tracés en temps réel
  • NVIDIA Audio2Gesture — pour générer des gestes corporels basés sur des pistes audio (pas encore disponible)
  • NVIDIA Nemotron-3 4.5B — un nouveau petit modèle de langage (SLM) spécialement conçu pour l'exécution locale à faible latence

Jusqu'à présent, cet ensemble de technologies et d'outils logiciels était uniquement accessible via des centres de données puissants, ce qui réservait son usage à de grosses entreprises et imposait l'utilisation de serveurs pour exécuter les services « d'humains numériques ». Et ce que Nvidia vient d'annoncer au Computex 2024, c'est l'arrivée de la suite Nvidia ACE directement sur les appareils dotés d'un circuit RTX, que ce soit pour la création de personnages virtuels du côté des développeurs ou leur exécution de celui des utilisateurs. Le parc de PC dotés de cartes graphiques RTX étant très important, on imagine donc aisément le potentiel de cette technologie pour les secteurs précités du service client et de la santé : assistance technique, service après-vente, télémédecine, coaching sportif, les possibilités semblent en effet nombreuses et prometteuses.

Mais on entrevoit aussi dès à présent les effets néfastes et les mésusages que va inévitablement entraîner la disponibilité à grande échelle de cette technologie. Nul doute que les arnaqueurs en tout genre ne vont pas se gêner pour investir dans quelques GPU RTX afin de monter de nouvelles escroqueries toujours mieux ficelées, que certains activistes et groupes de pression vont s'adonner à la création de fausses vidéos encore plus réalistes, et que les amateurs du genre s'en serviront pour réaliser des hypertrucages pornographiques toujours plus poussés. Sans parler de l'impact potentiel sur l'emploi de nombreuses personnes dans les métiers des soins et des services, déjà lourdement touchés par la déferlante des IA conversationnels comme ChatGPT.