OpenAI lance Sora 2, un nouveau générateur de vidéos avec son propre réseau social

OpenAI lance Sora 2, un nouveau générateur de vidéos avec son propre réseau social

OpenAI s'apprête à lancer Sora 2, son nouveau générateur vidéo associé à un réseau social éponyme destiné à concurrencer TikTok. Deux outils qui autorisent l'usage de deepfakes, franchissant une limite dangereuse pour l'IA.

Rien ne semble pouvoir arrêter OpenAI, le créateur de ChatGPT, qui vient de lancer ChatGPT Pulse – un assistant qui prépare automatiquement chaque matin un condensé d'informations personnalisées –, Instant Checkout – un nouvel outil destiné au shopping – et un système de contrôle parental pour son IA.

Mais l'entreprise de Sam Altman ne conte pas s'arrêter là ! Lors d'une conférence diffusée sur YouTube le 30 septembre, elle a dévoilé la deuxième version de Sora, son IA qui permet de générer des vidéos à partir d'une simple demande textuelle (voir notre article).

La première version avait été lancée en décembre 2024. Toutefois, bien qu'elle soit fort prometteuse, elle commençait à prendre du retard par rapport à ses concurrents, comme Google Veo 3 et RunwayML. Mais Sora 2 promet un joli bond en avant puisqu'elle est à la vidéo par IA ce que GPT-3.5 était aux générateurs de texte, si l'on en croit OpenAI. Elle comporte plusieurs nouveautés, comme la génération de sons, une meilleure compréhension de la physique et la possibilité de créer des "caméos" – qui sont ni plus ni moins que des deepfakes. L'entreprise en profite pour lancer son propre concurrent à TikTok mais, là aussi, centré sur l'intelligence artificielle. Et autant dire que cela promet déjà de nombreuses dérives...

Sora 2 : une seconde version beaucoup plus aboutie

Sora premier du nom était un outil très prometteur. Toutefois, le générateur enregistrait un certain nombre de lacunes, comme une compréhension imparfaite des styles demandés, des objets qui disparaissent subitement ou encore une impression générale de flottement, avec un étrange rythme. Mais, selon OpenAI, Sora 2 est "plus précis, plus réaliste et plus facile à contrôler que les systèmes précédents". Sur les exemples dévoilés par l'entreprise, on remarque une grande amélioration en ce qui concerne la physique et les disparitions soudaines de certains éléments en plein milieu de la vidéo.

Que ce soit des figures compliquées de patinage artistique, une scène pleine de jeux de lumière dans un animé ou un saut périlleux sur un lac, l'outil s'en sort haut la main, même si certaines animations sont parfois encore un peu étranges. "Les modèles vidéo antérieurs sont trop optimistes : ils transforment les objets et déforment la réalité pour répondre à une invite textuelle. Par exemple, si un basketteur rate un tir, le ballon peut se téléporter spontanément vers le panier. Dans Sora 2, si un basketteur rate un tir, le ballon rebondit sur le panneau", illustre OpenAI.

Sora 2 : l'arrivée des enregistrements audio et des caméos

Une des grandes nouveautés de Sora 2 est sa capacité à générer de l'audio, qu'il s'agisse de dialogues, d'effets sonores ou de musiques d'ambiance. Mais, surtout, l'IA accueille la fonction "Cameo", aussi prometteuse que problématique. C'est bien simple, elle permet de transformer n'importe quelle photo ou vidéo en un deepfake réaliste de son utilisateur ou de ses proches. Même la voix est imitée ! Il suffit de télécharger un enregistrement vidéo et audio unique pour vérifier son identité et capturer son apparence, pour ensuite s'insérer dans n'importe quelle scène générée par Sora 2. Notons qu'il est possible d'autoriser d'autres utilisateurs à inclure son image dans leurs vidéos, y compris des scènes avec plusieurs personnes ensemble. OpenAI met ainsi en avant la dimension sociale de son outil, mais les implications dépassent largement l'aspect ludique.

Car si l'entreprise a mis en place quelques protections, comme l'impossibilité de générer des images de célébrités et de personnalités publiques, ou la possibilité de refuser que d'autres personnes utilisent son image pour leurs caméos, elle ouvre surtout la porte à des dérives encore pires que celles que nous voyons déjà émerger. Car que se passera-t-il si quelqu'un crée un faux compte en utilisant l'image d'une autre personne puis autorise son exploitation pour générer des deepfakes ? Y aura-t-il une vérification d'identité systématique ? Et si une célébrité télécharge elle-même son visage et autorise son usage, tout le monde y aura-t-il accès ? C'est à coup sûr la porte ouverte à la diffusion de fake news, mais aussi de détournements sexuels à des fins de cyberharcèlement ou de sextorsion, comme c'est déjà le cas actuellement, malheureusement (voir notre article).

Sora 2 : des deepfakes utilisés à des fins malveillantes

En parallèle, OpenAI va lancer une application distincte de ChatGPT. Sobrement baptisée Sora, elle sera, dans un premier temps, uniquement disponible sur iOS. Il s'agira d'un réseau social concurrent à TikTok, à la seule différence qu'il sera entièrement rempli de vidéos générées par le modèle Sora 2. Une idée qui n'est pas sans rappeler celle de Mark Zuckerberg avec Vibes ou d'Elon Musk avec son flux Vine sur X.

© OpenAI

L'algorithme prendra en compte l'activité Sora de l'utilisateur, sa localisation (via son adresse IP), ses publications passées et même son historique ChatGPT afin de personnaliser les recommandations. Comme pour le chatbot, le réseau social comprendra un système de contrôle parental, qui permettra de limiter le défilement infini, de désactiver la personnalisation algorithmique, ou encore de gérer les messages directs. Bref, un système qui déplace la responsabilité sur les parents et dont l'efficacité dépendra beaucoup de leurs compétences techniques.

Dans un premier temps, Sora sera disponible uniquement aux États-Unis et au Canada. L'application sera disponible gratuitement à son lancement, mais avec une limite "généreuse" afin que les utilisateurs puissent "explorer librement ses fonctions". Pour y avoir accès, il faudra recevoir une invitation. Quant aux abonnés ChatGPT Pro, ils auront accès à Sora 2 Pro, un modèle bien plus performant, sans avoir besoin d'une quelconque invitation.