OpenAI prépare une nouvelle IA pour générer des vidéos
OpenAI, l'entreprise derrière ChatGPT et DALL-E, a des projets plein ses cartons ! Après le texte, les images et les objets 3D, l'entreprise s'attaque à la génération de vidéos par IA. Un projet ambitieux qui va prendre du temps...
OpenAI continue sa conquête du secteur de l'intelligence artificielle, et plus rien ne semble pouvoir l'arrêter dans son incroyable ascension ! L'entreprise derrière l'incroyable ChatGPT, le chatbot conversationnel qui fascine Internet par sa capacité à produire des réponses uniques et exhaustives aux requêtes que lui soumettent les utilisateurs, diversifie ses créations. Elle a également mis au point DALL-E, qui est capable de générer une image – qu'elle soit réaliste, artistique, poétique, amusante ou inquiétante – en quelques secondes à partir d'une commande textuelle, ainsi que Point-E, qui crée des images en 3D – trois dimensions – en couleurs à l'aide de simples indications textuelles – c'est le logiciel le plus rapide dans ce domaine à ce jour.
Si toutes ses IA sont incroyables, OpenAI ne compte pas s'arrêter là. Sam Altman, le PDG et co-fondateur de la firme, a accordé une interview de près d'une heure à StrictlyVC, un média couvrant l'actualité de la Silicon Valley, afin d'évoquer le futur de l'entreprise. Il a notamment abordé l'évolution du modèle de langage sur lequel repose ChatGPT, qui tourne actuellement avec GPT-3. Et il fait bien, parce que de nombreuses rumeurs courent actuellement sur la Toile à propos de GPT-4, selon lesquelles il contiendrait 100 billions de paramètres et sortirait en 2023. Sam Altman invite chacun à revoir ses attentes à la baisse, affirmant que GPT-4 sera bien moins révolutionnaire que ce que les bruits de couloir laissent entendre, et que ChatGPT 4 ne devrait être qu'une simple évolution de ChatGPT3. Et ce n'est peut-être pas plus mal comme ça, étant donné que l'IA conversationnelle fait face à de nombreux problèmes éthiques, comme de la triche étudiante – OpenAI travaille d'ailleurs sur un moyen de différencier les textes produits par son intelligence artificielle de ceux écrits par un humain – ou son utilisation pour du piratage informatique. C'est pourquoi Sam Altman préfère "décevoir les gens" et patienter avant de publier une nouvelle version "en toute sécurité et de manière responsable". En revanche, il révèle qu'un autre projet est en cours, et pas des moindres : une intelligence artificielle programmée pour générer des vidéos à partir de commandes textuelles.
OpenAI : les intelligences artificielles débarquent en masse
Sam Altman n'a pas donné beaucoup de détails sur son nouvel outil. Selon lui, "les gens s'intéressent" à la perspective d'une IA génératrice de vidéos. Le projet est déjà dans les cartons et il pourrait être accessible "bientôt" au grand public, bien que "cela pourrait prendre un certain temps". Il reste donc très mesuré pour le moment et se contente de nous teaser le nouvel outil sans trop de précision. On peut imager une déclinaison plus ambitieuse de DALL-E, qui est déjà en lui-même plutôt impressionnant. Notons qu'OpenAI n'est pas le premier à s'engager sur ce chemin. En effet, Meta avait dévoilé l'année dernière un projet similaire qui s'appuie sur une IA entrainée à partir d'un modèle d'apprentissage automatique et d'une immense base de données d'images. Elle est pour le moment uniquement accessible aux bêta-testeurs. En tout cas, si cet outil voit le jour, nul doute qu'il intéressera fortement Microsoft.
En effet, la firme de Redmond a grandement investi dans OpenAI. Après lui avoir versé un milliard de dollars en 2019, elle s'apprête à y investir cette fois 10 milliards de dollars. Cela lui permet de bénéficier d'une licence exclusive sur GPT-3, le modèle de langage derrière l'intelligence artificielle révolutionnaire, et d'intégrer les différentes IA à ses services, comme son moteur de recherche Bing, sa suite bureautique Microsoft 365 et sa nouvelle application Microsoft Designer. Notons toutefois que le partenariat avec Microsoft n'est pas exclusif, ce qui signifie qu'OpenAI est en théorie libre de vendre sa technologie à d'autres entreprises. De telles avancées inquiètent grandement les concurrents, qui ont redoublé d'efforts pour mettre au point leurs propres technologies. Google a notamment déclaré un "code rouge" afin de réorganiser ses équipes et d'avancer sur ses projets d'IA. La firme de Mountain View compte d'ailleurs beaucoup sur Sparrow, un chat similaire à ChatGPT, pour garder sa position de leader. Nous en saurons peut-être plus lors de sa conférence Google I/O, au mois de mai.