DALL-E : le génial générateur d'images par IA s'ouvre à tous

DALL-E devient accessible au grand public ! Tout le monde peut désormais demander à l'intelligence artificielle d'OpenAI de produire des images, qu'elles soient réalistes, artistiques, poétiques, amusantes ou inquiétantes.

Plus d'un million de personnes s'étaient inscrites sur la file d'attente pour utiliser DALL-E, une intelligence artificielle (IA) de génération d'images développée par OpenAI, cette fameuse société américaine qui veut mettre "l'intelligence artificielle au service de l'humanité". Il faut dire que les résultats sont aussi impressionnants que son utilisation est simple. Il suffit de décrire une image – "une peinture d'aurores boréales avec une ville au bord de l'eau", par exemple – pour que l'IA réalise une image unique qui représente ce que l'on a écrit. Après quelques secondes d'attente, l'IA présente quatre images, qu'on peut ensuite modifier en ajoutant des précisions dans un langage naturel via la fonction inpainting. On peut même inventer ce qu'il y a au-delà de ce que l'on voit sur le tableau grâce à l'outpainting – un utilisateur s'est amusé à créer l'environnement du célèbre tableau La Laitière de Johannes Vermeer. Toujours est-il que, comme l'a annoncé OpenAI – la société à l'origine de DALL-E – dans un billet de blog, tout le monde peut désormais accéder à cet outil vraiment bluffant !

DALL-E : un outil incroyable mais controversé

Lancé en janvier 2021, DALL-E – un mélange entre le peintre Salvador Dalí pour le côté artistique et le robot de Pixar WALL-E – repose sur le deep learning, une technologie qui imite le système neuronal humain grâce à des algorithmes. En analysant et en recoupant des modèles de millions de photos, il parvient à comprendre à quel mot appartient telle ou telle image. Une nouvelle version sortie en juillet 2022, DALL-E 2, a grandement amélioré l'IA afin de générer des images plus précises, plus réalistes, et avec une résolution quatre fois supérieure. Et le résultat est vraiment incroyable ! Pour en profiter, il suffit de s'inscrire sur le site en renseignant son adresse e-mail, son nom, prénom et numéro de téléphone. Un code est envoyé par SMS pour éviter la multiplication de comptes. Il ne reste plus qu'à rentrer la description de l'image souhaitée, et celle-ci est générée en quelques instants. Pour ceux qui seraient vraiment fiers du résultat, ils peuvent partager leur création à la communauté. La formule gratuite permet de générer 50 images pendant le premier mois, puis 15 pour chaque mois suivant. Pour augmenter ce nombre, il faut sortir le porte-monnaie et payer 15 dollars pour 115 crédits.

"Une peinture d'aurores boréales avec une ville au bord de l'eau", © OpenIA

Mais, comme toute IA, on peut très vite craindre des dérives. C'est pourquoi OpenAI a développé un système de filtres. Elle explique que "nos filtres sont devenus plus robustes et rejettent les requêtes visant à créer des visuels violents, sexuels, ou qui contreviennent à notre politique de contenus." DALL-E ne peut donc pas générer de représentation de personnalités publiques ni de sujet sensible – comme la guerre en Ukraine. Un des problèmes rencontrés était que l'outil avait tendance à avoir des résultats stéréotypés et racistes, puisqu'il se nourrit d'images libres de droit disponibles sur Internet et de peintures qui ont été créées dans une société elle-même porteuse de stéréotypes et de racisme. Aussi, pour éviter de représenter uniquement des hommes blancs et riches, la société rajoute des mots clés invisibles, comme "femme noire" ou "homme asiatique", afin de diversifier les résultats. Mais l'utilisation de l'IA soulève aussi de nombreux problèmes, notamment au niveau des droits d'auteur et de l'essence de l'art. Qui est l'auteur de l'image créée ? DALL-E ou l'utilisateur ? Une IA peut-elle être reconnue comme un auteur ? Et, plus globalement, est-ce qu'une IA peut être considérée comme la créatrice d'une œuvre ? Des cas concrets ont déjà posé problème. En août, un tableau généré par Mid-Journey – un outil semblable à DALL-E – a remporté un concours d'art aux États-Unis, suscitant une polémique. De même, une artiste américaine nommée Kris Kashtanova a obtenu l'enregistrement d'un copyright pour son roman graphique. Or, si elle a écrit l'histoire et organisé la scénographie, c'est là aussi Mid-Journey qui a généré les illustrations via les descriptions de l'Américaine. En tout cas, la démocratisation de DALL-E risque de relancer la question.