Bing Image Creator : l'IA Microsoft qui génère des images à partir d'un texte

Bing Image Creator : l'IA Microsoft qui génère des images à partir d'un texte

Microsoft continue sa course à l'intelligence artificielle en intégrant une IA génératrice d'images dans Bing et Edge. Baptisé Bing Image Creator, ce module est capable de créer de toutes pièces une illustration à partir d'une description textuelle.

Microsoft continue son offensive dans le domaine de l'intelligence artificielle ! Après avoir intégré le modèle de langage GPT-4 dans son moteur de recherche Bing et dans son navigateur Edge, puis annoncé le lancement d'un assistant Copilot pour sa suite Microsoft 365 (voir notre article), la firme de Redmond franchit une nouvelle étape avec Bing Image Creator ("créateur d'image Bing"), un générateur d'images directement intégré dans son chatbot. Grâce à lui, l'utilisateur peut, à partir d'une courte description textuelle, créer des visuels correspondants. Et le résultat est plutôt impressionnant ! Une petite révolution qui va probablement faire bondir la popularité du moteur de recherche puisque, depuis le lancement de son chatbot, Microsoft revendique plus de 100 millions de conversations. Avec Bing Image Creator, les compteurs risquent de s'affoler !

Bing Image Creator : une image grâce à une description

Bing Image Creator fonctionne comme DALL-E et Midjourney : il suffit de décrire l'image que l'on souhaite obtenir pour que l'IA génère quatre propositions. Si l'une d'elles intéresse l'utilisateur, il n'a qu'à cliquer dessus pour obtenir un rendu plus net et plus précis. Sinon, il peut modifier sa demande en essayant d'être plus clair. "En saisissant la description d'une image, en fournissant un contexte supplémentaire tel que le lieu ou l'activité, ou en choisissant un style artistique, Image Creator générera une image à partir de votre propre imagination", explique Microsoft dans son communiqué.

Pour le moment, Bing Image Creator n'est accessible qu'aux utilisateurs inscrits à la version Preview de Bing Chat, dans les versions mobiles et bureaux du moteur de recherche et du navigateur Edge. Pour ce dernier, il suffit de cliquer sur l'icône de l'outil située dans la barre latérale de droite ou de demander directement dans le chat. Sinon, il est aussi possible de tester l'outil à cette adresse, en se connectant à son compte Microsoft. La firme de Redmond n'est d'ailleurs pas peu fière d'indiquer qu'Edge est le premier navigateur équipé d'une IA génératrice d'images. "Historiquement, la recherche était limitée aux images qui existaient déjà sur le Web. Aujourd'hui, il n'y a pratiquement plus de limites à ce que vous pouvez rechercher et créer", triomphe-t-elle.

Bing Image Creator : des nouveautés à foison

Bing Image Creator étant disponible dans une version preview, il peut y avoir quelques ratés. L'IA n'est pour le moment accessible que dans le mode "Créatif" de Bing Chat – pour mieux adapter le chatbot à leurs besoins, les utilisateurs peuvent paramétrer le chatbot selon trois types de personnalités différentes (voir notre article) –, mais Microsoft compte bien l'étendre aux modes "Équilibré" et "Précis" par la suite. De même, elle comprend uniquement les demandes en anglais, mais des langues supplémentaires, dont le français, seront ajoutées plus tard.

Ce n'est pas le seul ajout de Microsoft au chatbot. En effet, l'entreprise annonce une fonction "Histoires", qui offre "une manière plus attrayante de rechercher et d'interagir avec le contenu, en proposant des images et de courtes vidéos." De même, la fonction "Cartes de connaissances" passe en version 2.0. Inspirée des infographies et alimentée par l'IA, elle "fournit des faits amusants et des informations clés d'un seul coup d'œil". La mise à jour permet de proposer "du contenu interactif et dynamique", comme des graphiques, des tableaux, des chronologies et plus encore.

Bing Image Creator : un outil à ne pas mettre entre toutes les mains

Le but de Microsoft est de mettre au point un outil multimodal, c'est-à-dire ayant la capacité de manipuler tout aussi bien du texte, des images et d'autres formes de contenu pour en générer d'autres de natures variées. Notons que Bing Image Creator est beaucoup plus accessible que Midjourney, où il faut entre des prompts dans des salons publics de Discord – et trouver ses images parmi les innombrables demandes formulées en même temps.

Bien entendu, il faut poser des limites et mettre au point des garde-fous avec ce type d'IA, afin d'éviter qu'elle soit utilisée pour générer des contenus inappropriés ou illicites – violent, sexuel, pédopornographique, ou encore des deepfakes de personnalités publiques. Une tâche délicate, vu comment la version Conversation de Bing avait déraillé. Aussi, Microsoft explique que lorsque la demande de l'utilisateur est susceptible d'aboutir à une image problématique, un avertissement lui est envoyé et la commande est bloquée. L'entreprise assure avoir travaillé en partenariat avec OpenAI – à l'origine de ChatGPT et DALL-E – et d'avoir elle-même rajouté des filtres supplémentaires. Par ailleurs, les images générées par Bing Image Creator seront automatiquement identifiées à l'aide d'une icône de Bing afin d'informer les utilisateurs que l'illustration est le fruit d'une IA.