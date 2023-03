Bing se dote d’une nouvelle fonction en intelligence artificielle : grâce à DALL-E, le moteur de recherche peut désormais générer des images en se basant sur vos instructions écrites. Comme Midjourney.

C’est encore une surprise de Microsoft : l’entreprise américaine annonce ce 21 mars la disponibilité d’un nouveau service capable de générer des images à la volée. Une nouvelle rubrique a été activée dans son moteur de recherche, Bing, dans laquelle il suffit d’écrire son instruction. Ensuite, l’intelligence artificielle générative se chargera d’imaginer plusieurs résultats.

Bing génère des images grâce à DALL-E d’OpenAI

L’outil fonctionne comme Midjourney. Il vous suffit de décrire l’image que vous voudriez voir pour que les algorithmes moulinent ensuite quatre propositions. Si l’une vous plaît, il vous suffit de cliquer dessus pour obtenir un rendu plus net et plus précis. Sinon, libre à vous de relancer une instruction, en essayant d’être plus fin dans votre demande.

Quelques propositions. // Source : Numerama avec DALL-E

Un exemple d’utilisation : nous avons demandé à Bing de générer un « un panda roux survolant les étoiles » (« A red panda flying over the stars »), en lui envoyant la commande en anglais. L’outil a ensuite retourné quatre résultats. En cliquant sur l’une d’elles, un rendu plus soigné a été proposé, avec des options pour le partager, le télécharger ou le commenter.

En revanche, impossible pour le moment d’envoyer des instructions autrement qu’en anglais. Nous avions tenté quelque chose autour de « Un pingouin en train de faire du surf devant la tour Eiffel », avant de recevoir un message d’erreur. En traduisant notre requête (« A penguin surfing in front of the Eiffel tower »), l’IA s’est remise en route et a pu générer quelques propositions.

Prêt pour les JO ! // Source : Numerama avec DALL-E

Ce nouvel outil est propulsé par DALL-E, un autre système d’IA conçu par OpenAI, une société américaine à qui l’on doit le chatbot ChatGPT ainsi que les différentes générations du modèle de langage GPT (GPT-4, GPT-3, etc.). OpenAI est devenu en quelques années un partenaire très proche de Microsoft ; celui-ci a d’ailleurs injecté des milliards de dollars dans la jeune pousse.

Microsoft dit s’appuyer sur une « une version avancée du modèle DALL-E » pour alimenter son service de génération d’image, baptisé Bing Image Creator. Il « sera entièrement intégré à l’expérience de Bing Chat », poursuit Microsoft, qui le décrit comme un « copilote créatif ». Cette description avait déjà été utilisée pour décrire l’arrivée de l’IA dans Microsoft Office.

Cette intégration est un pas de plus vers l’approche multimodale, qui désigne la capacité de manipuler tout aussi bien du texte, des images et d’autres formes de contenu pour en générer d’autres, de diverses natures. Dans ce cas, du texte permet de créer des images et des images peuvent être soumises à l’IA, qui en décrit ensuite le contenu. GPT-4 aura cette faculté.

Si l’association de Bing et de DALL-E rappelle Midjourney, l’intégration de DALL-E dans Bing s’avère plus accessible pour les internautes. Pas besoin de passer par un logiciel tiers, Discord, pour accéder aux algorithmes de l’IA générative. C’est l’un des points faibles de Midjourney. Dans le cas de Bing, il suffit d’aller sur sa page avec le navigateur web de son choix.

