Ce n’est pas la première fois que je vous parle de Midjourney et de toute façon si vous suivez le domaine de l’intelligence artificielle, difficile de passer à côté. D’ailleurs, on devrait plutôt parler d’intelligence artificielle générative et en particulier d’images en l’occurrence. C’est un domaine qui évolue tellement vite que c’est vraiment difficile à suivre … J’adore, mais avec mon travail à côté, c’est difficile de tout documenter ici tellement ça bouge vite !
Nous avons déjà vu beaucoup de choses avec les concurrents gratuits de Midjourney, principalement basés sur la liberté. Liberté qu’on pourrait qualifier de relative, mais quand même, il s’agit bien sur de Stable Diffusion. Le monde du libre est extrêmement actif mais ce n’est pas tout car Microsoft est lui aussi très actif et surtput en partenariat sérré avec OpenAI qui nous a proposé notre fameux ChatGPT. D’ailleurs, le générateur d’images de Bing est basé sur la technologie d’OpenAI. Plus précisément sur le modèle DALL-E, bon un peu boosté certes, juste pour Microsoft, et ça fonctionne très bien. Comme d’habitude, il suffit de savoir lui parler avec des bons prompts.
Les choses bougent donc très très vite chez OpenAI, mais aussi chez Midjourney. De toute façon, ça bouge vite de partout en fait … Si vous êtes arrivé ici, c’est que vous voulez en savoir plus sur une chose qui vient tout juste d’arriver sur Midjourney. Vous avez vu une image faite par une intelligence artificielle qui vous plaît, vous voulez essayer d’avoir la même ? Peut-être que ce n’est même pas une image faite par l’IA, mais vous voulez la reproduire à votre manière, mais comment la décrire facilement ?
Ça tombe bien, Midjourney vient justement de sortir une nouvelle commande qui permet de décrire une image et de sortir un prompt correspondant qui s’en rapproche le plus pour récréer une image similaire.
Test de la commande /describe sur Midjourney
Bon attention, on ne s’enflamme pas, je préfère vous le préciser tout de suite, vous ne pourrez pas recréer les images qui font le buzz facilement. Midjourney va tenter de vous donner un prompt, mais il ne sait pas lui-même ce qui a permis de générer l’image parfaite que vous voulez refaire de votre côté. Enfin, il le sait quelque part, mais c’est perdu dans les tréfonds de tout ce qu’il garde, dans sa mémoire à long terme pour s’améliorer. Pour la suite, Midjourney, il réfléchit et analyse directement l’image que vous allez lui donner, il pense pas à tout ce qu’il a créé par le passé.
Pour essayer cette nouvelle fonction de Midjourney, il vous suffit de lancer la commande /describe et d’envoyer votre image :
Puis maintenant on ajoute notre image à décrire :
Bon allez, on teste et on lui file l’image du pape en doudoune qui a fait le buzz récemment :
On attend le temps que l’intelligence artificielle Midjourney fasse son travail :
On fini par avoir notre résultat :
Ce n’est pas encore une solution idéale
Ce que l’on vient de faire, c’est ce que l’on appelle le Reverse Prompt Engineering. Désolé, je n’ai pas de belle traduction en français pour qualifier cela. Je pense que là aussi les solutions plus libres que Midjourney vont se développer. Surtout que pour faire une image, on ne parle pas de la même manière à Midjourney, Stable Diffusion ou encore DALL·E 2 pour ne citer qu’eux. Pour le moment du mois, si vous arrivez sur cet article d’ici quelques années, les choses auront changé et peut-être beaucoup changé.
La commande /describe de Midjourney n’est pas encore une solution idéale, car si vous tentez de reproduire des images que vous avez trouvé, le prompt ne sera jamais exactement le même que la personne qui a réellement fait l’image à la base. Que ce soit une image réelle comme une photographie stylée ou un perfect comme le pape avec Midjpourney.
Forcément, sur Twitter certains se sont amusés et regardez ce que peut faire cette recherche inversée pour avoir les prompt par rapport à une image sur des marques connues. Attention, bientôt, on va entendre parler de contrefaçon, faites par des intelligences artificielles … Sacré problème. Allez, les logos en full reverse et merci Twitter :
Ils ont recréé ces images seulement en faisant du reverse engineering image prompt, c’est fou non ? Vous en pensez quoi ?