Inpainting: aller trop loin

Image initiale: Mr. Rogers et son pull rouge (une vraie photo)

Sélection à la grosse louche du masque à appliquer:

Prompt d’inpainting: « A red wedding dress« . L’algo s’applique en gardant le contexte du reste de l’image non masquée, et décide donc que Monsieur Rogers porte plutôt des costumes d’homme que des robes:

Pour forcer le prompt, il faut donc rajouter le terme « woman » dans le prompt d’inpainting:

« A woman in a red wedding dress« .

Par curiosité on peut étendre le masque au visage pour voir comment l’algorithme a opéré la transition (Option « Restore Faces » de Automatic1111 activée)

Cette semelle de basket n’a plus aucun sens, les trucs au dessus ressemblent à des fleur donc repartons d’ici pour la transformer en vase, avec un nouveau masque:

« A woman in a red wedding dress, holds a white porcelain flower vase« 

Il est temps de finir le reste de l’image en transformant la plante verte, le rideau vert et les quelques meubles en bois, en quelque chose de plus intéressant. Masquage grossier:

« A woman sits on a dead tree log in a tropical forest »

les grands applats du mur de l’image d’origine ne fournissent pas assez de matière, il faut monter le curseur de « denoising strength » à 0.76 pour créer plus de chose à partir de rien:

L’anatomie des jambes est totalement à l’ouest. Les tentatives de regénérations des jambes ne donnent jamais rien avec cette position initiale, on va en faire autre chose avec ce bleu. Disons, « A blue giant bird« 

Ça ne ressemble plus vraiment à un endroit où porter une « robe de mariage », on remasque le haut du corps pour en faire « an middle-aged warrior woman with dark red leather clothes« 

Surprise ! Cette perruche et ce vase en porcelaine n’étaient qu’un habile camouflage pour une arme à dispersion énergétique !

« a sci-fi energy gun, with neon blue laser light, smoke« 

« a red general in a cyberpunk city by night »

Ah, il est bien loin le Mr Rogers amical et pacifique des débuts…

Transition complète animée

Encore plus ?…

Après avoir ciblé zone par zone, il peut être intéressant de passer la dernière image obtenue dans un img2img intégral (qui peut rattraper des jonctions de zones qui commençaient à manquer de cohérence) avec un denoise-strength pas trop fort (0.5)

« a red general in a cyberpunk city by night, holds a energy weapon with blue laser »

Pour comparaison, voici ce que donne le même prompt/paramètres, mais sur la photo de départ:

STOP !

« A bride in a red wedding dress holds a blue flower bouquet in front of a night club »

Making-Of

Pour faire cet article avec environ 15 images publiées, entre 100 et 200 essais intermédiaires ont été nécessaires pour sélectionner les plus convenables.