Reality is boring… but real | « Le Tribun », site public

Boring mais beaucoup plus réelle: Boring Reality https://civitai.com/models/639937/boreal-fd-boring-reality-flux-dev-lora et sa version vidéo https://civitai.com/models/1222102/boreal-hl ( exemples sur https://www.youtube.com/watch?v=0tuGBrDbXU0 ) donne un grain early-2000 au lieu du surréalisme/kraxiréalisme typiquement choisi pour la génération d’images qui claquent. Ceci permet de beaucoup plus facilement se faire passer pour vrai (à l’image du filtre CRT qui rend les Backrooms réalistes malgré un CGI sous blender très basique)

En repartant d’une vieille image non publiée pour réaliser l’article https://public.letribun.org/2023/05/02/4k-ultra-hd-remaster-blueray/ , faites sous Stable-Diffusion 1.5, je fais passer un Image2Image avec ComfyUI et FLux-1 Dev, Lora BoringReality et « SameFace Fix » ( https://civitai.com/models/766608/sameface-fix-flux-lora , poids négatif)

Prompt de la source sous SD1.5 + Lora style-paintmagic: concept-art of a beautiful korean girl with thick flowing hair in (style-paintmagic_0.1), detailed, high quality
Prompt du img2img avec un denoise de 50% : A polaroid photo of a indie japanese teenager girl in her bedroom, Polaroid Colorpack 80, long hair, dyed and wet hair, polaroid frame, grainy, large field of view
60% denoise: A photo taken from a fisheye doorbell of a indie japanese teenager girl on a porch

Ça reste encore assez « stylisé » pour être une photo travaillée (façon photo d’album indie).

Pour du pur boring réalisme il faut sans doute faire du txt2img ou un denoise suffisamment fort qu’il ne reste plus rien (en attendant d’avoir un guidage précis via ControlNet), dans ce genre à 87% de denoise:

Dans le doute mais normalement tout le monde a déjà récupéré des workflows ailleurs, voici le mien adapté d’un autre trouvé sur le net.

Télécharger l’image dans ce lien et drag-and-drop l’image dans comfyUI pour l’importer. (Ne pas importer l’apperçu visible ci-dessous car WordPress supprime les meta-datas du png, qui contiennent le workflow json effectivement utile)

Un autre Lora est Amateur Photography , entrainé a priori sur des photos amateurs de blog ou de flickr de 2007.

Réglages txt2img parfaitement minimalistes; à noter peut-être qu’un sampler « Heun/Beta » (au lieu du classique Euler) donne un rendu plus réaliste (l’auteur recommande Deis/DDIM pour la v6, mais chez moi ça ne rend pas si bien que ça et donc j’ai gardé ce qui était recommandé pour la v2).

An amateur theatre play of the revolution in the streets of an Italian suburb on a rainy day. A dog is chasing a cat in the middle of the crowd. Photo taken in 2007 from the sidewalk and posted on Flickr by Anonymous

A journalist interviews people about the revolution in the streets of an Italian suburb on a rainy day. The sky is dark and cloudy; A dog is chasing a cat in the middle of the crowd.
In the background we can guess a parade or carnaval is happening behind the crowd with colorful dancers.
Photo taken in 2007 from the sidewalk and posted on Flickr by a an anonymous bystander.

Presque rien ne fait penser à une image IA a priori… sauf ce cable de micro qui ne va nulle part, et la dame en blanc dans le fond a clairement l’air de juger fortement le journaliste pour être aussi incompétent.

Zoomons un peu pour mieux nous en rendre compte, en utilisant un Upscaler 4x_NMKD suivant d’un re-detailer couplé à Controlnet, inspiré du workflow de https://myaiforce.com/flux-controlnet-upscaler/ . Ici par contre pas de captionning automatique avec Florence2, ce sera fait main ou interrogé en ligne sans Node spécial.

Et là on se rend bien compte qu’il faut continuer de charger le même Lora « amateur photography » et les mêmes samplers lors de l’upscaling, sinon la vieille dame « populaire » commence à s’habiller chez Versace et à se transformer en Reine d’Angleterre.