Me paso por aquí para enseñaros un workflow que hice para imagen a imagen, con modelos de lenguaje para los prompts, y con el añadido de un upscale con refinado (Vamos, que tenemos tres IA involucradas en el workflow, y todo corriendo de manera local).
Primero cargo la imagen y está pasa a la IA Florence2 (de Microsoft) la cual analiza la imagen y genera una descripción detallada de la imagen, acto seguido esa descripción pasa a LLama3.1 (de Meta) la cual tiene unas ordenes específicas de comportamiento, y a la que además yo le puedo pedir y añadir órdenes más específicas. Una vez termina pasa a generar un prompt, y tanto la imagen original como el prompt son la información que le llega a Flux, que genera una nueva imagen basándose en la imagen original y el promt generado, tras generar una imagen nueva esta pasa a un upscale con refinado (que cambia un poco la nueva imagen y aumenta su resolución)... Y listo.
La gracia del asunto es que simplemente con meter una imagen ya tienes los prompts que te la describen con detalle, y además puedes ordenar a LLama3.1 que genere cambios en la misma.
Si la dejamos a su aire nos va a sacar imágenes con el mismo estilo que la original, aunque puede hacerle algunos cambios porque así se lo tengo especificado en su "roleplay" (el roleplay fue vilmente fusilado de otro workflow que vi).

Pero puedo pedirle que me gustaría que la chica fuese pelirroja...

Vale, pero la imagen es muy diferente a la original, y quizá me gustaría que se pareciese más a la original... Así que simplemente bajo el denoise y...

Mucho más fiel...
¿Un cambio de sexo?

Probamos con otra imagen, esta vez mucho más tenebrosa, le pido que me la describa con el estilo de HP Lovecraft y le añada unos detalles...

Muy bien me hizo caso y ahora tiene un aspecto menos humanoide, pero supongamos que también en este caso quisiera que sea más fiel a la original y que una luna rojiza aparezca, así que bajo el denoise...

Listo, mantiene mucho más la fidelidad del original, y además añadió otra luna de color rojo tal y como le pedí.
Vamos más lejos, ahora le pido a Llama que haga una descripción completamente opuesta a la de la imagen original...

Ahora la imagen oscura e inquietante se convirtió en una inquietante imagen de corte más celestial...
¿Qué hace el refinado final?
Pues dejo una imagen de FLUX normal y otra tras el refinado...


Y ya está, espero que os gustase la curiosidad de ver uno de mis worflows.