Ha muerto el Rey Stable Diffusion... ¡¡¡Viva Flux el nuevo rey!!!

QuentinTarantiros

Para los que no sepan mucho del movimiento Open Source respecto a la IA estamos viviendo tiempos altamente competitivos y muy moviditos (hace nada sacaron Llama 3.1 que es un pepinazo).

En el mundo de la generación de imágenes teníamos Dall-E o Midjourney como los representantes de los modelos cerrados, y únicamente a Stable Diffusión y algunos otros como modelos abiertos.

Stability sacó hace no mucho su nuevo modelo Stable Diffusion 3 Medium en el cual había puestas muchas esperanzas, pero el jarro de agua fría fue terrible, un modelo censurado, muy limitado, de calidad cuestionable, y con unas condiciones de uso en su licencia que eran una tomadura de pelo (y que luego rectificaron)... En ese punto parecía que el modelo Open Source estaba condenado... Pero llegó Black Forest Labs.

¿Quién puñetas son estos tipos de Black Forest Labs?...

Pues hace un tiempo un pequeño grupo de ingenieros (siete si mal no recuerdo) descontentos con el rumbo de Stability abandonaron el barco y fundaron Black Forest Labs, y como resultado de aquella espantada tenemos el tema principal de este mismo hilo... El modelo Flux.

Flux está al mismo nivel o es incluso mejor que modelos como Midjourney o Dall-E, entiende instrucciones complejas, maneja texto, diferentes estilos (anime, realista, artísticos, cinematográficos, etc, etc) y además ofrece una calidad de imagen estupenda...

Eso sí, es un modelo exigente que requiere de un hardware decente para correr de manera optima, pero por suerte también es altamente flexible así que se puede adaptar a especificaciones más bajas (aunque no será tan rápido).

De momento hay 3 modelos:

Flux.1 Pro (modelo comercial que solo funciona en línea).
Flux Dev (el modelo medio con el que hice las imágenes del hilo).
Flux Schnell (modelo rápido, pero puedo asegurar que mantiene una gran calidad de imagen).

Como el modelo es nuevo aún no tiene plugins específicos (como controlnet y otros) pero en cuanto la comunidad se ponga manos a la obra FLUX pasará a ser un modelo de posibilidades ilimitadas (y de altísima calidad).

El problema (de momento) es que aún no se sabe si se podrá entrenar, ya que quizá el hardware necesario sea demasiado elevado para el usuario medio (aunque quizá la comunidad con algo de optimización y paciencia logren hacerle finetuning al modelo).

Tras Llama y Flux estaría genial que alguien sacase un modelo para vídeo y otro para música que sean Open Source y tan buenos como los modelos cerrados...

Hay cosas como Stable Vídeo Diffusion o MAGNeT, pero no están al nivel, de hecho están lejísimos de ofrecer algo de buena calidad (supongo que la cosa debe ser complicada por las limitaciones que tiene el hardware de un PC doméstico medio).

Moi_85

😮, no sabía que Satble Diffusion se habia ido a la mierda!

Y las imágenes que has creado con Flux son top

QuentinTarantiros

🤣👏👏👏👏👏👏👏👏

Anonymous199

QuentinTarantiros

Mis dieces.

Dios

QuentinTarantiros Por ahora solo he probado la demo, es facil de instalar, tiene frontend?

hacendasdo

QuentinTarantiros funciona con amd?

Memphisto

A muerto

QuentinTarantiros

Memphisto

Gracias, ya está solucionada la metida de pata... 😂

QuentinTarantiros

Moi_85 😮, no sabía que Satble Diffusion se habia ido a la mierda!

Siguen funcionando y sacando modelos... El problema es que el último (SD3 Medium) resultó ser bastante decepcionante.

Con suerte la competencia puede que haga que se pongan las pilas.

Moi_85 Y las imágenes que has creado con Flux son top

Las originales de Flux las hice a 1280x720, pero luego les pasé un upscale para ponerlas a 4K y quedan de lujo la verdad.

Moi_85

QuentinTarantiros upscale para ponerlas a 4K

Como debe ser, esa imagen se merece estar de fondo de pantalla

🤣🤣👏

Dios

A ver si lo pruebo, SD3 fue un jarro de agua fria.

Dios

Probando

QuentinTarantiros

Dios Por ahora solo he probado la demo, es facil de instalar, tiene frontend?

Utilizo CopmfyUI el cual ya sabes como es, y bueno es más o menos lo de siempre, simplemente hay que bajar los modelos, meterlos en su carpeta correspondiente, y cargar un workflow...

No se si ahora mismo será compatible con Automatic1111 o algún otro, pero si no es así seguro que lo implementan en no mucho.

https://www.stablediffusiontutorials.com/2024/08/flux-installation.html

Oshvam99

QuentinTarantiros compatible con LM Studio?

QuentinTarantiros

Oshvam99 Pues la verdad es que no tengo ni idea, imagino que al ser un modelo reciente funcionará en pocas cosas de momento.

Al ser un modelo Open Source supongo que es cuestión de tiempo que al final se implemente su compatibilidad con casi todo.

Dios

Buff, que bien pinta esto, me voy a poner las botas

Karolus

Dios Si te gustan los dedos de mas, si.

Oshvam99

QuentinTarantiros gracias, la verdad es que el resultado es muy bueno. Sigue fallando en las manos, pero en todo lo demás es impresionante y me vendría genial. Voy a ver cómo darle caña a esto, tengo una 3070 y 32GB de RAM. Entiendo que podré moverlo.

sora63

¿Cómo funcionan las IAs descargandolas de Github? ¿Hay algún programa que debo tener?

QuentinTarantiros

sora63 ¿Cómo funcionan las IAs descargandolas de Github? ¿Hay algún programa que debo tener?

Es un poco lioso de entrada, si no tienes mucha idea y no quieres andar instalando dependencias o metiendo comandos en la consola lo mejor es esperar a que salga una script y utilices Pinokio...

Ahora voy a salir, pero luego si me da la neura y de verdad te interesa si quieres esta noche me pongo y hago un pequeño tutorial paso a paso de como instalar Python, ComfyUI, y todo lo necesario (aunque supongo que youtube ya debe estar petado de ese tipo de tutoriales y ni siquiera tengo que curramelo).

Oshvam99 Sigue fallando en las manos

No te creas que falla tanto, dale un par de intentos y no es raro que en unas cuantas imágenes las haga bien.

sora63

QuentinTarantiros Ahora voy a salir, pero luego si me da la neura y de verdad te interesa si quieres esta noche me pongo y hago un pequeño tutorial de como instalar ComfyUI y todo lo necesario.

Eso o poner alguna web en inglés que lo ponga.

Lo agradecería la verdad, porque muchas apps de github o hugging face no hay formas de usarlas veo y es una pared que me parece muy alta.

ErizerX41

QuentinTarantiros Es un poco lioso de entrada, si no tienes mucha idea y no quieres andar instalando dependencias o metiendo comandos en la consola lo mejor es esperar a que salga una script y utilices Pinokio…

Ahora voy a salir, pero luego si me da la neura y de verdad te interesa si quieres esta noche me pongo y hago un pequeño tutorial paso a paso de como instalar Python, ComfyUI, y todo lo necesario (aunque supongo que youtube ya debe estar petado de ese tipo de tutoriales y ni siquiera tengo que curramelo).

Cuanto crees que ocupara de espacio en el SSD de almacenamiento?

Con un SSD NVME de 2TB tendré suficiente?

Me preocupa más el tema de almacenamiento de datos, que el de la potencia de procesamiento de dicha herramienta, si tarda más o menos en procesar las imágenes y el contenido me la pela.

Yo tengo targeta gráfica de AMD en vez de Nvidia, en conceeto una Radeon RX 7900 GRE. Lo digo por el tema de procesamiento de IA y tal.

QuentinTarantiros

sora63 Eso o poner alguna web en inglés que lo ponga.

Aquí como instalar ComfyUI (en apenas dos minutos y medio lo explica)

Aquí se explica lo necesario para instalar los modelos de Flux (te lo dejo en el momento)...

hacendasdo funciona con amd?

Casi todo esto va con CUDA de NVidia, si tira con AMD lo desconozco.

Página siguiente »