Bueno, ya hice un post hablando del tema, pero me salió como una mierda: https://reflot.es/d/22330-ia-alternativa-a-sora-de-open-ai-kling-china-veo-google-xero-y-mas Así que traigo primero las noticias: La empresa Minimax , de China, ha generado un modelo de texto a video (similar a Sora) que no sólo es gratuito, si no que se puede probar online, sin registros, móbiles chinos ni mierdas. ¡Gratis! Lo podéis probar en su web: https://hailuoai.com/video Han sacado su primero model (Video-01, todo muy original) y sacarán en unos meses, si no semanas, su modelo Video-02. Tencent y Alibaba le han metido ambos pasta, así que prometen. Pongo mis pruebas en un segundo post, cuando @QuentinTarantiros me chive como subir vídeos en foro que no me entero. En general está bastante bien, aunque ya tiene competidores por delante: Kling , de la que ya hablamos, también China. Estuve mirando y hay una forma de probarla en línea sin tener que tener móbil chino y con casi todo en inglés: (Sí, tuve que meterme en Tik Tok para encontrar como se hacía, que menos que darle crédito). Ésta app en concreto te permite extender el clip hasta 10 segundos en su modo premium (Video-01 sólo puede hasta 6 segundos el clip). Enlance a Kling ( ACTUALIZADO a 1.6): https://www.klingai.com/ Y otra que he acabado de encontrar y que sí es americana es Runaway , sin embargo veo que las colas en la versión gratuita son las más comunes, y ésta está al nivel de Kling o algo más por encima: https://runwayml.com/ Enlaces de donde he sacado la información de Minimax https://www.genbeta.com/actualidad/china-quiere-convertirse-lider-ias-para-generar-video-esta-nueva-app-demuestra-puedes-usarla-gratis https://www.tomsguide.com/ai/ai-image-video/forget-sora-minimax-is-a-new-realistic-ai-video-generator-and-it-is-seriously-impressive Enlace a Cosmos, de Nvidia (gracias @QuentinTarantiros ) ACTUALIZADO : Enlace a VEO2 , la aplicación de Google (aún no disponible en España). https://deepmind.google/technologies/veo/veo-2/

Me reservo el post para añadir cosas. Kling y Runaway ya se comentaron en posts aparte, pero quería juntar un poco las opciones más fuertes del mercado para ver donde estamos. Video-01 de MiniMax Prompt: A bald black man is running from the police in the streets of Nanchang. The camera starts up in the sky showing a panoramic view and ends in a close-up of his distressed face, with police lights behind him Two people arround 20, one male and one female, eat together in a restaurant a bowl of ramen, having a romantic moment.

sora63 La empresa Minimax Ya la conocía, dejo un ejemplo de lo que se puede llegar a hacer...

QuentinTarantiros ¿Cómo subes los vídeos que subías en otros temas? ¿Qué plataforma usas? ¿O se puede desde el foro?

sora63 ¿Cómo subes los vídeos que subías en otros temas? ¿Qué plataforma usas? ¿O se puede desde el foro? Si te refieres a mis vídeos chorras simplemente utilizo Youtube... Es lo más sencillo en mi opinión.

Pues por lo pronto me convence, tiene bastante realismo, es relativamente rápida ofreciendo el resultado y además acepta idioma inglés Una cosilla que me ha hecho en un momento Pd: estaba haciendo otro pero esta vez está tardando más de la cuenta, luego lo cuelgo cuando termine

sonicsaiyan me refiero a éstos videos. Como lo subes?

yavanna si, que no vez que está respondiendo a este hilo?

sora63 el foro deja insertarlos tal cual, pillas el enlace directo del video en la propia página y lo pegas Aquí el otro video pero se le ha ido la olla, se supone que era un coche en llamas cayendo desde un puente

Post de IA generadoras de vídeos: Wan, Video-01, Veo 2, Kling...

QuentinTarantiros

sora63

QuentinTarantiros Aprovecho una polémica que vi de sora.

Un grupo de artistas enfadados ha filtrado Sora, lo último de OpenAI

https://www.merca2.es/2024/12/05/artistas-filtrado-sora-openai-2088422/

Hoy en día prácticamente todas las personas saben qué es OpenAI y por qué es tan relevante en el mundo de la tecnología actualmente. Sin embargo, no viene mal recordarlo: la compañía de Sam Altman es la mayor exponente del auge que está viviendo la inteligencia artificial (IA) en la actualidad, pues es la desarrolladora de herramientas como ChatGPT y el generador de imágenes DALL-E. Asimismo, con el fin de consolidar su poderío, durante febrero de este año OpenAI presentó a Sora, una IA capaz de crear vídeos a partir de texto.

Justamente sobre esta última herramienta hablaremos en esta ocasión, ya que, como muestra de su descontento, un grupo de artistas se ha encargado de filtrar Sora por medio de una interfaz; oportunidad que fue aprovechada por una gran cantidad de usuarios para generar diferentes vídeos por medio de ella. Básicamente, el enfado de este grupo artístico tiene que ver con la forma en la que OpenAI ha implementado este innovador programa para su gremio; situación que los ha hecho sentirse perjudicados por la compañía.

El generador de vídeo de OpenAI ha sido filtrado por un grupo de artistas

Según los reportes más recientes, hace unos días un grupo de artistas publicó un proyecto vinculado a Sora de OpenAI en Hugging Face, una plataforma de desarrollo. Cabe destacar que esta IA todavía no está disponible de forma pública, por lo que aquella interfaz publicada por esta agrupación terminó siendo una gran novedad para muchos usuarios, que aprovecharon la oportunidad para generar vídeos de 10 segundos en 1080 píxeles (p) a partir de descripciones de texto.

Luego de unas horas, la herramienta dejó de funcionar después de que, según el propio grupo, Sam Altman se encargara de suspender el acceso temprano a Sora tras tres horas de haberse filtrado. Al mismo tiempo, esta agrupación artística denuncia que OpenAI presiona a los desarrolladores iniciales para que hablen positivamente de este generador de vídeos sin compensarlos como debería, y que existen controles estrictos que obligan a que cada vídeo generado deba ser aprobado por la compañía para ser compartido públicamente por los creadores.

sonicsaiyan

QuentinTarantiros Pongo aquí los ejemplos que todos estabamos esperando

sora63

QuentinTarantiros

sonicsaiyan
Es este?

https://www.goenhance.ai/tools/hunyuan-video

QuentinTarantiros

sora63

No creo, me acabo de registrar para ver como va esa página y te deja elegir varios modelos...

La pagina oficial es China...

https://aivideo.hunyuan.tencent.com/

sonicsaiyan

Sí, se supone que ese es aunque yo había visto otro enlace

sora63

QuentinTarantiros Eso buscaba, Google no encuentra los páginas estás chinas.

Gracias, a trastear.

QuentinTarantiros

Bueno, hay nueva IA gratuita de generación de vídeo que funciona en modo local y que se une a la otra que estoy utilizando últimamente (Hunyuan).

En este caso es "Cosmos" de NVidia, y su particularidad es que a pesar de tener menos calidad que Hunyuan tiene la capacidad de hacer img2vid, vamos... Que puedes meterle una foto o imagen y la pone a moverse.

Aquí probé a meter una imagen de la serie Shogun y una foto de Sydney Sweeney...

El rayo raro es porque el prompt que metió la LLM indicaba que se transformara en algo futurista, pero como el vídeo es corto en eso se quedó 😂

La ventaja es que puedes elegir el último fotograma de un vídeo y hacerlo más largo, y repetir la operación tantas veces como quieras.

El problema es que me parece muy inestable... Dejo el último vídeo inspirado en Warhammer 40K que hice con Hunyuan, el cual con Cosmos hubiese tardado la vida porque el cabrón es una tómbola en sus resultados (la mitad de las veces te sale bien y la mitad mal) sin embargo Hunyuan suele tener una tasa más aceptable en su calidad).

Hacer un vídeo similar con Cosmos me hubiese llevado el doble de disgustos y el doble de tiempo... Hubiese sido una tortura 😂

El problema es que Hunyuan carece por completo de img2vid, así que si quieres alargar un vídeo o animar alguna imagen que ya tengas pues te tienes que joder (hay gente que trastea y hace trucos para intentarlo, pero no son reales y cambian la imagen).

Por su parte Cosmos aparte de generar vídeo a texto (como Hunyuan) tiene img2img, pero su contrapartida es que a cambio hace muchas cosas raras y no es tan bueno como Hunyuan (las manos fallan más, hace más cosas raras, es más lento, y la lía mucho más en general).

Resumiendo, si alguien quiere un modelo de imagen a vídeo en modo local Cosmos de momento es lo que hay (pero lo cierto es que hay mucho margen de mejora), para todo lo demás a nivel local Hunyuan es lo mejor que tenemos ahora mismo.

sora63

QuentinTarantiros Añadido un link de reddit con cosmos en el post inicial. Si hay alguno mejor ya me diréis.

QuentinTarantiros

Si antes lo digo antes aparece otro modelo de img2vid, aún no lo pude probar, pero dejo vídeo que acaban de estrenar porque parece prometedor...

Hagaren

sora63

Hagaren Ésta igual iría bien en el hilo de Deepseek. Que lo voy a subir por cierto.

sora63

Voy a tener que actualizar el post, molaría tener todos los text2video juntos.

Veo2, de google. Todavía no disponible en españa.

https://deepmind.google/technologies/veo/veo-2/

Kling se ha actualizado a 1.6
https://klingai.com/text-to-video/new

Al final Sora va a nacer muerto, les han adelantado todos xd.

sonicsaiyan

¿Hay alguna IA de estas que te permita generar de video a video? Por ejemplo si quisiera coger un videoclip musical y cambiar la cara del cantante original por la de otro o la de cualquier otro famoso

sora63

sonicsaiyan Hay texto a video e imagen a video, pero que yo sepa no hay video a video.

Para eso que dices creo que se están mirando algunas, me suena que Aliexpress hacía una IA con cosas parecidas, pero no que yo conozca.

QuentinTarantiros

sonicsaiyan coger un videoclip musical y cambiar la cara del cantante original por la de otro o la de cualquier otro famoso

Para el caso en concreto que pones de ejemplo yo recomiendo utilizar algo como Facefusion, es sencillo y tiene menos requisitos que la generación de vídeo completa.

sora63 que yo sepa no hay video a video.

Hunyuan permite vídeo a vídeo, y no funciona nada mal la verdad...

Tanto Facefusion como Hunyuan funcionan en modo local.

sora63

No pasan dos semanas sin un modelo más tocho que el anterior, qué puta barbaridad.

De momento estoy trasteando con lo que sale en la web y los spaces de Hugging face. Metedle caña a ver. Yo lo probaré el local el fin de semana.

sonicsaiyan

He estado viendo algunos ejemplos en la galería de la web y es sorprendente la calidad, quien iba a pensar que en tan solo un par de años ibamos a pasar de esos videos amorfos a esto

Pd: no hay forma de que se incruste, hay que clikar en el enlace para verlo

https://wan.video/wanxiang/preview?targetUrl%3Dhttps%253A%252F%252Ftongyi-wanx-international.oss-accelerate.aliyuncs.com%252Fstatic%252Frecommend%252Ftext2video_new%252F4_watermark.mp4%253FExpires%253D1743978765%2526OSSAccessKeyId%253DLTAI5tPLWJfJHNkZbfnQv245%2526Signature%253DGKdRp01voHz3IFzoguKqfrOrZGI%25253D%2526response-content-disposition%253Dattachment%26urlType%3Dvideo%26resolution%3D1280*720

https://wan.video/wanxiang/preview?targetUrl%3Dhttps%253A%252F%252Ftongyi-wanx-international.oss-accelerate.aliyuncs.com%252Fstatic%252Frecommend%252Fimg2video%252F11_watermark.mp4%253FExpires%253D1743978683%2526OSSAccessKeyId%253DLTAI5tPLWJfJHNkZbfnQv245%2526Signature%253Do3ZSqvay6sA1g5vr44W5QVWt08o%25253D%2526response-content-disposition%253Dattachment%26urlType%3Dvideo%26resolution%3D832*480

https://wan.video/wanxiang/preview?targetUrl%3Dhttps%253A%252F%252Ftongyi-wanx-international.oss-accelerate.aliyuncs.com%252Fstatic%252Frecommend%252Ftext2video_new%252F1_watermark.mp4%253FExpires%253D1743978766%2526OSSAccessKeyId%253DLTAI5tPLWJfJHNkZbfnQv245%2526Signature%253DxBva13KQcCLtTduALaIRQ%25252Fmj8vM%25253D%2526response-content-disposition%253Dattachment%26urlType%3Dvideo%26resolution%3D1280*720

https://wan.video/wanxiang/preview?targetUrl%3Dhttps%253A%252F%252Ftongyi-wanx-international.oss-accelerate.aliyuncs.com%252Fstatic%252Frecommend%252Ftext2video_new%252F20_watermark.mp4%253FExpires%253D1743978735%2526OSSAccessKeyId%253DLTAI5tPLWJfJHNkZbfnQv245%2526Signature%253DjrLvdiAFL4OepEts5JuBssmaGA8%25253D%2526response-content-disposition%253Dattachment%26urlType%3Dvideo%26resolution%3D1280*720

Deathman

sonicsaiyan

yavanna

sonicsaiyan Veo que en muy poco tiempo han pasado de aberración diabólica a dar el pego casi totalmente. Vale que son cinco segundos, pero joder....

sora63

sonicsaiyan Pd: no hay forma de que se incruste, hay que clikar en el enlace para verlo

Yo he tenido que descargarlos y subirlos a otro sitio como vimeo.

« Página anterior Página siguiente »