La respuesta china a VEO y Sora. KLING, la última plataforma de conversión de texto en vídeo de Kuaishou, una empresa de Pekín que compite con TikTok, eclipsa todo lo anterior. Analizamos en profundidad las características de KLING, lo comparamos con otros generadores de vídeo por IA y debatimos su posible impacto en el futuro de la producción de vídeo.
¿Qué es KLING?
KLING es un generador de vídeo AI de última generación capaz de crear vídeos de hasta 120 segundos de duración en resolución 1080p, a unos impresionantes 30 fotogramas por segundo. La flexibilidad de las relaciones de aspecto es una ventaja añadida. Pero lo que realmente distingue a KLING es la capacidad de su modelo de IA para comprender las relaciones físicas y simular con precisión movimientos complejos.
Un dato interesante es que para crear un clip de un minuto en la plataforma Sora se necesitan ocho GPU NVIDIA A100, cada una de las cuales cuesta más de 10.000 dólares. En teoría, KLING podría necesitar el doble de potencia de cálculo para crear un vídeo de dos minutos.
Comparación con otras plataformas
KLING compite directamente con otros generadores de vídeo por IA, como Sora y Vidu. Mientras que Vidu ya ofrece resultados impresionantes, KLING establece nuevos estándares en términos de calidad y duración de los vídeos generados. He aquí algunas comparaciones notables:
Sora: Aunque Sora ofrece sujetos más detallados y mejores condiciones de iluminación, KLING destaca por su capacidad para crear vídeos más largos manteniendo la coherencia narrativa.
Vidu: KLING supera a Vidu con su motor de física de IA más avanzado, que permite movimientos más realistas y fluidos.
Veo de Google y otros: KLING también supera a Veo y a otras herramientas de vídeo de IA como Pika Labs, RunwayML y StableVideo en términos de calidad de imagen y visualización de movimiento.
Ejemplos de vídeos y demostraciones
Para demostrar las capacidades de KLING, he aquí algunos vídeos de muestra que ilustran la diversidad y precisión de la plataforma:
Un chino come fideos con palillos: La coherencia temporal de este vídeo es notable, lo que significa que los movimientos del hombre y el cambio en el cuenco de fideos parecen lógicos y coherentes a lo largo del tiempo.
A Chinese man sits at a table and eats noodles with chopsticks pic.twitter.com/VnSKgwrtyx
— 青龍聖者 (@bdsqlsz) June 6, 2024
Un panda gigante toca la guitarra junto al lago: los suaves movimientos del panda y su interacción realista con la guitarra demuestran las impresionantes capacidades de la IA.
Panda playing the guitar pic.twitter.com/JLwntfzZea
— 青龍聖者 (@bdsqlsz) June 6, 2024
Un hombre cabalga en el atardecer del desierto de Gobi: una escena de calidad cinematográfica que demuestra que KLING no sólo sirve para animaciones sencillas, sino también para escenarios complejos.
A man riding a horse through the Gobi Desert with a beautiful sunset behind him, movie quality. pic.twitter.com/svdmPIIRMu
— 青龍聖者 (@bdsqlsz) June 6, 2024
Perspectivas de futuro y disponibilidad
KLING está disponible actualmente como demo pública en China y puede probarse a través de la app Kwaiying. Aunque todavía no es accesible en todo el mundo, todo indica que su disponibilidad generalizada está prevista para finales de 2024 o principios de 2025. Los desarrolladores se están centrando en seguir mejorando el rendimiento y las capacidades para convertirse en un líder internacional.
El rápido desarrollo de la tecnología de generación de vídeo por IA indica que plataformas como KLING podrían desempeñar pronto un papel central en la producción de vídeo.