@midjourney

KLING – Der neue Herausforderer für Sora und Veo in der Text-to-Video Welt

Die Antwort auf VEO und Sora aus China. KLING, die neueste Text-to-Video-Plattform von Kuaishou, einem Unternehmen aus Peking, das mit TikTok konkurriert, stellt alles bisher Dagewesene in den Schatten. Wir werfen einen detaillierten Blick auf die Funktionen von KLING, vergleichen sie mit anderen AI-Video-Generatoren und diskutieren die möglichen Auswirkungen auf die Zukunft der Videoproduktion.

Was ist KLING?

KLING ist ein hochmoderner AI-Video-Generator, der in der Lage ist, bis zu 120 Sekunden lange Videos in 1080p Auflösung zu erstellen – und das mit beeindruckenden 30 Frames pro Sekunde. Die Flexibilität bei den Seitenverhältnissen ist dabei ein zusätzliches Plus. Doch was KLING wirklich auszeichnet, ist die Fähigkeit seines AI-Modells, physikalische Zusammenhänge zu verstehen und komplexe Bewegungen präzise zu simulieren.

Eine interessante Tatsache ist, dass für die Erstellung eines einminütigen Clips auf der Plattform Sora acht NVIDIA A100 GPUs benötigt werden, die jeweils über 10.000 USD kosten​​​​. KLING könnte theoretisch doppelt so viel Rechenleistung benötigen, um ein zweiminütiges Video zu erzeugen.

Vergleich mit anderen Plattformen

KLING tritt in direkte Konkurrenz zu anderen AI-Video-Generatoren wie Sora und Vidu. Während Vidu bereits beeindruckende Ergebnisse liefert, setzt KLING neue Maßstäbe in Bezug auf die Qualität und Länge der generierten Videos. Hier sind einige bemerkenswerte Vergleiche:

Sora: Obwohl Sora detailreichere Subjekte und bessere Lichtverhältnisse bietet, punktet KLING mit der Fähigkeit, längere Videos zu erstellen und dabei die narrative Kohärenz zu wahren.

Vidu: KLING übertrifft Vidu durch seine fortschrittlichere AI-Physik-Engine, die realistischere und flüssigere Bewegungen ermöglicht.

Google’s Veo und andere: KLING schlägt auch Veo und weitere AI-Video-Tools wie Pika Labs, RunwayML und StableVideo in puncto Bildqualität und Bewegungsdarstellung.

Beispielvideos und Demonstrationen

Um die Leistungsfähigkeit von KLING zu demonstrieren, hier einige Beispielvideos, die die Vielfalt und Präzision der Plattform verdeutlichen:

Ein chinesischer Mann isst mit Stäbchen Nudeln: Die temporale Kohärenz in diesem Video ist bemerkenswert, was bedeutet, dass die Bewegungen des Mannes und die Veränderung des Nudelschüssels über die Zeit hinweg logisch und konsistent erscheinen.

Ein riesiger Panda spielt Gitarre am See: Die sanften Bewegungen des Pandas und die realistische Interaktion mit der Gitarre zeigen die beeindruckende Leistungsfähigkeit der AI.

Ein Mann reitet im Gobi-Wüsten-Sonnenuntergang: Eine Szene von filmischer Qualität, die beweist, dass KLING nicht nur für einfache Animationen, sondern auch für komplexe Szenarien geeignet ist.

Zukunftsaussichten und Verfügbarkeit

KLING ist derzeit als öffentliche Demo in China verfügbar und kann über die Kwaiying-App getestet werden. Obwohl es noch nicht weltweit zugänglich ist, deutet vieles darauf hin, dass eine breitere Verfügbarkeit bis Ende 2024 oder Anfang 2025 zu erwarten ist​​​​. Die Entwickler konzentrieren sich darauf, die Leistung und Fähigkeiten weiter zu verbessern, um international führend zu werden.

Die rasche Entwicklung in der AI-Video-Generationstechnologie deutet darauf hin, dass Plattformen wie KLING bald eine zentrale Rolle in der Videoproduktion spielen könnten.

Quellen

Bild von Justus Becker

Justus Becker

I have a passion for storytelling. AI enthusiast and addicted to midjourney.
Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert