Am 18. Mai berichtete die Financial Times, dass chinesische KI-Unternehmen die amerikanischen Konkurrenten im Bereich der Videogenerierung angeführt haben. Als wichtiges Schlachtfeld für generative KIDie Videogenerierungstechnologie erfreut sich in den Bereichen Werbung, E-Commerce und Unterhaltung zunehmender Beliebtheit.Derzeit trainieren Unternehmen wie ByteDance und Kuaishou ihre Systeme mithilfe riesiger Bibliotheken mit kurzen Videos, was ihnen einen Vorteil gegenüber ihren US-Pendants verschafft.

KI-Tools zur Videogenerierung sind weit verbreitet
Diese Änderung markiert eine Divergenz im KI-Wettlauf: Obwohl OpenAI, Google und Anthropic immer noch in Bereichen wie großen Sprachmodellen und Programmierung dominieren, hinken ihre Tools zur Videogenerierung laut Entwickler-Feedback und mehreren Bewertungsrankings hinsichtlich Qualität und Benutzerfreundlichkeit hinter den Produkten chinesischer Unternehmen zurück.
Vorteile chinesischer Unternehmen
„Die meisten amerikanischen Modelle, die wir ausprobiert haben, waren nicht sehr gut in der Videogenerierung“, sagte Ben Chiang, Gründer des KI-Startups Director AI. Das Unternehmen produziert KI-generierte Inhalte wie Animationen und Kurzdramen. Er glaubt, dass eine komplexere und langwierigere Moderation von Inhalten die Entwicklung amerikanischer Tools eingeschränkt hat und die erzielten Effekte oft nicht realistisch genug sind.
Director AI verwendet hauptsächlich das von Kuaishou entwickelte Videogenerierungstool „Keling“. Außerdem wird je nach Aufgabenstellung und Kostenvorgaben zwischen ByteDances Seedance 2.0 und dem „Conch“-Tool des Startups MiniMax gewechselt.
„Letztendlich kommt es immer noch auf die Qualität der Generierung und die Fähigkeit des Modells an, prompte Wörter zu verstehen und umzusetzen.“ sagte Ben Jiang. Er fügte hinzu, dass die jüngsten technologischen Fortschritte die Verwendung dieser Tools reibungsloser gemacht haben, insbesondere im Hinblick auf die audiovisuelle Synchronisierung und die Sprachstabilität.
Für Kreative verändern diese Verbesserungen bereits ihre Produktionsprozesse. George Won, ein unabhängiger KI-Filmemacher und Redakteur mit Sitz in Tiflis, Georgien, sagte:„Seedance 2.0 hat meine kreative Freiheit enorm erweitert.“
„Es ist in der Lage, aggressive Kamerawinkel und schnelle Bewegungen zu bewältigen, ohne die Gesichtszüge der Figur zu verlieren oder den Lichtkontrast zu zerstören. Die meisten KI-Modelle leiden unter Bildschirmverwacklungen oder Motivverschiebungen, wenn sie sich schnell bewegen“, sagte er.
Hohe Bewertung
Keling, Seedance 2.0 und Alibaba HappyHorse 1.0 erhielten alle hohe Punktzahlen in der Rangliste der besten Videomodelle der Arena-Plattform. Das Ranking wird auf Basis der Abstimmungsdaten unabhängiger Plattformnutzer erstellt. Im Vergleich zu den meisten Modell-Benchmark-Testsystemen gilt diese Art der Bewertung als zuverlässiger, da große KI-Labore häufig für Benchmark-Tests optimieren, was zu Ergebnissen führt, die die Leistung des Modells in realen Szenarien möglicherweise nicht genau widerspiegeln.
Auch das Veo-3-Modell von Google ist durchaus konkurrenzfähig. Experten sagten, dass der Vorteil dieses Modells darin besteht, dass Videomaterial auf der YouTube-Plattform abgerufen werden kann, es aber gleichzeitig mehr Inhaltssicherheitsschutz und Nutzungsbeschränkungen für Entwickler vorsieht.

Chinas Tool zur Videogenerierung schneidet am besten ab
Hinter diesem Fortschritt steht die Kontrolle riesiger Mengen proprietärer Videodaten. ByteDance und Kuaishou betreiben die weltweit führenden Kurzvideoplattformen, was ihnen Trainingsvorteile verschafft, die für Wettbewerber nur schwer zu reproduzieren sind, insbesondere da Videoinhalte nicht so einfach in großem Maßstab wie Text gecrawlt werden können.
Letzte Woche gab Kuaishou bekannt, dass es die Möglichkeit einer Ausgliederung seines KeLing-Geschäfts prüft und möglicherweise eine unabhängige Börsennotierung anstrebt, um die Chancen zu nutzen, die sich aus dem schnellen Wachstum seines KI-Videogeschäfts ergeben.
Die Verwendung solcher Materialien hat auch externe Prüfungen auf sich gezogen. ByteDance sah sich zuvor rechtlichen Drohungen wegen angeblicher Urheberrechtsverletzungen ausgesetzt und beschuldigte das Unternehmen, Benutzern ohne entsprechende Genehmigung die Erstellung von Videos mit Charakteren, darunter Charakteren aus Marvel-Filmen und der Fernsehserie „South Park“, zu erlauben.ByteDance hat sich verpflichtet, die Maßnahmen zum Schutz des Urheberrechts zu stärken.
Viele Entwickler und Inhaltsersteller sagten, dass die lockeren Inhaltsbeschränkungen das chinesische Modell für die tatsächliche Nutzung praktischer machen. Ben Jiang sagte:US-Tools „melden weiterhin Fehler“, werde aber die konkreten Gründe nicht näher erläutern.
Hohe Kostenleistung
Für einzelne YouTuber sind chinesische Plattformen oft günstiger und flexibler als westliche Alternativen. Sie bieten Abonnement- oder Pay-as-you-go-Modelle an, sodass Benutzer schnell eine Vielzahl kreativer Experimente durchführen können. Allerdings kam es seit Februar dieses Jahres aufgrund der starken Nachfrage nach Seedance 2.0 bei einigen Nutzern zu einer eingeschränkten Nutzung und langen Wartezeiten.
Für Unternehmenskunden hat ByteDance eine andere Strategie verfolgt. Laut mit der Angelegenheit vertrauten Personen verlangt ByteDance für einige US-Kunden eine hohe Vorauszahlung, und Kunden müssen etwa 2 Millionen US-Dollar bezahlen, um Modellzugang und Kontingentzuteilung zu erhalten. ByteDance antwortete nicht auf eine Anfrage nach einem Kommentar.
Einige Benutzer umgehen diese Barrieren durch Plattformen von Drittanbietern wie BeHooked. Solche Plattformen verpacken diese Modelle neu und bieten unterschiedliche Preispläne an.
Für die Generierung von Video sind weitaus mehr Token erforderlich als für Text oder Audio, sodass eine groß angelegte Bereitstellung äußerst kostspielig ist. Im März dieses Jahres stellte OpenAI die Bereitstellung seines Sora-Videogenerierungsmodells teilweise aufgrund der hohen Kosten für Rechenleistung ein.
Für diejenigen Unternehmen, die auf dieser Technologie basierende Geschäfte aufbauen, eröffnen die jüngsten Sprünge in der Produktionsqualität Geschäftsmöglichkeiten.
„In der Vergangenheit waren die generierten Videos peinlich und starr und entsprachen nicht den Standards der Marke. Jetzt sind wir an einem Punkt angelangt, an dem es schwierig ist zu sagen, ob sie von KI generiert oder von einer echten Person gedreht wurden.“ sagte Vincent Yang, CEO von Fireworks, einem Unternehmen, das Videoinfrastruktur für E-Commerce-Websites bereitstellt.
Er sagte:Die Technologie verändert bereits die Werbebranche und ermöglicht es Marken, Videoinhalte in einem beispiellosen Ausmaß zu generieren.
„Ein Einzelhändler hat uns einmal gebeten, 100.000 Videos für seine Produktseiten zu erstellen“, sagte er. „Ohne KI wären die Kosten unerschwinglich hoch. Jetzt kann jedes Produkt sein eigenes Video haben und es können sogar mehrere angepasste Versionen für verschiedene Kunden generiert werden.“