Laut dem Wall Street Journal spielten am 27. April in dem von Amazon produzierten biblischen Historiendrama „König von David“ echte Schauspieler gefallene Engel und sterbliche Frauen, und die umliegende Landschaft war ein KI-generiertes Meisterwerk, wie ein düsterer stahlgrauer Himmel und schroffe Bergkämme.

Abbildung 1: Der Hintergrund von „The Dynasty of David“ wird mithilfe von KI generiert

In der ersten Staffel der Serie gab es 850 visuelle Effektaufnahmen, von denen 73 mit generativer KI erstellt wurden, darunter einem von der chinesischen Videoseite Kuaishou entwickelten Tool. Wonder Project, der Produzent der Show, sagte, dies erspare die Kosten für teure Dreharbeiten vor Ort.

Von Hollywood-Blockbustern bis hin zu Kurzvideos für soziale Medien greifen Videokünstler zunehmend auf KI zurück, um Inhalte zu produzieren, für die früher große Videofilmerteams erforderlich waren.

„Da die Produktionskosten sinken, sinkt auch die Hemmschwelle für Entwickler, neue Ideen zu experimentieren und zu testen“, sagte Zeng Yushen, Betriebsleiter beim großen Modell Keling AI von Kuaishou Video. Das vom Unternehmen entwickelte KI-Modell kam bei der Produktion von „King of David“ zum Einsatz.

Chinas Video-Big-Model weist den Weg

Auch wenn es den meisten Amerikanern vielleicht nicht bewusst ist, wenn sie fernsehen oder auf ihren Handys durch Videos scrollen, spielt China in diesem Bereich eine wichtige Rolle. Chinesische Unternehmen stellen sieben der zehn besten Videogenerierungsmodelle der Bewertungsplattform Artificial Analysis, die mit Konkurrenten wie Google und Elon Musks xAI konkurrieren.

In diesem Monat ging ein Videogenerierungsmodell namens „HappyHorse“ viral, nachdem es sich in einer blinden Qualitätsbewertung gegen US-Konkurrenten durchgesetzt hatte. Später enthüllte der chinesische E-Commerce-Riese Alibaba, dass es sich bei dem Modell um ein eigenes Modell handelte.

Abbildung 2: Auf China entfallen sieben der zehn besten Videomodels

Anfang des Jahres brachte Bytedance seinen neuesten KI-Videogenerator, Seedance 2.0, auf den Markt, der ebenfalls viel Aufmerksamkeit erregte. Es kann Textansagen in realistische Kurzfilmszenen umwandeln. TikTok von ByteDance konkurriert mit Kuaishou, das in China Hunderte Millionen Nutzer hat.

Tilly Zhang, Technologieanalystin beim Forschungsunternehmen Gavekal, sagte, diese Plattformen „verfügen natürlich über riesige Mengen an gekennzeichneten kurzen Videodaten, die für das Modelltraining verwendet werden können. Dadurch entsteht eine Datenbarriere, die für die meisten Unternehmen schwer zu reproduzieren ist.“

Herausforderungen für Videomodelle

OpenAI hat kürzlich beschlossen, seinen Sora-Videogenerierungsdienst einzustellen und seine Partnerschaft mit Disney zu beenden. Andere US-Unternehmen wie Google investieren weiterhin aktiv in diesen Bereich.

Die Schließung von Sora verdeutlicht die technischen und rechtlichen Herausforderungen, vor denen KI-Video steht. Das Generieren eines Videos kann hundertmal mehr Rechenleistung erfordern als das Erstellen einer Textantwort durch eine Chatbot-Anwendung. OpenAI hofft, Investitionen in Randprojekte, die zu viel Rechenleistung verbrauchen, zu vermeiden und sich auf Produkte mit höheren Gewinnmargen zu konzentrieren.

Auch Urheberrechtsprobleme plagen die Branche. ByteDance hat die Veröffentlichung seines Seedance-Updates in den USA nach dem Widerstand Hollywoods verschoben. Auch in China haben einige bekannte Schauspieler kürzlich öffentlich die unbefugte Verwendung ihrer Konterfeis in KI-generierten Videos verurteilt.

Abbildung 3: OpenAI fährt Sora herunter

Die chinesische Videoplattform iQiyi war kürzlich in Kontroversen verwickelt. Als CEO Gong Yu ein KI-Projekt vorstellte, das eine Bibliothek zur Lizenzierung von Porträts von Prominenten umfasst, sagte er: „Fotografieren mit echten Schauspielern könnte bald der Vergangenheit angehören.“ Sobald diese Aussage herauskam, meldeten sich schnell viele bekannte Schauspieler zu Wort und erklärten, dass sie nichts mit dem Projekt zu tun hätten.

Dennoch werden KI-Videos zunehmend in das tägliche Online-Leben der Menschen integriert, insbesondere in China, aber auch in den Vereinigten Staaten, wo sich die beiden Supermächte gegenseitig beeinflussen. Anfang des Jahres löste eine Reihe absurder kurzer KI-Parodien von Kampfkunstfilmen Milliarden von Aufrufen in den chinesischen sozialen Medien aus und inspirierte eine große Anzahl von Fans, ähnliche Videos zu erstellen. Die Originalvideos wurden von einem chinesischen Lebensmittelunternehmen produziert, das die KI-Tools von ByteDance nutzte, um für sein geschmortes Entenprodukt zu werben.

Einige chinesische Videomodellierungs-Startups investieren in „Weltmodelle“, die die physische Welt simulieren sollen. Einige Forscher sagen, dass humanoide Roboter, die mit hervorragenden Weltmodellen ausgestattet sind, Verhaltensweisen zeigen können, die denen des Menschen ähneln.

Unabhängig davon, ob es sich um ein Weltmodell oder eine KI-Videogenerierung handelt, ist es notwendig, die grundlegenden mathematischen und physikalischen Gesetze der Objektbewegung in der realen Welt zu beherrschen. Viele von Alibaba investierte Unternehmen wie Aishi Technology und Shengshu Technology schreiten gleichzeitig in diese beiden technischen Richtungen voran.

Kurzspiel-KI

Die schnell wachsende Kurzfilmbranche hat sich zu einem frühen Anwender der KI-Videogenerierungstechnologie entwickelt. Diese Serien, die sich um Liebesromane oder Familienfehden drehen, dauern jeweils nur wenige Minuten und sind so konzipiert, dass sie die Zuschauer vor dem Bildschirm fesseln. Aufgrund des engen Tempos und der häufigen Handlungsumkehr reagieren die Zuschauer beim Betrachten dieser Art von Inhalten auf kleinen Bildschirmen oft weniger empfindlich auf visuelle Mängel.

Diese Art von Inhalten hat in China explosionsartig zugenommen, und Miniserien werden in E-Commerce-Websites und Lebensmittelliefer-Apps integriert, um um die Aufmerksamkeit der Verbraucher zu konkurrieren. In jüngster Zeit hat sich dieses Modell nach und nach auch in den USA etabliert. Plattformen wie ReelShort und DramaBox, die von chinesischen Gründern entwickelt wurden, haben dem amerikanischen Publikum Einnahmen in zweistelliger Millionenhöhe beschert.

In einem Studio in der ostchinesischen Stadt Hangzhou leitet Shao Zhikun ein 60-köpfiges KI-Kurzdrama-Produktionsteam. Er sagte, ihr Arbeitsablauf habe sich eher wie ein Lottospiel angefühlt als wie das Drehen eines Films.

Um eine brauchbare Szene zu erstellen, muss das Team von Shao Zhikun wiederholt Aufforderungswörter in das KI-Modell eingeben, was viel Zeit und Rechenleistung kostet. Gelegentlich, sagt er, seien die erfolgreich produzierten Clips von ausreichender Qualität, um als Grundlage für weitere Verbesserungen zu dienen. Das Team fand außerdem heraus, wie man Geld sparen kann, indem man zunächst günstigere statische Bilder erstellt und diese Bilder dann als Leitfaden verwendet, um das Modell bei der Erstellung von Videos zu unterstützen und so Kosten zu sparen.

Das Team von Shao Zhikun nutzt die Tools von Bytedance, um jeden Monat 100 Kurzdramen für Plattformen wie Bytedances Hongguo Short Drama und ReelShort zu produzieren. Shao Zhikun sagte, dass die Produktionskosten zwischen einigen hundert und mehr als 10.000 US-Dollar liegen, was nur einen kleinen Teil des traditionellen Budgets ausmache.

Der 29-jährige Teamleiter sagte: „Die Logik hier ist eine andere. Wir versuchen nicht, künstlerische Meisterwerke zu schaffen. Solange ein oder zwei Dramen zu Hits werden, können die Kosten amortisiert werden.“

Ähnlich wie Videospiele versuchen Miniserien, Zuschauer mit kostenlosen Episoden oder Trailern anzulocken und sie dann zu bezahlen oder Werbung anzusehen, um weitere Inhalte freizuschalten. Sie können auch Werbeunterbrechungen innerhalb der Show beinhalten.

Zeng Yushen, Betriebsleiter bei Kuaishou Keling AI, sagte, dass die Nachfrage aus der Unterhaltungsindustrie auch außerhalb Chinas wachse. Miracle Pictures, der Produzent der „King of David“-Serie, gab bekannt, dass in der zweiten Staffel die Anzahl der mit generativen KI-Tools produzierten Aufnahmen mehr als viermal so hoch war wie in der ersten Staffel.

Zeng Yushen sagte, dass 70 % des Umsatzes von Keling außerhalb Chinas erwirtschaftet werden und die Vereinigten Staaten sein Hauptmarkt seien. Kuaishou sagte, dass es in diesem Jahr Investitionsausgaben in Höhe von rund 3,8 Milliarden US-Dollar plant, hauptsächlich um Kelings wachsenden Bedarf an Rechenleistung zu decken.

„Ich gehe davon aus, dass KI-Videos in den nächsten ein bis zwei Jahren ein Niveau erreichen werden, bei dem es für Menschen wirklich schwierig wird, den Unterschied zwischen Authentizität und Fälschung zu erkennen“, sagte Zeng Yushen. „Diese Technologie wird zu einer tragenden Säule der Film- und Unterhaltungsindustrie werden.“