Laut dem offiziellen Weibo von Bytedance Seed hat das Bytedance Seed-Team offiziell eine neue Generation des Bilderstellungsmodells Seedream 4.0 veröffentlicht. Berichten zufolge verwendet Seedream 4.0 dieselbe Architektur, um grafische und allgemeine Bearbeitungsfunktionen zu implementieren und dabei gesunden Menschenverstand und Argumentationsfunktionen zu integrieren. Im Vergleich zu den Vorgängermodellen Seedream 3.0 und SeedEdit 3.0 hat Seedream 4.0 bedeutende Durchbrüche bei multimodalen Effekten, Geschwindigkeit und Benutzerfreundlichkeit erzielt:


Multimodale Gameplay-Erweiterung: Unterstützt flexibel die kombinierte Eingabe von Text und Bildern und ermöglicht kreative Modi wie textbasierte Bilder, bildbasierte Bilder, Bildbearbeitung, Bearbeitung mehrerer Bilder und Generierung von Gruppenbildern. Das Gameplay ist kreativ und abwechslungsreich.

Verbesserte stilisierte Ästhetik: Unterstützt ein hohes Maß an Freiheit bei der künstlerischen Stilmigration, von Barock bis Cyberpunk, die Stile ändern sich ständig und können kombiniert werden, um neue Stile mit herausragender Ästhetik zu schaffen.

Verbessertes logisches Verständnis: In Kombination mit Weltwissen verbessert es das Verständnis multimodaler Eingaben. Es kann zuerst „zeichnen“ und „denken“, zeigt Argumentations- und Generierungsfähigkeiten bei Aufgaben, die physische und zeitliche Einschränkungen erfordern, löst Rätsel und Kreuzworträtsel und schreibt weiterhin Comics.

Adaptive und 4K-Generierung: Das Bild mit den besten Proportionen kann gemäß Anweisungen oder Referenzbildern generiert werden und unterstützt auch benutzerdefinierte Größen. Die maximale Auflösung reicht von 2K bis 4K Ultra HD.

Sprung in der Inferenzgeschwindigkeit: Durch ein neues und effizientes Architekturdesign und eine extreme Destillationsbeschleunigung ist die Inferenzgeschwindigkeit der von DiT generierten Diagramme mehr als zehnmal höher als die von Seedream 3.0.

Laut dem offiziellen Weibo ist Seedream 4.0 nicht nur ein Bildgenerierungsmodell, sondern auch eine vollständige multimodale Kreativ-Engine. Basierend auf den neuesten Funktionen von Seedream 4.0 werden acht grundlegende Spielmethoden des Modells vorgeschlagen. Neben der allgemeinen Bildgenerierung und -bearbeitung wird auch das Potenzial des Modells bei der Derivaterstellung, Inferenzgenerierung und professionellen Anwendungen untersucht.