Heute hat Volcano Engine auf der FORCE Power Conference offiziell das Sitzsackmodell 1.8 und das Audio- und Videoerstellungsmodell Seedance 1.5 Pro vorgestellt. Maßgebliche Bewertungsdaten zeigen, dass Doubao Big Model in Bezug auf multimodales Verständnis, Generierungsfähigkeiten und Agentenfähigkeiten weltweit an erster Stelle steht.
Laut Tan Dai, Präsident von Volcano Engine, hat die durchschnittliche tägliche Token-Nutzung des Doubao Big Model im Dezember dieses Jahres 50 Billionen überschritten, was einem Anstieg um mehr als das Zehnfache im Vergleich zum Vorjahreszeitraum entspricht; Derzeit haben mehr als 100 Firmenkunden eine Token-Nutzung von mehr als 1 Billion.
Als neuestes Flaggschiffmodell der Doubao-Familie wurde das Doubao-Großmodell 1.8 (Doubao-Seed-1.8) für multimodale Agentenszenarien optimiert. Die Fähigkeit zum Aufrufen von Werkzeugen, die Fähigkeit zur Befolgung komplexer Anweisungen und die Fähigkeit zum Betriebssystemagenten wurden alle verbessert, wodurch die Planungs- und Ausführungsebene des Modells bei der Bewältigung komplexer Aufgaben verbessert wurde.
Was das visuelle Verständnis betrifft, hat sich die Anzahl der einzelnen Videoverständnisbilder von Doubao 1.8 von 640 Bildern auf 1280 Bilder verdoppelt. Das Modell unterstützt das Verständnis sehr langer Videos bei niedrigen Bildraten und kann Tools aufrufen, um wichtige Segmente bei hohen Bildraten zu verstehen. Diese Funktion kann in großem Umfang in der Online-Schulung, bei der Produktqualitätsprüfung und anderen Szenarien eingesetzt werden.
Als Reaktion auf die wachsende Nachfrage nach Videoerstellung hat Volcano Engine das Audio- und Videoerstellungsmodell Seedance 1.5 Pro auf den Markt gebracht. Dieses Modell verfügt nicht nur über eine erzählerische Spannung auf Film- und Fernsehniveau, kann Bewegungsdetails präzise erfassen und die Emotionen der Charaktere feinfühlig darstellen, sondern hat auch bahnbrechende Fortschritte in der Audio- und Videosynchronisationstechnologie erzielt.
Seedance 1.5 Pro nutzt eine innovative native Audio- und Video-Joint-Generation-Architektur, unterstützt Umgebungsgeräusche, Hintergrundmusik, Gesang und andere Elemente und erreicht eine synchrone Ausgabe von Audio und Video im Millisekundenbereich. Im Hinblick auf die Dialogverarbeitung unterstützt das Modell Dialoge mit mehreren Personen und mehreren Sprachen mit präziser Mundausrichtung und deckt chinesische Dialekte (wie Sichuan-Dialekt, Kantonesisch usw.), Englisch und Minderheitensprachen ab, was den Realismus und das globale Erstellungspotenzial von Videoinhalten erheblich verbessert.
Um die Erstellungsschwelle und die Kosten weiter zu senken, wird die Seedance-Serie in Kürze die Funktion „Musterentwurf“ einführen. Urheber können zunächst ein Beispiel mit niedriger Auflösung für die Vorschau erstellen, und seine Schlüsselelemente stimmen in hohem Maße mit dem endgültigen Film überein, es ist wirklich „Vorschau ist das, was man bekommt“. Daten zeigen, dass diese Funktion den Erstellern dabei helfen kann, die Gesamteffizienz um 65 % zu verbessern und ineffektive Erstellungskosten um 60 % zu senken.
Derzeit können einzelne Benutzer das Modell auf Doubao, Jimeng AI und anderen Plattformen erleben; Unternehmensbenutzer können ab dem 23. Dezember über die Volcano Engine API auf den Seedance 1.5 Pro-Modelldienst zugreifen.
Tan Dai wies darauf hin, dass die traditionelle IT-Architektur den Anforderungen des Agentenzeitalters nicht mehr gerecht werden kann. Die modellzentrierte cloudnative KI-Architektur nimmt Gestalt an und wird rund um die Entwicklung und den Betrieb von Agenten neu aufgebaut.
Auf der Ebene der Agentenentwicklung hat Volcano Engine die KI-Agentenplattform AgentKit auf Unternehmensebene umfassend aktualisiert. Die Plattform deckt den gesamten Lebenszyklus des Agenten ab, von der Entwicklung über die Bereitstellung bis hin zur Verwaltung und Kontrolle, und zielt darauf ab, die zentralen Herausforderungen zu lösen, mit denen Unternehmen bei der Implementierung des Agenten konfrontiert sind, wie z. B. Identitätsrechteverwaltung, Modellsicherheit und Systemintegration.
Um die Schwelle für den Einsatz in Unternehmen zu senken, hat Volcano Engine außerdem den branchenweit ersten „KI-Sparplan“ eingeführt. Dieser Plan deckt alle Produkte großer Modelle ab, die eine nutzungsbasierte Preisgestaltung erfordern, und hilft Unternehmen, durch gestaffelte Rabatte bis zu 47 % der Kosten zu sparen.
