Ein kurzes Video mit dem Titel „Neujahrsgrüße von Chefs aus Übersee“ hat im Internet große Aufmerksamkeit erregt. In diesem Video senden Elon Musk, Bill Gates, Taylor Swift und andere international bekannte Persönlichkeiten in fließendem Chinesisch Neujahrsgrüße für 2024 an das weltweite Publikum. Dieser Erfolg wurde nicht durch konventionelles Schießen erreicht, sondern durch den Einsatz fortschrittlicher KI-Generierungstechnologie. Dies demonstriert nicht nur die leistungsstarken Fähigkeiten künstlicher Intelligenz bei der Sprachübersetzung und Videoproduktion, sondern markiert auch einen Durchbruch für Chinas KI-Technologie in praktischen Anwendungsszenarien.
Chinesischer Segen von ausländischen Chefs (Quelle: Phoenix Technology)
Die KI passt sich automatisch an Mundform und Akzent an, und die magisch veränderten Videos der Internetnutzer durchbrechen den Kreis
Dieses beliebte Kurzvideo wurde durch Silicon Language-Übersetzung erstellt und wird derzeit im WeChat-Applet einem Graustufentest unterzogen. Sie müssen nur das Video hochladen, die Sprache auswählen und einige Minuten warten, um es in der Vorschau anzuzeigen und herunterzuladen. Nachdem er es erlebt hat, ist der Autor der Meinung, dass die Anwendung einfach zu bedienen ist und eine niedrige Nutzungsschwelle aufweist. Es kann die Sprache der Charaktere im Video übersetzen und gleichzeitig eine präzise Lippensynchronisation erreichen, und auch die gesamte Klangfarbe und Textur werden vollständig automatisch angepasst.
Der Hersteller, der dieses Miniprogramm ins Leben gerufen hat, sind keine „großen Hersteller“ wie Tencent und Alibaba, sondern Silicon-based Intelligence, ein KI-Hersteller, der sich auf die digitale menschliche Spur konzentriert. Nach offiziellen Angaben von Silicon Intelligence wurde „Silicon Language Translator“ am 27. Dezember gestartet, und eine Person aus dem Umfeld von Silicon Intelligence gab außerdem bekannt, dass das Miniprogramm am ersten Tag seiner Einführung mehr als 100.000 Benutzer hatte.
Die App ist einfach, klar und leicht zu bedienen und Sprache, Mundform, Akzent und Gesichtsausdruck sind nahtlos auf den übersetzten Film abgestimmt. Die Kreativität und Fantasie, die durch die verrückten Aktivitäten der Internetnutzer hervorgerufen wurden, haben auch eine Reihe magischer Werke hervorgebracht. Giao Ge und Guo Degang, die über die Lebensphilosophie auf Englisch sprechen, bringen Ihnen bei, wie man Englisch durch traditionelle Stand-up-Comedy lernt. Es war auch dieses kleine Programm, das es Musk ermöglichte, sein Chinesisch unter Beweis zu stellen, und David Beckham, Neujahrsgrüße auf Chinesisch zu versenden. Dies sorgte dafür, dass eine Reihe von Begrüßungsvideos zum chinesischen Neujahr von großen Jungs viral gingen.
Grenzüberschreitende E-Commerce-Werbung in drei Fremdsprachen durch die obligatorische Vermieterin – Quelle: Chinagoods
Der Fall des Turmbaus zu Babel und die Kommerzialisierung der KI
Im vergangenen Jahr 2023 wurden in China mehr als 200 große KI-Modelle hergestellt, die in verschiedenen Branchen eingesetzt werden, darunter intelligente Bildgenerierung, Textgenerierung, Sprachsynthese, Videogenerierung, unterstützte Live-Übertragungen usw. Verschiedene Anwendungen entstehen in einem endlosen Strom, und obwohl jede Anwendung populär und aus dem Kreis geraten ist, haben wir tatsächlich immer noch viele kommerzielle Mythen über KI und müssen mehr über die Möglichkeiten von KI in kommerziellen Anwendungsszenarien nachdenken. Allerdings reicht ein kurzfristiger Unterhaltungsboom allein nicht aus, um einem Unternehmen langfristigen gesellschaftlichen Wert zu verschaffen, und es ist für ein Unternehmen schwierig, mit kommerzieller Logik lange zu überleben.
Es gibt immer noch viele „Pain Points“ und „Ititch Points“ für diese Art von KI-Produkten: Beispielsweise erfordert das bekannte Stabilitätsproblem von Netzwerkverbindungen, dass mehr inländische KI-Hersteller Produkte mit höheren technischen Fähigkeiten anbieten; Und für Benutzer ist die Benutzerfreundlichkeit immer eine unüberwindbare Hürde. Egal wie einfach die Eingabeaufforderungen zu verwenden sind, die Demokratisierung von Anwendungen wird vor Herausforderungen stehen. Optimistisch gesehen besteht in der Zukunft einer schnellen technologischen Expansion, insbesondere im Zusammenhang mit Chinas Bemühungen, seine Bemühungen in der Industrie der künstlichen Intelligenz zu verstärken, eine hohe Wahrscheinlichkeit, dass diese Probleme gelöst werden.
Nachdem ich Silicon Language Translation, ein inländisches kleines Programm, ausprobiert habe, kann ich sehen, dass sich ein benutzerfreundliches, effizientes und professionelles Geschäftsszenario entwickelt hat. Wie in der Selbstvorstellung von Silicon Language Translation dargelegt, müssen sich Entwickler mit Hilfe von KI nur auf die Kreativität selbst konzentrieren, ihre Leidenschaft bewahren, Kosten senken und die Effizienz verbessern sowie mehr Videoinhalte produzieren, die der Welt dienen.
Silicon Language Translation nutzt Genauigkeit und lippensynchrone Matching-Technologie, um schnell kurze Marketingvideos für Übersee zu erstellen und so Praktikern dabei zu helfen, effizienter mit globalen Kunden zu kommunizieren und die Umsetzung kommerzieller Projekte zu fördern. Das Aufnehmen von Werbeanzeigen erfordert keine mehrsprachige Übersetzung, die Modelle entsprechen direkt den erforderlichen Landessprachen und es werden schnell verschiedene Versionen von Werbearbeiten erstellt, was viel Produktionskosten und Zeit spart; Self-Media-Blogger können ganz einfach die Zielsprache des Videos auswählen, wodurch fremdsprachige Film- und Fernsehinhalte mit einem Klick übersetzt werden und der Erstellungsprozess vereinfacht wird.“
Gleichzeitig hat Silicon-based Intelligence für Berufsgruppen und Vielnutzer auch anylang.ai für den PC-Einsatz eingeführt. Im Gegensatz zur Silicon Language-Übersetzungs-App, die leichter ist und einen niedrigeren Schwellenwert hat, hat Silicon-based Intelligence anylang.ai umfangreichere und leistungsfähigere Funktionen verliehen, darunter schnelles Klonen digitaler Personen, genaue Bearbeitung von Inhalten, Unterstützung für 27 Sprachen usw. In bestimmten Szenarien wie Unternehmen, die ins Ausland gehen, grenzüberschreitendem E-Commerce, internationaler Werbung, globaler Werbung und Videoerstellung, machen diese speziellen Funktionen die Effizienz, Genauigkeit und Bequemlichkeit der KI anschaulicher.
In der Bibelgeschichte schlossen sich Menschen zusammen, um den „Turm zu Babel“ zu bauen, der in den Himmel führte, aber Gott ließ die Menschen verschiedene Sprachen sprechen, konnte nicht miteinander kommunizieren und zerstreute sich. Doch mit dem Segen der KI stürzt der „Turm zu Babel“ nun still und leise ein. Die KI-Übersetzung scheint ein richtiger Weg zur Erschließung künstlicher Intelligenz geworden zu sein und ein konkretes Szenario für die schnelle kommerzielle Anwendung künstlicher Intelligenz zu schaffen.