Diese Woche hat AICopilot im Microsoft Edge-Browser eine Funktion hinzugefügt, die Videotextzusammenfassungen generiert. Doch wie Mikhail Parakhin, CEO von Microsoft Advertising and Network Services, erklärte, sind die zeitsparenden Funktionen von EdgeCopilot noch recht begrenzt und funktionieren nur mit vorverarbeiteten Videos oder Videos mit Untertiteln.
„Damit das funktioniert, müssen wir das Video vorverarbeiten. Wenn das Video Untertitel hat, können wir es jederzeit wiederherstellen; wenn es keine Untertitel gibt und wir es nicht vorverarbeitet haben, dann wird es nicht funktionieren“, schrieb Parakhin.
Mit anderen Worten, EdgeCopilot selbst ist weniger ein zusammenfassendes Video als vielmehr ein Transkript, das das Video zusammenfasst. Copilot kann auch ähnliche Funktionen in Microsoft 365 ausführen, einschließlich der Zusammenfassung von Team-Videobesprechungen und Anrufen von Kundendienstmitarbeitern – in beiden Fällen muss der Ton zunächst von Microsoft transkribiert werden. Copilot auf Microsoft Stream kann auch jedes Video zusammenfassen, erfordert jedoch wiederum, dass der Benutzer ein schriftliches Transkript erstellt.
Das Gespräch begann, nachdem Designer Pietro Schirano eine Bildschirmaufnahme von EdgeCopilot gepostet hatte, in der er das YouTube-Video des GTAVI-Trailers zusammenfasste. In diesem Fall scheint Copilot die Arbeit perfekt erledigt zu haben. Der Benutzer in der Aufzeichnung klickt in der Seitenleiste von Copilot auf die Schaltfläche „Videozusammenfassung generieren“ und nur wenige Sekunden später generiert Copilot eine Videozusammenfassung mit wichtigen Punkten und Zeitstempeln.
Natürlich können viele Plattformen, darunter YouTube und Vimeo, automatisch Transkripte und Untertitel generieren, wenn der Benutzer diese Funktion aktiviert hat. TheVerge fragte Parakhin weiter
Copilot ist nur das jüngste Beispiel dafür, wie Microsoft im Wettlauf um die Entwicklung generativer KI gegen Google (und andere) antritt. Letzten Monat hat Google seinen Bard-Chatbot mit einer YouTube-Erweiterung aktualisiert, die es ihm ermöglicht, Videoinhalte zusammenzufassen und spezifische Informationen daraus anzuzeigen. Erst diese Woche kündigte Google ein großes Update für Gemini an, aber das Update selbst hat seine Probleme – in einer Präsentation haben die Redakteure des Unternehmens möglicherweise einige der Fähigkeiten der KI falsch dargestellt, und Google bringt die Fakten nicht immer klar.
Parashin sprach in den sozialen Medien offen über die verschiedenen Entwicklungsstadien von Copilot.