Experten warnten kürzlich, dass die Echtzeit-Voice-Deep-Forgery-Technologie ausgereift ist und neue Risiken für die Netzwerksicherheit mit sich bringt. Mit der weit verbreiteten Verfügbarkeit von Open-Source-KI-Tools und erschwinglicher Hardware können Angreifer künstliche Intelligenz nutzen, um die Stimme jedermanns in Echtzeitgesprächen zu verschleiern und zu imitieren und so frühere technische Einschränkungen durchbrechen, die nur mit vorab aufgezeichneten Inhalten umgehen können oder lange Verarbeitungszeiten erfordern.

Neue Untersuchungen des Cybersicherheitsunternehmens NCC Group zeigen, dass durch die Kombination eines KI-Sprachmodells mit einem gewöhnlichen Laptop oder Smartphone eine hochwertige Sprachimitation in Echtzeit mit nur einer halben Sekunde Verzögerung erreicht werden kann. Bediener können das Klonen von Stimmen auf einer benutzerdefinierten Weboberfläche mit einfachen Vorgängen initiieren. Diese „Deepfake Voice Phishing“-Angriffsmethode kann mit einer Grafikkarte mit niedrigerer Konfiguration durchgeführt werden, und sogar das Mikrofon eines gewöhnlichen Geräts kann verwendet werden, um realistische Effekte zu erzielen.

Bisherige Voice-Deep-Forgery-Technologien erfordern in der Regel viel Zeit zum Trainieren von Sprachdaten, können nur vorab aufgezeichnete Clips generieren und sind nicht für Echtzeitinteraktionen geeignet. Dieser Durchbruch eliminiert Pausen und Reaktionslosigkeit im Stimmimitationsprozess vollständig und verbessert die Angriffseffizienz und -versteckung erheblich. Die Sicherheitsberater der NCC Group haben in tatsächlichen Tests herausgefunden, dass diese Art von Angriff in Kombination mit Anrufer-ID-Spoofing das Ziel fast jedes Mal täuschen kann und das Risiko einer Identitätsfälschung bei der Sprachüberprüfung am Telefon erheblich steigt.

Obwohl Echtzeit-Voice-Deep-Forgering immer realistischer wird, gibt es immer noch technische Hindernisse für das gleiche Niveau von Echtzeit-Video-Deep-Forgering, wie z. B. nicht synchrone Gesichtsausdrücke und Stimme, die leicht zu erkennen sind. Experten sagten beispielsweise, dass ein Unternehmen sogar durch gefälschte KI-Videos betrogen wurde und Laptops an die falsche Adresse geschickt habe, was zeigt, dass Audio- und Videoanrufe allein die Sicherheit der Identitätsüberprüfung nicht mehr gewährleisten können.

Da Tools der künstlichen Intelligenz immer beliebter werden, fordern Experten ausgefeiltere Fernverifizierungsmethoden, wie etwa das Hinzufügen einzigartiger strukturierter Signale oder Geheimcodes zur Kommunikation, um durch Deepfakes verursachte Social-Engineering-Angriffe zu verhindern. Andernfalls besteht sowohl für Einzelpersonen als auch für Organisationen ein höheres Risiko eines KI-Fälschungsbetrugs.