Letzte Woche erhielt die US-Regierung Informationen von den Cybersicherheitsingenieuren von Amazon und erließ eine Notfall-Exportkontrollanordnung, mit der Unternehmen A verpflichtet wurde, die Lieferung des Claude Fable 5-Modells an Nicht-US-Bürger einzustellen. Der Grund für den Erlass der Exportkontrollanordnung war, dass die Netzwerksicherheitsingenieure von Amazon festgestellt hatten, dass der Sicherheitsmechanismus des Modells unzureichend war und die Sicherheitsgrenze durch bestimmte Methoden umgangen werden konnte, um an vertrauliche Inhalte zu gelangen. Aufgrund von Compliance-Erwägungen hat Unternehmen A das Claude Fable 5-Modell direkt weltweit entfernt.

Während das Modell entfernt wurde, veröffentlichte A Company auch einen offenen Brief, in dem es der US-Regierung vorwarf, bei der Erteilung von Exportkontrollanweisungen undurchsichtig zu sein. Zu diesem Zweck schickte A Company ein hochrangiges technisches Team nach Washington, um Notfallkonsultationen mit der US-Regierung durchzuführen. Ursprünglich wurde erwartet, dass das Modell bald nach Notfallkonsultationen und der Einführung strengerer Sicherheitsgrenzen durch ein Unternehmen wiederhergestellt werden würde. Allerdings laufen die Verhandlungen derzeit nicht reibungslos.

Die Kontrollanordnung wurde auch nach Abschluss der Verhandlungen nicht aufgehoben:

Der Grund, warum die US-Regierung die Exportkontrollanordnung erlassen hat, besteht darin, dass Claude Fable 5 mit einem Jailbreak versehen werden kann, um den Sicherheitsschutz zu umgehen, sodass normale Benutzer leistungsstarke Netzwerksicherheitsfunktionen erhalten können, die dem Claude Mythos Preview-Modell ähneln. Dies kann versteckte Gefahren für die Internetsicherheit mit sich bringen. Natürlich ist die US-Regierung besorgt, dass normale Benutzer Claude Fable 5 verwenden könnten, um durch Jailbreaking Angriffe auf die US-Infrastruktur zu starten und dadurch die öffentliche Sicherheit zu beeinträchtigen.

Anthropic glaubte immer, dass die Bedenken der US-Regierung übertrieben waren, aber Verhandlungen waren noch nötig, um das Problem zu lösen, also schickte das Unternehmen seinen Mitbegründer und Chief Computing Officer, Leiter für Außenbeziehungen, Frontier Red Teamleiter und leitenden Sicherheitsforscher nach Washington, D.C., um an den Verhandlungen teilzunehmen; Teilnehmer der US-Regierung an den Verhandlungen waren der US-Handelsminister und Forscher des US-amerikanischen Artificial Intelligence Standards and Innovation Center.

Laut WIRED-Nachrichten sind die Verhandlungen zwischen Anthropic und der US-Regierung beendet. Allerdings hat die US-Regierung das Exportkontrollverbot für das Modell Claude Fable 5 nicht aufgehoben, so dass es weiterhin in der Sackgasse steckt. Die Erholungszeit des Claude Fable 5-Modells ist weit entfernt. Anthropic erklärte lediglich, dass beide Parteien sich schnell für eine Lösung des Problems einsetzen, und die US-Regierung lehnte eine Stellungnahme ab.

Das Kernproblem besteht darin, dass das Jailbreaking nicht gelöst wurde:

Der aktuelle Streit zwischen den beiden Parteien dreht sich immer noch um die Sicherheitsfrage des Claude Fable 5-Modells. Anthropic ist davon überzeugt, dass das Mythos-Klassenmodell tatsächlich hervorragend dazu geeignet ist, Schwachstellen zu finden und sie als Waffe auszunutzen, aber es ist nicht einzigartig. Auch andere Modelle können Ähnliches bewirken, und durch die Entfernung des Modells werden Netzwerksicherheitsverteidigern nur ihre besten Tools vorenthalten, was stattdessen zu Unsicherheit führt und sogar die Netzwerksicherheit gefährdet.

Die US-Regierung war immer der Ansicht, dass sie bereit ist, einen Weg zu finden, Claude Fable 5 wieder nutzbar zu machen, aber Voraussetzung ist, dass Anthropic das Jailbreak-Problem vollständig lösen kann. Wenn das Jailbreak-Problem nicht gelöst werden kann, wird es unmöglich sein, es zu deregulieren, da die Sicherheitsrisiken, über die sich die US-Regierung Sorgen macht, weiterhin bestehen. Allerdings ist es für das KI-Modell sehr schwierig, das Jailbreak-Problem vollständig zu lösen, und es gibt Möglichkeiten, es zu umgehen, egal wie streng die Sicherheitsgrenzen sind.