Eine mit der Angelegenheit vertraute Person gab bekannt, dass OpenAI ein neues Modell mit erweiterten Netzwerksicherheitsfunktionen fertigstellt und plant, es nur einer kleinen Anzahl von Unternehmenskunden zur Verfügung zu stellen, ähnlich wie Anthropics kleine Version seines Netzwerksicherheitsmodells „Mythos“. Der Grund für die Aufmerksamkeit liegt darin, dass die künstliche Intelligenz nach Ansicht vieler Sicherheitsexperten einen „kritischen Punkt“ in Bezug auf Autonomie und Hacking-Fähigkeiten erreicht hat. Modellentwicklungsunternehmen machen sich zunehmend Sorgen über den realen Schaden, den ihre eigenen Tools anrichten könnten, und zwar so sehr, dass sie nicht bereit sind, diesen vollständig in die öffentliche Umgebung „freizugeben“.

Am Dienstag gab Anthropic bekannt, dass sein neues Modell „Mythos Preview“ nur einer kleinen Anzahl sorgfältig ausgewählter Technologie- und Cybersicherheitsunternehmen zugänglich sein wird, da das Modell über sehr fortschrittliche Einbruchs- und Ausnutzungsfähigkeiten verfügt, was Bedenken hinsichtlich eines möglichen Missbrauchs aufkommen lässt. Damals war Anthropic das erste KI-Unternehmen, das derart strenge Beschränkungen für seine Strategie zur Veröffentlichung neuer Modelle einführte, und nun wurde bekannt, dass OpenAI einen ähnlichen Weg einschlagen will.
Im Detail startete OpenAI im Februar dieses Jahres ein Pilotprojekt mit dem Namen „Trusted Access for Cyber“, nachdem es GPT-5.3-Codex auf den Markt gebracht hatte, das über die bislang leistungsfähigsten Netzwerksicherheitsbegründungsfunktionen verfügt. Laut einem Unternehmensblog erhalten Organisationen, die zur Teilnahme am geschlossenen Programm eingeladen werden, Zugang zu höheren Cyber-Offensiv- und -Defensivfähigkeiten oder einem höheren „nachsichtigen“ Modell, um die rechtlichen Verteidigungsmaßnahmen zu beschleunigen. OpenAI versprach damals auch, den Projektteilnehmern insgesamt 10 Millionen US-Dollar an API-Kontingentunterstützung für entsprechende Experimente und Bereitstellungen zur Verfügung zu stellen.
Der größere Kontext besteht darin, dass im vergangenen Jahr mehrere ehemalige Regierungsbeamte und hochrangige Sicherheitsführer Alarm geschlagen und davor gewarnt haben, dass einige KI-Modelle eines Tages in der Lage sein könnten, Wassersysteme, Stromnetze und sogar die Finanzinfrastruktur ohne menschliches Eingreifen zu stören, wenn sie in die falschen Hände geraten. Diese Fähigkeiten, die früher als „Zukunftsszenarien“ galten, beginnen nun in den Augen von Brancheninsidern Gestalt anzunehmen.
Doch selbst wenn KI-Unternehmen durch begrenzte Pilotprojekte und schrittweise Veröffentlichungen vorübergehend „die Schleusen verschließen“, glauben führende Sicherheitsexperten im Allgemeinen, dass sich der allgemeine Trend nur schwer umkehren lässt. „Man kann nicht verhindern, dass das Modell eine Codeaufzählung durchführt oder Lücken in der alten Codebasis findet. Diese Fähigkeit ist objektiv bereits vorhanden.“ Rob T. Lee, Chief AI Officer des SANS Institute, betonte. Wendi Whitmore, Chief Security Intelligence Officer bei Palo Alto Networks, sagte in einer Diskussionsrunde auf der HumanX-Konferenz in San Francisco, dass möglicherweise nur noch wenige Wochen oder Monate verbleiben, bis das nächste Modell mit ähnlichen Fähigkeiten auf den Markt kommt und in eine offenere Umgebung übergeht. Adam Meyers, Senior Vice President für Gegenmaßnahmen bei CrowdStrike, beschrieb die von Mythos gezeigten Fähigkeiten als „einen Weckruf für die gesamte Branche“.
Nach Ansicht einiger Sicherheitsexperten wäre es „vernünftiger“, den Einführungsumfang modernster Modelle zu begrenzen und eine Batch-Freigabe zu implementieren, wenn das Unternehmen sich wirklich Sorgen um die Fähigkeit des Modells macht, „neue Angriffs- und Exploit-Programme zu schreiben“, anstatt nur „Menschen bei der Suche nach bestehenden Schwachstellen zu helfen“. Stanislav Fort, CEO der Aisle Security Company, erklärte gegenüber Axios, dass die Fähigkeit, automatisch eine neue Schwachstellen-Ausnutzungskette zu generieren, eine größere potenzielle Bedrohung für das Ökosystem darstellt als die bloße Entdeckung von Schwachstellen und daher langsam in einer kontrollierten Umgebung überprüft werden muss.
Einige Experten wiesen auch darauf hin, dass das aktuelle groß angelegte Modell stufenweise geöffnet wird, was in gewissem Maße der Art und Weise ähnelt, wie traditionelle Netzwerksicherheitsanbieter Informationen zu Software-Schwachstellen offenlegen. Lee glaubt, dass dies der Debatte, die die Branche seit Jahren über die „verantwortungsvolle Offenlegung von Schwachstellen“ geführt hat, sehr ähnlich ist: Wie man den Zeitpunkt und den Umfang zwischen der Offenlegung von Risiken und der Bereitstellung von Patches in Einklang bringen kann, ist ein immer wieder diskutiertes Thema. Der Unterschied besteht darin, dass es sich diesmal nicht mehr um eine einzelne Softwareschwachstelle, sondern um ein allgemeines intelligentes Tool handelt, das die Angriffs- und Verteidigungsfähigkeiten erheblich verbessern kann.
Es ist unklar, ob OpenAI dieses kommende Cybersicherheitsmodell irgendwann in der Zukunft breiter auf den Markt bringen wird. Im Gegensatz dazu hat Anthropic deutlich gemacht, dass es die Mythos-Vorschau nicht vollständig der Öffentlichkeit zugänglich machen wird. Wenn es jedoch in Zukunft mit ausreichend starken Sicherheitsgeländern ausgestattet werden kann, schließt dies nicht aus, dass eine größere Auswahl an Öffnungen für andere Modelle der Mythos-Serie in Betracht gezogen wird. Gleichzeitig erinnerten Forschungsteams wie Aisle auch daran, dass bestehende, auf dem Markt weit verbreitete KI-Modelle in Mythos-Demonstrationsfällen bereits eine beträchtliche Anzahl von Schwachstellen und Ausnutzungspfaden finden können. Das bedeutet, dass das, was den Sicherheitsgraben wirklich ausmacht, wahrscheinlich eher die Systeme und Prozesse sind, die um das Modell herum aufgebaut sind, als das „Volumen“ und die „Generation“ des Modells selbst.