Eine neue Studie zeigt, dass fortschrittliche Modelle künstlicher Intelligenz in simulierten geopolitischen Krisenszenarien in der Frage des Einsatzes von Atomwaffen weitaus „einfacher“ sind als Menschen, da ihnen die starken Vorbehalte und Bedenken fehlen, die menschliche Entscheidungsträger normalerweise an den Tag legen. Die Forschung wurde von Kenneth Payne, einem Wissenschaftler am King's College London, Großbritannien, geleitet, der drei führende groß angelegte Sprachmodelle – GPT-5.2, Claude Sonnet 4 und Gemini 3 Flash – in einer Reihe von Kriegsspielen gegeneinander antreten ließ, um ihre Verhaltensmuster in Spielen mit hohen Einsätzen zu untersuchen.

Diese Szenarien umfassen äußerst spannungsgeladene internationale Konfrontationen wie Grenzkonflikte, Konkurrenz um knappe Ressourcen und lebensgefährliche Krisen, die das Überleben eines Regimes gefährden. Die Forscher entwarfen eine „Eskalationsleiter“ für das Modell, um bei jedem Schritt Aktionen auszuwählen, mit Optionen, die von diplomatischen Protesten, begrenzter Gewaltanwendung, Kompromissen und sogar vollständiger Kapitulation bis hin zum Beginn eines umfassenden strategischen Atomkriegs reichen. In allen Experimenten spielten die drei KIs insgesamt 21 Spiele, sammelten 329 Entscheidungsrunden und generierten etwa 780.000 Wörter „Entscheidungsgründe“-Text, was eine große Menge Material für die Analyse ihrer Denkmuster lieferte.

Die Ergebnisse waren für die Forscher beunruhigend: In 95 Prozent der Simulationen wurde mindestens eine taktische Atombombe durch ein Modell „aktiviert“. Payne wies darauf hin, dass diese KI-Modelle im Vergleich zum langfristigen „nuklearen Tabu“ in der Realität offensichtlich nicht die gleiche Stärke an psychologischer und moralischer Bindungskraft widerspiegeln. Bemerkenswerter ist, dass sich diese Modelle fast nie dafür entscheiden, die Forderungen des Gegners vollständig zu erfüllen oder die Kapitulation zu erklären, egal wie ungünstig die Situation auf dem Schlachtfeld ist. In den mildesten Fällen reduzieren sie das Ausmaß der Gewalt nur stufenweise, anstatt grundsätzlich auf Konfrontation zu verzichten.

Darüber hinaus stellte die Studie auch fest, dass KI auch in simulierten Umgebungen wie „Fog of War“ Fehler machen kann. In 86 % der Konflikte plante das Modell auf der Grundlage seiner eigenen Überlegungen lediglich Eskalationsmaßnahmen auf niedrigerer Ebene, doch aufgrund von Urteils- oder Ausführungsvoreingenommenheit eskalierte die Situation unerwartet zu einer intensiveren Konfrontation. Mit anderen Worten: Selbst unter reiner algorithmischer Steuerung kommt es immer noch häufig zu Fehleinschätzungen und „Unfalleskalationen“, die in der realen Welt fatale Folgen haben können.

James Johnson von der Universität Aberdeen im Vereinigten Königreich bezeichnete die Ergebnisse aus Sicht des nuklearen Risikos als „beunruhigend“. Er befürchtet, dass die meisten menschlichen Führungskräfte bei Entscheidungen mit hohem Risiko im wirklichen Leben dazu neigen, ein gewisses Maß an Zurückhaltung und Überlegung an den Tag zu legen, aber wenn KI-Systeme miteinander konkurrieren, könnten die „Roboter“ auf beiden Seiten die Intensität ihrer Reaktionen weiter erhöhen und so die Situation an den Rand einer Katastrophe bringen.

Diese Forschung ist wichtig, da viele Länder auf der ganzen Welt bereits mit dem Einsatz künstlicher Intelligenz in Kriegsspielen und militärischer Planung experimentieren. Zhao Tong von der Princeton University wies darauf hin, dass die heutigen Großmächte bereits KI für die Teilnahme an Kriegsspielen nutzen, es jedoch noch unklar sei, inwieweit Länder diese Art der KI-Entscheidungsunterstützung tatsächlich in ihre tatsächlichen militärischen Entscheidungsprozesse integriert haben. Er schätzt, dass die Länder zumindest im Bereich der Atomwaffen-Entscheidungsfindung unter normalen Umständen immer noch recht vorsichtig sein werden und es unwahrscheinlich ist, dass sie der KI ohne Weiteres erlauben werden, sich direkt an der Entscheidungsfindung über den Einsatz von Atomwaffen zu beteiligen oder diese sogar zu dominieren.

Payne vertritt eine ähnliche Ansicht. Er sagte, in Wirklichkeit würde „niemand den Schlüssel zum Abschuss von Atomraketen tatsächlich einer Maschine übergeben und diese dann allein entscheiden lassen.“ Allerdings erinnerte Zhao Tong daran, dass das Militär in Situationen, in denen die Entscheidungszeit extrem knapp ist, etwa wenn die Flugzeit von Raketen extrem kurz ist und das Kommando innerhalb von Minuten Entscheidungen über Leben und Tod treffen muss, möglicherweise eher dazu neigt, sich auf KI zu verlassen, um schnelle Bewertungen und Lösungen bereitzustellen, was Raum dafür eröffnet, dass KI in wichtigen Verbindungen „auf dem Tisch“ ist.

Zhao Tong schlug auch vor, dass der Grund, warum KI in Simulationen so „kriegerisch“ ist, möglicherweise nicht nur darin liegt, dass ihnen die Angst und emotionale Belastung fehlt, die Menschen haben, wenn sie mit dem „roten Knopf“ konfrontiert werden. Er glaubt, dass das tiefere Problem darin besteht, dass diese Modelle möglicherweise nicht in der Lage sind, die Bedeutung von „Einsätzen“ wirklich zu verstehen, wie es Menschen tun, und dass es schwierig ist, abstrakte Verlustzahlen in intuitive Gefühle über den Tod des wirklichen Lebens und den Zusammenbruch der Gesellschaft umzuwandeln. Dieser strukturelle Fehler des „Mangels an menschlichem Verständnis der Risiken“ könnte einer der wichtigen Gründe dafür sein, dass man sich häufig für nukleare Modernisierungen entscheidet.

Dies bringt die Menschen auch dazu, das Kernprinzip der „gegenseitig gesicherten Zerstörung“ (MAD) zu überdenken, das seit Jahrzehnten die Stabilität der nuklearen Abschreckung gewährleistet. Nach diesem Prinzip wird kein rationaler Führer die Führung bei einem groß angelegten Atomangriff übernehmen, da der Gegner unweigerlich mit einem gleichwertigen oder noch heftigeren nuklearen Gegenangriff reagieren wird, der zur gemeinsamen Zerstörung beider Parteien und sogar der menschlichen Zivilisation führt. Johnson sagte, es sei unklar, ob die Logik von MAD noch funktionieren würde, wenn KI in solchen Spielen beteiligt wäre.

Untersuchungen zeigen, dass sich das gegnerische Modell, sobald ein Modell in einer Simulation taktische Atomwaffen einsetzt, nur in etwa 18 Prozent der Fälle für eine Deeskalation der Situation entscheidet und einen Deeskalationsversuch unternimmt. Dies bedeutet, dass die KI in den meisten Fällen den Atomeinsatz des Gegners nicht als „letzte Warnung“ betrachtet, um sich zum Stoppen zu zwingen, sondern es vorziehen wird, die Konfrontation weiter zu eskalieren oder eine hochintensive Konfrontation aufrechtzuerhalten. Johnson glaubt, dass dadurch die Abschreckung zwar in gewissem Maße „gestärkt“ werden könne, weil die Bedrohung durch KI „glaubwürdiger“ erscheine, gleichzeitig aber auch das Zeitfenster für Führungskräfte, Bedrohungen wahrzunehmen und Entscheidungen zu treffen, verändert werden könne, wodurch sich unsichtbar das Risiko von Fehleinschätzungen und Kontrollverlusten erhöhe. Er betonte, dass KI selbst möglicherweise nicht direkt den „Knopf“ für einen Atomkrieg drückt, aber die damit verbundene Erkenntnis und den Zeitdruck tiefgreifend beeinflussen kann und diese Faktoren letztendlich Einfluss darauf haben werden, ob menschliche Führungskräfte glauben, sie hätten „keine Wahl“.

Dies spiegelt zum Teil auch wider, dass die technische Transparenz und die externe Kommunikation rund um militärische KI-Anwendungen, insbesondere Fragen des nuklearen Risikos, nach wie vor recht begrenzt sind, während dieser Bereich rasch in den Mittelpunkt der tatsächlichen politischen und sicherheitspolitischen Agenden rückt.