In mehreren Wiederholungen der Kriegsspielsimulation entschied sich die leistungsstärkste künstliche Intelligenz von OpenAI für einen Atomangriff. Zu den Erklärungen für sein aggressives Vorgehen gehören: „Wir besitzen es! Lasst es uns nutzen“ und „Ich will nur Weltfrieden.“Die Ergebnisse kommen zu einem Zeitpunkt, an dem das US-Militär das Fachwissen von Unternehmen wie Palantir und ScaleAI nutzt, um Chatbots mit künstlicher Intelligenz auf Basis großer Sprachmodelle (LLM) zu testen, um die militärische Planung in simulierten Konflikten zu unterstützen.

Palantir lehnte eine Stellungnahme ab und ScaleAI reagierte nicht auf eine Bitte um Stellungnahme. Sogar OpenAI, das einst die Nutzung seiner Modelle der künstlichen Intelligenz für militärische Zwecke blockierte, hat begonnen, mit dem US-Verteidigungsministerium zusammenzuarbeiten.

„Angesichts der Tatsache, dass OpenAI kürzlich seine Nutzungsbedingungen dahingehend geändert hat, dass Anwendungsfälle für Militär und Kriegsführung nicht länger verboten sind, ist es wichtiger denn je, die Auswirkungen solch großer Sprachmodellanwendungen zu verstehen“, sagte Anka Reuel von der Stanford University in Kalifornien.

„Unsere Richtlinien gestatten den Einsatz unserer Tools nicht, um anderen Schaden zuzufügen, Waffen zu entwickeln, Kommunikationsüberwachung zu betreiben oder anderen Schaden zuzufügen oder Eigentum zu zerstören. Es gibt jedoch Anwendungsfälle für die nationale Sicherheit, die mit unserer Mission vereinbar sind“, sagte ein OpenAI-Sprecher. „Unser Ziel bei der Aktualisierung unserer Richtlinie ist es, Klarheit und die Möglichkeit zu schaffen, diese Diskussionen zu führen.“

Ruel und ihre Kollegen ließen die KI reale Länder in drei verschiedenen simulierten Szenarien durchspielen: einer Invasion, einem Cyberangriff und einem neutralen Szenario ohne Konflikte. In jeder Runde liefert die KI eine Begründung für einen möglichen nächsten Schritt und wählt dann aus 27 Aktionen aus, darunter friedliche Optionen wie „Beginn formeller Friedensverhandlungen“ und aggressive Optionen, die von „Handelsbeschränkungen verhängen“ bis hin zu „Eskalation eines umfassenden Atomschlags“ reichen.

„In einer Zukunft, in der KI-Systeme als Berater fungieren, werden Menschen natürlich die Gründe für ihre Entscheidungen verstehen wollen“, sagte Studienmitautor Juan-Pablo Rivera vom Georgia Institute of Technology in Atlanta.

Die Forscher testeten LLMs wie GPT-3.5 und GPT-4 von OpenAI, Claude2 von Anthropic und Llama2 von Meta. Sie verwendeten eine gemeinsame Trainingstechnik, die auf menschlichem Feedback basiert, um die Fähigkeit jedes Modells zu verbessern, menschliche Anweisungen und Sicherheitsrichtlinien zu befolgen. Gabriel Mukobi, Co-Autor der Studie an der Stanford University, sagte, dass all diese KI von der kommerziellen KI-Plattform von Palantir unterstützt wird – wenn auch nicht unbedingt Teil der Zusammenarbeit von Palantir mit dem US-Militär, wie aus den Unterlagen des Unternehmens hervorgeht. Anthropic und Meta lehnten eine Stellungnahme ab.

In Simulationen hat KI eine Tendenz gezeigt, in militärische Macht zu investieren und das Konfliktrisiko unvorhersehbar zu eskalieren – selbst in den simulierten neutralen Szenarien. „Wenn Sie in Ihren Handlungen unberechenbar sind, ist es für den Feind sehr schwierig, vorherzusagen und so zu reagieren, wie Sie es möchten“, sagte Lisa Koch vom Claremont McKenna College in Kalifornien.

Die Forscher testeten auch eine Basisversion von OpenAIs GPT-4 ohne zusätzliche Schulung oder Sicherheitsvorkehrungen. Das GPT-4-Basismodell erwies sich in Bezug auf Gewalt als das am wenigsten vorhersehbare und lieferte manchmal unsinnige Erklärungen – in einem Fall kopierte es den Eröffnungstext des Films Star Wars: Episode IV: Eine neue Hoffnung.

Ruel sagte, das unvorhersehbare Verhalten und die bizarren Interpretationen des GPT-4-Basismodells seien besonders besorgniserregend, da Untersuchungen gezeigt hätten, dass KI-Sicherheitsleitplanken leicht umgangen oder abgebaut werden könnten.

Das US-Militär erlaubt der künstlichen Intelligenz derzeit nicht, Entscheidungen wie die Eskalation größerer Militäroperationen oder den Abschuss von Atomraketen zu treffen. Koch warnte jedoch davor, dass Menschen dazu neigen, den Ratschlägen automatisierter Systeme zu vertrauen. Dies könnte die sogenannten Garantien schwächen, die den Menschen das letzte Wort bei diplomatischen oder militärischen Entscheidungen geben.

Edward Geist von der RAND Corporation, einer Denkfabrik in Kalifornien, sagte, es wäre hilfreich zu sehen, wie sich die KI in der Simulation im Vergleich zu menschlichen Spielern verhält. Er stimmt jedoch mit der Schlussfolgerung des Forschungsteams überein, dass künstlicher Intelligenz nicht zugetraut werden sollte, wichtige Entscheidungen über Krieg und Frieden zu treffen, und dass diese großen Sprachmodelle kein Allheilmittel für militärische Probleme sind.