Am Montag (18. Dezember) Ortszeit kündigte das Forschungsunternehmen für künstliche Intelligenz (KI) OpenAI eine Reihe von Richtlinien zur Vermeidung von KI-Risiken an. Eine beachtenswerte Regel lautet: Selbst wenn Unternehmensleiter wie der CEO glauben, dass ein KI-Modell sicher ist, kann der Vorstand dessen Veröffentlichung verhindern. Der von OpenAI entwickelte Chatbot ChatGPT ist seit einem ganzen Jahr veröffentlicht. Diese phänomenale Anwendung hat die Entwicklung des KI-Bereichs erheblich vorangetrieben und bringt Bedenken hinsichtlich einer außer Kontrolle geratenen Entwicklung der KI mit sich.
Regulierungsbehörden auf der ganzen Welt formulieren ihre eigenen KI-Vorschriften, und auch OpenAI, ein führendes Unternehmen im KI-Bereich, ergreift Maßnahmen.
Am 27. Oktober dieses Jahres kündigte OpenAI die Bildung eines Sicherheitsteams namens „Preparedness“ an, um die durch KI verursachten Risiken zu minimieren.
Das Preparedness-Team wird von Aleksander Madry, Direktor des Center for Deployable Machine Learning am MIT, geleitet. Das Team wird Fähigkeitsbewertungen und Red-Team-Tests verschiedener KI-Modelle durchführen, um verschiedene Arten von Katastrophenrisiken zu verfolgen, vorherzusagen und zu verhindern.
OpenAI veröffentlichte am Montag Richtlinien namens „Preparedness Framework“ und betonte, dass sich die Richtlinien noch in der Testphase befinden.
Es wird berichtet, dass das Preparedness-Team monatliche Berichte an eine neue interne Sicherheitsberatungsgruppe senden wird, die diese dann analysieren und Empfehlungen an OpenAI-CEO Sam Altman und den Vorstand unterbreiten wird.
Als einer der Mitbegründer von OpenAI war Altman vor nicht allzu langer Zeit Mitglied im Vorstand des Unternehmens, wurde jedoch in einem personellen Schock aus dem Unternehmen entfernt und verließ OpenAI eine Zeit lang. Obwohl Altman schließlich zu OpenAI zurückkehren und weiterhin als CEO fungieren konnte, hatte er keinen Sitz im neu gebildeten „ursprünglichen“ Vorstand.
Das Preparedness-Team wird wiederholt die fortschrittlichsten, noch zu veröffentlichenden KI-Modelle von OpenAI bewerten und sie basierend auf verschiedenen Arten wahrgenommener Risiken in vier Stufen einstufen, von niedrig bis hoch: „niedrig“, „mittel“, „hoch“ und „schwerwiegend“. Gemäß den neuen Richtlinien wird OpenAI nur Modelle mit der Bewertung „niedrig“ und „mittel“ einführen.