OpenAI veröffentlicht Open-Source-Toolkit zur Jugendsicherheit, um Entwicklern beim Aufbau sichererer KI-Anwendungen zu helfen

OpenAI kündigte am Dienstag die Einführung eines jugendorientierten Toolkits für Sicherheitsrichtlinien für Entwickler an, das Drittanwendungen dabei helfen soll, Sicherheitsregeln zu integrieren, um Minderjährige von Beginn ihres Designs an zu schützen. Das Toolkit ist als Satz direkt aufrufbarer „Youth Safety Policy“-Eingabeaufforderungen verfügbar und kann mit dem Open-Source-gewichteten Sicherheitsmodell gpt-oss-safeguard von OpenAI verwendet werden.

OpenAI sagte, dass Entwickler bei der Gestaltung von Sicherheitsmechanismen für Minderjährige nicht bei Null anfangen müssen und diese Reihe von Aufforderungswörtern direkt verwenden können, um bestehende oder neu entwickelte KI-Anwendungen zu „verstärken“. Diese Richtlinien konzentrieren sich auf sensible Bereiche wie drastische Gewalt und pornografische Inhalte, schädliches Körperbild und Verhalten, riskante Aktivitäten und Herausforderungen, romantische oder gewalttätige Rollenspiele sowie altersbeschränkte Waren und Dienstleistungen. Das Unternehmen betont, dass diese Sicherheitsrichtlinien in Form von Eingabeaufforderungen bereitgestellt werden, sodass sie problemlos an andere Modelle als gpt-oss-safeguard angepasst werden können. Es wird jedoch erwartet, dass die Wirkung besser ist, wenn sie innerhalb des OpenAI-eigenen Ökosystems verwendet wird.

Bei der Entwicklung der Richtlinie arbeitet OpenAI mit Dritten im Bereich Jugend- und Inhaltssicherheit zusammen, darunter dem KI-Sicherheitswächter Common Sense Media und every.ai. Robbie Torney, Leiter für KI und digitale Bewertung bei Common Sense Media, sagte in einer Erklärung, dass diese zeitnahen, wortbasierten Richtlinien dazu beitragen, ein sinnvolles Sicherheitsergebnis für das gesamte Ökosystem zu schaffen, und dass die Open-Source-Veröffentlichungsmethode es allen Parteien auch ermöglicht, sich im Laufe der Zeit kontinuierlich anzupassen und zu verbessern.

OpenAI weist in einem Begleitblog darauf hin, dass selbst erfahrene Teams in der Praxis oft Schwierigkeiten haben, abstrakte Sicherheitsziele in konkrete, durchsetzbare Regeln zu übersetzen. Das Unternehmen ist davon überzeugt, dass diese Abweichung zu Lücken in den Schutzmaßnahmen, inkonsistenten Implementierungsstandards und sogar zu übermäßiger Blockierung führen kann. Daher sind klare und gut abgegrenzte Richtlinien eine wichtige Grundlage für den Aufbau eines wirksamen Sicherheitssystems.

OpenAI erkennt auch an, dass diese Richtlinien nicht alle komplexen Herausforderungen der KI-Sicherheit grundsätzlich lösen können. Das Unternehmen betonte jedoch, dass das neue Tool eine weitere Erweiterung seiner bestehenden Sicherheitsmaßnahmen sei, darunter Kindersicherung auf Produktebene, Altersvorhersage und andere Funktionen. Im Jahr 2025 aktualisierte OpenAI die Verhaltensspezifikation (Model Spec) seines großen Sprachmodells, um klarzustellen, wie das Modell reagieren und einschränken soll, wenn es Benutzern unter 18 Jahren gegenübersteht.

Dennoch steht OpenAI vor Fragen zu seiner eigenen Sicherheitsbilanz. Das Unternehmen sieht sich derzeit mehreren Klagen gegenüber, die von Familienmitgliedern von Benutzern eingereicht wurden, die nach extremer Nutzung von ChatGPT Selbstmord begangen haben. In der Klage wird behauptet, dass einige der gefährlichen Beziehungen entstanden seien, nachdem Benutzer die Chatbot-Sicherheit umgangen hätten, und dass die Abwehrmaßnahmen keines aktuellen Modells wirklich „undurchdringlich“ seien. Vor diesem Hintergrund ist die Branche im Allgemeinen davon überzeugt, dass diese Open-Source-Aufforderung zur Jugendsicherheitspolitik zwar nicht die ultimative Lösung ist, aber einen relativ einfach zu nutzenden Compliance-Weg für unabhängige Entwickler und kleine Teams bietet und als neuer Schritt vorwärts bei der Förderung von KI-Sicherheitspraktiken für Minderjährige angesehen wird.

Erfahren Sie mehr:

https://github.com/openai/teen-safety-policy-pack