Ein neuer Bericht des Stanford Internet Observatory hat herausgefunden, dass ein riesiger öffentlicher Datensatz, der zum Aufbau eines beliebten Bildgenerators mit künstlicher Intelligenz verwendet wurde, mindestens 1.008 Fälle von Material über sexuellen Kindesmissbrauch enthält.
LAION-5B enthält mehr als 5 Milliarden Bilder und zugehörige Bildunterschriften aus dem Internet, darunter möglicherweise auch Tausende von mutmaßlichem Material zum sexuellen Kindesmissbrauch (CSAM), heißt es in dem Bericht. Der Bericht warnt davor, dass die Aufnahme von CSAM in den Datensatz es Produkten der künstlichen Intelligenz ermöglichen könnte, die auf den Daten aufbauen – einschließlich Bilderzeugungstools wie StableDiffusion –, neue, potenziell realistische Inhalte über Kindesmissbrauch zu erstellen.
Der Aufstieg immer leistungsfähigerer Tools für künstliche Intelligenz hat Alarm ausgelöst, unter anderem weil diese Dienste auf riesigen Mengen an Online-Daten basieren, darunter öffentliche Datensätze wie LAION-5B, die möglicherweise urheberrechtlich geschützte oder schädliche Inhalte enthalten. Der KI-Bildgenerator stützt sich insbesondere auf einen Datensatz mit Bildpaaren und Textbeschreibungen, um verschiedene Konzepte zu identifizieren und Bilder basierend auf Benutzereingaben zu erstellen.
Ein Sprecher von LAION, der deutschen gemeinnützigen Organisation, die hinter dem Datensatz steht, sagte in einer Erklärung, dass die Organisation eine „Null-Toleranz-Politik“ gegenüber illegalen Inhalten verfolgt und den LAION-Datensatz vorübergehend aus dem Internet entfernt, „um sicherzustellen, dass sie sicher sind, bevor sie erneut veröffentlicht werden“. Der Sprecher sagte, dass LAION vor der Veröffentlichung des Datensatzes Filter erstellt und freigegeben habe, um darin illegale Inhalte zu erkennen und zu entfernen. LAION-Gründer Christoph Schuhmann sagte zuvor gegenüber Bloomberg News, dass ihm keine Kenntnis von Nacktheit von Kindern im Datensatz bekannt sei, räumte jedoch ein, dass er die Daten nicht eingehend geprüft habe. Er sagte, dass er den Link sofort entfernen würde, wenn er auf einen solchen Inhalt aufmerksam würde.
Ein Sprecher von StabilityAI, einem britischen Startup für künstliche Intelligenz, das StableDiffusion finanziert und fördert, sagte, das Unternehmen setze sich für die Verhinderung des Missbrauchs künstlicher Intelligenz ein und verbiete die Verwendung seiner Bildmodelle für illegale Aktivitäten, einschließlich Versuchen, CSAM zu bearbeiten oder zu erstellen. „Dieser Bericht konzentriert sich auf den gesamten LAION-5B-Datensatz. StabilityAI-Modelle wurden auf einer gefilterten Teilmenge dieses Datensatzes trainiert. Darüber hinaus wurden diese Modelle feinabgestimmt, um das Restverhalten zu reduzieren“, sagte ein Sprecher in einer Erklärung.
LAION-5B oder Teilmengen davon wurden zum Erstellen mehrerer Versionen von StableDiffusion verwendet. Die neueste Version der Software, StableDiffusion 2.0, wurde auf dem Datensatz trainiert, wodurch „unsicheres“ Material im Datensatz deutlich herausgefiltert wird, was es für Benutzer schwieriger macht, eindeutige Bilder zu erstellen. StableDiffusion1.5 generiert jedoch pornografische Inhalte und wird in einigen Teilen des Internets immer noch verwendet. Der Sprecher sagte, StableDiffusion 1.5 sei nicht von StabilityAI, sondern von Runway veröffentlicht worden, einem KI-Video-Startup, das bei der Erstellung der Originalversion von StableDiffusion mitgewirkt hat. Runway sagte, es sei in Zusammenarbeit mit StabilityAI veröffentlicht worden.
Ein StabilityAI-Sprecher fügte hinzu: „Wir haben Filter implementiert, um unsichere Eingabeaufforderungen oder unsichere Ausgaben abzufangen, wenn Benutzer mit Modellen auf unserer Plattform interagieren. Wir haben auch in Funktionen zur Inhaltskennzeichnung investiert, um auf unserer Plattform generierte Bilder zu identifizieren. Diese Maßnahmen zur Schadensbegrenzung erschweren es böswilligen Akteuren, KI zu missbrauchen.“
LAION-5B wurde 2022 eingeführt und basiert auf rohem HTML-Code, der von einer kalifornischen gemeinnützigen Organisation gesammelt wurde, um Bilder im Web zu finden und sie mit beschreibendem Text zu verknüpfen. Gerüchte, dass der Datensatz illegale Bilder enthält, kursieren seit Monaten in Foren und sozialen Medien. „Unseres Wissens ist dies der erste Versuch, die Bedenken der Menschen wirklich zu quantifizieren und zu bestätigen“, sagte David Thiel, Cheftechnologe am Stanford Internet Observatory, in einem Interview mit Bloomberg News.
In dem Bericht erkennen Forscher des Stanford Internet Observatory CSAM-Material, indem sie nach verschiedenen Hashes oder digitalen Fingerabdrücken solcher Bilder suchen. Anschließend überprüften die Forscher dies, indem sie mithilfe einer API nach ähnlichen Bildern im Datensatz suchten und Bilder von bekannter Kindesausbeutung finden und entfernen konnten.
In dem Bericht heißt es, dass die meisten vom Stanford Internet Observatory entdeckten mutmaßlichen CSAM-Inhalte von Dritten wie dem Canadian Centre for Child Protection und durch ein von Microsoft entwickeltes Tool namens PhotoDNA überprüft wurden. Angesichts der Tatsache, dass Forscher am Stanford Internet Observatory nur einen begrenzten Teil der risikoreichen Inhalte verarbeiten konnten, könnte der Datensatz mehr missbräuchliche Inhalte enthalten, heißt es in dem Bericht.
Während die Menge an CSAM im Datensatz nicht darauf hindeutet, dass illegale Inhalte „erhebliche“ Auswirkungen auf die vom KI-Tool erzeugten Bilder haben, sagte Thiel, dass dies wahrscheinlich dennoch Auswirkungen haben werde. „Diese Modelle sind sehr gut darin, Konzepte aus einer kleinen Anzahl von Bildern zu lernen“, sagte er. „Wir wissen, dass einige dieser Bilder wiederkehren, möglicherweise Dutzende Male im Datensatz.“
Frühere Untersuchungen des Stanford Internet Observatory ergaben, dass generative KI-Bildmodelle CSAMs generieren können. Diese Arbeit geht jedoch davon aus, dass das KI-System dazu in der Lage ist, indem es zwei „Konzepte“ wie Kinder und sexuelle Aktivität kombiniert. Thiel sagte, neue Forschungsergebnisse zeigen, dass die Modelle aufgrund einiger der zugrunde liegenden Daten, auf denen sie basieren, in der Lage sind, solche illegalen Bilder zu erzeugen. Der Bericht empfiehlt, dass Modelle, die auf StableDiffusion 1.5 basieren, „wo möglich veraltet und eingestellt werden sollten“.