Nightshade „vergiftet“ Bilder, um das KI-Training zu stoppen und zum Schutz von artist

Eine der vielen Bedenken hinsichtlich generativer KI ist ihre Fähigkeit, Bilder mithilfe von Bildern zu generieren, die ohne die Erlaubnis des ursprünglichen Erstellers aus dem Internet stammen. Ein neues Tool kann dieses Problem jedoch lösen, indem es die zum Trainieren des Modells verwendeten Daten „vergiftet“.

MIT Technology Review stellt ein neues Tool namens Nightshade vor, das von Forschern der University of Chicago entwickelt wurde. Dabei werden vor dem Hochladen sehr kleine Änderungen an Bildpixeln vorgenommen, die für das bloße Auge unsichtbar sind. Dadurch werden die von Tools wie DALL-E, StableDiffusion und Midjourney verwendeten Trainingsdaten vergiftet, was dazu führt, dass das Modell auf unvorhersehbare Weise abstürzt.

Einige Beispiele dafür, wie generative KI Bilder von durch Nachtschattengewächse vergifteten Menschen falsch interpretieren kann, sind die Umwandlung von Hunden in Katzen, von Autos in Kühe, von Hüten in Kuchen und von Handtaschen in Toaster. Es eignet sich auch hervorragend, um verschiedene Kunststile anzusprechen: Kubismus wird zu Anime, Cartoons werden zu Impressionismus, Konzeptkunst wird zur Abstraktion.

Ein kürzlich von Forschern auf arXiv veröffentlichter Artikel beschreibt Nightshade als einen Hinweis-spezifischen Vergiftungsangriff. Anstatt Millionen von Bildern zu vergiften, kann Nightshade stabile Diffusionshinweise mit etwa 50 Proben zerstören, wie im Bild unten gezeigt.

Die Forscher schrieben, dass das Tool nicht nur bestimmte Aufforderungsbegriffe wie „Hund“ vergiften könne, sondern auch verwandte Konzepte wie „Welpe“, „Hund“ und „Husky“ „infiltrieren“ könne. Es betrifft sogar indirekt verwandte Bilder; Durch die Vergiftung von „Fantasy Art“ werden beispielsweise die Eingabeaufforderungen für „ein Drache“, „ein Schloss aus Herr der Ringe“ und „ein Gemälde von Michael Whelan“ in etwas anderes umgewandelt.

Ben Zhao, Professor an der University of Chicago, der das Team leitete, das Nightshade entwickelt hat, sagte, er hoffe, dass das Tool eine abschreckende Wirkung auf KI-Unternehmen haben werde, die die Urheberrechte und geistigen Eigentumsrechte von Künstlern nicht respektieren. Er erkannte das Potenzial für böswillige Nutzung an, aber um größeren, leistungsfähigeren Modellen echten Schaden zuzufügen, müssten Angreifer Tausende von Bildern verunreinigen, da diese Systeme auf Milliarden von Datenproben trainiert werden.

Trainer für generative KI-Modelle können auch Abwehrmaßnahmen gegen diese Praxis ergreifen, wie z. B. das Filtern von Daten mit hohem Verlust, Frequenzanalysen und andere Erkennungs-/Entfernungsmethoden, aber Ben Zhao sagte, dass diese nicht sehr robust seien.

Einige große KI-Unternehmen bieten Künstlern die Möglichkeit, ihre Arbeiten nicht in KI-Trainingsdatensätzen verwenden zu lassen. Dies kann jedoch ein mühsamer Prozess sein und berücksichtigt nicht Arbeiten, die möglicherweise verschrottet wurden. Viele sind der Meinung, dass Künstler sich dafür entscheiden können sollten, anstatt sich abmelden zu müssen.