Seit dem Aufkommen generativer KI und großer Sprachmodelle warnen einige davor, dass der von einer KI erzeugte Output letztendlich den Output nachfolgender KIs beeinflussen kann, wodurch eine gefährliche Rückkopplungsschleife entsteht. Wir haben jetzt einen solchen dokumentierten Fall, der die Risiken im aufstrebenden Technologiebereich noch deutlicher macht.

Beim Versuch, einen Chatbot mit künstlicher Intelligenz zu veranschaulichen, der falsche Informationen halluziniert, beeinflusste ein Forscher versehentlich die Rangfolge der Suchergebnisse, was dazu führte, dass ein anderer Chatbot halluzinierte. Dieser Vorfall zeigt die Notwendigkeit weiterer Schutzmaßnahmen, da KI-gestützte Suchmaschinen immer beliebter werden.

Der Informationswissenschaftsforscher Daniel S. Griffin veröffentlichte Anfang des Jahres auf seinem Blog zwei Beispiele für Chatbots, die falsche Informationen lieferten, an denen der einflussreiche Informatiker Claude E. Shannon beteiligt war. Griffin fügte auch einen Haftungsausschluss hinzu, in dem er feststellte, dass die vom Chatbot bereitgestellten Informationen unwahr seien, um zu verhindern, dass Maschinensucher die Informationen indizieren, aber das reichte nicht aus.

Griffin entdeckte schließlich, dass mehrere Chatbots, darunter Bing und Google Bard von Microsoft, seine halluzinatorischen Nachrichten mit echten Nachrichten verwechselten und sie in den Suchergebnissen höher einordneten. Als ihnen spezifische Fragen zu Shannon gestellt wurden, bauten die Bots auf Griffins Warnungen mit einer konsistenten, aber falschen Erzählung auf und schrieben Shannon eine Arbeit zu, die Shannon nie geschrieben hatte. Noch besorgniserregender ist, dass die Suchergebnisse von Bing und Bard nicht darauf hindeuteten, dass es sich bei ihrer Quelle um einen LL.M.-Absolventen handelte.

Diese Situation ähnelt der Situation, in der Menschen Quellen außerhalb des Kontexts oder aus dem Kontext zitieren, was zu fehlerhaften Recherchen führt. Griffins Fall zeigt das Potenzial generativer KI-Modelle, solche Fehler in erschreckendem Ausmaß automatisch zu korrigieren.

Anschließend korrigierte Microsoft den Fehler in Bing und ging davon aus, dass das Problem eher dann auftrat, wenn es um Themen mit relativ wenig von Menschen geschriebenem Material im Internet ging. Ein weiterer Grund für die Gefährlichkeit dieses Präzedenzfalls besteht darin, dass er böswilligen Akteuren eine theoretische Blaupause bietet, um LLM gezielt auszunutzen, um Fehlinformationen zu verbreiten, indem sie Suchergebnisse beeinflussen. Es ist bekannt, dass Hacker Malware verbreiten, indem sie betrügerische Websites so manipulieren, dass sie in den Suchergebnissen Spitzenplätze erreichen.

Die Sicherheitslücke fällt mit einer Warnung im Juni zusammen, dass, wenn mehr LLM-generierte Inhalte im Web verfügbar werden, diese zum Training zukünftiger LLMs verwendet werden. Die daraus resultierende Rückkopplungsschleife kann die Qualität und Glaubwürdigkeit von KI-Modellen erheblich schwächen, was als „Modellkollaps“ bekannt ist.

Unternehmen, die KI einsetzen, sollten sicherstellen, dass Schulungen weiterhin von Menschen erstellte Inhalte priorisieren. Die Bewahrung weniger sichtbarer Informationen und Materialien von Minderheitengruppen kann zur Lösung dieses Problems beitragen.