Die Medien entdeckten, dass das ChatGPT-Suchtool mit versteckten Inhalten manipuliert werden kann und schädlichen Code von den durchsuchten Websites zurückgeben kann. Nach dem Angriff durch versteckten Text ignorierte ChatGPT selbst negative Benutzerbewertungen auf einer Produktseite und reagierte mit einer positiven Bewertung des Produkts.

Nur eine Woche, nachdem OpenAI offiziell die weltweite Einführung seines ChatGPT-Suchdienstes angekündigt hatte, wurde bekannt, dass dieser Sicherheitsrisiken birgt und Benutzer täuschen und irreführen könnte.

Eine kürzlich vom britischen „Guardian“ veröffentlichte Studie ergab, dass das Suchtool ChatGPT möglicherweise mit versteckten Inhalten manipuliert wird und von den durchsuchten Websites möglicherweise Schadcode zurückgibt. Die Medien sind der Ansicht, dass das Risiko einer böswilligen Nutzung verwandter Technologien möglicherweise überdacht werden muss. Dies kann beispielsweise dazu führen, dass ChatGPT diese negativen Bewertungen und Rückmeldungen ignoriert, selbst wenn auf einer Produktseite negative Bewertungen von Benutzern vorliegen. Die Antwort des Benutzers ist eine positive Bewertung des Produkts.

Der Guardian testete, wie ChatGPT auf Anfragen reagierte, Webseiten mit versteckten Inhalten zusammenzufassen. Dieser versteckte Inhalt kann Anweisungen von Dritten enthalten, die die Antworten von ChatGPT ändern, auch bekannt als „Promptinjection“. Es kann auch Inhalte enthalten, die darauf abzielen, die Reaktionen von ChatGPT zu beeinflussen, beispielsweise große Mengen versteckten Textes, der über die Vorteile eines Produkts oder einer Dienstleistung spricht.

In einem Test bat der Guardian ChatGPT, die URL einer gefälschten Website zu erhalten, die wie eine Kameraproduktseite aussah, und fragte ChatGPT dann, ob sich der Kauf der Kamera lohnte. Die ChatGPT-Antwort auf der Kontrollseite ergab eine positive, aber ausgewogene Bewertung und hob einige Funktionen hervor, die den Leuten möglicherweise nicht gefallen. Wenn der versteckte Text jedoch Anweisungen dazu enthielt, dass ChatGPT eine positive Bewertung zurückgibt, war die tatsächliche Antwort von ChatGPT immer völlig positiv. Dies gilt auch dann, wenn auf der Seite negative Bewertungen vorhanden sind. Es ist ersichtlich, dass versteckter Text dazu verwendet werden kann, die eigentliche Rezension zu überschreiben.

In einigen Kommentaren heißt es, dass versteckte Textangriffe ein häufiges Risiko für große Sprachmodelle (LLM) darstellen, aber dies scheint das erste Mal zu sein, dass solche Risiken in Echtzeit-KI-Suchprodukten festgestellt wurden. Der Guardian erklärte, dass Google, der führende Anbieter im Suchbereich, mehr Erfahrung im Umgang mit ähnlichen Problemen habe als OpenAI.

OpenAI äußerte sich nicht zu den Testergebnissen des Guardian, sagte jedoch, dass es verschiedene Methoden zum Blockieren bösartiger Websites einsetze und sich ständig verbessere.