Forscher stellen fest, dass ChatGPT durch die Wiederholung bestimmter Wörter vertrauliche Informationen preisgeben kann

Ein Team von Google-Forschern hat herausgefunden, dass der Chatbot ChatGPT für künstliche Intelligenz von OpenAI vertrauliche Informationen in seinen Trainingsdaten preisgeben kann, beispielsweise die persönlichen Daten realer Personen. Es wird berichtet, dass ChatGPT ein neues KI-Chatbot-Tool ist, das am 30. November 2022 von OpenAI eingeführt wurde. Es kann je nach Benutzeranforderungen schnell Artikel, Geschichten, Texte, Prosa, Witze und sogar Codes generieren und verschiedene Fragen beantworten.

Nur zwei Monate nach seiner Einführung erreichte ChatGPT 100 Millionen aktive Nutzer pro Monat und ist damit eine der am schnellsten wachsenden Verbraucher-Apps in der Geschichte. Auf der ersten OpenAI-Entwicklerkonferenz am 6. November dieses Jahres gab OpenAI-CEO Sam Altman bekannt, dass die Zahl der wöchentlichen aktiven Benutzer von ChatGPT 100 Millionen erreicht hat.

Wie alle sogenannten Large Language Models (LLMs) werden die zugrunde liegenden maschinellen Lernmodelle, die ChatGPT antreiben, mithilfe großer Datenmengen aus dem Internet trainiert. Besorgniserregend war jedoch, dass einige der extrahierten Trainingsdaten identifizierende Informationen über echte Personen enthielten, darunter Namen, E-Mail-Adressen und Telefonnummern.

Google-Forscher haben eine Möglichkeit gefunden, ChatGPT dazu zu bringen, einige der für das Training verwendeten Daten offenzulegen, indem sie es auffordern, bestimmte Wörter „für immer“ zu wiederholen. Zu den Daten gehörten private Informationen (z. B. persönliche Namen, E-Mails, Telefonnummern usw.), Ausschnitte aus Forschungsarbeiten und Nachrichtenartikeln, Wikipedia-Seiten und mehr.

Katherine Lee, leitende Forschungswissenschaftlerin bei Google Brain, sagte: „Wir haben diese Schwachstelle im Juli entdeckt und OpenAI am 30. August benachrichtigt, und nach der standardmäßigen Offenlegungsfrist von 90 Tagen haben wir die Schwachstelle freigegeben. Nachdem wir dies nun OpenAI offengelegt haben, könnte die Situation jetzt anders sein.“ Forscher sagten, dass OpenAI die Schwachstelle am 30. August behoben habe.

Ausländische Medien sagten, dass die von Google-Forschern entdeckte Schwachstelle in ChatGPT ernsthafte Bedenken hinsichtlich des Datenschutzes aufwirft, insbesondere für Modelle, die mit Datensätzen trainiert wurden, die sensible Informationen enthalten.