Die Kläger einer Sammelklage, in der sie OpenAI der Verletzung der Privatsphäre von Trainingsdaten vorwarfen, ließen ihre Klage gegen das Unternehmen fallen. Der Fall wurde unbeschadet abgewiesen und die Kläger haben laut Gerichtsdokumenten die Möglichkeit, erneut zu klagen.Die Klage, die erstmals im Juni im nördlichen Bezirk von Kalifornien eingereicht wurde, wirft den Spidern von OpenAI vor, „das Eigentum und die Datenschutzrechte aller Personen zu verletzen, deren persönliche Daten für die Aufnahme in [OpenAIs] Produkte entwendet und missbraucht wurden“.

Die Namen der Kläger werden in der Klage nicht genannt, sie werden lediglich durch ihre Initialen identifiziert. Die Anwaltskanzlei Clarkson reichte in ihrem Namen eine Sammelklage ein.

OpenAI ruft, wie andere generative KI-Unternehmen, öffentlich verfügbare Daten aus dem Internet ab, um das Training großer Sprachmodelle zu unterstützen.

Es wurden mehrere Klagen darüber eingereicht, wie generative KI-Unternehmen wie OpenAI öffentlich verfügbare Daten erhalten und verwenden, um ihre Modelle zu trainieren. In den meisten Fällen geht es eher um heikle Urheberrechtsfragen als um Datenschutzfragen. Die Komikerin Sarah Silverman, die Autoren Christopher Golden und Richard Kadrey verklagten OpenAI und Meta und warfen ihnen Urheberrechtsverletzungen beim Training von GPT-4 und Llama2 vor.

Im Juli leitete die US-amerikanische Federal Trade Commission eine Untersuchung ein, um den möglichen Schaden von OpenAI für Verbraucher durch Datenerfassung und Veröffentlichung falscher Informationen zu untersuchen.

Im August gab OpenAI bekannt, dass Websitebesitzer nun ihre Webcrawler blockieren können. Einige Websites, darunter Nachrichtenverlage wie die New York Times, haben OpenAI daran gehindert, ihre Daten zu extrahieren.