Führungskräfte von MetaPlatforms sagten Reuters in einem Interview, dass das Unternehmen öffentliche Beiträge auf Facebook und Instagram nutzte, um einige der Funktionen seines neuen virtuellen Assistenten Meta für künstliche Intelligenz zu trainieren, private Beiträge jedoch ausschloss, die nur mit Familie und Freunden geteilt wurden, um die Privatsphäre der Verbraucher zu respektieren.

Meta nutzt auch keine privaten Chats in seinem Messaging-Dienst als Trainingsdaten für seine Modelle und hat Schritte unternommen, um private Details aus dem öffentlichen Datensatz, der für das Training verwendet wird, herauszufiltern, sagte Nick Clegg, Metas Präsident für globale Angelegenheiten, diese Woche am Rande der jährlichen Connect-Konferenz des Unternehmens.

„Wir haben versucht, Datensätze auszuschließen, in denen überwiegend persönliche Informationen vorhanden sind“, sagte Clegg und fügte hinzu, dass die „große Mehrheit“ der Daten, die Meta für das Training verwendet, öffentlich verfügbar sei.

Als Beispiel nannte er LinkedIn und wies darauf hin, dass Meta die Inhalte der Seite aus Datenschutzgründen bewusst nicht nutzt.

Cleggs Kommentare kommen zu einem Zeitpunkt, an dem Technologieunternehmen wie Meta, OpenAI und Alphabets Google dafür kritisiert werden, dass sie ohne Erlaubnis Informationen aus dem Internet nutzen, um ihre Modelle für künstliche Intelligenz zu trainieren.

Die beiden Unternehmen überlegen, wie sie mit privatem oder urheberrechtlich geschütztem Material umgehen sollen, das ihre künstlichen Intelligenzsysteme dabei möglicherweise kopieren, und sehen sich gleichzeitig mit Klagen von Autoren konfrontiert, die ihnen Urheberrechtsverletzungen vorwerfen.

Vorstandsvorsitzender Mark Zuckerberg stellte am Mittwoch auf Metas jährlicher Produktkonferenz „Connect“ die ersten verbraucherorientierten Tools für künstliche Intelligenz des Unternehmens vor, wobei MetaAI das wichtigste Produkt war. Die diesjährige Konferenz konzentrierte sich auf künstliche Intelligenz, im Gegensatz zu früheren Konferenzen, die sich auf Augmented Reality und Virtual Reality konzentrierten.

Meta sagt, dass der Assistent ein benutzerdefiniertes Modell verwendet, das auf dem leistungsstarken Llama2-Sprachmodell im großen Maßstab basiert, das im Juli dieses Jahres für die kommerzielle Nutzung verfügbar gemacht wurde, sowie ein neues Modell namens Emu, das Bilder basierend auf Textaufforderungen generiert.

Das Produkt wird in der Lage sein, Text, Audio und Bilder zu generieren und durch die Zusammenarbeit mit der Bing-Suchmaschine von Microsoft auf Echtzeitinformationen zuzugreifen. Öffentliche Facebook- und Instagram-Beiträge, die zum Trainieren von MetaAI verwendet werden, enthalten auch Text und Fotos.

Ein Sprecher von Meta sagte gegenüber Reuters, dass die Beiträge dazu verwendet wurden, Emus Bilderzeugungsfähigkeiten zu trainieren, während die Chat-Funktion auf Llama2 basierte und öffentlich verfügbare kommentierte Datensätze hinzufügte.

Die Interaktion mit MetaAI könnte auch zur Verbesserung zukünftiger Funktionen genutzt werden, sagte der Sprecher. Meta erlegt Sicherheitsbeschränkungen für das auf, was MetaAI-Tools generieren können, beispielsweise das Verbot der Erstellung realistischer Bilder von Persönlichkeiten des öffentlichen Lebens.

In Bezug auf urheberrechtlich geschütztes Material sagte Clegg, er erwarte „einen erheblichen Rechtsstreit“ darüber, ob „kreative Inhalte unter die bestehende Fair-Use-Doktrin fallen“, die eine begrenzte Nutzung geschützter Werke für Zwecke wie Kommentare, Recherchen und Parodien zulässt.

Einige Unternehmen, die über Tools zur Bildgenerierung verfügen, machen es einfach, ikonische Charaktere wie Mickey Mouse nachzubilden, während andere für das Filmmaterial bezahlen oder es bewusst vermeiden, es in ihre Trainingsdaten aufzunehmen.

OpenAI beispielsweise hat diesen Sommer einen Sechsjahresvertrag mit dem Content-Anbieter Shutterstock unterzeichnet, um die Bild-, Video- und Musikbibliothek des Unternehmens für Schulungen zu nutzen.

Auf die Frage, ob Meta solche Schritte unternommen habe, um das Kopieren urheberrechtlich geschützter Bilder zu vermeiden, stellte ein Meta-Sprecher fest, dass die neuen Nutzungsbedingungen benutzergenerierte Inhalte verbieten, die die Privatsphäre und Rechte an geistigem Eigentum verletzen.