OpenAI führt seinen neuesten Text-zu-Bild-Generator in größerem Umfang ein. Am Donnerstag wird das Unternehmen das neue DALL-E3-Modell für die Verwendung in der ChatGPT-Anwendung für ChatGPTPlus- und Unternehmenskunden verfügbar machen. OpenAI sagte, es habe einen Sicherheitsminderungs-Stack für das Modell vorbereitet, der es ihm ermöglicht, seine Veröffentlichung zu erweitern.
DALL-E3 wurde letzten Monat erstmals veröffentlicht, und OpenAI zeigte, wie es sich gegenüber dem vorherigen DALL-E2 verbesserte, indem es Benutzern ermöglichte, ChatGPT zu nutzen, um längere, visuell anschaulichere Eingabeaufforderungen für die Verwendung durch Bildgeneratoren zu schreiben. DALL-E3 wurde zu Bing Chat und Bing Image Generator hinzugefügt, wodurch Microsofts Plattform die erste war, die der Öffentlichkeit einen umfassenderen Modellzugang bot – noch vor ChatGPT.
Die beworbenen Schutzmaßnahmen zur Reduzierung schädlicher Bilder funktionierten nicht immer, da Benutzer Bilder des World Trade Centers erstellten, auf denen SpongeBob Schwammkopf und andere Charaktere zu sehen sind, die Flugzeuge auf die Gebäude zufliegen. Obwohl Microsoft versucht hat, bestimmte Eingabeaufforderungen zu blockieren, haben andere einfache Problemumgehungen zu ähnlichen Ergebnissen geführt.
Text-zu-Bild-Generatoren wie Midjourney, StableDiffusion und frühere Versionen von DALL-E haben alle für Kontroversen gesorgt. Die Technologie hat urheberrechtlich geschütztes Bildmaterial, nicht einvernehmliche Nacktheit, rassenverändernde Motive und fotorealistische Falschdarstellungen von Persönlichkeiten des öffentlichen Lebens exportiert.
OpenAI verspricht dieses Mal einen breiteren Ansatz und hat eine Website bereitgestellt, auf der die zu DALL-E3 durchgeführten Forschungsarbeiten vorgestellt werden. Das Unternehmen sagt, es werde „die Wahrscheinlichkeit begrenzen, dass Models Inhalte generieren, die von lebenden Künstlern und Bildern von Persönlichkeiten des öffentlichen Lebens gestaltet wurden, und die demografische Darstellung der generierten Bilder verbessern.“ OpenAI verfügt außerdem über ein internes Tool zur „Herkunftsklassifizierung“, das laut eigenen Angaben mit einer Genauigkeit von 99 % erkennt, ob ein Bild von DALL-E3 generiert wurde.