Google hat TextFX veröffentlicht, ein neues Tool zur Bilderstellung mit künstlicher Intelligenz. TextFX basiert auf Imagen2, dem vom Google DeepMind-Team entwickelten GenAI-Bildmodell, und bietet eine auf Eingabeaufforderungen basierende Benutzeroberfläche zum Erstellen und Bearbeiten von Bildern.Dies unterscheidet sich nicht von Tools wie DALL-E3 von OpenAI, Midjourney, ImaginewithMetaAI von Meta und Microsoft Designer. Die Einzigartigkeit von TextFX liegt jedoch im „Ausdruck“, der als Liste von Schlüsselwortvorschlägen verstanden werden kann, die es Benutzern ermöglicht, ihre Kreationen und Ideen in der „angrenzenden Dimension“ auszuprobieren.
Google schrieb in einem Blogbeitrag: „ImageFX wurde für Experimente und Kreativität entwickelt und ermöglicht es Ihnen, Bilder mit einfachen Texteingabeaufforderungen zu erstellen und diese dann mithilfe des Expression Chip problemlos mit neuen Eingabeaufforderungen zu ändern.“
Google gibt an, Maßnahmen ergriffen zu haben, um sicherzustellen, dass TextFX nicht auf unbeabsichtigte Weise verwendet wird, beispielsweise durch die Einführung „technischer Schutzmaßnahmen“, um „problematische Ausgaben“ wie gewalttätige, beleidigende und pornografische Inhalte einzuschränken. TextFX richtet außerdem einen Filter auf Eingabeaufforderungsebene für „benannte Personen“ (bei denen es sich möglicherweise um Persönlichkeiten des öffentlichen Lebens handelt) ein – obwohl Google dies in seinen Pressematerialien nicht besonders deutlich macht.
„Wir haben von Anfang an in die Sicherheit unserer Trainingsdaten investiert“, sagte Google. „Im Einklang mit unseren KI-Grundsätzen führen wir außerdem umfangreiche kontradiktorische Tests und Red Teaming durch, um potenziell schädliche und problematische Inhalte zu identifizieren und zu entschärfen.“
Als zusätzliche Sicherheitsmaßnahme markiert Google mit ImageFX erstellte Bilder mit einem digitalen SynthID-Wasserzeichen, das angeblich äußerst resistent gegen Bildbearbeitung und -zuschnitt ist.
Google fuhr im Blog-Beitrag fort: „SynthID-Wasserzeichen sind für das bloße Auge unsichtbar, können aber zur Identifizierung verwendet werden. Mit zusätzlichen Einblicken in „Über dieses Bild“ wissen Sie, wenn Sie ein Bild in der Google-Suche oder in Chrome sehen, ob es wahrscheinlich von Googles Tools für künstliche Intelligenz generiert wurde.“
Sie finden ImageFX in AITestKitchen, der Web-App von Google für experimentelle Projekte im Bereich der künstlichen Intelligenz.
Imagen2-Erweiterung
In einer entsprechenden Nachricht gab Google heute bekannt, dass Imagen2 ab dieser Woche in weitere Produkte und Dienste integriert werden wird, darunter das Sucherlebnis der nächsten Generation mit künstlicher Intelligenz und die VertexAI-Reihe verwalteter Dienste mit künstlicher Intelligenz.
Jetzt unterstützt Imagen2 auch die Text-zu-Bild-Funktion in Google Ads und DuetAI in Workspace, der Produktivitätsproduktsuite von Google GenAI, und hat Eingang in die SGE (Search Generation Experience) von Google gefunden. SGE begann im Oktober letzten Jahres damit, Nutzern Tools zur Bildgenerierung in der Google-Bildersuche zur Verfügung zu stellen und verwendet nun Imagen2 zur Generierung von Bildern. Benutzer können eine Eingabeaufforderung eingeben, die beschreibt, welche Art von Bild sie möchten, und SGE gibt vier Ergebnisse direkt im SGE-Konversationserlebnis zurück.
In VertexAI steht Imagen2 Google Cloud-Kunden über die API zur Verfügung. An anderer Stelle ist Imagen2 jetzt über Bard, den KI-Chatbot von Google, verfügbar.
Google erklärt: „Mit Imagen2 kann Bard einfache oder komplexe Eingabeaufforderungen verstehen, sodass Sie eine Reihe hochwertiger Bilder generieren können. Geben Sie einfach eine Beschreibung ein – wie zum Beispiel „Erstellen Sie ein Bild eines Hundes, der auf einem Surfbrett reitet“ – und Bard generiert eine benutzerdefinierte, breite Palette visueller Bilder, die Ihnen dabei helfen, Ihre Ideen zum Leben zu erwecken.“
Google hat die zum Trainieren von Imagen2 verwendeten Daten immer noch nicht offengelegt, was nicht überraschend ist. Ob GenAI-Anbieter wie Google Modelle anhand öffentlicher Daten (sogar urheberrechtlich geschützter Daten) trainieren und dieses Modell dann kommerzialisieren können, ist eine ungeklärte Rechtsfrage.
Es ist ein Rechtsstreit vor Gericht anhängig und die Anbieter glauben, dass sie durch die Fair-Use-Doktrin geschützt sind. Aber es wird einige Zeit dauern, bis sich der Staub gelegt hat.
Google schweigt unterdessen vorsorglich zu der Angelegenheit.