Microsoft hat kürzlich sein Bildmodell zur Textgenerierung der neuesten Generation, MAI-Image-2.5, veröffentlicht und belegte sofort den dritten Platz in der neuesten Rangliste zur Textgenerierung von Arena. Dies zeigt, dass seine Gesamtstärke im Bereich der KI-Bildgenerierung deutlich zu den Branchenführern aufschließt. Derzeit steht gpt-image-2 von OpenAI auf dieser Liste mit einem Wert von 1388 an erster Stelle.

Laut Microsoft hat MAI-Image-2.5 seine Leistung in einer Vielzahl von Bildstilen umfassend verbessert, kann Benutzeraufforderungen zur Generierung von Bildern besser anpassen und weist erhebliche Verbesserungen bei der Textwiedergabe und Bildschirmdetails auf.

Microsoft hat im vergangenen Jahr zunächst sein selbst entwickeltes Bildgenerierungsmodell MAI-Image-1 auf den Markt gebracht. Das Modell belegte im Image Arena-Ranking von Arena nur den 9. Platz und unterschied sich damit deutlich von den Topmodellen anderer Labore zu dieser Zeit. Microsoft hat das Modell dann in Bing.com/create und die Bing-Mobilanwendung integriert und den Benutzern zur Verfügung gestellt. Im März dieses Jahres veröffentlichte das Microsoft AI-Team das MAI-Image-2 der zweiten Generation, das deutliche Verbesserungen bei der Leistung bei natürlichem Licht, der Wiederherstellung der Hautfarbe usw. mit sich brachte, und schaffte es zum ersten Mal in die Top 3 der Arena-Rangliste, nur hinter Googles gemini-3.1-flash-image-preview und OpenAIs gpt-image-1.5-high-fidelity. Es ist außerdem gleichzeitig mit Copilot, Bing Image Creator und der Microsoft Foundry API verbunden, damit Entwickler sie aufrufen können.

Auf dieser Basis stärkt die neue Generation MAI-Image-2.5 die Gesamtfähigkeiten des Modells weiter. Microsoft sagte, dass MAI-Image-2.5 die Textaufforderungen des Benutzers genauer verstehen und ausführen kann, die generierten Bilder in Details und Gesamtstruktur kohärenter seien und die Wiedergabe von Textinhalten zuverlässiger sei. Auch die visuellen Denkfähigkeiten des Modells wurden verbessert, mit einem genaueren Verständnis von Objekten, Beleuchtung, Proportionen, Szenenstrukturen und räumlichen Beziehungen, was dazu beiträgt, Bilder zu erzeugen, die realen Szenen und Benutzererwartungen besser entsprechen.

HJRDuJKbsAAbMCN.jpg

Microsoft betonte ausdrücklich, dass MAI-Image-2.5 die offensichtlichsten Fortschritte bei der Textwiedergabe, stilisierten Illustrationen und kommerziellen Bildern, einschließlich Postern, Verpackungsproofs, Markenkreativität und Produktbildern usw., gemacht hat, was zu einer qualitativ hochwertigeren Ausgabe führen kann. Im Vergleich zum Modell der vorherigen Generation ist der Text in den vom neuen Modell generierten Bildern klarer und schärfer, das Layout stabiler und die visuellen Elemente der Marke sind stärker hervorgehoben und haben eine allgemeinere Textur, was den Anforderungen kommerzieller Design- und Marketinganwendungen besser entspricht.

Mustafa Suleyman, Leiter von Microsoft AI, sagte auf sozialen Plattformen, dass MAI-Image-2.5 in der Rangliste der Arena Vincentian-Charts den dritten Platz belegt und damit einen weiteren wichtigen Sprung in der Qualität der Bilderzeugung markiert. Er sagte auch voraus, dass das Microsoft AI-Team auf der bevorstehenden Build-Konferenz weitere verwandte Updates und Releases bringen wird. Er sagte, dies sei nur ein weiterer Schritt in Microsofts Bemühungen im Bereich der KI-Bildgebung und werde die Iteration von Modellfunktionen und Produktformen auch in Zukunft weiter vorantreiben.

Derzeit steht MAI-Image-2.5 allen Benutzern zur Testnutzung über Arena offen und Benutzer können es direkt mit anderen Modellen auf der Plattform vergleichen und erleben. Nach dem Plan von Microsoft wird dieses neue Modell in den nächsten zwei Wochen auch auf MAI Playground und Microsoft Foundry eingeführt und bietet normalen Benutzern und Entwicklern vielfältigere Möglichkeiten zur generativen Bilderstellung und Integration.