ChatGPT Images 2.0: OpenAI verspricht einen riesigen Sprung bei der Bildgenerierung

Nachdem OpenAI Sora auf den Kopf gestellt hat, stellt es ChatGPT Images 2.0 bereitdie neueste Version seines KI-Bildgenerators. Aufbauend auf dem neuen gpt-image-2-Modell bringt dieses Update erhebliche Verbesserungen in Bezug auf Wiedergabetreue, Kontrolle und Kontextverständnis.

OpenAI-Chef Sam Altman hebt erhebliche Fortschritte hervor und zieht eine Analogie zum Sprung von GPT-3 zu GPT-5 für ein Update, das ChatGPT- und Codex-Benutzern zur Verfügung steht.

Neue Denkfähigkeiten

Eine neue Funktion von ChatGPT Images 2.0 sind die Reflexionsfunktionen, die Abonnenten der ChatGPT Plus-, Pro- und Business-Angebote vorbehalten sind.

In diesem erweiterten Modus benötigt das Modell mehr Zeit, um eine Abfrage eingehend zu analysieren. Es kann Echtzeitinformationen im Internet durchsuchenErstellen Sie mehrere separate Bilder aus einer einzigen Eingabeaufforderungund überprüfen Sie Ihre eigenen Ergebnisse.

chatgpt-images-2.0

Es ist möglich, bis zu acht zusammenhängende Bilder auf einmal zu erzeugen und dabei die Kontinuität von Charakteren und Stilen zu wahren. OpenAI nennt Anwendungsfälle wie die Erstellung von Manga-Seiten, Designkonzepte für ein Haus oder Grafikserien für soziale Netzwerke.

Verbesserungen für alle Benutzer

ChatGPT Images 2.0 zeigt eine viel bessere Bereitschaft, Schritt-für-Schritt-Anweisungen zu befolgen und komplexe Elemente darzustellen, die bei früheren Modellen problematisch waren, einschließlich kleiner Texte, Ikonographie und Elemente der Benutzeroberfläche.

Textgenerierunghistorisch gesehen eine Schwachstelle, wurde erheblich verbessert. Das Modell erlangt Mehrsprachigkeit und verbessert die Wiedergabe nicht-lateinischer Texte, insbesondere Japanisch, Koreanisch, Chinesisch, Hindi und Bengali.

chatgpt-images-2.0

Auch die Stiltreue wird erhöht, sei es für Fotorealismus, Pixelkunst oder Manga. Endlich Unterstützung für neue Bildformatebis zu 3:1 in der Breite und 1:3 in der Höhe, bietet mehr Flexibilität für Anwendungen wie Banner oder mobile Bildschirme.

OpenAI gibt zu, dass es noch nicht perfekt ist

Trotz dieser Fortschritte erkennt OpenAI an, dass das Modell nicht perfekt ist. Möglicherweise hat er immer noch Schwierigkeiten mit sehr dichten oder sich wiederholenden visuellen Details. sowie Aufgaben, die ein komplexes physikalisches Verständnis der Welt erfordern. Diese und andere Einschränkungen sind „ wichtige Grenzen für die zukünftige Arbeit „.