Mit OpenAI gpt-image-2

gpt-image-2 · GAAPI live

Die Bild-API das liest was es schreibt.

OpenAI gpt-image-2 hinter einem HTTP-Endpunkt. Nativer 2K-Text, mehrsprachiger Text mit einer Lesbarkeit von über 95 % und eine Argumentation, die jede Anweisung in Ihrer Eingabeaufforderung berücksichtigt.

Holen Sie sich einen API-Schlüssel Lesen Sie die Dokumente

5 kostenlose Credits bei der AnmeldungAb $0,035 / Bild · ~75 % unter OpenAI-Liste⌘KMehrsprachige Textwiedergabe

POST /v1/images

$ curl https://gptimage2.com/api/images \
  -H "Authorization: Bearer $GPTIMAGE2_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{ "model": "gpt-image-2", "prompt": "editorial portrait, shallow dof", "size": "1024x1024" }'

cURL · Node · Python

— Beispielausgaben —04 / 04

Photorealistic candid photograph of an elderly sailor on a small fishing boat. W — /gpt-image-201

In this room photo, replace ONLY the white chairs with chairs made of wood. Pres — /gpt-image-202

/gpt-image-203

A simple biology diagram titled "Cellular Respiration at a Glance" for high scho — /gpt-image-204

gpt-image-2 · 1024pxLive-Beispiele

Benchmarks

Wie es stapelt sich.

Unabhängige Benchmarks von LM Arena und Artificial Analysis. Die folgenden Zahlen stammen von Dritten – nicht von uns.

LM Arena ELO-Führung

+242

vs. Nano Banana Pro

Mehrsprachiger Text

99%+

EN · ZH · JA · KO · AR

Generationszeit

~3s

Instant-Modus

Pro Bild, Ihr Preis

$0,035

vs. $0,21 OpenAI-Liste · ~75 % Rabatt

Fähigkeit	gpt-image-2 OpenAI	Nano Banana Pro Gemini 3 Pro-Bild	Nano Banana 2 Gemini 3.1 Flash-Image
LM Arena ELO (Text-zu-Bild)	1,512	1,360	1,360
Textgenauigkeit im Bild	99 %+ mehrsprachig	Stark (EN-Fokus)	Stark (EN-Fokus)
Generationszeit	~3 s	10–20 s	4–8 Sek
Native Auflösung	2K (4K hochskaliert)	1K (4K verfügbar)	1K (4K verfügbar)
Argumentationsmodus	Integriertes Denken	—	Minimal · Hoch · Dynamisch
Mehrsprachige Skripte	EN · ZH · JA · KO · AR · HI · BN	EN-stark, andere variabel	EN-stark, andere variabel
Charakterkonsistenz	Pixelebene über Winkel hinweg	Bis zu 5 Fächer	Bis zu 5 Fächer
Charge pro Anruf	Bis zu 10	Mehrere	1–4
API-Schema	OpenAI-Bilder (Drop-in)	Google Gemini API	Google Gemini API
Offizieller Listenpreis (1024px, hoch)	$0.21	$0.12	$0.06–$0.12

Ihr Preis vs. die anderen

Gleiches Modell. Ein Bruchteil der Kosten.

OpenAI direkt

$0,21

Liste · 1024px · hoch

Nano Banana Pro

$0,12

Liste · 2K nativ

gptimage2api.orgBestes Angebot

$0,035

Ab, pro gpt-image-2-Bild · Volumen-Creditpack

Kosteneffizient gebaut

Wir kaufen OpenAI-Kapazität in großen Mengen vorab und geben den Mengenrabatt über Credit-Pakete weiter. Damit kostet gpt-image-2 auf Ihrem Konto nur $0,035–$0,056 pro Bild – dasselbe OpenAI-Modell, ~75 % unter dem direkten Listenpreis und günstiger als jede Nano-Banana-Stufe. Nutzen Sie es als Standard, nicht nur für Hero-Assets.

Quellen: LM Arena-Rangliste · Künstliche Analyse · OpenAI gpt-image-2-Modellseite · fal.ai-Benchmarks

Fähigkeiten

Öffentliche APIs, keine Platzhalter.

Die folgenden Karten spiegeln nun die Dokumente wider: echte öffentliche Endpunkte, echte Modell-IDs und die Bild- und Video-APIs, die tatsächlich zuerst aufgerufen werden – GPT Image 2, die drei Nano Banana-Stufen, Veo 3.1 und Sora 2.

POST/api/ai/image/generate

model: gpt-image-2

GPT Image 2 API

Our primary OpenAI image endpoint. Use `gpt-image-2` on `POST /api/ai/image/generate` for text-to-image or image-to-image with the same model ID and a flat 3-credit call.

Referenz anzeigen

POST/api/ai/image/generate

model: google/nano-banana

Nano-Bananen-API

The fastest Nano Banana tier. Call `POST /api/ai/image/generate` with `google/nano-banana` for lightweight text-to-image or image-to-image jobs at a flat 3 credits.

Referenz anzeigen

POST/api/ai/image/generate

model: nano-banana-2

Nano Banana 2 API

Die Flaggschiff-Bildebene von Google in diesem Stapel. Gleicher öffentlicher Bildendpunkt, Modell-ID `nano-banana-2`, mit 1K-/2K-/4K-Ausgabeebenen und bis zu 14 Referenzbildern.

Referenz anzeigen

POST/api/ai/image/generate

model: nano-banana-pro

Nano Banana Pro-API

Die teurere Nano-Bananen-Variante mit höherer Wiedergabetreue. Verwenden Sie `nano-banana-pro` auf demselben Bildendpunkt, wenn Sie eine 2K-/4K-Ausgabe und eine stärkere Premium-Generierung benötigen.

Referenz anzeigen

POST/api/ai/video/generate

model: veo3 / veo3_fast / veo3_lite

Veo 3.1 Video API

Flagship Google video generation through `POST /api/ai/video/generate`. Public models include `veo3`, `veo3_fast`, and `veo3_lite`, with both text-to-video and image-to-video support.

Referenz anzeigen

POST/api/ai/video/generate

model: sora-2-*

Sora 2 Video API

OpenAI-Videogenerierung auf dem öffentlichen Videoendpunkt. Unterstützt `sora-2-text-to-video`, `sora-2-pro-text-to-video` und `sora-2-image-to-video` für die bekanntesten OpenAI-Video-Einstiegspunkte.

Referenz anzeigen

Notizbuch

Was macht gpt-image-2 anders.

Vier Schichten gegenüber der vorherigen Generation – die Gründe, warum Produktionsteams aufgehört haben, sich mit verstümmeltem Text, abweichenden Zeichen und ignorierten Eingabeaufforderungen herumzuschlagen.

Poster, Benutzeroberflächen und Beschilderungen mit tatsächlich lesbarem Text – in Englisch, Chinesisch, Japanisch, Koreanisch, Arabisch und mehr, mit einer Genauigkeit von über 95 % bei der ersten Generation. Das Schlagzeilen-Upgrade gegenüber gpt-image-1.5.

DAYBREAK to-do app screen — every slot filled with measurable instructions: hierarchy, exact copy, typography, spacing.

Lesbarer mehrsprachiger Text

fr · 1 / 4

Preise

Pro Bild. Keine Überraschungen.

Zahlen Sie nur für die Bilder, die Sie generieren. Beginnen Sie mit 5 kostenlosen Credits bei der Anmeldung – keine Karte erforderlich – und skalieren Sie dann mit dem Pauschalpreis pro Bild für gpt-image-2.

Lite

$13.90

250 credits≈ 250 GPT-Image-2-Bilder

Einsteiger-API für Indie-Entwickler

250 Credits
Bildgenerierungs-API
3 parallele Anfragen
E-Mail-Support
Videogenerierungs-API
Kommerzielle Lizenz

Beliebt

Pro

Credits

1,000

$44.90

1,000 credits≈ 1,000 GPT-Image-2-Bilder

Skalierbare API für produktive Workloads

1,000–8,000 Credits
Bild- & Video-API
10 parallele Anfragen
Prioritätswarteschlange — 2× schneller
Kommerzielle Lizenz

Geschäft

$529.90

16,000 credits≈ 16,000 GPT-Image-2-Bilder

High-Volume-API für Teams und Agenturen

16,000 Credits
Alle Modelle + Early Access
50 parallele Anfragen
Dedizierte Warteschlange — 3× schneller
Team-Sitze + Nutzungs-Dashboard
Priority-Support & SLA

Oder starten Sie kostenlos

Kostenlos

50 credits≈ 50 GPT-Image-2-Bilder

Starten Sie mit KI-Bildgenerierung

5 Credits pro Tag (Anmeldung erforderlich)
Standardqualität
Community-Support
Basis-KI-Modelle
HD & 4K Auflösung
Prioritätswarteschlange

FAQ

Antworten

Häufige Fragen, die Teams stellen, bevor sie GPT Image 2 in ihren Stack integrieren.

Brauchen Sie noch Hilfe? Sprich mit einem Menschen

GPT Image 2 (Modell-ID gpt-image-2) ist das native Bildmodell der zweiten Generation von OpenAI, das am 21. April 2026 veröffentlicht wurde. Es folgt GPT Image 1.5 mit drei wesentlichen Änderungen: mehrsprachige Textwiedergabe im Bild mit einer Lesbarkeit von über 95 %, Argumentation, die mehrschichtige Eingabeaufforderungen interpretiert, und native 2K-Auflösung mit optionaler 4K-Hochskalierung. Wir stellen das Modell über eine HTTPS-API bereit, die Text-zu-Bild, Bearbeitung in natürlicher Sprache, Variationen, Stilübertragung, 4K-Upscale und Multi-Referenz-Mischung abdeckt.

Drei Orte. (1) Text in Bildern: 1,5 Treffer ~70 % nur bei lateinischen Schriften; gpt-image-2 erreicht 95 %+ auf Englisch, Chinesisch, Japanisch, Koreanisch und Arabisch. (2) Sofortige Wiedergabetreue: 1,5 beginnt mit dem Weglassen von Elementen nach sechs oder sieben; gpt-image-2 enthält dank der Argumentationsintegration Szenen mit fünfzehn Elementen. (3) Auflösung: natives 2K (im Vergleich zu 1K), mit optionaler zerstörungsfreier 4K-Hochskalierung. Aus Gründen der Abwärtskompatibilität wird DALL-E 3 weiterhin ausgeliefert, gpt-image-2 ist jedoch das Modell, auf dem man aufbauen kann.

Zwei Orte, die Sie vor dem Versand kennen sollten. Die Reproduktion von Markenlogos ist unzuverlässig – für exakte Vektormarkierungen setzen Sie diese nach der Generierung in Photoshop oder Figma zusammen. Und die Erzeugung ist langsamer als bei leichten Modellen wie FLUX, typischerweise 30–60 Sekunden pro Bild. Für Produktionspipelines ist dies ein fairer Tausch für die schnelle Wiedergabetreue, aber nicht die richtige Wahl für sofortige interaktive Benutzeroberflächen.

Ja. Neue Konten erhalten bei der Anmeldung 5 kostenlose Bild-Credits – keine Karte erforderlich. Tägliche Gratisguthaben werden wochentags aktualisiert, sodass Sie durch Prototyping weiterbauen können.

Ja. Jede kostenpflichtige Stufe beinhaltet eine gebührenfreie kommerzielle Lizenz für Werbung, E-Commerce, redaktionelle, gedruckte und abgeleitete Werke. Sie besitzen die vollen Rechte an Ihren Ausgaben; wir behalten keine.

Jeder HTTP-Client funktioniert. Das Anforderungsschema spiegelt die Bilder-API von OpenAI wider, sodass vorhandene OpenAI-SDKs (TypeScript, Python, Go, Swift) die Basis-URL umleiten und weiter ausführen können. Innerhalb von Bildern stellt gpt-image-2 zuverlässig Englisch, Chinesisch, Japanisch, Koreanisch, Arabisch und die meisten anderen wichtigen Skripte dar.

Brauchen Sie noch Hilfe? Sprich mit einem Menschen

Beginnen Sie mit dem Versand

Von prompt bis Produktion bis zum Ende des Tages.

Ein Curl-Aufruf, ein Webhook, dann lebt gpt-image-2 in Ihrem Produkt. Das Anforderungsschema spiegelt die Bilder-API von OpenAI wider – die meisten vorhandenen SDKs benötigen lediglich eine Änderung der Basis-URL, um mit der Generierung zu beginnen.

Holen Sie sich einen API-Schlüssel Sehen Sie sich die Dokumente an

5 kostenlose CreditsKeine Karte erforderlichOpenAI-kompatibles Schema

Die Bild-API das liest was es schreibt.

5 kostenlose Credits bei der AnmeldungAb $0,035 / Bild · ~75 % unter OpenAI-Liste⌘KMehrsprachige Textwiedergabe

POST /v1/images

$ curl https://gptimage2.com/api/images \
  -H "Authorization: Bearer $GPTIMAGE2_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{ "model": "gpt-image-2", "prompt": "editorial portrait, shallow dof", "size": "1024x1024" }'

cURL · Node · Python

Fähigkeit

gpt-image-2

OpenAI

Nano Banana Pro

Gemini 3 Pro-Bild

Nano Banana 2

Gemini 3.1 Flash-Image

LM Arena ELO (Text-zu-Bild)

1,512

1,360

Textgenauigkeit im Bild

99 %+ mehrsprachig

Stark (EN-Fokus)

Generationszeit

~3 s

10–20 s

4–8 Sek

Native Auflösung

2K (4K hochskaliert)

1K (4K verfügbar)

Argumentationsmodus

Integriertes Denken

—

Minimal · Hoch · Dynamisch

Mehrsprachige Skripte

EN · ZH · JA · KO · AR · HI · BN

EN-stark, andere variabel

Charakterkonsistenz

Pixelebene über Winkel hinweg

Bis zu 5 Fächer

Charge pro Anruf

Bis zu 10

Mehrere

1–4

API-Schema

OpenAI-Bilder (Drop-in)

Google Gemini API

Offizieller Listenpreis (1024px, hoch)

$0.21

$0.12

$0.06–$0.12

Von prompt bis Produktion bis zum Ende des Tages.

5 kostenlose CreditsKeine Karte erforderlichOpenAI-kompatibles Schema

Die Bild-API das liest was es schreibt.

Wie es stapelt sich.

Gleiches Modell. Ein Bruchteil der Kosten.

Öffentliche APIs, keine Platzhalter.

GPT Image 2 API

Nano-Bananen-API

Nano Banana 2 API

Nano Banana Pro-API

Veo 3.1 Video API

Sora 2 Video API

Was macht gpt-image-2 anders.

Lesbarer mehrsprachiger Text

Argumentationsbewusste Eingabeaufforderungen

Identität auf Pixelebene

Natives 2K, 4K hochskaliert

Pro Bild. Keine Überraschungen.

Lite

Pro

Geschäft

Kostenlos

Antworten

Was ist GPT-Bild 2?

Wie unterscheidet sich gpt-image-2 von GPT Image 1.5 und DALL-E 3?

Wo greift gpt-image-2 zu kurz?

Gibt es eine kostenlose Stufe?

Kann ich generierte Bilder kommerziell nutzen?

Welche Sprachen und SDKs werden unterstützt?

Von prompt bis Produktion bis zum Ende des Tages.

Die Bild-API das liest was es schreibt.

Wie es stapelt sich.

Gleiches Modell. Ein Bruchteil der Kosten.

Öffentliche APIs, keine Platzhalter.

GPT Image 2 API

Nano-Bananen-API

Nano Banana 2 API

Nano Banana Pro-API

Veo 3.1 Video API

Sora 2 Video API

Was macht gpt-image-2 anders.

Lesbarer mehrsprachiger Text

Argumentationsbewusste Eingabeaufforderungen

Identität auf Pixelebene

Natives 2K, 4K hochskaliert

Pro Bild. Keine Überraschungen.

Lite

Pro

Geschäft

Kostenlos

Antworten

Was ist GPT-Bild 2?

Wie unterscheidet sich gpt-image-2 von GPT Image 1.5 und DALL-E 3?

Wo greift gpt-image-2 zu kurz?

Gibt es eine kostenlose Stufe?

Kann ich generierte Bilder kommerziell nutzen?

Welche Sprachen und SDKs werden unterstützt?

Von prompt bis Produktion bis zum Ende des Tages.