画像API それは読む 何が書いてあるのか。
1 つの HTTP エンドポイントの背後にある OpenAI gpt-image-2。ネイティブ 2K、95% 以上の可読性を備えた多言語テキスト、プロンプト内のすべての指示を保持する推論。
$ curl https://gptimage2.com/api/images \
-H "Authorization: Bearer $GPTIMAGE2_API_KEY" \
-H "Content-Type: application/json" \
-d '{ "model": "gpt-image-2", "prompt": "editorial portrait, shallow dof", "size": "1024x1024" }'



なんと 積み重なる。
LM Arena と Artificial Analysis からの独立したベンチマーク。以下の数字は当社ではなく、サードパーティから得られたものです。
| 能力 | gpt-画像-2 OpenAI | Nano Banana Pro ジェミニ 3 プロの画像 | Nano Banana 2 Gemini 3.1 フラッシュ イメージ |
|---|---|---|---|
| LM アリーナ ELO (テキストから画像へ) | 1,512 | 1,360 | 1,360 |
| 画像内のテキストの精度 | 99%以上多言語対応 | 強い(EN重視) | 強い(EN重視) |
| 生成時間 | ~3秒 | 10~20秒 | 4~8秒 |
| ネイティブ解像度 | 2K(4Kアップスケール) | 1K (4Kも利用可能) | 1K (4Kも利用可能) |
| 推理モード | 組み込まれた思考 | — | ミニマル・ハイ・ダイナミック |
| 多言語スクリプト | EN · ZH · JA · KO · AR · HI · BN | EN が強い、その他は変動する | EN が強い、その他は変動する |
| キャラクターの一貫性 | あらゆる角度のピクセルレベル | 最大5科目まで | 最大5科目まで |
| 呼び出しごとのバッチ | 最大10個 | 複数 | 1~4 |
| APIスキーマ | OpenAI イメージ (ドロップイン) | Google Gemini API | Google Gemini API |
| 公式リスト価格(1024px・高画質) | $0.21 | $0.12 | $0.06–$0.12 |
同じモデル、 コストはごく一部。
当社は OpenAI の処理能力をまとめて先行購入し、そのボリューム割引をクレジットパックとしてそのまま還元しています。結果として、あなたの口座では gpt-image-2 が 1枚あたり $0.035〜$0.056 で使えます。同じ OpenAI モデルが公式リストより約 75% 安く、どの Nano Banana 層よりも安価です。ヒーロー用途だけでなく、通常用途のデフォルトとして使えます。
パブリック API、 プレースホルダーではありません。
以下のカードはドキュメントを反映しています: 実際のパブリック エンドポイント、実際のモデル ID、人々が実際に最初に呼び出す画像およびビデオ API (GPT Image 2、3 つの Nano Banana 層、Veo 3.1、および Sora 2)。
GPT Image 2 API
Our primary OpenAI image endpoint. Use `gpt-image-2` on `POST /api/ai/image/generate` for text-to-image or image-to-image with the same model ID and a flat 3-credit call.
ナノバナナ API
The fastest Nano Banana tier. Call `POST /api/ai/image/generate` with `google/nano-banana` for lightweight text-to-image or image-to-image jobs at a flat 3 credits.
ナノバナナ 2 API
このスタックの主力の Google イメージ層。同じパブリック イメージ エンドポイント、モデル ID `nano-banana-2`、1K / 2K / 4K 出力層と最大 14 個の参照イメージ。
Nano Banana Pro API
より高コストでより忠実度の高い Nano Banana の亜種。 2K / 4K 出力と強力なプレミアム生成が必要な場合は、同じ画像エンドポイントで `nano-banana-pro` を使用します。
Veo 3.1 Video API
Flagship Google video generation through `POST /api/ai/video/generate`. Public models include `veo3`, `veo3_fast`, and `veo3_lite`, with both text-to-video and image-to-video support.
Sora 2 Video API
パブリック ビデオ エンドポイントでの OpenAI ビデオ生成。最も認識可能な OpenAI ビデオ エントリ ポイントとして `sora-2-text-to-video`、`sora-2-pro-text-to-video`、`sora-2-image-to-video` をサポートします。
何がそうさせるのか gpt-image-2 は異なります。
前世代からの 4 つの変更 - 制作チームが文字化け、文字の漂流、プロンプトの無視と格闘するのをやめた理由。

画像ごと。 驚くことはありません。
生成した画像に対してのみお支払いください。サインアップ時に 5 の無料クレジットから始めて (カードは必要ありません)、その後、gpt-image-2 のイメージごとの定額料金にスケールアップします。
ライト
250 creditsGPT Image 2 画像 約 250 枚
個人開発者向けの入門 API
- 250 クレジット
- 画像生成 API
- 同時リクエスト 3 件
- メールサポート
- 動画生成 API
- 商用ライセンス
Pro
1,000 creditsGPT Image 2 画像 約 1,000 枚
本番ワークロード向けのスケーラブル API
- 1,000~8,000 クレジット
- 画像 + 動画 API
- 同時リクエスト 10 件
- 優先キュー — 2× 高速
- 商用ライセンス
仕事
16,000 creditsGPT Image 2 画像 約 16,000 枚
チーム・代理店向け大容量 API
- 16,000 クレジット
- 全モデル + 早期アクセス
- 同時リクエスト 50 件
- 専用キュー — 3× 高速
- チームシート + 使用状況ダッシュボード
- プライオリティサポート & SLA
または、無料で開始
無料
50 creditsGPT Image 2 画像 約 50 枚
AI 画像生成を開始する
- 1 日あたり 5 クレジット (ログインして取得)
- 標準品質出力
- コミュニティ サポート
- 基本 AI モデル
- HD および 4K 解像度
- 優先キュー
GPT Image 2 (モデル ID gpt-image-2) は、2026 年 4 月 21 日にリリースされた OpenAI の第 2 世代ネイティブ イメージ モデルです。 GPT Image 1.5 の後継として 3 つの段階的な変更が加えられています。95% 以上の可読性での多言語画像内テキスト レンダリング、階層化されたプロンプトを解釈する推論、およびオプションの 4K アップスケールを備えたネイティブ 2K 解像度です。テキストから画像への変換、自然言語編集、バリエーション、スタイル転送、4K アップスケール、マルチリファレンス ブレンディングをカバーする 1 つの HTTPS API を通じてモデルを公開します。
3か所。 (1) 画像内のテキスト: 1.5 ラテン文字のみで最大 70% に達します。 gpt-image-2 は、英語、中国語、日本語、韓国語、アラビア語で 95% 以上のヒットを記録しました。 (2) 即時忠実度: 1.5 では、6 または 7 を超える要素が削除され始めます。 gpt-image-2 は、推論の統合により 15 要素のシーンを保持します。 (3) 解像度: ネイティブ 2K (対 1K)、オプションの非破壊 4K アップスケール。 DALL-E 3 は下位互換性のためにまだ出荷されていますが、gpt-image-2 がビルドの基礎となるモデルです。
発送前に知っておくべき 2 つの場所。ブランド ロゴの複製は信頼できません。正確なベクトル マークを得るには、生成後に Photoshop または Figma で合成します。また、生成は FLUX のような軽量モデルよりも遅く、通常は画像あたり 30 ~ 60 秒です。運用パイプラインの場合、これはプロンプトの忠実性を考慮すると公平な取引ですが、インスタント インタラクティブ UI には適切な選択ではありません。
はい。新しいアカウントには、サインアップ時に 5 枚の無料画像クレジットが付与されます。カードは必要ありません。毎日の無料クレジットは平日に更新されるため、プロトタイピングを通じて構築を続けることができます。
はい。すべての有料層には、広告、電子商取引、編集、印刷、派生作品のためのロイヤリティフリーの商用ライセンスが含まれています。あなたは自分の出力に対する完全な権利を所有します。私たちは何も保持しません。
どの HTTP クライアントでも動作します。リクエスト スキーマは OpenAI の Images API を反映しているため、既存の OpenAI SDK (TypeScript、Python、Go、Swift) はベース URL をリダイレクトして実行を続けることができます。イメージ内では、gpt-image-2 は英語、中国語、日本語、韓国語、アラビア語、その他のほとんどの主要な文字を確実にレンダリングします。
まだ助けが必要ですか? 人間と話す
プロンプトから 一日の終わりまでに生産。
1 つのカール呼び出し、1 つの Webhook、そして gpt-image-2 が製品内に存在します。リクエスト スキーマは OpenAI の Images API を反映しています。ほとんどの既存の SDK では、ベース URL を変更するだけで生成を開始できます。
