GPT IMAGE

GPT-Image-2 Token 计费生图

使用原生 gpt-image-2 按 token 计费生图，支持 1K/2K/4K 尺寸、URL 返回和费用估算。

GPT-Image-2 Token 计费生图

RootFlowAI 支持两种 GPT-Image-2 生图接入方式：

计次版：使用 gpt-image-2-count、gpt-image-2-hd-count、gpt-image-2-4k-count，每张图固定价格，适合预算明确的场景
Token 计费版：使用原生模型名 gpt-image-2，按实际输入和图片输出 token 计费，适合想按真实用量结算的场景

本页介绍 Token 计费版。直接发 HTTP 请求时，文生图完整地址是 https://api.rootflowai.com/v1/images/generations，图生图和本地图片编辑完整地址是 https://api.rootflowai.com/v1/images/edits。如果你的 SDK 已经把 base_url / baseURL 设置成 https://api.rootflowai.com/v1，后面的接口路径只需要写 /images/generations 或 /images/edits，不要再重复拼一次 /v1。

如果你只是想稳定知道“一张图多少钱”，优先看图像生成的计次版。如果你想让费用跟实际分辨率、画面复杂度和 prompt 长度走，或者想直接使用原生 gpt-image-2 模型名，就使用本页的 Token 计费版。

开通与模型选择

1. 进入账户中心，创建或选择一个 API Key 2. 分组选择支持 gpt-image-2 的 GPT 绘图 或 GPT AZ 绘图 分组 3. 使用 OpenAI SDK 时，把 base_url / baseURL 设置为 https://api.rootflowai.com/v1 4. 自己拼 HTTP 请求时，使用完整地址 https://api.rootflowai.com/v1/images/generations 或 https://api.rootflowai.com/v1/images/edits 5. 如果你的客户端已经配置了上面的 base_url，相对路径只写 /images/generations 或 /images/edits 6. 模型名都填写 gpt-image-2

GPT-Image-2 现在有两套可用的原生生图分组：

GPT 绘图：原有 GPT-Image-2 原生生图分组，模型名填写 gpt-image-2
GPT AZ 绘图：新接入的 GPT-Image-2 原生生图分组，模型名同样填写 gpt-image-2

如果你同时使用两个分组，建议分别创建两个 API Key，并在客户端里分开配置。计次模型名 gpt-image-2-count、gpt-image-2-hd-count、gpt-image-2-4k-count 不属于本页的原生 gpt-image-2 Token 计费调用。

你可以先请求模型列表确认当前 Key 是否能看到 gpt-image-2：

curl https://api.rootflowai.com/v1/models \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx"

如果模型列表里没有 gpt-image-2，说明这个 API Key 的分组没有开启原生 GPT 生图能力。请换到支持该模型的分组，或联系站点客服处理。

快速开始

curl

curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "一张高级感咖啡杯商品主图，白色背景，柔和棚拍灯光，陶瓷质感清晰，不要文字",
    "n": 1,
    "size": "1024x1024",
    "quality": "medium"
  }'

Python

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxxxxxxxxxxxxxxx",
    base_url="https://api.rootflowai.com/v1",
)

response = client.images.generate(
    model="gpt-image-2",
    prompt="一张高级感咖啡杯商品主图，白色背景，柔和棚拍灯光，陶瓷质感清晰，不要文字",
    n=1,
    size="1024x1024",
    quality="medium",
)

print(response.data[0].url)
print(response.usage)

Node.js

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "sk-xxxxxxxxxxxxxxxx",
  baseURL: "https://api.rootflowai.com/v1",
});

const response = await client.images.generate({
  model: "gpt-image-2",
  prompt: "一张高级感咖啡杯商品主图，白色背景，柔和棚拍灯光，陶瓷质感清晰，不要文字",
  n: 1,
  size: "1024x1024",
  quality: "medium",
});

console.log(response.data[0].url);
console.log(response.usage);

参数说明

参数	必填	说明
`model`	是	固定填写 `gpt-image-2`
`prompt`	是	图片描述。越长输入 token 越多，但通常费用大头在图片输出 token
`size`	是	输出尺寸，例如 `1024x1024`、`2048x2048`、`3840x2160`
`quality`	否	建议先用 `medium`。可选 `low`、`medium`、`high`，实际可用值以模型返回为准
`n`	否	建议设为 `1`。要多张图时，多发几次请求更方便控制费用

Token 计费版只使用 gpt-image-2。

这些模型名属于计次版，不要在本页的按量计费分组里使用：gpt-image-2-count、gpt-image-2-hd-count、gpt-image-2-4k-count。

响应格式

RootFlowAI 会把上游返回的图片上传到 RootFlowAI CDN，并统一返回 URL：

{
  "created": 1781677111,
  "data": [
    {
      "url": "https://cdn.rootflowai.com/images/2026-06-17/example.png"
    }
  ],
  "usage": {
    "prompt_tokens": 37,
    "completion_tokens": 2099,
    "total_tokens": 2136
  }
}

data[0].url 可以直接打开、下载或放到你的工作流里继续使用。重要成品建议保存到自己的素材库，避免长期只依赖临时工作流变量。

计费方式

Token 计费版按本次请求的实际 usage 计算，再叠加你的账户分组倍率。消费日志里通常会看到：

字段	含义
输入 token	prompt 和请求参数等输入内容折算的 token
输出 token	图片生成结果折算的 token，通常由分辨率和画面复杂度决定
输入价格	当前模型的输入 token 单价
分组倍率	你的账户或 API Key 所在分组倍率
扣费金额	平台按 usage、模型价格和分组倍率计算出的最终费用

如果你的消费日志显示输入价格为 $5 / 1M tokens，输出按 6 倍输入计价，分组倍率为 2.0x，可以用下面的方式估算：

费用 USD ~= (输入 tokens + 输出 tokens x 6) x 5 / 1,000,000 x 2.0

在这个口径下，复杂 prompt 每增加 100 个输入 tokens，单张图大约多 $0.001。也就是说，prompt 变长会涨价，但通常不如分辨率带来的输出 token 影响大。

Token 计费会随模型价格、分组倍率、上游 usage 和质量参数变化。文档里的金额只是参考估算，最终扣费请以账户中心的消费日志为准。

支持的尺寸

下面是当前实测可用的常用尺寸。图片返回后会保持你请求的实际像素尺寸，不会把 1K 图片简单拉伸成 2K 或 4K。

1K 常用尺寸

尺寸	适合场景
`1024x1024`	正方商品图、头像、封面缩略图
`1536x1024`	3:2 横图
`1024x1536`	2:3 竖图
`1024x768`	4:3 横图
`768x1024`	3:4 竖图
`1280x1024`	5:4 横图
`1024x1280`	4:5 竖图
`1536x864`	16:9 横图
`864x1536`	9:16 竖图
`2048x1024`	2:1 宽图
`1024x2048`	1:2 长竖图
`1536x512`	3:1 超宽横图
`512x1536`	1:3 超长竖图
`2016x864`	21:9 横图
`864x2016`	9:21 竖图

2K 常用尺寸

尺寸	适合场景
`2048x2048`	2K 正方图
`2048x1360`	3:2 横图
`1360x2048`	2:3 竖图
`2048x1536`	4:3 横图
`1536x2048`	3:4 竖图
`2560x2048`	5:4 横图
`2048x2560`	4:5 竖图
`2048x1152`	16:9 横图
`1152x2048`	9:16 竖图
`2688x1344`	2:1 宽图
`1344x2688`	1:2 长竖图
`3072x1024`	3:1 超宽横图
`1024x3072`	1:3 超长竖图
`2688x1152`	21:9 横图
`1152x2688`	9:21 竖图

4K 常用尺寸

尺寸	适合场景
`2880x2880`	4K 正方图
`3520x2336`	3:2 横图
`2336x3520`	2:3 竖图
`3312x2480`	4:3 横图
`2480x3312`	3:4 竖图
`3216x2576`	5:4 横图
`2576x3216`	4:5 竖图
`3840x2160`	16:9 横图
`2160x3840`	9:16 竖图
`3840x1920`	2:1 宽图
`1920x3840`	1:2 长竖图
`3840x1280`	3:1 超宽横图
`1280x3840`	1:3 超长竖图
`3840x1648`	21:9 横图
`1648x3840`	9:21 竖图

原生 GPT-Image-2 对像素尺寸有校验：宽和高都需要能被 16 整除。

例如 1536x512、512x1536 可以使用；1881x836、887x1774 会返回参数错误。

费用参考

下面是使用短 prompt、quality=medium 时的实测参考，按 GPT AZ 绘图 2.0x 倍率 估算。不同 prompt、质量档位和上游实际 usage 会让费用变化；最终扣费仍以账户中心消费日志为准。

下表是「GPT AZ 绘图」分组里 gpt-image-2 原生 Token 计费的参考价。「GPT 绘图」分组同样使用 gpt-image-2，但如果分组倍率或上游实际 usage 不同，扣费会跟着变化。计次版模型 gpt-image-2-count、gpt-image-2-hd-count、gpt-image-2-4k-count 请看图像生成。

档位总览

档位	覆盖尺寸数	2.0x 参考合计
1K	15	约 `$1.059970`
2K	15	约 `$1.750170`
4K	15	约 `$3.070890`
全部	45	约 `$5.881030`

1K 参考价格

尺寸	输出 tokens	2.0x 参考价
`1024x1024`	1756	约 `$0.106430`
`1536x1024`	1372	约 `$0.083390`
`1024x1536`	1372	约 `$0.083390`
`1024x768`	1204	约 `$0.073300`
`768x1024`	1204	约 `$0.073300`
`1280x1024`	1510	约 `$0.091670`
`1024x1280`	1510	约 `$0.091670`
`1536x864`	1078	约 `$0.065740`
`864x1536`	1078	约 `$0.065740`
`2048x1024`	1180	约 `$0.071870`
`1024x2048`	1180	约 `$0.071870`
`1536x512`	535	约 `$0.033160`
`512x1536`	535	约 `$0.033160`
`2016x864`	943	约 `$0.057640`
`864x2016`	943	约 `$0.057640`

2K 参考价格

尺寸	输出 tokens	2.0x 参考价
`2048x2048`	3568	约 `$0.215150`
`2048x1360`	1838	约 `$0.111350`
`1360x2048`	1838	约 `$0.111350`
`2048x1536`	2223	约 `$0.134450`
`1536x2048`	2223	约 `$0.134450`
`2560x2048`	3303	约 `$0.199250`
`2048x2560`	3303	约 `$0.199250`
`2048x1152`	1413	约 `$0.085850`
`1152x2048`	1413	约 `$0.085850`
`2688x1344`	1617	约 `$0.098090`
`1344x2688`	1617	约 `$0.098090`
`3072x1024`	988	约 `$0.060350`
`1024x3072`	988	约 `$0.060350`
`2688x1152`	1285	约 `$0.078170`
`1152x2688`	1285	约 `$0.078170`

4K 参考价格

尺寸	输出 tokens	2.0x 参考价
`2880x2880`	5930	约 `$0.356870`
`3520x2336`	3926	约 `$0.236630`
`2336x3520`	3926	约 `$0.236630`
`3312x2480`	4413	约 `$0.265850`
`2480x3312`	4413	约 `$0.265850`
`3216x2576`	4690	约 `$0.282470`
`2576x3216`	4690	约 `$0.282470`
`3840x2160`	3336	约 `$0.201230`
`2160x3840`	3336	约 `$0.201230`
`3840x1920`	2700	约 `$0.163070`
`1920x3840`	2700	约 `$0.163070`
`3840x1280`	1328	约 `$0.080750`
`1280x3840`	1328	约 `$0.080750`
`3840x1648`	2099	约 `$0.127010`
`1648x3840`	2099	约 `$0.127010`

费用不只看最长边，也和输出 token 有关。横竖互换的费用通常接近，但不同画面复杂度和上游 usage 可能会有小幅差异。

图生图和本地图片编辑

Token 计费版支持通过完整地址 https://api.rootflowai.com/v1/images/edits 上传本地图片进行图生图或图片编辑。请求格式是 multipart/form-data，返回格式和文生图一致，仍然是 RootFlowAI CDN 图片 URL。已经配置 base_url=https://api.rootflowai.com/v1 的客户端，相对路径只写 /images/edits。

适合这些场景：

上传一张商品图，改成更高级的棚拍质感
上传人物头像，改成统一风格的证件照或职业照
上传一张草图、布局图或参考图，让模型保留构图并重新渲染
重复传入多个 image 字段，把多张参考图合成到同一张结果里

curl 上传本地图片

curl https://api.rootflowai.com/v1/images/edits \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -F "model=gpt-image-2" \
  -F "image=@./source.png" \
  -F "prompt=保留原图主体和构图，改成高级产品海报风格，柔和棚拍灯光，清晰阴影，不要文字" \
  -F "size=1024x1024" \
  -F "quality=low" \
  -F "n=1"

如果要传多张参考图，重复 image 字段即可：

curl https://api.rootflowai.com/v1/images/edits \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -F "model=gpt-image-2" \
  -F "image=@./product.png" \
  -F "image=@./style-reference.png" \
  -F "prompt=参考第二张图片的灯光和材质，重新渲染第一张商品图，保持商品结构不变" \
  -F "size=1024x1024" \
  -F "quality=medium" \
  -F "n=1"

Python requests

import requests

api_key = "sk-xxxxxxxxxxxxxxxx"

with open("./source.png", "rb") as image_file:
    response = requests.post(
        "https://api.rootflowai.com/v1/images/edits",
        headers={"Authorization": f"Bearer {api_key}"},
        data={
            "model": "gpt-image-2",
            "prompt": "保留原图主体和构图，改成高级产品海报风格，柔和棚拍灯光，清晰阴影，不要文字",
            "size": "1024x1024",
            "quality": "low",
            "n": "1",
        },
        files={"image": image_file},
        timeout=900,
    )

response.raise_for_status()
result = response.json()

print(result["data"][0]["url"])
print(result.get("usage"))

Node.js fetch

import { readFile } from "node:fs/promises";
import { File } from "node:buffer";

const apiKey = "sk-xxxxxxxxxxxxxxxx";
const form = new FormData();

form.set("model", "gpt-image-2");
form.set("prompt", "保留原图主体和构图，改成高级产品海报风格，柔和棚拍灯光，清晰阴影，不要文字");
form.set("size", "1024x1024");
form.set("quality", "low");
form.set("n", "1");

const imageBytes = await readFile("./source.png");
form.set("image", new File([imageBytes], "source.png", { type: "image/png" }));

const response = await fetch("https://api.rootflowai.com/v1/images/edits", {
  method: "POST",
  headers: {
    Authorization: `Bearer ${apiKey}`,
  },
  body: form,
});

if (!response.ok) {
  throw new Error(await response.text());
}

const result = await response.json();
console.log(result.data[0].url);
console.log(result.usage);

edits 参数说明

参数	必填	说明
`model`	是	固定填写 `gpt-image-2`
`image`	是	输入图片文件。可以重复传入多个 `image` 字段作为参考图
`prompt`	是	编辑说明。建议明确写出“保留什么”和“改变什么”
`size`	是	输出尺寸，例如 `1024x1024`、`2048x2048`、`3840x2160`
`quality`	否	建议测试时用 `low` 或 `medium`，正式成品再按需使用 `high`
`n`	否	建议设为 `1`，方便控制单次费用
`mask`	否	可选遮罩图，适合只编辑局部区域

图生图请求会根据上传图片、prompt 和输出图片 usage 计费。上传多张参考图或使用更高分辨率时，费用通常会更高。最终费用仍以账户中心消费日志为准。

常见错误

`model_not_found` 或找不到模型

通常是 API Key 所在分组没有开启 gpt-image-2。请确认模型列表里能看到 gpt-image-2，并确认请求模型名没有写成 gpt-image-2-count。

`Invalid size ... Width and height must both be divisible by 16`

说明传入的宽或高不能被 16 整除。把尺寸改成文档上方列出的常用尺寸，或把宽高都调整到 16 的倍数。

请求超时

生图请求可能需要几十秒到几分钟，4K 更慢。建议把完整请求超时设置到 900 秒，包括客户端、工作流平台、Serverless、反向代理和本地代理的 read/idle timeout。

如果本地设置了代理，且经常在 60 秒左右断开，可以先用下面的方式排查是不是本地代理超时：

curl --noproxy '*' --max-time 900 https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "一张干净的技术测试图，白色背景，不要文字",
    "size": "1024x1024",
    "quality": "medium",
    "n": 1
  }'

返回里没有 `b64_json`

这是正常的。RootFlowAI 会统一返回 CDN 图片 URL，方便你直接打开、下载和在工作流里传递。客户端只需要读取 data[0].url。

GPT-Image-2 Token 计费生图