GPT IMAGE
GPT-Image-2 Token 计费生图
使用原生 gpt-image-2 按 token 计费生图,支持 1K/2K/4K 尺寸、URL 返回和费用估算。
GPT-Image-2 Token 计费生图
RootFlowAI 支持两种 GPT-Image-2 生图接入方式:
- 计次版:使用
gpt-image-2-count、gpt-image-2-hd-count、gpt-image-2-4k-count,每张图固定价格,适合预算明确的场景 - Token 计费版:使用原生模型名
gpt-image-2,按实际输入和图片输出 token 计费,适合想按真实用量结算的场景
本页介绍 Token 计费版。直接发 HTTP 请求时,文生图完整地址是 https://api.rootflowai.com/v1/images/generations,图生图和本地图片编辑完整地址是 https://api.rootflowai.com/v1/images/edits。如果你的 SDK 已经把 base_url / baseURL 设置成 https://api.rootflowai.com/v1,后面的接口路径只需要写 /images/generations 或 /images/edits,不要再重复拼一次 /v1。
如果你只是想稳定知道“一张图多少钱”,优先看 图像生成 的计次版。 如果你想让费用跟实际分辨率、画面复杂度和 prompt 长度走,或者想直接使用原生 gpt-image-2 模型名,就使用本页的 Token 计费版。
开通与模型选择
1. 进入账户中心,创建或选择一个 API Key 2. 分组选择支持 gpt-image-2 的 GPT 绘图 或 GPT AZ 绘图 分组 3. 使用 OpenAI SDK 时,把 base_url / baseURL 设置为 https://api.rootflowai.com/v1 4. 自己拼 HTTP 请求时,使用完整地址 https://api.rootflowai.com/v1/images/generations 或 https://api.rootflowai.com/v1/images/edits 5. 如果你的客户端已经配置了上面的 base_url,相对路径只写 /images/generations 或 /images/edits 6. 模型名都填写 gpt-image-2
GPT-Image-2 现在有两套可用的原生生图分组:
- GPT 绘图:原有 GPT-Image-2 原生生图分组,模型名填写
gpt-image-2 - GPT AZ 绘图:新接入的 GPT-Image-2 原生生图分组,模型名同样填写
gpt-image-2
如果你同时使用两个分组,建议分别创建两个 API Key,并在客户端里分开配置。计次模型名 gpt-image-2-count、gpt-image-2-hd-count、gpt-image-2-4k-count 不属于本页的原生 gpt-image-2 Token 计费调用。
你可以先请求模型列表确认当前 Key 是否能看到 gpt-image-2:
curl https://api.rootflowai.com/v1/models \
-H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx"如果模型列表里没有 gpt-image-2,说明这个 API Key 的分组没有开启原生 GPT 生图能力。请换到支持该模型的分组,或联系站点客服处理。
快速开始
curl
curl https://api.rootflowai.com/v1/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
-d '{
"model": "gpt-image-2",
"prompt": "一张高级感咖啡杯商品主图,白色背景,柔和棚拍灯光,陶瓷质感清晰,不要文字",
"n": 1,
"size": "1024x1024",
"quality": "medium"
}'Python
from openai import OpenAI
client = OpenAI(
api_key="sk-xxxxxxxxxxxxxxxx",
base_url="https://api.rootflowai.com/v1",
)
response = client.images.generate(
model="gpt-image-2",
prompt="一张高级感咖啡杯商品主图,白色背景,柔和棚拍灯光,陶瓷质感清晰,不要文字",
n=1,
size="1024x1024",
quality="medium",
)
print(response.data[0].url)
print(response.usage)Node.js
import OpenAI from "openai";
const client = new OpenAI({
apiKey: "sk-xxxxxxxxxxxxxxxx",
baseURL: "https://api.rootflowai.com/v1",
});
const response = await client.images.generate({
model: "gpt-image-2",
prompt: "一张高级感咖啡杯商品主图,白色背景,柔和棚拍灯光,陶瓷质感清晰,不要文字",
n: 1,
size: "1024x1024",
quality: "medium",
});
console.log(response.data[0].url);
console.log(response.usage);参数说明
| 参数 | 必填 | 说明 |
|---|---|---|
model | 是 | 固定填写 gpt-image-2 |
prompt | 是 | 图片描述。越长输入 token 越多,但通常费用大头在图片输出 token |
size | 是 | 输出尺寸,例如 1024x1024、2048x2048、3840x2160 |
quality | 否 | 建议先用 medium。可选 low、medium、high,实际可用值以模型返回为准 |
n | 否 | 建议设为 1。要多张图时,多发几次请求更方便控制费用 |
Token 计费版只使用 gpt-image-2。
这些模型名属于计次版,不要在本页的按量计费分组里使用:gpt-image-2-count、gpt-image-2-hd-count、gpt-image-2-4k-count。
响应格式
RootFlowAI 会把上游返回的图片上传到 RootFlowAI CDN,并统一返回 URL:
{
"created": 1781677111,
"data": [
{
"url": "https://cdn.rootflowai.com/images/2026-06-17/example.png"
}
],
"usage": {
"prompt_tokens": 37,
"completion_tokens": 2099,
"total_tokens": 2136
}
}data[0].url 可以直接打开、下载或放到你的工作流里继续使用。重要成品建议保存到自己的素材库,避免长期只依赖临时工作流变量。
计费方式
Token 计费版按本次请求的实际 usage 计算,再叠加你的账户分组倍率。消费日志里通常会看到:
| 字段 | 含义 |
|---|---|
| 输入 token | prompt 和请求参数等输入内容折算的 token |
| 输出 token | 图片生成结果折算的 token,通常由分辨率和画面复杂度决定 |
| 输入价格 | 当前模型的输入 token 单价 |
| 分组倍率 | 你的账户或 API Key 所在分组倍率 |
| 扣费金额 | 平台按 usage、模型价格和分组倍率计算出的最终费用 |
如果你的消费日志显示输入价格为 $5 / 1M tokens,输出按 6 倍输入计价,分组倍率为 2.0x,可以用下面的方式估算:
费用 USD ~= (输入 tokens + 输出 tokens x 6) x 5 / 1,000,000 x 2.0在这个口径下,复杂 prompt 每增加 100 个输入 tokens,单张图大约多 $0.001。也就是说,prompt 变长会涨价,但通常不如分辨率带来的输出 token 影响大。
Token 计费会随模型价格、分组倍率、上游 usage 和质量参数变化。文档里的金额只是参考估算,最终扣费请以账户中心的消费日志为准。
支持的尺寸
下面是当前实测可用的常用尺寸。图片返回后会保持你请求的实际像素尺寸,不会把 1K 图片简单拉伸成 2K 或 4K。
1K 常用尺寸
| 尺寸 | 适合场景 |
|---|---|
1024x1024 | 正方商品图、头像、封面缩略图 |
1536x1024 | 3:2 横图 |
1024x1536 | 2:3 竖图 |
1024x768 | 4:3 横图 |
768x1024 | 3:4 竖图 |
1280x1024 | 5:4 横图 |
1024x1280 | 4:5 竖图 |
1536x864 | 16:9 横图 |
864x1536 | 9:16 竖图 |
2048x1024 | 2:1 宽图 |
1024x2048 | 1:2 长竖图 |
1536x512 | 3:1 超宽横图 |
512x1536 | 1:3 超长竖图 |
2016x864 | 21:9 横图 |
864x2016 | 9:21 竖图 |
2K 常用尺寸
| 尺寸 | 适合场景 |
|---|---|
2048x2048 | 2K 正方图 |
2048x1360 | 3:2 横图 |
1360x2048 | 2:3 竖图 |
2048x1536 | 4:3 横图 |
1536x2048 | 3:4 竖图 |
2560x2048 | 5:4 横图 |
2048x2560 | 4:5 竖图 |
2048x1152 | 16:9 横图 |
1152x2048 | 9:16 竖图 |
2688x1344 | 2:1 宽图 |
1344x2688 | 1:2 长竖图 |
3072x1024 | 3:1 超宽横图 |
1024x3072 | 1:3 超长竖图 |
2688x1152 | 21:9 横图 |
1152x2688 | 9:21 竖图 |
4K 常用尺寸
| 尺寸 | 适合场景 |
|---|---|
2880x2880 | 4K 正方图 |
3520x2336 | 3:2 横图 |
2336x3520 | 2:3 竖图 |
3312x2480 | 4:3 横图 |
2480x3312 | 3:4 竖图 |
3216x2576 | 5:4 横图 |
2576x3216 | 4:5 竖图 |
3840x2160 | 16:9 横图 |
2160x3840 | 9:16 竖图 |
3840x1920 | 2:1 宽图 |
1920x3840 | 1:2 长竖图 |
3840x1280 | 3:1 超宽横图 |
1280x3840 | 1:3 超长竖图 |
3840x1648 | 21:9 横图 |
1648x3840 | 9:21 竖图 |
原生 GPT-Image-2 对像素尺寸有校验:宽和高都需要能被 16 整除。
例如 1536x512、512x1536 可以使用;1881x836、887x1774 会返回参数错误。
费用参考
下面是使用短 prompt、quality=medium 时的实测参考,按 GPT AZ 绘图 2.0x 倍率 估算。不同 prompt、质量档位和上游实际 usage 会让费用变化;最终扣费仍以账户中心消费日志为准。
下表是「GPT AZ 绘图」分组里 gpt-image-2 原生 Token 计费的参考价。「GPT 绘图」分组同样使用 gpt-image-2,但如果分组倍率或上游实际 usage 不同,扣费会跟着变化。计次版模型 gpt-image-2-count、gpt-image-2-hd-count、gpt-image-2-4k-count 请看 图像生成。
档位总览
| 档位 | 覆盖尺寸数 | 2.0x 参考合计 |
|---|---|---|
| 1K | 15 | 约 $1.059970 |
| 2K | 15 | 约 $1.750170 |
| 4K | 15 | 约 $3.070890 |
| 全部 | 45 | 约 $5.881030 |
1K 参考价格
| 尺寸 | 输出 tokens | 2.0x 参考价 |
|---|---|---|
1024x1024 | 1756 | 约 $0.106430 |
1536x1024 | 1372 | 约 $0.083390 |
1024x1536 | 1372 | 约 $0.083390 |
1024x768 | 1204 | 约 $0.073300 |
768x1024 | 1204 | 约 $0.073300 |
1280x1024 | 1510 | 约 $0.091670 |
1024x1280 | 1510 | 约 $0.091670 |
1536x864 | 1078 | 约 $0.065740 |
864x1536 | 1078 | 约 $0.065740 |
2048x1024 | 1180 | 约 $0.071870 |
1024x2048 | 1180 | 约 $0.071870 |
1536x512 | 535 | 约 $0.033160 |
512x1536 | 535 | 约 $0.033160 |
2016x864 | 943 | 约 $0.057640 |
864x2016 | 943 | 约 $0.057640 |
2K 参考价格
| 尺寸 | 输出 tokens | 2.0x 参考价 |
|---|---|---|
2048x2048 | 3568 | 约 $0.215150 |
2048x1360 | 1838 | 约 $0.111350 |
1360x2048 | 1838 | 约 $0.111350 |
2048x1536 | 2223 | 约 $0.134450 |
1536x2048 | 2223 | 约 $0.134450 |
2560x2048 | 3303 | 约 $0.199250 |
2048x2560 | 3303 | 约 $0.199250 |
2048x1152 | 1413 | 约 $0.085850 |
1152x2048 | 1413 | 约 $0.085850 |
2688x1344 | 1617 | 约 $0.098090 |
1344x2688 | 1617 | 约 $0.098090 |
3072x1024 | 988 | 约 $0.060350 |
1024x3072 | 988 | 约 $0.060350 |
2688x1152 | 1285 | 约 $0.078170 |
1152x2688 | 1285 | 约 $0.078170 |
4K 参考价格
| 尺寸 | 输出 tokens | 2.0x 参考价 |
|---|---|---|
2880x2880 | 5930 | 约 $0.356870 |
3520x2336 | 3926 | 约 $0.236630 |
2336x3520 | 3926 | 约 $0.236630 |
3312x2480 | 4413 | 约 $0.265850 |
2480x3312 | 4413 | 约 $0.265850 |
3216x2576 | 4690 | 约 $0.282470 |
2576x3216 | 4690 | 约 $0.282470 |
3840x2160 | 3336 | 约 $0.201230 |
2160x3840 | 3336 | 约 $0.201230 |
3840x1920 | 2700 | 约 $0.163070 |
1920x3840 | 2700 | 约 $0.163070 |
3840x1280 | 1328 | 约 $0.080750 |
1280x3840 | 1328 | 约 $0.080750 |
3840x1648 | 2099 | 约 $0.127010 |
1648x3840 | 2099 | 约 $0.127010 |
费用不只看最长边,也和输出 token 有关。横竖互换的费用通常接近,但不同画面复杂度和上游 usage 可能会有小幅差异。
图生图和本地图片编辑
Token 计费版支持通过完整地址 https://api.rootflowai.com/v1/images/edits 上传本地图片进行图生图或图片编辑。请求格式是 multipart/form-data,返回格式和文生图一致,仍然是 RootFlowAI CDN 图片 URL。已经配置 base_url=https://api.rootflowai.com/v1 的客户端,相对路径只写 /images/edits。
适合这些场景:
- 上传一张商品图,改成更高级的棚拍质感
- 上传人物头像,改成统一风格的证件照或职业照
- 上传一张草图、布局图或参考图,让模型保留构图并重新渲染
- 重复传入多个
image字段,把多张参考图合成到同一张结果里
curl 上传本地图片
curl https://api.rootflowai.com/v1/images/edits \
-H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
-F "model=gpt-image-2" \
-F "image=@./source.png" \
-F "prompt=保留原图主体和构图,改成高级产品海报风格,柔和棚拍灯光,清晰阴影,不要文字" \
-F "size=1024x1024" \
-F "quality=low" \
-F "n=1"如果要传多张参考图,重复 image 字段即可:
curl https://api.rootflowai.com/v1/images/edits \
-H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
-F "model=gpt-image-2" \
-F "image=@./product.png" \
-F "image=@./style-reference.png" \
-F "prompt=参考第二张图片的灯光和材质,重新渲染第一张商品图,保持商品结构不变" \
-F "size=1024x1024" \
-F "quality=medium" \
-F "n=1"Python requests
import requests
api_key = "sk-xxxxxxxxxxxxxxxx"
with open("./source.png", "rb") as image_file:
response = requests.post(
"https://api.rootflowai.com/v1/images/edits",
headers={"Authorization": f"Bearer {api_key}"},
data={
"model": "gpt-image-2",
"prompt": "保留原图主体和构图,改成高级产品海报风格,柔和棚拍灯光,清晰阴影,不要文字",
"size": "1024x1024",
"quality": "low",
"n": "1",
},
files={"image": image_file},
timeout=900,
)
response.raise_for_status()
result = response.json()
print(result["data"][0]["url"])
print(result.get("usage"))Node.js fetch
import { readFile } from "node:fs/promises";
import { File } from "node:buffer";
const apiKey = "sk-xxxxxxxxxxxxxxxx";
const form = new FormData();
form.set("model", "gpt-image-2");
form.set("prompt", "保留原图主体和构图,改成高级产品海报风格,柔和棚拍灯光,清晰阴影,不要文字");
form.set("size", "1024x1024");
form.set("quality", "low");
form.set("n", "1");
const imageBytes = await readFile("./source.png");
form.set("image", new File([imageBytes], "source.png", { type: "image/png" }));
const response = await fetch("https://api.rootflowai.com/v1/images/edits", {
method: "POST",
headers: {
Authorization: `Bearer ${apiKey}`,
},
body: form,
});
if (!response.ok) {
throw new Error(await response.text());
}
const result = await response.json();
console.log(result.data[0].url);
console.log(result.usage);edits 参数说明
| 参数 | 必填 | 说明 |
|---|---|---|
model | 是 | 固定填写 gpt-image-2 |
image | 是 | 输入图片文件。可以重复传入多个 image 字段作为参考图 |
prompt | 是 | 编辑说明。建议明确写出“保留什么”和“改变什么” |
size | 是 | 输出尺寸,例如 1024x1024、2048x2048、3840x2160 |
quality | 否 | 建议测试时用 low 或 medium,正式成品再按需使用 high |
n | 否 | 建议设为 1,方便控制单次费用 |
mask | 否 | 可选遮罩图,适合只编辑局部区域 |
图生图请求会根据上传图片、prompt 和输出图片 usage 计费。上传多张参考图或使用更高分辨率时,费用通常会更高。最终费用仍以账户中心消费日志为准。
常见错误
model_not_found 或找不到模型
通常是 API Key 所在分组没有开启 gpt-image-2。请确认模型列表里能看到 gpt-image-2,并确认请求模型名没有写成 gpt-image-2-count。
Invalid size ... Width and height must both be divisible by 16
说明传入的宽或高不能被 16 整除。把尺寸改成文档上方列出的常用尺寸,或把宽高都调整到 16 的倍数。
请求超时
生图请求可能需要几十秒到几分钟,4K 更慢。建议把完整请求超时设置到 900 秒,包括客户端、工作流平台、Serverless、反向代理和本地代理的 read/idle timeout。
如果本地设置了代理,且经常在 60 秒左右断开,可以先用下面的方式排查是不是本地代理超时:
curl --noproxy '*' --max-time 900 https://api.rootflowai.com/v1/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
-d '{
"model": "gpt-image-2",
"prompt": "一张干净的技术测试图,白色背景,不要文字",
"size": "1024x1024",
"quality": "medium",
"n": 1
}'返回里没有 b64_json
这是正常的。RootFlowAI 会统一返回 CDN 图片 URL,方便你直接打开、下载和在工作流里传递。客户端只需要读取 data[0].url。