【福利上架】【Claude Kiro 特惠】0.1 倍率,Kiro 逆向自建号池,支持 Claude CLI、工具调用、WebSearch、文件读取、流式输出和 1M 上下文模型,高缓存优化查看通知

IMAGE API

图像生成

GPT-Image-2 和 Gemini 文生图、图生图、分辨率和调用示例。

图像生成

RootFlow AI 的绘图接口兼容 OpenAI Images API。你可以用同一套 /v1/images/generations 调用 GPT-Image-2 和 Gemini 绘图模型,支持文生图、图生图、1K/2K/4K 输出。

简单说:

  • 想要默认稳定的绘图体验,用 gpt-image-2-count
  • 想要 Gemini / Nano Banana 风格、角色或风格一致性,用 gemini-3.1-flash-image-countgemini-3-pro-image-count
  • 想要高清图,就选带 hd-count 的模型
  • 想要 4K,就选带 4k-count 的模型

功能特性

  • 兼容 OpenAI /v1/images/generations 协议,现有 SDK 无缝接入
  • 支持文生图(text-to-image)和图生图(image-to-image)
  • 三档分辨率:1K / 2K / 4K
  • GPT-Image-2 和 Gemini 两套绘图模型可选
  • 常用画面比例可选,Gemini 3.1 Flash 还支持极端长图比例
  • 按次计费,失败不扣费

可用模型与定价

创建令牌时,按你要用的模型选择对应分组:

  • GPT-Image-2 模型:选择 GPT绘图计次
  • Gemini 模型:选择 Gemini绘图计次

下列价格为 SVIP 用户分组参考价格。

GPT-Image-2

模型名分辨率默认质量价格说明
gpt-image-2-count1Khigh¥0.10 / 次标准分辨率,所有比例可用
gpt-image-2-hd-count2Khigh¥0.25 / 次高清分辨率,所有比例可用
gpt-image-2-4k-count4Khigh¥0.50 / 次超清分辨率,仅支持 6 种宽幅比例

Gemini 绘图

模型名分辨率价格说明
gemini-2.5-flash-image-count1K¥0.10 / 次便宜、快,适合草图和轻量生成
gemini-3.1-flash-image-count1K¥0.30 / 次Gemini 3.1 Flash 标准图
gemini-3.1-flash-image-hd-count2K¥0.40 / 次Gemini 3.1 Flash 高清图
gemini-3.1-flash-image-4k-count4K¥0.55 / 次Gemini 3.1 Flash 4K
gemini-3-pro-image-count1K¥0.40 / 次Gemini 3 Pro 标准图
gemini-3-pro-image-hd-count2K¥0.40 / 次Gemini 3 Pro 高清图
gemini-3-pro-image-4k-count4K¥0.50 / 次Gemini 3 Pro 4K

创建 API Key 时,分组要选对。GPT 模型用「GPT绘图计次」,Gemini 模型用「Gemini绘图计次」。分组选错时,模型列表可能看得到,但调用会失败。

质量控制

GPT-Image-2 支持 quality 参数,可以控制生成质量:

质量档位说明生成速度适用场景
low低质量,细节较少快(30-60s)快速预览、草图
medium中等质量,平衡速度与效果中(40-80s)日常使用
high高质量,细节丰富(默认)慢(50-120s)最终成品、高要求场景

Gemini 模型不需要传 quality,直接选模型档位即可。

GPT-Image-2 示例

# 快速预览(低质量)
curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-count",
    "prompt": "一只橘猫坐在窗台上看夕阳",
    "quality": "low",
    "size": "1024x1024"
  }'

# 最终成品(高质量,默认)
curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-4k-count",
    "prompt": "赛博朋克风格的未来城市夜景,超精细细节",
    "quality": "high",
    "size": "2880x1680"
  }'

GPT-Image-2 的不同质量档位价格相同,仅影响生成速度和画面细节。建议先用 low 快速验证构图,确认后再用 high 生成最终版本。

支持的 size

支持标准 OpenAI 像素格式和比例格式,系统会自动转换:

像素格式等效比例类型
1024x10241:1正方
1536x10243:2横图
1024x15362:3竖图
1792x102416:9横图
1024x17929:16竖图

也可以直接传比例格式:1:13:22:34:33:45:44:516:99:162:11:221:99:21

GPT-Image-2 的 4K 分辨率仅支持 16:99:162:11:221:99:21 六种宽幅比例。

Gemini 3.1 Flash 支持更宽的比例,包括 1:44:11:88:1 这类长图。gemini-2.5-flash-image-count 只提供 1K,不建议拿它做 2K/4K。

快速开始

文生图

curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-count",
    "prompt": "一只橘猫坐在窗台上看夕阳,水彩画风格",
    "n": 1,
    "size": "1024x1024"
  }'
from openai import OpenAI

client = OpenAI(
    api_key="sk-xxxxxxxxxxxxxxxx",
    base_url="https://api.rootflowai.com/v1"
)

response = client.images.generate(
    model="gpt-image-2-count",
    prompt="一只橘猫坐在窗台上看夕阳,水彩画风格",
    n=1,
    size="1024x1024",
    quality="high"  # 可选:low / medium / high(默认)
)

print(response.data[0].url)
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "sk-xxxxxxxxxxxxxxxx",
  baseURL: "https://api.rootflowai.com/v1",
});

const response = await client.images.generate({
  model: "gpt-image-2-count",
  prompt: "一只橘猫坐在窗台上看夕阳,水彩画风格",
  n: 1,
  size: "1024x1024",
  quality: "high", // 可选:low / medium / high(默认)
});

console.log(response.data[0].url);

高清文生图(2K)

使用 gpt-image-2-hd-count 模型获得 2K 分辨率输出:

curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-hd-count",
    "prompt": "赛博朋克风格的未来城市夜景,霓虹灯倒映在雨水中",
    "n": 1,
    "size": "1792x1024"
  }'

Gemini 文生图

Gemini 的调用方式和 GPT-Image-2 一样,只要换模型名。不要传 quality

curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gemini-3.1-flash-image-count",
    "prompt": "一张黑色陶瓷咖啡杯的商品主图,白色背景,干净高级",
    "n": 1,
    "size": "1:1"
  }'

Gemini 4K

curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gemini-3-pro-image-4k-count",
    "prompt": "高端腕表广告海报,棚拍灯光,细节清晰,质感高级",
    "n": 1,
    "size": "1:1"
  }'

图生图(URL 参考图)

如果参考图已经是公网可访问的 URL,使用 /v1/images/generations,通过 JSON 的 image 字段传入参考图数组:

curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-count",
    "prompt": "把这张照片转换成油画风格",
    "n": 1,
    "size": "1024x1024",
    "image": ["https://example.com/photo.png"]
  }'
  • image 字段接受 URL 数组,最多 16 张参考图
  • Gemini 最多建议 14 张参考图
  • 支持 HTTPS URL 和 base64 data URI 混填
  • 不传 size 时输出分辨率跟随输入图;传 size 则按指定尺寸出图

图片编辑(本地文件上传)

如果参考图是本地文件,客户端继续调用 /v1/images/edits,但请求必须改成 multipart/form-data,用 -F image=@file 上传文件:

curl https://api.rootflowai.com/v1/images/edits \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -F "model=gpt-image-2-count" \
  -F "prompt=把这张照片转换成油画风格" \
  -F "n=1" \
  -F "size=1024x1024" \
  -F "quality=medium" \
  -F "image=@/path/to/photo.png;type=image/png"

多张参考图可以重复传 image 字段:

curl https://api.rootflowai.com/v1/images/edits \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -F "model=gpt-image-2-count" \
  -F "prompt=基于两张参考图生成一张产品海报" \
  -F "n=1" \
  -F "size=1024x1024" \
  -F "image=@/path/to/reference-1.png;type=image/png" \
  -F "image=@/path/to/reference-2.jpg;type=image/jpeg"

不要把 Content-Type: application/json 的请求直接发送到 /v1/images/edits。如果参考图是 URL,请使用 /v1/images/generations + image 数组;如果参考图是本地文件,请使用上面的 multipart 写法。

连续图生图

如果要把上一轮结果继续作为下一轮参考图,推荐保存上一轮响应里的 data[0].url,下一轮继续传入参考图。

上一轮返回:

{
  "data": [
    {
      "url": "https://cdn.rootflowai.com/images/2026/xx/xx/result.png"
    }
  ]
}

下一轮如果使用 URL 参考图,可以继续走 /v1/images/generations

curl https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-count",
    "prompt": "保持上一张图的主体和构图,给角色加一个透明太空头盔",
    "n": 1,
    "size": "1024x1024",
    "quality": "low",
    "image": ["https://cdn.rootflowai.com/images/2026/xx/xx/result.png"]
  }'

如果你的工作流已经把上一轮图片下载到了本地文件,下一轮使用 /v1/images/edits 的 multipart 上传方式:

curl https://api.rootflowai.com/v1/images/edits \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -F "model=gpt-image-2-count" \
  -F "prompt=保持上一张图的主体和构图,给角色加一个透明太空头盔" \
  -F "n=1" \
  -F "size=1024x1024" \
  -F "quality=low" \
  -F "image=@/path/to/previous-result.png;type=image/png"

每轮请求都建议保存返回的图片 URL。不要只依赖工作流平台的临时变量或上一轮上下文;跨工作流、跨服务商或长时间运行时,显式传入上一轮图片 URL 或文件最稳定。

Responses 多轮生图(高级)

如果你直接调用 /v1/responses 做多轮生图或连续编辑,每一轮都必须显式传入 image_generation 工具。previous_response_id 只负责引用上一轮上下文,不会自动继承上一轮的工具列表。

第一轮:

curl https://api.rootflowai.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-5.4-mini",
    "instructions": "你是图像生成与图像编辑助手。用户要求生图时必须调用 image_generation 工具并返回图片。",
    "input": "生成一张赛博朋克城市夜景海报",
    "tools": [
      { "type": "image_generation" }
    ],
    "tool_choice": "auto",
    "store": true
  }'

保存第一轮返回的 id,例如 resp_xxx。第二轮继续编辑时继续传 tools,并把第一轮 id 放到 previous_response_id

curl https://api.rootflowai.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-5.4-mini",
    "instructions": "你是图像生成与图像编辑助手。用户要求生图时必须调用 image_generation 工具并返回图片。",
    "input": "保持上一张图的主体和构图,改成雨夜霓虹风格",
    "previous_response_id": "resp_xxxxxxxxxxxxxxxx",
    "tools": [
      { "type": "image_generation" }
    ],
    "tool_choice": "auto",
    "store": true
  }'
  • 每一轮都要传 tools: [{"type":"image_generation"}]
  • 需要使用 previous_response_id 时,相关轮次建议传 store: true
  • previous_response_id 不是图片 URL,也不会自动恢复工具列表
  • 如果返回体里是 tools: [],或 output 中没有 image_generation_call,说明本轮没有真正触发生图工具,应检查请求参数
  • 如果要跨工作流、跨服务商或长期复用图片,建议保存上一轮返回的图片 URL,并在下一轮作为参考图重新传入

响应格式

标准 OpenAI Images 响应格式:

{
  "created": 1777026453,
  "data": [
    {
      "url": "https://img.rootflowai.com/f/image/xxx.png"
    }
  ]
}

返回的是 RootFlowAI CDN 图片链接,可以直接打开和下载。建议你仍然把重要成品保存到自己的素材库里。

AI 编程工具集成

我们提供了开源的图像生成 Skill 工具包,可以集成到 Claude Code、Codex、Cherry Studio 等 AI 编程工具中,让 AI 助手直接帮你生成和编辑图片。

GitHub 仓库RyanWeb31110/rootflowai-image

支持的平台:

平台安装方式
Claude Code下载 claude-compatible 包,放入 .claude/skills/
Codex (Skill)下载 codex-skill 包,放入 skills 目录
Codex (Plugin)下载 codex-plugin 包,放入 .codex-plugins/
Cherry Studio下载 cherry-studio 包,按平台说明安装

安装后,AI 助手可以通过自然语言指令帮你生图:

帮我生成一张 16:9 的赛博朋克城市海报,2K 分辨率
把这张照片转换成水彩画风格

也可以直接点名 Gemini:

用 Gemini 3.1 Flash 给我生成一张 1:1 商品主图
用 Gemini 3 Pro 4K 生成一张高端腕表广告海报

详细安装和使用说明请参考 GitHub 仓库 README

注意事项

1. 建议把 n 设为 1。要多张图时,多发几次请求更容易控制成本 2. 建议不要在 prompt 中重复描述比例,通过 size 字段控制即可 3. 生成时间

  • 1K/2K 分辨率:通常 30~90 秒
  • 4K 分辨率:通常 50~150 秒
  • GPT-Image-2 使用 quality=low 可缩短 20-30% 生成时间
  • 请设置足够的请求等待时间,建议 900 秒。这里指完整请求的 read/request timeout,不只是 connect timeout
  • 如果你通过 Dify、workflow、Serverless、反向代理或本地代理访问,也要同步调大这些中间层的 idle/read timeout;任意一层 60 秒空闲断开,客户端都会拿不到图片 URL
  • 本地 curl 如果配置了代理且代理有 60 秒空闲限制,可以先用 --noproxy '*' 绕过代理验证:
curl --noproxy '*' --max-time 900 https://api.rootflowai.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxx" \
  -d '{
    "model": "gpt-image-2-count",
    "prompt": "一只橘猫坐在窗台上看夕阳",
    "n": 1,
    "size": "1024x1024",
    "quality": "low"
  }'

4. 内容会经过安全审核,违规内容会被拒绝且不计费 5. 失败请求不扣费