绘图模型总览
大约 5 分钟
绘图模型总览
章节定位
这里是所有 图片生成 / 视频生成 模型的入口。先看一遍下面这张表,挑出最适合你场景的模型,再点进对应教程跟着做。
- 通用接口地址(文生图 / 图生图):
https://www.yuzhixiaolongxia.com/v1/images/generations - 图片编辑接口:
https://www.yuzhixiaolongxia.com/v1/images/edits - 认证方式:
Authorization: Bearer <你的令牌> - 模型 ID 与价格:以 模型广场 实际显示为准
模型对比一览
下面三款为图片模型,使用同一套 /v1/images/generations 接口,只需要替换 model 字段就能切换;视频模型先看“视频生成总览”,再进入 Seedance 2.0 或其他视频模型专文。
| 模型名称 | API 模型 ID | 特长 | 输出类型 | 推荐场景 | 详细文档 |
|---|---|---|---|---|---|
| GPT-Image2 | image2 / gpt-image-2 | 高精度、贴近参考图、4K 关键词自动放大 | 图片 | 产品图、海报、UI 原型、4K 商用图 | GPT-Image2 教程 |
| Nano Banana | gemini-3.1-flash-image | 速度快、价格低 | 图片 | 批量试稿、提示词调试、日常配图 | Nano Banana 教程 |
| Banana 2 Pro | gemini-3-pro-image-preview | 细节好、参考图遵循度高 | 图片 | 产品视觉、人像、商品图、对外定稿 | Banana 2 Pro 教程 |
| 视频生成总览 | Seedance / Sora / Veo / Grok | 先选模型,再看接口流程 | 视频 | 所有视频生成用户的入口 | 视频生成总览 |
| Seedance 2.0 | seedance-2.0 系列共 6 个 | 文生视频、图生视频、参考视频、参考音频、1080P 成片 | 视频 | 商品视频、广告短片、社媒短视频 | Seedance 2.0 视频教程 |
| Seedance 程序接入 | 同上 | 给开发者用的异步任务接入指引 | 视频 | Codex / Claude Code 自动接入工程 | Seedance 程序接入 |
模型 ID 写哪个都行
- GPT-Image2 同时收
image2和gpt-image-2,平台自动归一。 - Banana 系列 ID 后缀可能随平台迭代变化,以模型广场显示为准。
五步选型流程
按这五步走,基本不会选错:
- 要图还是要视频?
- 图片 → 在 GPT-Image2 / Nano Banana / Banana 2 Pro 三选一
- 视频 → 先看 视频生成总览,再进入 Seedance 2.0 或其他视频模型
- 图片要不要高精度商用?
- 是 → GPT-Image2 或 Banana 2 Pro
- 否(先试稿、批量出图)→ Nano Banana
- 要不要参考图?
- 有参考图,且要严格遵循 → Banana 2 Pro 或 GPT-Image2
- 纯文生图 → 任意都行
- 要不要 4K?
- 4K 商用稿 → GPT-Image2(提示词写 "4K" 关键字即可自动放大到 3840×2160 / 2160×3840)
- 普通分辨率 → 三款都能出 1024×1024 起
- 预算够不够?
- 预算紧、批量出几十张 → Nano Banana
- 预算可以、要一稿过 → GPT-Image2 或 Banana 2 Pro
常见使用场景推荐
| 业务场景 | 首推模型 | 备选 | 理由 |
|---|---|---|---|
| 电商产品主图、详情页配图 | GPT-Image2 | Banana 2 Pro | 参考图遵循度高,4K 直出 |
| 海报 / 营销 KV / 社媒封面 | GPT-Image2 | Banana 2 Pro | 排版、文字、构图更稳 |
| 人像头像 / 写实人物 | Banana 2 Pro | GPT-Image2 | 人物细节、皮肤质感更自然 |
| 文章插图 / 公众号配图 | Nano Banana | GPT-Image2 | 单张价格低,可批量 |
| 提示词试错、找方向 | Nano Banana | — | 速度最快,便宜,敢于试错 |
| UI 原型图、后台界面草图 | GPT-Image2 | — | 4K 横版 / 竖版自动切,长文本贴合 |
| 商品视频、广告短片 | Seedance 2.0 | — | 视频接口,文生视频 + 图生视频 |
接入方式
| 方式 | 适合人群 | 入口 |
|---|---|---|
| Cherry Studio(推荐) | 小白首选,图形界面,点点就能出图 | Cherry Studio 官网 |
| n8n 工作流 | 想做自动化生图链路的进阶用户 | 详见各教程的 n8n 章节 |
| 直接 API 调用 | 开发者,自己写代码调接口 | 详见各教程的 curl / Node / Python 示例 |
Cherry Studio 接口地址特殊点
- 正常生图填
https://www.yuzhixiaolongxia.com/v1 - 生图失败时尝试
https://www.yuzhixiaolongxia.com/v1#(末尾加#是平台特性,用来绕过某些 SDK 的 schema 校验)
前置条件
- 已注册平台账号并充值额度
- 按模型创建了对应令牌:
- GPT-Image2 用 GPT-Image2 分组
- Banana 系列用 Gemini-Banana 或 Gemini-高速生图 分组(以令牌实际显示为准)
- 安装好 Cherry Studio(或其他支持 OpenAI 兼容图像接口的客户端)
还没准备好?先去 快速开始 走完 5 步。
常见误区(出图前先看一遍)
- 用错令牌分组:拿 Claude / Codex 等文本模型令牌去生图必然 401。GPT-Image2 必须用 GPT-Image2 分组,Banana 系列必须用 Gemini 系列分组。
- 没关流式输出:生图模型一律不支持流式。Cherry Studio 助手设置里必须把"流式输出"关掉,否则一直转圈。
- Cherry Studio 模型类型没改成 Image:默认是 Chat,必须手动改为 Image 才能在客户端原生预览图片。
image字段传了 base64 或本地路径:图生图必须用公网可访问的 URL,先把图传到任意图床或 OSS。- 没写 4K 关键字却期望 4K 输出:GPT-Image2 是按提示词推断的,提示词里没有
4K/4k/4K就按默认尺寸出图。 - 4K 模式没意识到加价:4K 输出会额外加价,预算敏感时优先用标准分辨率。
想看视频生成?先跳 视频生成总览
