Nano Banana 生图教程
Nano Banana 生图教程
Nano Banana 是平台主打的 高性价比生图模型。单次成本极低、出图速度快,最适合 批量出图、提示词试错、低预算项目。同一个模型 ID 既能文生图,也能图生图(传 image 字段即可),平台后端自动判断走哪条路径。
接入结论
- API Base URL:
https://www.yuzhixiaolongxia.com/v1 - 文生图 / 图生图:
POST /images/generations - 图片编辑:
POST /images/edits - 认证方式:
Authorization: Bearer <你的 Gemini-Banana 令牌> - 模型 ID:
gemini-3.1-flash-image - 令牌分组:
Gemini-Banana或Gemini-高速生图(以令牌实际显示为准) - 价格 / 最新 ID:以 模型广场 实际显示为准
它的核心定位
| 优势 | 说明 |
|---|---|
| 快 | 出图速度比同档生图模型快一截,适合做"试 100 张挑 1 张"的工作流 |
| 便宜 | 单次成本极低,批量跑也不心疼 |
| 稳 | 同一组模型 ID 同时覆盖文生图和图生图,不用切换接口 |
| 简单 | 跟 GPT-Image2 走完全一样的 endpoint 和参数,只换 model 即可 |
适合什么场景
| 场景 | 为什么选它 |
|---|---|
| 批量出图 | 一组提示词跑 20 张,挑表现最好的一张 |
| 提示词试错 | 找方向、调风格,便宜地试错 |
| 日常配图 | 公众号、文档、内部分享 PPT 的配图 |
| 低预算项目 | 个人项目、demo、社团活动 |
| AI 工作流上游 | n8n / 自动化里跑批量内容 |
不适合的场景
- 商品主图、对外定稿 → 用 GPT-Image2 或 Banana 2 Pro
- 必须严格遵循参考图细节 → 用 Banana 2 Pro
- 要 4K 商用稿 → 用 GPT-Image2
第一步:创建 Gemini 系列令牌
去平台控制台 → 令牌管理 → 添加令牌,令牌分组选 "Gemini-Banana" 或 "Gemini-高速生图"(以平台界面实际显示为准),复制令牌备用。
不熟悉这一步?看 创建 API 令牌。
不要拿文本令牌生图
Claude / Codex / Gemini 文本模型令牌不能用来生图。必须用 Banana 系列分组令牌,否则直接 401。
用法一:文生图(最常用)
跟 GPT-Image2 完全一样的接口,只需要换 model 字段。
curl
curl -X POST "https://www.yuzhixiaolongxia.com/v1/images/generations" \
-H "Authorization: Bearer 你的Banana令牌" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.1-flash-image",
"prompt": "A cozy bookstore corner with warm afternoon light, watercolor style"
}'Python(OpenAI SDK 兼容)
from openai import OpenAI
client = OpenAI(
api_key="你的Banana令牌",
base_url="https://www.yuzhixiaolongxia.com/v1"
)
response = client.images.generate(
model="gemini-3.1-flash-image",
prompt="A futuristic city skyline at night, neon lights, cinematic",
size="1792x1024"
)
print(response.data[0].url)Node.js
const API_BASE_URL = "https://www.yuzhixiaolongxia.com/v1";
const API_KEY = process.env.YZX_IMAGE_API_KEY;
const response = await fetch(`${API_BASE_URL}/images/generations`, {
method: "POST",
headers: {
Authorization: `Bearer ${API_KEY}`,
"Content-Type": "application/json",
},
body: JSON.stringify({
model: "gemini-3.1-flash-image",
prompt: "A panoramic landscape painting, soft golden hour light",
size: "1792x1024",
}),
});
const json = await response.json();
console.log(json.data[0].url);用法二:图生图(传输入图)
把一张已有图作为输入,让模型按提示词修改、扩展或换风格。
curl -X POST "https://www.yuzhixiaolongxia.com/v1/images/generations" \
-H "Authorization: Bearer 你的Banana令牌" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.1-flash-image",
"prompt": "Replace the background with a sunset beach",
"image": "https://your-cdn.com/source.jpg"
}'多图融合(image 传数组):
{
"model": "gemini-3.1-flash-image",
"prompt": "Combine these two photos into a single scene",
"image": [
"https://your-cdn.com/photo1.jpg",
"https://your-cdn.com/photo2.jpg"
]
}输入图必须是公网 URL
不能传 base64 或本地路径。把图先传到任意公网图床或 OSS,再把 URL 填进 image 字段。
如果用 Cherry Studio 等支持拖拽的客户端,可以直接拖本地图进对话框,客户端会自动上传(这是客户端能力,不是直接 API 能力)。
请求参数
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | gemini-3.1-flash-image |
prompt | string | 是 | 生图提示词 |
image | string / string[] | 否 | 单张或多张参考图 URL |
size | string | 否 | 常用 1024x1024、1792x1024、1024x1792 |
n | number | 否 | 生成数量,建议 1,批量时也可一次出多张 |
response_format | string | 否 | url 或 b64_json |
客户端推荐:Cherry Studio
配置步骤
打开 Cherry Studio → 设置 → 模型服务 → 添加
填写:
字段 填什么 提供商名称 预制小龙虾-BananaAPI Key 你的 Banana 系列令牌 API 地址 https://www.yuzhixiaolongxia.com/v1模型列表里手动添加
gemini-3.1-flash-image点该模型的"编辑"图标,把 "模型类型 / Type" 从 Chat 改为 Image,保存
助手设置 → 模型设置 → 关闭流式输出
输入提示词 → 发送
两个必踩坑
- 模型类型必须改成 Image:默认是 Chat,不改就不会按图片接口走,看不到图片预览。
- 必须关闭流式输出:生图模型不支持流式,开着会一直转圈。
生图失败时换地址
如果 Cherry Studio 报路径错或 schema 校验失败,把 API 地址改成 https://www.yuzhixiaolongxia.com/v1#(末尾加 #)。这是平台特性,用来绕过某些 SDK 的 schema 校验。
提示词建议
- 英文成功率显著更高,建议优先英文
- 写清楚 主体 + 风格 + 光线 + 色调
- 示例:
- 好:
A serene Japanese garden in autumn, koi pond, soft golden light, ukiyo-e style - 差:
做一个秋天的图
- 好:
- 想要稳定风格的批量出图,把风格关键词固定下来,只变主体
推荐工作流:试稿用 Banana,定稿用 GPT-Image2
性价比最高的玩法
- 用 Nano Banana 批量跑 5~10 张,便宜地找方向
- 挑出表现最好的提示词
- 把同一组提示词丢给 GPT-Image2,加上
4K关键词出最终高清版
这样既不会在试错阶段烧钱,最终稿也能拿到高质量的 4K 输出。
常见问题
报 401 / 令牌无效
令牌分组选错。Nano Banana 必须用 Gemini-Banana 或 Gemini-高速生图分组,不是 Claude / Codex 的文本分组。
报 model not found
确认 model ID 拼写:gemini-3.1-flash-image。建议直接从 模型广场 复制。
Cherry Studio 一直转圈
90% 是没关流式输出,或没把模型类型改成 Image。回去检查这两项。
图生图报错
image 字段必须是公网可访问的 URL,不能传 base64 或本地路径。
出图质量明显比 GPT-Image2 差
正常现象。Nano Banana 主打速度和价格,对细节、文字、参考图遵循度的表现不如 GPT-Image2 和 Banana 2 Pro。批量试稿用 Banana,定稿换上面两个。
想出 4K
Nano Banana 不主打 4K 商用稿。要 4K 请改用 GPT-Image2,在提示词里写 4K 即可自动放大。
上一步:绘图模型总览 | 下一步:Banana 2 Pro 教程
