Veo 3.1 视频生成使用指南
Veo 3.1 视频生成使用指南
谷歌系视频模型,画面细腻、支持 4K,是要交付高清商用稿时的首选。 先读 视频生成总览 拿到接口共通约定,再看本页细节。
接口地址 & 模型
- 创建任务:
POST https://your-domain.com/v1/video/generations(把your-domain.com换成你的预制小龙虾域名) - 查询任务:
GET https://your-domain.com/v1/video/generations/{task_id} - API 模型 ID:
veo3.1-fast(快速版)/veo3.1-pro(高质版) - 认证:HTTP Header
Authorization: Bearer <你的 API 令牌> - 任务类型:异步任务(提交 → 轮询 → 下载,无需配置 callback)
- 时长固定:8 秒
拿令牌 + 怎么测试(5 分钟流程)
- 登录你的预制小龙虾后台(
https://your-domain.com)。 - 左侧菜单进「令牌」页,点「添加令牌」,分组挑含 Veo 的视频分组,生成后完整复制好。
- 打开 Postman 或终端 curl,按本文「文生视频 curl 示例」粘贴执行;拿到
task_id后调查询接口轮询,直到status=completed。 - 第一次只传
model+prompt跑通,再加quality/aspect_ratio等可选参数。
分组开通须知
视频模型属于受控分组 sora-veo-grok-video,新用户无法自助开通。
- 在 newapi 后台「个人 → API 令牌」页生成令牌时,如果令牌分组下拉找不到
sora-veo-grok-video,请联系客服 zhiyanck@gmail.com 开通该分组权限。 - 已开通用户:创建令牌时选
sora-veo-grok-video分组,调用即可。 - 余额不足时调用会返回
403 quota_exceeded,先充值再试。
veo3.1-fast vs veo3.1-pro 怎么选
| 模型 | 画质 | 支持分辨率 | 典型场景 | 价格区间 |
|---|---|---|---|---|
veo3.1-fast | 标准,画面够用 | 720p / 1080p / 4k | 试稿、社媒、批量出片 | 0.31–0.77 元/次 |
veo3.1-pro | 高质,细节丰富 | 720p / 1080p / 4k | 商用交付、广告、需要终稿质量 | 1.54–2.31 元/次 |
一句话:先用 fast 跑通效果,确认 prompt 合适后再切 pro 出终稿。
完整参数表
| 参数 | 类型 | 必填 | 可选值 / 说明 |
|---|---|---|---|
model | string | 是 | veo3.1-fast 或 veo3.1-pro |
prompt | string | 是 | 视频描述 |
quality | string | 否 | 720p / 1080p / 4k,默认 720p |
aspect_ratio | string | 否 | 16:9(横版,默认)/ 9:16(竖版)/ 1:1(方形) |
generation_type | string | 否 | text_to_video / image_to_video / frame_to_video,默认 text_to_video |
image_urls | string[] | 否 | 参考图 URL,按 generation_type 不同含义不同(见下) |
能力组合校验
- 必填只有
model+prompt,其它字段都可省略。 - 平台不开放
callback_url/webhook_url,结果一律走GET /v1/video/generations/{task_id}取。 veo3.1-fast与veo3.1-pro都支持 4K,但 4K 比 1080p 更贵,按需选。image_to_video需要 1 张参考图。frame_to_video(首尾帧)需要 2 张参考图:第 1 张是首帧,第 2 张是尾帧。- 不传
image_urls时,默认走text_to_video。
文生视频 curl 示例
curl -X POST "https://your-domain.com/v1/video/generations" \
-H "Authorization: Bearer <YOUR_API_KEY>" \
-H "Content-Type: application/json" \
-d '{
"model": "veo3.1-fast",
"prompt": "A cinematic shot of a chef carefully placing crawfish on a black slate plate, steam rising, soft top light, fine focus on the spices, premium restaurant aesthetic",
"quality": "1080p",
"aspect_ratio": "16:9"
}'响应(关键字段):
{
"task_id": "task_xxx",
"model": "veo3.1-fast",
"status": "queued",
"created_at": 1717000000
}拿到 task_id 后调用查询接口轮询:
curl "https://your-domain.com/v1/video/generations/task_xxx" \
-H "Authorization: Bearer <YOUR_API_KEY>"status=completed 后按 总览页 的下载流程取视频。
图生视频 curl 示例
让一张静态图"动起来":
curl -X POST "https://your-domain.com/v1/video/generations" \
-H "Authorization: Bearer <YOUR_API_KEY>" \
-H "Content-Type: application/json" \
-d '{
"model": "veo3.1-pro",
"prompt": "The camera slowly orbits around the bowl, steam continues to rise, ambient warm light",
"generation_type": "image_to_video",
"image_urls": [
"https://example.com/dish-photo.jpg"
],
"quality": "1080p",
"aspect_ratio": "16:9"
}'首尾帧生视频 curl 示例
给一张起始帧和一张结束帧,模型自动补中间过渡:
curl -X POST "https://your-domain.com/v1/video/generations" \
-H "Authorization: Bearer <YOUR_API_KEY>" \
-H "Content-Type: application/json" \
-d '{
"model": "veo3.1-pro",
"prompt": "Smooth transition from a still empty plate to the same plate fully loaded with crawfish, warm restaurant lighting, no harsh cuts",
"generation_type": "frame_to_video",
"image_urls": [
"https://example.com/empty-plate.jpg",
"https://example.com/full-plate.jpg"
],
"quality": "1080p",
"aspect_ratio": "16:9"
}'首尾帧效果建议
- 两张图的构图、视角、光线尽量接近,过渡才自然。
- prompt 里描述"过渡过程"的动作,比如 "smooth slow transition"、"camera holds still"。
- 不要让首尾帧差异过大(比如白天 → 黑夜 + 室内 → 室外),效果容易崩。
价格表 + 算例
售价已是客户最终价,按 1:1 站内汇率扣费。一次任务固定 8 秒。
| 模型 | 720p | 1080p | 4k |
|---|---|---|---|
veo3.1-fast | 0.31 元/次 | 0.62 元/次 | 0.77 元/次 |
veo3.1-pro | 1.54 元/次 | 1.85 元/次 | 2.31 元/次 |
算例 1: 我用 veo3.1-fast 出 1 段 1080p 视频,要扣多少?
0.62 元/次(直接看表)算例 2: 我要做 1 条商用广告,用 veo3.1-pro 出 4k 终稿:
2.31 元/次算例 3: 我先用 fast 720p 试 10 次 prompt,再用 pro 1080p 出 1 个终稿:
0.31 × 10 + 1.85 = 3.10 + 1.85 = 4.95 元提示词技巧
Veo3.1 对"镜头语言"特别敏感,提示词里把镜头说清楚效果会好得多。
| 要素 | 示例片段 |
|---|---|
| 镜头类型 | wide shot / close-up / over-the-shoulder / top-down |
| 镜头运动 | slow push in / orbit around / static handheld / crane up |
| 光线 | soft top light / golden hour / studio softbox |
| 焦深 | shallow depth of field / everything in focus |
| 风格 | cinematic / commercial / documentary / 35mm film |
参考模板:
[镜头类型] of [主体] [动作],[镜头运动],[光线],[焦深],[风格]
填空示例:
Close-up of a bowl of red crawfish, steam rising, slow camera push in, soft warm top light, shallow depth of field, cinematic food commercial style.
Veo3.1 vs Sora-2 的提示词差异
- Veo3.1 喜欢"专业术语"(镜头类型、焦深、光位)。
- Sora-2 偏向"自然语言描述"(像你跟朋友讲一个画面)。
- 同一个 prompt 给两个模型可能效果差很多,先用 fast 试再决定走哪个。
常见错误 + 排查
| 现象 | 可能原因 | 处理 |
|---|---|---|
400 unsupported quality | quality 写成了 2k 之类 | 只接受 720p / 1080p / 4k |
400 missing image_urls | generation_type=image_to_video 没传图 | 加 image_urls |
400 frame_to_video requires 2 images | 首尾帧只传了 1 张 | 传 2 张图 |
401 | 令牌错 / 分组不含 Veo | 用对应的 Veo 分组令牌 |
402 | 余额不足 | 充值,4K 一次 0.77 元起 |
任务 failed,提示安全策略 | prompt 或参考图触发审查 | 改 prompt / 换图 |
| 4K 看起来没区别 | 浏览器播放器降采样了 | 下载到本地用 VLC / PotPlayer 看 |
| 图生视频画面"鬼影" | 参考图分辨率太低 | 换 ≥ 1024px 的清晰图 |
FAQ
时长能改吗?
Veo3.1 当前固定 8 秒。需要更长的请看 Grok-Video(最长 30 秒)。
4K 输出真的是 3840×2160 吗?
是的,quality=4k 出的是 3840×2160(16:9)。竖版 4K 是 2160×3840。
image_to_video 和 frame_to_video 有啥区别?
image_to_video:1 张图,模型自己"想象"动作。frame_to_video:2 张图(首帧 + 尾帧),模型在两者间补过渡。
生成失败扣不扣钱?
不扣。只有任务 completed 才扣费。
中文 prompt 行不行?
行,但 Veo3.1 对英文专业术语反应更好(特别是镜头语言),建议关键词用英文。
怎么做"连续多镜头"叙事?
一次只能出 8 秒。需要叙事可以:
- 拆分剧本为多个 8 秒镜头。
- 每个镜头单独提交(用
frame_to_video衔接镜头间过渡)。 - 拿到所有 mp4 后用剪辑软件拼接。
上一步:Sora-2 视频生成使用指南 | 下一步:Grok-Video 视频生成使用指南
