Grok-Video 视频生成使用指南
Grok-Video 视频生成使用指南
xAI 系视频模型,时长最自由(6/10/15/20/25/30 秒可选),适合做社媒短片、口播 vlog、节奏自由的短视频。 先读 视频生成总览 拿到接口共通约定,再看本页细节。
接口地址 & 模型
- 创建任务:
POST https://your-domain.com/v1/video/generations(把your-domain.com换成你的预制小龙虾域名) - 查询任务:
GET https://your-domain.com/v1/video/generations/{task_id} - API 模型 ID:
grok-video - 认证:HTTP Header
Authorization: Bearer <你的 API 令牌> - 任务类型:异步任务(提交 → 轮询 → 下载,无需配置 callback)
- 分辨率:720p(唯一档位)
- 时长档位:6 / 10 / 15 / 20 / 25 / 30 秒
拿令牌 + 怎么测试(5 分钟流程)
- 登录你的预制小龙虾后台(
https://your-domain.com)。 - 左侧菜单进「令牌」页,点「添加令牌」,分组挑含 Grok 的视频分组,生成后完整复制好。
- 打开 Postman 或终端 curl,按本文「文生视频 curl 示例」粘贴执行;拿到
task_id后调查询接口轮询,直到status=completed。 - 第一次只传
model+prompt跑通,再加duration/aspect_ratio等可选参数。
分组开通须知
视频模型属于受控分组 sora-veo-grok-video,新用户无法自助开通。
- 在 newapi 后台「个人 → API 令牌」页生成令牌时,如果令牌分组下拉找不到
sora-veo-grok-video,请联系客服 zhiyanck@gmail.com 开通该分组权限。 - 已开通用户:创建令牌时选
sora-veo-grok-video分组,调用即可。 - 余额不足时调用会返回
403 quota_exceeded,先充值再试。
模型亮点
| 特点 | 说明 |
|---|---|
| 时长灵活 | 最短 6 秒、最长 30 秒,按时长分三档计费 |
| 价格便宜 | 6/10s 仅 0.43 元 / 次,是同类最长档里性价比最高的 |
| 720p 单档 | 不分高低清,省得纠结 |
| 文生 + 图生 | 都支持,传 image_urls 即图生视频 |
完整参数表
| 参数 | 类型 | 必填 | 可选值 / 说明 |
|---|---|---|---|
model | string | 是 | grok-video |
prompt | string | 是 | 视频描述 |
duration | int | 否 | 6 / 10 / 15 / 20 / 25 / 30 秒,默认 6 |
aspect_ratio | string | 否 | 16:9(横版,默认)/ 9:16(竖版)/ 1:1 |
image_urls | string[] | 否 | 参考图 URL,1–N 张,传了即图生视频 |
注意
- 必填只有
model+prompt,其它字段都可省略。 - 平台不开放
callback_url/webhook_url,结果一律走GET /v1/video/generations/{task_id}取。 duration必须是上面列出的 6 个值之一,传 7 / 12 / 24 之类的会直接报错。- 没有 1080p / 4K 档位,要高清请改用 Veo3.1。
文生视频 curl 示例
curl -X POST "https://your-domain.com/v1/video/generations" \
-H "Authorization: Bearer <YOUR_API_KEY>" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-video",
"prompt": "A street food vendor stir-frying spicy crawfish in a giant wok, flames jumping, crowd watching, neon city lights at night, handheld documentary feel",
"duration": 15,
"aspect_ratio": "9:16"
}'响应(关键字段):
{
"task_id": "task_xxx",
"model": "grok-video",
"status": "queued",
"created_at": 1717000000
}拿到 task_id 后调用查询接口轮询:
curl "https://your-domain.com/v1/video/generations/task_xxx" \
-H "Authorization: Bearer <YOUR_API_KEY>"status=completed 后按 总览页 的下载流程取视频。
参考图(图生视频)curl 示例
curl -X POST "https://your-domain.com/v1/video/generations" \
-H "Authorization: Bearer <YOUR_API_KEY>" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-video",
"prompt": "Use image 1 as the scene reference. The camera slowly pans left to right, ambient noise of a bustling night market, neon reflections on wet pavement",
"duration": 10,
"aspect_ratio": "9:16",
"image_urls": [
"https://example.com/night-market.jpg"
]
}'多张参考图
传多张图时,在 prompt 里用 "image 1"、"image 2" 指代,模型会按顺序对应。
价格表 + 算例
售价已是客户最终价,按时长分三档收费。
| 时长档 | 6 / 10 秒 | 15 / 20 秒 | 25 / 30 秒 |
|---|---|---|---|
| 价格 | 0.43 元 / 次 | 0.86 元 / 次 | 1.29 元 / 次 |
算例 1: 我做 1 条 15 秒 grok 视频:
0.86 元 / 次(直接看表)算例 2: 我用 10 秒做了 5 个试稿,再用 30 秒出 1 个终稿:
0.43 × 5 + 1.29 × 1 = 2.15 + 1.29 = 3.44 元算例 3: 我要做一组 9:16 抖音号素材,10 条 20 秒:
0.86 × 10 = 8.60 元提示词技巧
Grok-Video 风格偏"接地气、真实感",提示词写得越具体、越生活化效果越好。
| 要素 | 示例片段 |
|---|---|
| 场景细节 | street food stall in Chengdu、crowded night market、steam rising |
| 人物动作 | vendor tossing crawfish in the wok、customer takes a bite and smiles |
| 氛围 | neon lights reflect on wet pavement、background chatter、handheld documentary feel |
| 节奏 | 长视频建议描述"分段动作":先 ... 再 ... 最后 ... |
15 秒以上的视频,建议把镜头拆成 2–3 段写:
0-5s: A vendor places crawfish in a wok, flames jump. 5-10s: Close-up of spices being added, sizzling sound. 10-15s: Plate served to customer, customer takes a bite and gives a thumbs up.
节奏分段技巧
- 6 / 10 秒:写 1 个动作就够。
- 15 / 20 秒:可以拆 2 个动作。
- 25 / 30 秒:拆 3 个动作 + 1 个收尾。
- 写得太"满"反而效果差;留点"自然停顿"给模型发挥。
常见错误 + 排查
| 现象 | 可能原因 | 处理 |
|---|---|---|
400 invalid duration | 时长不在 6/10/15/20/25/30 里 | 改成允许的档位 |
400 model not found | 模型 ID 写错 | 必须是 grok-video(中划线,不是下划线) |
401 | 令牌错 / 分组不含 Grok | 用对应的 Grok 分组令牌 |
402 | 余额不足 | 充值 |
任务一直 queued 超过 5 分钟 | 上游排队 | 别重复提交,再等等 |
failed 提示内容审查 | prompt 触发安全策略 | 改 prompt,避免敏感描述 |
| 参考图没起作用 | URL 不通 / prompt 没引用 image | 换公网 URL,prompt 里写 "use image 1 as ..." |
| 视频里"动作"很机械 | prompt 太干 / 缺少环境描述 | 加氛围词(光、声音、背景) |
FAQ
为啥没有 1080p / 4K?
Grok-Video 目前只有 720p。要高清请用 Veo3.1。
30 秒的视频值得做吗?
如果是社媒短视频(抖音、Reels、X 短视频),30 秒是黄金时长。如果是产品广告,建议拆 2 个 15 秒分别试稿。
失败扣不扣钱?
不扣。只有任务 completed 才扣费。
一次最多能挂多少任务?
接口没硬限,但 30 秒的任务上游耗时也较长,建议并发 ≤ 5。
中文 prompt 行不行?
行。Grok 系列对中文支持算比较自然,不过英文 prompt 在镜头描述上更稳。
能拼接多个 30 秒做 1 分钟以上视频吗?
可以,但要自己用剪辑软件拼。Grok-Video 接口本身不直接给"延长"能力。建议每段开头和结尾留 1 秒"过渡画面",方便剪辑对齐。
Cherry Studio / n8n 能用吗?
能。Cherry Studio / n8n 配置请参考:
上一步:Veo 3.1 视频生成使用指南 | 返回:视频生成总览
