Omni 视频生成
基于 Gemini Veo 的视频生成服务,支持文生视频、图生视频(最多 5 张参考图)、视频转视频。
模型与价格
| 模型 | 能力 | 计费 | 价格 |
omni-fast | 文生视频 / 图生视频 | 按次 | ¥0.40/次 |
omni-fast-v2v | 视频转视频(V2V) | 按次 | ¥0.55/次 |
omni-fast-no-water | 文生/图生视频(无水印) | 按次 | ¥0.50/次 |
omni-fast-v2v-no-water | V2V(无水印) | 按次 | ¥0.65/次 |
无水印模型输出经过自动清洗处理,完成前可能多一个 processing 阶段,稍慢。失败不计费。
接口信息
| 项 | 说明 |
| 提交任务 | POST /v1/videos(JSON 或 multipart) |
| 轮询进度 | GET /v1/videos/{task_id} |
| 下载成片 | GET /v1/videos/{task_id}/content 或返回的 data[0].url |
| 鉴权 | Authorization: Bearer sk-你的令牌 |
| 令牌分组 | gemini-高速 |
核心参数
| 参数 | 类型 | 必填 | 默认 | 说明 |
model | string | 是 | - | 模型名,见上表 |
prompt | string | 是 | - | 视频描述提示词 |
aspect_ratio | string | 否 | 16:9 | 画幅比例:16:9(横)、9:16(竖) |
seconds / duration | string/int | 否 | 10 | 时长秒数(接收但当前 Gemini 固定输出约 10 秒) |
image_url | string | 否 | - | 单张参考图(公网 URL 或 data:image Base64) |
first_image_url | string | 否 | - | 首帧参考图 URL |
last_image_url | string | 否 | - | 末帧参考图 URL |
video_url | string | 否 | - | V2V 模型的源视频 URL(限 5MB、1920x1080 内) |
Multipart 提交(支持文件上传)
| 字段 | 说明 |
input_reference | 参考图文件上传(最多 5 张,每张 ≤5MB) |
input_video | V2V 源视频文件上传(≤5MB) |
示例:文生视频
curl -X POST https://YOUR_BASE/v1/videos \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "omni-fast",
"prompt": "雨夜霓虹街道,镜头缓慢推进,电影感光影",
"aspect_ratio": "16:9"
}'
示例:图生视频
curl -X POST https://YOUR_BASE/v1/videos \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "omni-fast",
"prompt": "保持人物一致,缓慢走动",
"image_url": "https://your-cdn.com/photo.jpg",
"aspect_ratio": "16:9"
}'
示例:视频转视频(V2V)
# Multipart 文件上传
curl -X POST https://YOUR_BASE/v1/videos \
-H "Authorization: Bearer sk-xxx" \
-F "model=omni-fast-v2v" \
-F "prompt=将画面风格转换为赛博朋克风" \
-F "input_video=@source.mp4"
轮询取片
curl https://YOUR_BASE/v1/videos/{task_id} \
-H "Authorization: Bearer sk-xxx"
# 完成后:
# {"status":"completed","data":[{"url":"/v1/videos/{task_id}/content"}]}
Python 完整示例
import time, requests
BASE = "https://YOUR_BASE/v1"
H = {"Authorization": "Bearer sk-xxx", "Content-Type": "application/json"}
# 提交
task = requests.post(f"{BASE}/videos", headers=H, json={
"model": "omni-fast",
"prompt": "雨夜霓虹街道,镜头缓慢推进",
"aspect_ratio": "16:9"
}).json()
task_id = task["task_id"]
# 轮询
while True:
time.sleep(8)
s = requests.get(f"{BASE}/videos/{task_id}", headers=H).json()
if s["status"] == "completed":
print("下载:", s["data"][0]["url"])
break
if s["status"] == "failed":
print("失败:", s.get("error"))
break
print(f"进度: {s.get('progress', 0)}%")
注意事项
- 视频生成通常需要 1-5 分钟,请设置足够的超时时间
- 轮询间隔建议 5-10 秒
- 参考图最多 5 张,每张 ≤5MB
- V2V 源视频限制:≤5MB 且 ≤1920x1080
- 画幅仅支持 16:9(横屏)和 9:16(竖屏),9:16 为尽力而为模式
- 输出分辨率固定 720p
- 包含可识别真人面孔的参考图可能触发内容策略(系统会自动尝试处理)
- 被内容策略拒绝的图片会明确提示「请更换图片」
- 服务重启时进行中的任务自动恢复
Veo-Clean 去水印
上传带水印的视频,系统自动去除水印后返回。异步任务流程与视频生成一致。
模型与价格
| 模型 | 计费 | 价格 |
veo-clean | 按秒 | ¥0.02/秒 |
按视频实际时长计费。例如 10 秒视频 = ¥0.20。失败不计费。
参数
| 参数 | 类型 | 必填 | 说明 |
model | string | 是 | 固定 veo-clean |
prompt | string | 否 | 可省略,默认 "remove watermark" |
input_video | file | 是 | 带水印视频文件(≤20MB,必须 multipart 上传) |
示例
# Multipart 上传
curl -X POST https://YOUR_BASE/v1/videos \
-H "Authorization: Bearer sk-xxx" \
-F "model=veo-clean" \
-F "prompt=remove watermark" \
-F "input_video=@watermarked.mp4"
# 轮询取片(同其他视频模型)
curl https://YOUR_BASE/v1/videos/{task_id} \
-H "Authorization: Bearer sk-xxx"
注意事项
- 仅支持 multipart/form-data 提交(需上传视频文件)
- 视频文件大小限制 20MB
- 处理时间通常 20-60 秒(取决于视频长度)
- 不涉及 Gemini 视频生成,不消耗生成配额
Seedance 2.0 视频生成(Video Pro/Fast/Lite)
基于 Seedance 2.0 的视频生成服务。三个模型调用方式完全一致,切换只需改 model 字段。支持多图/视频/音频参考。
模型与价格
| 模型 | 版本 | 定位 | 价格 | duration 范围 |
video-pro-720p | 满血 | 最佳质量,人脸/一致性最强,正式成片首选 | ¥0.65/秒 | 4-15(任意整数) |
video-fast-720p | 满血 | 快速出片,质量接近 Pro | ¥0.60/秒 | 4-15(任意整数) |
video-lite-720p | 非满血 | 经济档,性价比高,复杂真人一致性略弱 | ¥0.45/秒 | 仅 4 / 8 / 12(固定档位) |
满血 vs 非满血:Pro 和 Fast 为满血版,支持 4-15 秒任意整数时长,全部高级参考功能(@Image/@Video/@Audio 引用)。Lite 为非满血版,时长仅支持 4/8/12 秒三个固定档位(传其他值会报错),高级参考字段名不同(见下方),复杂真人场景一致性略弱,但价格更低。
按秒计费 = 单价 × duration。例如 video-pro-720p 8秒 = ¥5.20。失败不计费。
核心参数
| 参数 | 类型 | 必填 | 说明 |
model | string | 是 | video-pro-720p / video-fast-720p / video-lite-720p |
prompt | string | 是 | 视频描述提示词 |
aspect_ratio | string | 否 | 16:9(默认)、9:16、1:1、21:9、3:4、4:3 |
duration | integer | 否 | 时长秒数。Pro/Fast: 4-15;Lite: 仅 4/8/12 |
image_url | string | 否 | 单张主参考图(公网 HTTPS URL) |
高级参考(Pro/Fast 专用)
在 prompt 中用 @Image1、@Video1、@Audio1 引用对应素材:
| 参数 | 说明 |
extra_images | 参考图数组,最多 9 张,@Image1...@Image9 引用 |
extra_videos | 参考视频数组,最多 3 个,@Video1...@Video3 引用 |
extra_audios | 参考音频数组,最多 3 个,@Audio1...@Audio3 引用 |
高级参考(Lite 专用)
| 参数 | 说明 |
reference_image_urls | 参考图数组,与 image_url 合计最多 9 张 |
reference_video / reference_videos | 参考视频,最多 3 个,单条 3-10 秒,总时长 ≤15 秒 |
audio_url | 参考音频,最多 3 个,单条 2-15 秒;用音频时必须同时给至少一张参考图 |
video_config.reference_mode | auto(默认)、start_frame(首帧,1张图)、start_end(首尾帧,2张图) |
示例
# 文生视频
curl -X POST https://YOUR_BASE/v1/videos \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "video-pro-720p",
"prompt": "雨夜霓虹街道,镜头缓慢推进,电影感光影",
"aspect_ratio": "16:9",
"duration": 8
}'
# 多素材参考(Pro/Fast)
curl -X POST https://YOUR_BASE/v1/videos \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "video-pro-720p",
"prompt": "以 @Image1 的人物、@Video1 的运镜,配合 @Audio1 的节奏生成广告",
"image_url": "https://cdn.example.com/main.jpg",
"extra_images": ["https://cdn.example.com/ref.jpg"],
"extra_videos": ["https://cdn.example.com/ref.mp4"],
"extra_audios": ["https://cdn.example.com/ref.mp3"],
"aspect_ratio": "16:9",
"duration": 10
}'
Grok 图像 & 视频
基于 xAI Grok Imagine 的图像和视频生成服务,封装为 OpenAI 兼容接口。
模型与价格
| 模型 | 能力 | 价格 |
grok-imagine-image | 标准文生图 | ¥0.06/张 |
grok-imagine-image-lite | 快速文生图 | ¥0.06/张 |
grok-imagine-image-pro | 高质量文生图 | ¥0.08/张 |
grok-imagine-image-edit | 图生图 / 编辑 | ¥0.06/张 |
grok-imagine-video | 文生/图生视频 | ¥0.28/条 |
接口信息
| 项 | 说明 |
| 统一接口 | POST /v1/chat/completions(按模型自动分发图像/视频) |
| 视频异步 | 也支持 POST /v1/videos(multipart 表单提交 + 轮询取片) |
| 鉴权 | Authorization: Bearer sk-xxx |
| 令牌分组 | 必须为 grok 分组 |
视频参数 video_config
| 字段 | 取值 | 默认 | 说明 |
seconds | 6/10/12/16/20 | 6 | 时长,最长 20 秒。越长越慢(16/20s 约 2-3 分钟) |
size | 720x1280 / 1280x720 / 960x960 | 720x1280 | 画幅(仅支持这 3 种) |
public_url | true/false | false | 建议 true,返回可直接打开的完整下载链接 |
示例:文生视频
curl https://YOUR_BASE/v1/chat/completions \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-video",
"stream": true,
"messages": [{"role":"user","content":"灯塔在日落时分,海浪拍打礁石"}],
"video_config": {"seconds": 10, "size": "1280x720", "public_url": true}
}'
示例:图生视频
curl https://YOUR_BASE/v1/chat/completions \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-video",
"stream": true,
"messages": [{"role":"user","content":[
{"type":"text","text":"让画面动起来,光线柔和"},
{"type":"image_url","image_url":{"url":"https://your-image.jpg"}}
]}],
"video_config": {"seconds": 6, "size": "1280x720", "public_url": true}
}'
示例:文生图
curl https://YOUR_BASE/v1/chat/completions \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-image",
"messages": [{"role":"user","content":"一只穿宇航服的橘猫,电影质感"}]
}'
注意事项
- 视频提示词不超过 1500 字符
- 参考图最多 7 张,支持
@IMAGE1...@IMAGE7 占位符
- 图生图输出固定
1024x1024
- 视频
stream:true 时推送 视频正在生成 NN% 进度
- 客户端超时建议 ≥300 秒
- 失败不计费,成功出片才扣费
Grok CLI 视频专线
独立视频专线,模型名 grok-imagine-video-cli,官方通道稳定性更好。仅走 /v1/videos 异步接口。
模型与价格
| 模型 | 能力 | 价格 |
grok-imagine-video-cli | 文生/图生视频 | ¥0.30/条(一口价) |
grok-imagine-video-cli-edit | 视频局部编辑 | ¥0.35/条(一口价) |
grok-imagine-video-1.5-cli | 1.5 图生视频(仅单图) | ¥0.28/条(一口价) |
一口价:与时长、画幅无关。失败不计费。
grok-imagine-video-1.5-cli 为 xAI 较新的 1.5 图生模型,仅支持单张首帧图生视频——不支持文生视频、不支持多参考图(reference_images)、不支持视频编辑;size/aspect_ratio/resolution/seconds 取值与 grok-imagine-video-cli 一致。
接口信息
| 项 | 说明 |
| 提交 | POST /v1/videos(JSON 或 multipart 均可) |
| 轮询 | GET /v1/videos/{task_id} |
| 令牌分组 | grok-video-cli |
生成参数
| 参数 | 取值 | 默认 | 说明 |
prompt | 文本 | - | 必填,提示词 |
seconds | 整数 | 6 | 文生/单图最长 15 秒;多图最长 10 秒 |
size | 720x1280 / 1280x720 | 720x1280 | 画幅 |
aspect_ratio | 1:1/16:9/9:16/4:3/3:4/3:2/2:3 | 跟随 size | 比例(可替代 size 指定非标比例) |
resolution | 480p / 720p | 720p | 分辨率(定短边像素) |
input_reference | URL / data URL | - | 单张首帧参考图 |
reference_images | 数组,≤10 张 | - | 多参考图(与 input_reference 二选一) |
编辑参数(grok-imagine-video-cli-edit)
| 参数 | 说明 |
prompt | 必填,只写要改的内容(如 "add a gold necklace") |
video | {"url": "源视频公网URL"},源视频 ≤8.7 秒,H.264 MP4 |
示例
# 文生视频
curl https://YOUR_BASE/v1/videos \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-video-cli",
"prompt": "hot air balloon rising over green hills at sunrise",
"seconds": "10",
"size": "1280x720"
}'
# 视频编辑
curl https://YOUR_BASE/v1/videos \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-video-cli-edit",
"prompt": "add a large gold necklace around her neck",
"video": {"url": "https://your-source-video.mp4"}
}'
# 1.5 图生视频(仅单图,必须带 input_reference)
curl https://YOUR_BASE/v1/videos \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "grok-imagine-video-1.5-cli",
"prompt": "gentle camera push-in, water flowing",
"input_reference": "https://your-image.jpg",
"seconds": "4",
"size": "1280x720"
}'
各比例实际输出像素
| aspect_ratio | 720p | 480p |
| 9:16 | 720x1280 | 480x848 |
| 16:9 | 1280x720 | 848x480 |
| 1:1 | 720x720 | 480x480 |
| 4:3 | 960x720 | - |
| 3:4 | 720x960 | - |
GPT-Image-2
文生图 / 图生图 / Chat 生图,支持三种调用方式。
模型与价格
接口
| 端点 | 方式 | 说明 |
/v1/images/generations | JSON | 文生图 |
/v1/images/edits | multipart | 图生图(参考图 + 描述) |
/v1/chat/completions | JSON | Chat 对话生图 |
参数(文生图)
| 参数 | 类型 | 必填 | 说明 |
prompt | string | 是 | 图片描述 |
model | string | 否 | 默认 gpt-image-2 |
n | integer | 否 | 生成数量 1-4 |
size | string | 否 | 1024x1024、1536x1024(横)、1024x1536(竖)、auto |
quality | string | 否 | auto / low / medium / high |
response_format | string | 否 | b64_json(默认)或 url |
示例
# 文生图
curl -X POST https://YOUR_BASE/v1/images/generations \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "一只橘猫趴在窗台上晒太阳,水彩画风格",
"size": "1024x1024",
"quality": "high"
}'
# 图生图
curl -X POST https://YOUR_BASE/v1/images/edits \
-H "Authorization: Bearer sk-xxx" \
-F "image=@reference.png" \
-F "prompt=把背景改成海边日落" \
-F "model=gpt-image-2"
注意事项
- 响应时间 15-60 秒,超时建议 ≥120 秒
- 默认返回 b64_json(Base64 编码),需客户端解码保存
- 支持横版 1536x1024 和竖版 1024x1536
Gemini 图像生成
基于 Gemini 的图像生成服务。
模型与价格
| 模型 | 价格 |
gemini-image | ¥0.11/张 |
gemini-image-pro | ¥0.12/张 |
接口
通过 POST /v1/images/generations 调用,参数与 GPT-Image-2 类似。
curl -X POST https://YOUR_BASE/v1/images/generations \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-image",
"prompt": "赛博朋克风格的东京夜景",
"size": "1024x1024"
}'
Gemini 音乐生成
通过 Chat Completions 接口生成音乐。
模型与价格
示例
curl https://YOUR_BASE/v1/chat/completions \
-H "Authorization: Bearer sk-xxx" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-music",
"messages": [{"role":"user","content":"创作一首轻快的电子风格BGM,适合科技产品广告"}]
}'
通用说明 & FAQ
平台信息
| 平台 | Base URL |
| 平台 A | https://newapi.oairegbox.cc/v1 |
| 平台 B | https://newapi-2.oairegbox.cc/v1 |
两平台能力一致,账号与令牌独立、不互通。选择其一使用即可。
鉴权
所有请求需携带 Authorization: Bearer sk-你的令牌 请求头。令牌在对应平台后台创建,分组必须与模型匹配(错误分组会返回"无可用渠道")。
错误码
| HTTP | 含义 | 处理 | 计费 |
| 200 | 成功 | 正常取用 | 成功才扣 |
| 400 | 参数/素材问题 | 按 message 改正 | 不计费 |
| 401 | 鉴权失败 | 检查令牌 | 不计费 |
| 404 | 路径错误 | 检查 URL(勿重复 /v1) | 不计费 |
| 429 | 限速/额度不足 | 降并发或充值 | 不计费 |
| 502/5xx | 上游临时故障 | 直接重试 | 不计费 |
FAQ
Q: 视频生成需要多久?
Omni 视频约 1-5 分钟,Grok 视频约 30s-3 分钟(时长越长越慢)。建议客户端超时 ≥300 秒。
Q: 失败会扣费吗?
不会。所有模型失败一律不扣费,仅成功出片/出图才计费。
Q: 参考图被内容策略拒绝怎么办?
包含可识别真人面孔的参考图可能触发 Gemini 内容策略。系统会自动尝试处理并重试。如仍失败,建议:使用非写实风格、虚构人物、侧面/背影/远景,或使用已授权的素材。
Q: 两个平台有什么区别?
能力完全一致。账号和余额独立。选其一使用,不可跨平台混用令牌。