Omni 视频生成

基于 Gemini Veo 的视频生成服务，支持文生视频、图生视频（最多 5 张参考图）、视频转视频。

模型与价格

模型	能力	计费	价格
`omni-fast`	文生视频 / 图生视频	按次	¥0.40/次
`omni-fast-v2v`	视频转视频（V2V）	按次	¥0.55/次
`omni-fast-no-water`	文生/图生视频（无水印）	按次	¥0.50/次
`omni-fast-v2v-no-water`	V2V（无水印）	按次	¥0.65/次

无水印模型输出经过自动清洗处理，完成前可能多一个 processing 阶段，稍慢。失败不计费。

接口信息

项	说明
提交任务	`POST /v1/videos`（JSON 或 multipart）
轮询进度	`GET /v1/videos/{task_id}`
下载成片	`GET /v1/videos/{task_id}/content` 或返回的 `data[0].url`
鉴权	`Authorization: Bearer sk-你的令牌`
令牌分组	`gemini-高速`

核心参数

参数	类型	必填	默认	说明
`model`	string	是	-	模型名，见上表
`prompt`	string	是	-	视频描述提示词
`aspect_ratio`	string	否	`16:9`	画幅比例：`16:9`（横）、`9:16`（竖）
`seconds` / `duration`	string/int	否	`10`	时长秒数（接收但当前 Gemini 固定输出约 10 秒）
`image_url`	string	否	-	单张参考图（公网 URL 或 data:image Base64）
`first_image_url`	string	否	-	首帧参考图 URL
`last_image_url`	string	否	-	末帧参考图 URL
`video_url`	string	否	-	V2V 模型的源视频 URL（限 5MB、1920x1080 内）

Multipart 提交（支持文件上传）

字段	说明
`input_reference`	参考图文件上传（最多 5 张，每张 ≤5MB）
`input_video`	V2V 源视频文件上传（≤5MB）

示例：文生视频

curl -X POST https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "omni-fast",
    "prompt": "雨夜霓虹街道，镜头缓慢推进，电影感光影",
    "aspect_ratio": "16:9"
  }'

示例：图生视频

curl -X POST https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "omni-fast",
    "prompt": "保持人物一致，缓慢走动",
    "image_url": "https://your-cdn.com/photo.jpg",
    "aspect_ratio": "16:9"
  }'

示例：视频转视频（V2V）

# Multipart 文件上传
curl -X POST https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -F "model=omni-fast-v2v" \
  -F "prompt=将画面风格转换为赛博朋克风" \
  -F "input_video=@source.mp4"

轮询取片

curl https://YOUR_BASE/v1/videos/{task_id} \
  -H "Authorization: Bearer sk-xxx"

# 完成后:
# {"status":"completed","data":[{"url":"/v1/videos/{task_id}/content"}]}

Python 完整示例

import time, requests

BASE = "https://YOUR_BASE/v1"
H = {"Authorization": "Bearer sk-xxx", "Content-Type": "application/json"}

# 提交
task = requests.post(f"{BASE}/videos", headers=H, json={
    "model": "omni-fast",
    "prompt": "雨夜霓虹街道，镜头缓慢推进",
    "aspect_ratio": "16:9"
}).json()
task_id = task["task_id"]

# 轮询
while True:
    time.sleep(8)
    s = requests.get(f"{BASE}/videos/{task_id}", headers=H).json()
    if s["status"] == "completed":
        print("下载:", s["data"][0]["url"])
        break
    if s["status"] == "failed":
        print("失败:", s.get("error"))
        break
    print(f"进度: {s.get('progress', 0)}%")

注意事项

视频生成通常需要 1-5 分钟，请设置足够的超时时间
轮询间隔建议 5-10 秒
参考图最多 5 张，每张 ≤5MB
V2V 源视频限制：≤5MB 且 ≤1920x1080
画幅仅支持 16:9（横屏）和 9:16（竖屏），9:16 为尽力而为模式
输出分辨率固定 720p
包含可识别真人面孔的参考图可能触发内容策略（系统会自动尝试处理）
被内容策略拒绝的图片会明确提示「请更换图片」
服务重启时进行中的任务自动恢复

Veo-Clean 去水印

上传带水印的视频，系统自动去除水印后返回。异步任务流程与视频生成一致。

模型与价格

模型	计费	价格
`veo-clean`	按秒	¥0.02/秒

按视频实际时长计费。例如 10 秒视频 = ¥0.20。失败不计费。

参数

参数	类型	必填	说明
`model`	string	是	固定 `veo-clean`
`prompt`	string	否	可省略，默认 "remove watermark"
`input_video`	file	是	带水印视频文件（≤20MB，必须 multipart 上传）

示例

# Multipart 上传
curl -X POST https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -F "model=veo-clean" \
  -F "prompt=remove watermark" \
  -F "input_video=@watermarked.mp4"

# 轮询取片（同其他视频模型）
curl https://YOUR_BASE/v1/videos/{task_id} \
  -H "Authorization: Bearer sk-xxx"

注意事项

仅支持 multipart/form-data 提交（需上传视频文件）
视频文件大小限制 20MB
处理时间通常 20-60 秒（取决于视频长度）
不涉及 Gemini 视频生成，不消耗生成配额

Seedance 2.0 视频生成（Video Pro/Fast/Lite）

基于 Seedance 2.0 的视频生成服务。三个模型调用方式完全一致，切换只需改 model 字段。支持多图/视频/音频参考。

模型与价格

模型	版本	定位	价格	duration 范围
`video-pro-720p`	满血	最佳质量，人脸/一致性最强，正式成片首选	¥0.65/秒	4-15（任意整数）
`video-fast-720p`	满血	快速出片，质量接近 Pro	¥0.60/秒	4-15（任意整数）
`video-lite-720p`	非满血	经济档，性价比高，复杂真人一致性略弱	¥0.45/秒	仅 4 / 8 / 12（固定档位）

满血 vs 非满血：Pro 和 Fast 为满血版，支持 4-15 秒任意整数时长，全部高级参考功能（@Image/@Video/@Audio 引用）。Lite 为非满血版，时长仅支持 4/8/12 秒三个固定档位（传其他值会报错），高级参考字段名不同（见下方），复杂真人场景一致性略弱，但价格更低。

按秒计费 = 单价 × duration。例如 video-pro-720p 8秒 = ¥5.20。失败不计费。

核心参数

参数	类型	必填	说明
`model`	string	是	`video-pro-720p` / `video-fast-720p` / `video-lite-720p`
`prompt`	string	是	视频描述提示词
`aspect_ratio`	string	否	`16:9`（默认）、`9:16`、`1:1`、`21:9`、`3:4`、`4:3`
`duration`	integer	否	时长秒数。Pro/Fast: 4-15；Lite: 仅 4/8/12
`image_url`	string	否	单张主参考图（公网 HTTPS URL）

高级参考（Pro/Fast 专用）

在 prompt 中用 @Image1、@Video1、@Audio1 引用对应素材：

参数	说明
`extra_images`	参考图数组，最多 9 张，`@Image1`...`@Image9` 引用
`extra_videos`	参考视频数组，最多 3 个，`@Video1`...`@Video3` 引用
`extra_audios`	参考音频数组，最多 3 个，`@Audio1`...`@Audio3` 引用

高级参考（Lite 专用）

参数	说明
`reference_image_urls`	参考图数组，与 image_url 合计最多 9 张
`reference_video` / `reference_videos`	参考视频，最多 3 个，单条 3-10 秒，总时长 ≤15 秒
`audio_url`	参考音频，最多 3 个，单条 2-15 秒；用音频时必须同时给至少一张参考图
`video_config.reference_mode`	`auto`（默认）、`start_frame`（首帧，1张图）、`start_end`（首尾帧，2张图）

示例

# 文生视频
curl -X POST https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "video-pro-720p",
    "prompt": "雨夜霓虹街道，镜头缓慢推进，电影感光影",
    "aspect_ratio": "16:9",
    "duration": 8
  }'

# 多素材参考（Pro/Fast）
curl -X POST https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "video-pro-720p",
    "prompt": "以 @Image1 的人物、@Video1 的运镜，配合 @Audio1 的节奏生成广告",
    "image_url": "https://cdn.example.com/main.jpg",
    "extra_images": ["https://cdn.example.com/ref.jpg"],
    "extra_videos": ["https://cdn.example.com/ref.mp4"],
    "extra_audios": ["https://cdn.example.com/ref.mp3"],
    "aspect_ratio": "16:9",
    "duration": 10
  }'

Grok 图像 & 视频

基于 xAI Grok Imagine 的图像和视频生成服务，封装为 OpenAI 兼容接口。

模型与价格

模型	能力	价格
`grok-imagine-image`	标准文生图	¥0.06/张
`grok-imagine-image-lite`	快速文生图	¥0.06/张
`grok-imagine-image-pro`	高质量文生图	¥0.08/张
`grok-imagine-image-edit`	图生图 / 编辑	¥0.06/张
`grok-imagine-video`	文生/图生视频	¥0.28/条

接口信息

项	说明
统一接口	`POST /v1/chat/completions`（按模型自动分发图像/视频）
视频异步	也支持 `POST /v1/videos`（multipart 表单提交 + 轮询取片）
鉴权	`Authorization: Bearer sk-xxx`
令牌分组	必须为 `grok` 分组

视频参数 `video_config`

字段	取值	默认	说明
`seconds`	`6/10/12/16/20`	`6`	时长，最长 20 秒。越长越慢（16/20s 约 2-3 分钟）
`size`	`720x1280` / `1280x720` / `960x960`	`720x1280`	画幅（仅支持这 3 种）
`public_url`	`true`/`false`	`false`	建议 `true`，返回可直接打开的完整下载链接

示例：文生视频

curl https://YOUR_BASE/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-video",
    "stream": true,
    "messages": [{"role":"user","content":"灯塔在日落时分，海浪拍打礁石"}],
    "video_config": {"seconds": 10, "size": "1280x720", "public_url": true}
  }'

示例：图生视频

curl https://YOUR_BASE/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-video",
    "stream": true,
    "messages": [{"role":"user","content":[
      {"type":"text","text":"让画面动起来，光线柔和"},
      {"type":"image_url","image_url":{"url":"https://your-image.jpg"}}
    ]}],
    "video_config": {"seconds": 6, "size": "1280x720", "public_url": true}
  }'

示例：文生图

curl https://YOUR_BASE/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-image",
    "messages": [{"role":"user","content":"一只穿宇航服的橘猫，电影质感"}]
  }'

注意事项

视频提示词不超过 1500 字符
参考图最多 7 张，支持 @IMAGE1...@IMAGE7 占位符
图生图输出固定 1024x1024
视频 stream:true 时推送 视频正在生成 NN% 进度
客户端超时建议 ≥300 秒
失败不计费，成功出片才扣费

Grok CLI 视频专线

独立视频专线，模型名 grok-imagine-video-cli，官方通道稳定性更好。仅走 /v1/videos 异步接口。

模型与价格

模型	能力	价格
`grok-imagine-video-cli`	文生/图生视频	¥0.30/条（一口价）
`grok-imagine-video-cli-edit`	视频局部编辑	¥0.35/条（一口价）
`grok-imagine-video-1.5-cli`	1.5 图生视频（仅单图）	¥0.28/条（一口价）

一口价：与时长、画幅无关。失败不计费。

grok-imagine-video-1.5-cli 为 xAI 较新的 1.5 图生模型，仅支持单张首帧图生视频——不支持文生视频、不支持多参考图（reference_images）、不支持视频编辑；size/aspect_ratio/resolution/seconds 取值与 grok-imagine-video-cli 一致。

接口信息

项	说明
提交	`POST /v1/videos`（JSON 或 multipart 均可）
轮询	`GET /v1/videos/{task_id}`
令牌分组	`grok-video-cli`

生成参数

参数	取值	默认	说明
`prompt`	文本	-	必填，提示词
`seconds`	整数	`6`	文生/单图最长 15 秒；多图最长 10 秒
`size`	`720x1280` / `1280x720`	`720x1280`	画幅
`aspect_ratio`	`1:1/16:9/9:16/4:3/3:4/3:2/2:3`	跟随 size	比例（可替代 size 指定非标比例）
`resolution`	`480p` / `720p`	`720p`	分辨率（定短边像素）
`input_reference`	URL / data URL	-	单张首帧参考图
`reference_images`	数组，≤10 张	-	多参考图（与 input_reference 二选一）

编辑参数（`grok-imagine-video-cli-edit`）

参数	说明
`prompt`	必填，只写要改的内容（如 "add a gold necklace"）
`video`	`{"url": "源视频公网URL"}`，源视频 ≤8.7 秒，H.264 MP4

示例

# 文生视频
curl https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-video-cli",
    "prompt": "hot air balloon rising over green hills at sunrise",
    "seconds": "10",
    "size": "1280x720"
  }'

# 视频编辑
curl https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-video-cli-edit",
    "prompt": "add a large gold necklace around her neck",
    "video": {"url": "https://your-source-video.mp4"}
  }'

# 1.5 图生视频（仅单图，必须带 input_reference）
curl https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-video-1.5-cli",
    "prompt": "gentle camera push-in, water flowing",
    "input_reference": "https://your-image.jpg",
    "seconds": "4",
    "size": "1280x720"
  }'

各比例实际输出像素

aspect_ratio	720p	480p
9:16	720x1280	480x848
16:9	1280x720	848x480
1:1	720x720	480x480
4:3	960x720	-
3:4	720x960	-

GPT-Image-2

文生图 / 图生图 / Chat 生图，支持三种调用方式。

模型与价格

模型	价格
`gpt-image-2`	¥0.02/张

接口

端点	方式	说明
`/v1/images/generations`	JSON	文生图
`/v1/images/edits`	multipart	图生图（参考图 + 描述）
`/v1/chat/completions`	JSON	Chat 对话生图

参数（文生图）

参数	类型	必填	说明
`prompt`	string	是	图片描述
`model`	string	否	默认 `gpt-image-2`
`n`	integer	否	生成数量 1-4
`size`	string	否	`1024x1024`、`1536x1024`（横）、`1024x1536`（竖）、`auto`
`quality`	string	否	`auto` / `low` / `medium` / `high`
`response_format`	string	否	`b64_json`（默认）或 `url`

示例

# 文生图
curl -X POST https://YOUR_BASE/v1/images/generations \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "一只橘猫趴在窗台上晒太阳，水彩画风格",
    "size": "1024x1024",
    "quality": "high"
  }'

# 图生图
curl -X POST https://YOUR_BASE/v1/images/edits \
  -H "Authorization: Bearer sk-xxx" \
  -F "image=@reference.png" \
  -F "prompt=把背景改成海边日落" \
  -F "model=gpt-image-2"

注意事项

响应时间 15-60 秒，超时建议 ≥120 秒
默认返回 b64_json（Base64 编码），需客户端解码保存
支持横版 1536x1024 和竖版 1024x1536

Gemini 图像生成

基于 Gemini 的图像生成服务。

模型与价格

模型	价格
`gemini-image`	¥0.11/张
`gemini-image-pro`	¥0.12/张

接口

通过 POST /v1/images/generations 调用，参数与 GPT-Image-2 类似。

curl -X POST https://YOUR_BASE/v1/images/generations \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-image",
    "prompt": "赛博朋克风格的东京夜景",
    "size": "1024x1024"
  }'

Gemini 音乐生成

通过 Chat Completions 接口生成音乐。

模型与价格

模型	价格
`gemini-music`	¥1.00/首

示例

curl https://YOUR_BASE/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-music",
    "messages": [{"role":"user","content":"创作一首轻快的电子风格BGM，适合科技产品广告"}]
  }'

通用说明 & FAQ

平台信息

平台	Base URL
平台 A	`https://newapi.oairegbox.cc/v1`
平台 B	`https://newapi-2.oairegbox.cc/v1`

两平台能力一致，账号与令牌独立、不互通。选择其一使用即可。

鉴权

所有请求需携带 Authorization: Bearer sk-你的令牌 请求头。令牌在对应平台后台创建，分组必须与模型匹配（错误分组会返回"无可用渠道"）。

错误码

HTTP	含义	处理	计费
200	成功	正常取用	成功才扣
400	参数/素材问题	按 message 改正	不计费
401	鉴权失败	检查令牌	不计费
404	路径错误	检查 URL（勿重复 /v1）	不计费
429	限速/额度不足	降并发或充值	不计费
502/5xx	上游临时故障	直接重试	不计费

FAQ

Q: 视频生成需要多久？

Omni 视频约 1-5 分钟，Grok 视频约 30s-3 分钟（时长越长越慢）。建议客户端超时 ≥300 秒。

Q: 失败会扣费吗？

不会。所有模型失败一律不扣费，仅成功出片/出图才计费。

Q: 参考图被内容策略拒绝怎么办？

包含可识别真人面孔的参考图可能触发 Gemini 内容策略。系统会自动尝试处理并重试。如仍失败，建议：使用非写实风格、虚构人物、侧面/背影/远景，或使用已授权的素材。

Q: 两个平台有什么区别？

能力完全一致。账号和余额独立。选其一使用，不可跨平台混用令牌。

Omni 视频生成

模型与价格

接口信息

核心参数

Multipart 提交（支持文件上传）

示例：文生视频

示例：图生视频

示例：视频转视频（V2V）

轮询取片

Python 完整示例

注意事项

Veo-Clean 去水印

模型与价格

参数

示例

注意事项

Seedance 2.0 视频生成（Video Pro/Fast/Lite）

模型与价格

核心参数

高级参考（Pro/Fast 专用）

高级参考（Lite 专用）

示例

Grok 图像 & 视频

模型与价格

接口信息

视频参数 video_config

示例：文生视频

示例：图生视频

示例：文生图

注意事项

Grok CLI 视频专线

模型与价格

接口信息

生成参数

编辑参数（grok-imagine-video-cli-edit）

示例

各比例实际输出像素

GPT-Image-2

模型与价格

接口

参数（文生图）

示例

注意事项

Gemini 图像生成

模型与价格

接口

Gemini 音乐生成

模型与价格

示例

通用说明 & FAQ

平台信息

鉴权

错误码

FAQ

Q: 视频生成需要多久？

Q: 失败会扣费吗？

Q: 参考图被内容策略拒绝怎么办？

Q: 两个平台有什么区别？

视频参数 `video_config`

编辑参数（`grok-imagine-video-cli-edit`）