v2.0

Omni 视频生成

基于 Gemini Veo 的视频生成服务,支持文生视频、图生视频(最多 5 张参考图)、视频转视频。

模型与价格

模型能力计费价格
omni-fast文生视频 / 图生视频按次¥0.40/次
omni-fast-v2v视频转视频(V2V)按次¥0.55/次
omni-fast-no-water文生/图生视频(无水印)按次¥0.50/次
omni-fast-v2v-no-waterV2V(无水印)按次¥0.65/次
无水印模型输出经过自动清洗处理,完成前可能多一个 processing 阶段,稍慢。失败不计费。

接口信息

说明
提交任务POST /v1/videos(JSON 或 multipart)
轮询进度GET /v1/videos/{task_id}
下载成片GET /v1/videos/{task_id}/content 或返回的 data[0].url
鉴权Authorization: Bearer sk-你的令牌
令牌分组gemini-高速

核心参数

参数类型必填默认说明
modelstring-模型名,见上表
promptstring-视频描述提示词
aspect_ratiostring16:9画幅比例:16:9(横)、9:16(竖)
seconds / durationstring/int10时长秒数(接收但当前 Gemini 固定输出约 10 秒)
image_urlstring-单张参考图(公网 URL 或 data:image Base64)
first_image_urlstring-首帧参考图 URL
last_image_urlstring-末帧参考图 URL
video_urlstring-V2V 模型的源视频 URL(限 5MB、1920x1080 内)

Multipart 提交(支持文件上传)

字段说明
input_reference参考图文件上传(最多 5 张,每张 ≤5MB)
input_videoV2V 源视频文件上传(≤5MB)

示例:文生视频

curl -X POST https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "omni-fast",
    "prompt": "雨夜霓虹街道,镜头缓慢推进,电影感光影",
    "aspect_ratio": "16:9"
  }'

示例:图生视频

curl -X POST https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "omni-fast",
    "prompt": "保持人物一致,缓慢走动",
    "image_url": "https://your-cdn.com/photo.jpg",
    "aspect_ratio": "16:9"
  }'

示例:视频转视频(V2V)

# Multipart 文件上传
curl -X POST https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -F "model=omni-fast-v2v" \
  -F "prompt=将画面风格转换为赛博朋克风" \
  -F "input_video=@source.mp4"

轮询取片

curl https://YOUR_BASE/v1/videos/{task_id} \
  -H "Authorization: Bearer sk-xxx"

# 完成后:
# {"status":"completed","data":[{"url":"/v1/videos/{task_id}/content"}]}

Python 完整示例

import time, requests

BASE = "https://YOUR_BASE/v1"
H = {"Authorization": "Bearer sk-xxx", "Content-Type": "application/json"}

# 提交
task = requests.post(f"{BASE}/videos", headers=H, json={
    "model": "omni-fast",
    "prompt": "雨夜霓虹街道,镜头缓慢推进",
    "aspect_ratio": "16:9"
}).json()
task_id = task["task_id"]

# 轮询
while True:
    time.sleep(8)
    s = requests.get(f"{BASE}/videos/{task_id}", headers=H).json()
    if s["status"] == "completed":
        print("下载:", s["data"][0]["url"])
        break
    if s["status"] == "failed":
        print("失败:", s.get("error"))
        break
    print(f"进度: {s.get('progress', 0)}%")

注意事项

Veo-Clean 去水印

上传带水印的视频,系统自动去除水印后返回。异步任务流程与视频生成一致。

模型与价格

模型计费价格
veo-clean按秒¥0.02/秒
按视频实际时长计费。例如 10 秒视频 = ¥0.20。失败不计费。

参数

参数类型必填说明
modelstring固定 veo-clean
promptstring可省略,默认 "remove watermark"
input_videofile带水印视频文件(≤20MB,必须 multipart 上传)

示例

# Multipart 上传
curl -X POST https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -F "model=veo-clean" \
  -F "prompt=remove watermark" \
  -F "input_video=@watermarked.mp4"

# 轮询取片(同其他视频模型)
curl https://YOUR_BASE/v1/videos/{task_id} \
  -H "Authorization: Bearer sk-xxx"

注意事项

Seedance 2.0 视频生成(Video Pro/Fast/Lite)

基于 Seedance 2.0 的视频生成服务。三个模型调用方式完全一致,切换只需改 model 字段。支持多图/视频/音频参考。

模型与价格

模型版本定位价格duration 范围
video-pro-720p满血最佳质量,人脸/一致性最强,正式成片首选¥0.65/秒4-15(任意整数)
video-fast-720p满血快速出片,质量接近 Pro¥0.60/秒4-15(任意整数)
video-lite-720p非满血经济档,性价比高,复杂真人一致性略弱¥0.45/秒仅 4 / 8 / 12(固定档位)
满血 vs 非满血:Pro 和 Fast 为满血版,支持 4-15 秒任意整数时长,全部高级参考功能(@Image/@Video/@Audio 引用)。Lite 为非满血版,时长仅支持 4/8/12 秒三个固定档位(传其他值会报错),高级参考字段名不同(见下方),复杂真人场景一致性略弱,但价格更低。

按秒计费 = 单价 × duration。例如 video-pro-720p 8秒 = ¥5.20。失败不计费

核心参数

参数类型必填说明
modelstringvideo-pro-720p / video-fast-720p / video-lite-720p
promptstring视频描述提示词
aspect_ratiostring16:9(默认)、9:161:121:93:44:3
durationinteger时长秒数。Pro/Fast: 4-15;Lite: 仅 4/8/12
image_urlstring单张主参考图(公网 HTTPS URL)

高级参考(Pro/Fast 专用)

prompt 中用 @Image1@Video1@Audio1 引用对应素材:

参数说明
extra_images参考图数组,最多 9 张,@Image1...@Image9 引用
extra_videos参考视频数组,最多 3 个,@Video1...@Video3 引用
extra_audios参考音频数组,最多 3 个,@Audio1...@Audio3 引用

高级参考(Lite 专用)

参数说明
reference_image_urls参考图数组,与 image_url 合计最多 9 张
reference_video / reference_videos参考视频,最多 3 个,单条 3-10 秒,总时长 ≤15 秒
audio_url参考音频,最多 3 个,单条 2-15 秒;用音频时必须同时给至少一张参考图
video_config.reference_modeauto(默认)、start_frame(首帧,1张图)、start_end(首尾帧,2张图)

示例

# 文生视频
curl -X POST https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "video-pro-720p",
    "prompt": "雨夜霓虹街道,镜头缓慢推进,电影感光影",
    "aspect_ratio": "16:9",
    "duration": 8
  }'

# 多素材参考(Pro/Fast)
curl -X POST https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "video-pro-720p",
    "prompt": "以 @Image1 的人物、@Video1 的运镜,配合 @Audio1 的节奏生成广告",
    "image_url": "https://cdn.example.com/main.jpg",
    "extra_images": ["https://cdn.example.com/ref.jpg"],
    "extra_videos": ["https://cdn.example.com/ref.mp4"],
    "extra_audios": ["https://cdn.example.com/ref.mp3"],
    "aspect_ratio": "16:9",
    "duration": 10
  }'

Grok 图像 & 视频

基于 xAI Grok Imagine 的图像和视频生成服务,封装为 OpenAI 兼容接口。

模型与价格

模型能力价格
grok-imagine-image标准文生图¥0.06/张
grok-imagine-image-lite快速文生图¥0.06/张
grok-imagine-image-pro高质量文生图¥0.08/张
grok-imagine-image-edit图生图 / 编辑¥0.06/张
grok-imagine-video文生/图生视频¥0.28/条

接口信息

说明
统一接口POST /v1/chat/completions(按模型自动分发图像/视频)
视频异步也支持 POST /v1/videos(multipart 表单提交 + 轮询取片)
鉴权Authorization: Bearer sk-xxx
令牌分组必须为 grok 分组

视频参数 video_config

字段取值默认说明
seconds6/10/12/16/206时长,最长 20 秒。越长越慢(16/20s 约 2-3 分钟)
size720x1280 / 1280x720 / 960x960720x1280画幅(仅支持这 3 种)
public_urltrue/falsefalse建议 true,返回可直接打开的完整下载链接

示例:文生视频

curl https://YOUR_BASE/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-video",
    "stream": true,
    "messages": [{"role":"user","content":"灯塔在日落时分,海浪拍打礁石"}],
    "video_config": {"seconds": 10, "size": "1280x720", "public_url": true}
  }'

示例:图生视频

curl https://YOUR_BASE/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-video",
    "stream": true,
    "messages": [{"role":"user","content":[
      {"type":"text","text":"让画面动起来,光线柔和"},
      {"type":"image_url","image_url":{"url":"https://your-image.jpg"}}
    ]}],
    "video_config": {"seconds": 6, "size": "1280x720", "public_url": true}
  }'

示例:文生图

curl https://YOUR_BASE/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-image",
    "messages": [{"role":"user","content":"一只穿宇航服的橘猫,电影质感"}]
  }'

注意事项

Grok CLI 视频专线

独立视频专线,模型名 grok-imagine-video-cli,官方通道稳定性更好。仅走 /v1/videos 异步接口。

模型与价格

模型能力价格
grok-imagine-video-cli文生/图生视频¥0.30/条(一口价)
grok-imagine-video-cli-edit视频局部编辑¥0.35/条(一口价)
grok-imagine-video-1.5-cli1.5 图生视频(仅单图)¥0.28/条(一口价)
一口价:与时长、画幅无关。失败不计费。
grok-imagine-video-1.5-cli 为 xAI 较新的 1.5 图生模型,仅支持单张首帧图生视频——不支持文生视频、不支持多参考图(reference_images)、不支持视频编辑;size/aspect_ratio/resolution/seconds 取值与 grok-imagine-video-cli 一致。

接口信息

说明
提交POST /v1/videos(JSON 或 multipart 均可)
轮询GET /v1/videos/{task_id}
令牌分组grok-video-cli

生成参数

参数取值默认说明
prompt文本-必填,提示词
seconds整数6文生/单图最长 15 秒;多图最长 10 秒
size720x1280 / 1280x720720x1280画幅
aspect_ratio1:1/16:9/9:16/4:3/3:4/3:2/2:3跟随 size比例(可替代 size 指定非标比例)
resolution480p / 720p720p分辨率(定短边像素)
input_referenceURL / data URL-单张首帧参考图
reference_images数组,≤10 张-多参考图(与 input_reference 二选一)

编辑参数(grok-imagine-video-cli-edit

参数说明
prompt必填,只写要改的内容(如 "add a gold necklace")
video{"url": "源视频公网URL"},源视频 ≤8.7 秒,H.264 MP4

示例

# 文生视频
curl https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-video-cli",
    "prompt": "hot air balloon rising over green hills at sunrise",
    "seconds": "10",
    "size": "1280x720"
  }'

# 视频编辑
curl https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-video-cli-edit",
    "prompt": "add a large gold necklace around her neck",
    "video": {"url": "https://your-source-video.mp4"}
  }'

# 1.5 图生视频(仅单图,必须带 input_reference)
curl https://YOUR_BASE/v1/videos \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-video-1.5-cli",
    "prompt": "gentle camera push-in, water flowing",
    "input_reference": "https://your-image.jpg",
    "seconds": "4",
    "size": "1280x720"
  }'

各比例实际输出像素

aspect_ratio720p480p
9:16720x1280480x848
16:91280x720848x480
1:1720x720480x480
4:3960x720-
3:4720x960-

GPT-Image-2

文生图 / 图生图 / Chat 生图,支持三种调用方式。

模型与价格

模型价格
gpt-image-2¥0.02/张

接口

端点方式说明
/v1/images/generationsJSON文生图
/v1/images/editsmultipart图生图(参考图 + 描述)
/v1/chat/completionsJSONChat 对话生图

参数(文生图)

参数类型必填说明
promptstring图片描述
modelstring默认 gpt-image-2
ninteger生成数量 1-4
sizestring1024x10241536x1024(横)、1024x1536(竖)、auto
qualitystringauto / low / medium / high
response_formatstringb64_json(默认)或 url

示例

# 文生图
curl -X POST https://YOUR_BASE/v1/images/generations \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "一只橘猫趴在窗台上晒太阳,水彩画风格",
    "size": "1024x1024",
    "quality": "high"
  }'

# 图生图
curl -X POST https://YOUR_BASE/v1/images/edits \
  -H "Authorization: Bearer sk-xxx" \
  -F "image=@reference.png" \
  -F "prompt=把背景改成海边日落" \
  -F "model=gpt-image-2"

注意事项

Gemini 图像生成

基于 Gemini 的图像生成服务。

模型与价格

模型价格
gemini-image¥0.11/张
gemini-image-pro¥0.12/张

接口

通过 POST /v1/images/generations 调用,参数与 GPT-Image-2 类似。

curl -X POST https://YOUR_BASE/v1/images/generations \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-image",
    "prompt": "赛博朋克风格的东京夜景",
    "size": "1024x1024"
  }'

Gemini 音乐生成

通过 Chat Completions 接口生成音乐。

模型与价格

模型价格
gemini-music¥1.00/首

示例

curl https://YOUR_BASE/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-music",
    "messages": [{"role":"user","content":"创作一首轻快的电子风格BGM,适合科技产品广告"}]
  }'

通用说明 & FAQ

平台信息

平台Base URL
平台 Ahttps://newapi.oairegbox.cc/v1
平台 Bhttps://newapi-2.oairegbox.cc/v1
两平台能力一致,账号与令牌独立、不互通。选择其一使用即可。

鉴权

所有请求需携带 Authorization: Bearer sk-你的令牌 请求头。令牌在对应平台后台创建,分组必须与模型匹配(错误分组会返回"无可用渠道")。

错误码

HTTP含义处理计费
200成功正常取用成功才扣
400参数/素材问题按 message 改正不计费
401鉴权失败检查令牌不计费
404路径错误检查 URL(勿重复 /v1)不计费
429限速/额度不足降并发或充值不计费
502/5xx上游临时故障直接重试不计费

FAQ

Q: 视频生成需要多久?

Omni 视频约 1-5 分钟,Grok 视频约 30s-3 分钟(时长越长越慢)。建议客户端超时 ≥300 秒。

Q: 失败会扣费吗?

不会。所有模型失败一律不扣费,仅成功出片/出图才计费。

Q: 参考图被内容策略拒绝怎么办?

包含可识别真人面孔的参考图可能触发 Gemini 内容策略。系统会自动尝试处理并重试。如仍失败,建议:使用非写实风格、虚构人物、侧面/背影/远景,或使用已授权的素材。

Q: 两个平台有什么区别?

能力完全一致。账号和余额独立。选其一使用,不可跨平台混用令牌。