国产视频模型
国产视频模型指腾讯 VOD AIGC 生视频渠道下的一组模型,统一通过 Geeknow 视频接口调用。- 提交任务:
POST /v1/videos - 查询任务:
GET /v1/videos/{task_id} - 获取视频内容:
GET /v1/videos/{task_id}/content
视频生成
提交国产视频任务,支持文生、图生、参考图、参考视频、首尾帧、动作控制、数字人、对口型和模板特效。
任务查询
查询任务状态、进度、错误与结果地址,并获取生成后的视频内容。
渠道鉴权
渠道密钥使用竖线分隔:SubAppId|SecretId|SecretKeySubAppId|SecretId|SecretKey|Region
Region 可选。创建渠道时选择 AIGC / 腾讯 VOD 相关渠道后,把上面的密钥填入渠道密钥即可。
模型命名
用户请求model 推荐传基础模型,例如 Kling-2.6、Vidu-q2-pro、GV-3.1-fast。也可以直接传组合计费模型,例如 kling-3.0-omni-1080p-ref-audio、vidu-q2-pro-reference-1080p-offpeak。
接口会做两件事:
- 根据
model识别模型家族和版本,例如Kling、Vidu、GV、OS、Hailuo、Hunyuan、Mingmou、SV、JV。 - 根据模型、场景、分辨率、参考输入、音频开关、错峰等参数匹配对应计费规则。
基础模型
| 模型名 | 含义 |
|---|---|
Vidu-* | Vidu 系列模型 |
Kling-* | 可灵系列模型 |
GV-* | GV 系列模型 |
OS-* | OS 系列模型 |
Hunyuan-* | 混元系列模型 |
Mingmou-* | 明眸系列模型 |
Hailuo-* | 海螺系列模型 |
SV-* | SV 系列模型 |
JV-* | JV 系列模型 |
组合计费模型
组合计费模型可以直接作为model 传入。接口会根据组合模型中的版本、分辨率、场景和音频等信息应用对应参数与计费规则。
| 示例 | 含义 |
|---|---|
vidu-q2-pro-reference-1080p-offpeak | vidu 模型族,q2-pro 版本,参考生视频 / 参考模式,1080p 分辨率档位,offpeak 错峰模式 |
kling-3.0-omni-1080p-ref-audio | kling 模型族,3.0-omni 版本,1080p 分辨率档位,ref 表示有参考输入,audio 表示有声 |
kling-2.6-motion-pro-1080p | kling 模型族,2.6 版本,动作控制场景,pro 动作控制档位,1080p 分辨率档位 |
kling-avatar-720p | 可灵数字人场景,720p 分辨率档位 |
kling-identify-face | 可灵对口型场景,不足 5 秒按 5 秒计 |
sv-1.5-pro-1080p-audio | sv 模型族,1.5-pro 版本,1080p 分辨率档位,有声 |
国产模型怎么选
| 模型家族 | 代表模型 | 适合场景 | 选型建议 |
|---|---|---|---|
Vidu | Vidu-q2、Vidu-q2-pro、Vidu-q3-pro、Vidu-q3-turbo、Vidu-template | 文生视频、图生视频、参考图、多图参考、首尾帧、模板特效 | 更看重参考图、多图输入、模板特效和较完整分辨率档位时,优先看 Vidu。 |
Kling | Kling-1.6、Kling-2.0、Kling-2.1、Kling-2.5、Kling-2.6、Kling-3.0、Kling-3.0-Omni、Kling-O1 | 文生视频、图生视频、动作控制、数字人、对口型、多镜头扩展 | 需要动作控制、数字人、对口型或音频开关时,优先看 Kling。 |
GV | GV-3.1、GV-3.1-fast | 文生视频、首尾帧、平滑过渡 | 适合固定时长和首尾帧过渡场景。 |
OS | OS-2.0 | 文生视频 | 适合参数较少、快速调用的短视频场景。 |
Hunyuan / Mingmou | Hunyuan-1.5、Mingmou-1.0 | 常规文生视频 | 适合通用国产视频接入,参数面相对简单。 |
Hailuo | Hailuo-02、Hailuo-2.3、Hailuo-2.3-fast | 文生视频、首帧生视频 | 更适合文生和首帧生视频,当前不建议强依赖 aspect_ratio。 |
SV | SV-1.5-pro、SV-1.0-pro、SV-1.0-pro-fast、SV-1.0-lite | 组合计费模型 | 常见按分辨率和音频开关拆分计费。 |
JV | JV-3.0-pro | 组合计费模型 | 当前多按版本直接计费,参数面较简单。 |
请求体总览
统一请求体使用POST /v1/videos。
| 字段 | 说明 |
|---|---|
model | 模型名称,支持基础模型或组合计费模型 |
prompt | 提示词 |
seconds / duration | 生成时长,顶层字段优先级最高 |
size | 快速尺寸输入,例如 720P、1080P、720x1280 |
image / images / input_reference | 图生、参考图、首帧、首尾帧等输入 |
metadata | 扩展参数,建议把高级输出配置放入 metadata.output_config |
seconds / duration 目前仍然生效,不是只能放进 metadata。复杂场景建议显式传 metadata.output_config.resolution 和 metadata.output_config.aspect_ratio,减少尺寸推断带来的歧义。
参数优先级
时长优先级:- 顶层
seconds - 顶层
duration metadata.seconds/metadata.duration/metadata.video_duration- 默认
5
metadata.output_config.resolution- 顶层
size - 模型默认值
- 存在参考输入,例如
image、images、input_reference、last_frame_*,按图生或参考输入场景处理。 - 没有参考输入时,按文生视频处理。
metadata 扩展
| 字段 | 说明 |
|---|---|
scene_type | 场景类型,常见值为 motion_control、avatar_i2v、lip_sync、template_effect |
motion_level | 动作控制档位,std / pro,用于动作控制计费分档 |
offpeak | 是否错峰计费,布尔值 |
last_frame_url / last_frame_file_id | 首尾帧中的尾帧 |
video_url | 参考视频 URL |
file_infos | 素材列表,高级用法 |
output_config | 输出配置,支持 snake_case 字段 |
ext_info | 扩展信息字符串,高级用法 |
output_config 字段映射
metadata.output_config 支持 snake_case 字段,也兼容对应的 UpperCamelCase 字段:
| snake_case 字段 | 兼容字段 |
|---|---|
storage_mode | StorageMode |
media_name | MediaName |
class_id | ClassId |
expire_time | ExpireTime |
duration | Duration |
resolution | Resolution |
aspect_ratio | AspectRatio |
audio_generation | AudioGeneration |
person_generation | PersonGeneration |
input_compliance_check | InputComplianceCheck |
output_compliance_check | OutputComplianceCheck |
enhance_switch | EnhanceSwitch |
frame_interpolate | FrameInterpolate |
logo_add | LogoAdd |
output_config 字段
| 字段 | 类型 | 说明 |
|---|---|---|
storage_mode | String | Permanent / Temporary,默认 Temporary |
media_name | String | 输出媒体名,最长 64 字符 |
class_id | Integer | 分类 ID,默认 0 |
expire_time | String | 过期时间,ISO 8601,例如 2025-12-28T00:35:00Z |
duration | Float | 生成时长,单位秒 |
resolution | String | 分辨率档位,例如 720P / 1080P |
aspect_ratio | String | 宽高比,例如 16:9 / 9:16 |
audio_generation | String | Enabled / Disabled |
person_generation | String | AllowAdult / Disallowed |
input_compliance_check | String | Enabled / Disabled |
output_compliance_check | String | Enabled / Disabled |
enhance_switch | String | Enabled / Disabled |
frame_interpolate | String | Enabled / Disabled,Vidu 常用 |
logo_add | String | Enabled / Disabled,Vidu 常用 |
seconds 和 metadata.output_config.duration 一致。如果只传一处,优先传顶层 seconds。
模型约束
| 参数 | 模型家族 | 可用值 |
|---|---|---|
Duration | Kling | 5 / 10,默认 5 |
Duration | Hailuo | 6 / 10,默认 6 |
Duration | Vidu | 1 到 10 |
Duration | GV | 8,默认 8 |
Duration | OS | 4 / 8 / 12,默认 8 |
Resolution | Kling | 720P / 1080P,默认 720P |
Resolution | Hailuo | 768P / 1080P,默认 768P |
Resolution | Vidu | 720P / 1080P,默认 720P |
Resolution | GV | 720P / 1080P,默认 720P |
Resolution | OS | 720P |
AspectRatio | Kling 文生 | 16:9 / 9:16 / 1:1,默认 16:9 |
AspectRatio | Vidu 文生 / 图生 | 16:9 / 9:16 / 4:3 / 3:4 / 1:1,4:3 / 3:4 仅 q2 |
AspectRatio | GV | 16:9 / 9:16,默认 16:9 |
AspectRatio | OS 文生 | 16:9 / 9:16,默认 16:9 |
AspectRatio | Hailuo | 暂不支持 |
特殊规则
scene_type=motion_control必须提供视频参考,仅传图片会触发类似videoUrl must not be blank的错误。- 动作控制视频参考可以用
metadata.video_url,也可以用metadata.file_infos且Category=Video。 scene_type=lip_sync/identify-face不足 5 秒按 5 秒计。- 素材列表最多支持 3 项。
Type=Url时必须有Url。Type=File时必须有FileId。- 顶层
image/images/input_reference会作为图片素材处理。 - 顶层图片输入仅支持可访问的
http(s)图片 URL 或文件 ID;当前不支持data:image/...;base64,...这类 base64 data URI。
file_infos 子字段
素材列表可使用 metadata.file_infos,也兼容 metadata.FileInfos。
| 字段 | 说明 |
|---|---|
Type / type | File / Url |
Category / category | Image / Video |
FileId / file_id | Type=File 时使用 |
Url / url | Type=Url 时使用 |
Usage / usage | 例如 FirstFrame / Reference |
ReferenceType / reference_type | 适用于 GV / Kling 的参考类型区分;Kling + Category=Video 时,feature 表示特征参考视频,base 表示待编辑视频 |
ObjectId / object_id | 适用于 Vidu 主体 / 参考图模式 |
VoiceId / voice_id | 适用于 Vidu-q2 |
KeepOriginalSound / keep_original_sound | Category=Video 时有效 |
默认可选模型
渠道选择 AIGC 后,前端默认模型列表包含:Vidu-q2/Vidu-q2-pro/Vidu-q2-turbo/Vidu-q3-pro/Vidu-q3-turbo/Vidu-templateHunyuan-1.5/Mingmou-1.0/OS-2.0GV-3.1/GV-3.1-fastKling-1.6/Kling-2.0/Kling-2.1/Kling-2.5/Kling-2.6/Kling-3.0/Kling-3.0-Omni/Kling-O1Hailuo-02/Hailuo-2.3/Hailuo-2.3-fastSV-1.5-pro/SV-1.0-pro/SV-1.0-pro-fast/SV-1.0-liteJV-3.0-pro- 组合计费模型,例如
vidu-q2-pro-reference-1080p-offpeak、kling-2.6-motion-pro-1080p、kling-3.0-omni-1080p-ref-audio、hailuo-2.3-fast-1080p、sv-1.5-pro-1080p-audio、jv-3.0-pro
Kling 型号;Kling-O3、Kling-Mini 还未作为预置型号加入文档与计费映射。
默认价格表
以下为默认单价,单位为元 / 秒。实际以账户侧开通能力与结算为准。Vidu
| 版本 | 场景 | 分辨率 | 单价 |
|---|---|---|---|
| q2 | 普通 | ≤720P | 0.32 |
| q2 | 普通(错峰) | ≤720P | 0.16 |
| q2 | 普通 | ≤1080P | 0.47 |
| q2 | 普通(错峰) | ≤1080P | 0.24 |
| q2 | 参考 | ≤540P | 0.24 |
| q2 | 参考(错峰) | ≤540P | 0.12 |
| q2 | 参考 | ≤720P | 0.32 |
| q2 | 参考(错峰) | ≤720P | 0.16 |
| q2 | 参考 | ≤1080P | 0.82 |
| q2 | 参考(错峰) | ≤1080P | 0.41 |
| q2-pro | 普通 | ≤720P | 0.35 |
| q2-pro | 普通(错峰) | ≤720P | 0.18 |
| q2-pro | 普通 | ≤1080P | 0.70 |
| q2-pro | 普通(错峰) | ≤1080P | 0.35 |
| q2-pro | 参考 | ≤540P | 0.27 |
| q2-pro | 参考(错峰) | ≤540P | 0.14 |
| q2-pro | 参考 | ≤720P | 0.35 |
| q2-pro | 参考(错峰) | ≤720P | 0.18 |
| q2-pro | 参考 | ≤1080P | 0.90 |
| q2-pro | 参考(错峰) | ≤1080P | 0.45 |
| q2-turbo | 普通 | ≤720P | 0.25 |
| q2-turbo | 普通(错峰) | ≤720P | 0.13 |
| q2-turbo | 普通 | ≤1080P | 0.47 |
| q2-turbo | 普通(错峰) | ≤1080P | 0.24 |
| q3-pro | 普通 | ≤540P | 0.44 |
| q3-pro | 普通(错峰) | ≤540P | 0.22 |
| q3-pro | 普通 | ≤720P | 0.937 |
| q3-pro | 普通(错峰) | ≤720P | 0.468 |
| q3-pro | 普通 | ≤1080P | 1.00 |
| q3-pro | 普通(错峰) | ≤1080P | 0.50 |
| q3-turbo | 普通 | ≤540P | 0.25 |
| q3-turbo | 普通(错峰) | ≤540P | 0.13 |
| q3-turbo | 普通 | ≤720P | 0.38 |
| q3-turbo | 普通(错峰) | ≤720P | 0.19 |
| q3-turbo | 普通 | ≤1080P | 0.50 |
| q3-turbo | 普通(错峰) | ≤1080P | 0.25 |
| template | 特效模板 | - | 0.40 |
Hunyuan / Mingmou / OS / GV
| 模型 | 版本 | 分辨率 | 单价 |
|---|---|---|---|
| Hunyuan | 1.5 | ≤720P | 0.30 |
| Hunyuan | 1.5 | ≤1080P | 0.50 |
| Mingmou | 1.0 | ≤720P | 0.30 |
| Mingmou | 1.0 | ≤1080P | 0.50 |
| OS | 2.0 | 不区分 | 0.75 |
| GV | 3.1 | 不区分 | 3.00 |
| GV | 3.1-fast | 不区分 | 1.15 |
Kling
| 版本 | 场景 | 分辨率 | 单价 |
|---|---|---|---|
| 3.0 | 无声 | ≤720P | 0.60 |
| 3.0 | 有声 | ≤720P | 0.90 |
| 3.0 | 无声 | ≤1080P | 0.80 |
| 3.0 | 有声 | ≤1080P | 1.20 |
| 3.0-Omni | 无参考无声 | ≤720P | 0.60 |
| 3.0-Omni | 无参考有声 | ≤720P | 0.80 |
| 3.0-Omni | 有参考无声 | ≤720P | 0.90 |
| 3.0-Omni | 有参考有声 | ≤720P | 1.10 |
| 3.0-Omni | 无参考无声 | ≤1080P | 0.80 |
| 3.0-Omni | 无参考有声 | ≤1080P | 1.00 |
| 3.0-Omni | 有参考无声 | ≤1080P | 1.20 |
| 3.0-Omni | 有参考有声 | ≤1080P | 1.40 |
| 2.6 | 无声 | 不区分 | 0.50 |
| 2.6 | 有声 | 不区分 | 1.00 |
| 2.6 | 动作控制 std | 不区分 | 0.50 |
| 2.6 | 动作控制 pro | 不区分 | 0.80 |
| O1 | 普通 | ≤720P | 0.90 |
| O1 | 普通 | ≤1080P | 1.20 |
| 2.5 | 普通 | ≤720P | 0.30 |
| 2.5 | 普通 | ≤1080P | 0.50 |
| 1.6 / 2.0 / 2.1 | 普通 | ≤720P | 0.40 |
| 1.6 / 2.0 / 2.1 | 普通 | ≤1080P | 0.70 |
| avatar | 数字人 | ≤720P | 0.40 |
| avatar | 数字人 | ≤1080P | 0.80 |
| identify-face | 对口型 | 不区分,不足 5 秒按 5 秒 | 0.10 |
Hailuo
| 版本 | 分辨率 | 单价 |
|---|---|---|
| 02 / 2.3 | ≤768P | 0.33 |
| 02 / 2.3 | ≤1080P | 0.58 |
| 2.3-fast | ≤768P | 0.23 |
| 2.3-fast | ≤1080P | 0.39 |
SV
| 版本 | 分辨率 | 单价 |
|---|---|---|
| 1.5-pro | ≤480P(无声) | 0.08 |
| 1.5-pro | ≤480P(有声) | 0.16 |
| 1.5-pro | ≤720P(无声) | 0.172 |
| 1.5-pro | ≤720P(有声) | 0.346 |
| 1.5-pro | ≤1080P(无声) | 0.388 |
| 1.5-pro | ≤1080P(有声) | 0.778 |
| 1.0-pro | ≤480P | 0.146 |
| 1.0-pro | ≤720P | 0.308 |
| 1.0-pro | ≤1080P | 0.734 |
| 1.0-pro-fast | ≤480P | 0.04 |
| 1.0-pro-fast | ≤720P | 0.086 |
| 1.0-pro-fast | ≤1080P | 0.206 |
| 1.0-lite | ≤480P | 0.098 |
| 1.0-lite | ≤720P | 0.206 |
| 1.0-lite | ≤1080P | 0.49 |
JV
| 模型 | 版本 | 分辨率 | 单价 |
|---|---|---|---|
| JV | 3.0-pro | 不区分 | 1.00 |