SurgeAI
  1. gptproto-format
SurgeAI
  • SurgeAI
    • SurgeAI核心优势
    • 快速开始
    • 认证
    • 如何使用
      • OpenClaw
      • Codex
      • 聊天应用
      • Claude Code
      • Dify
    • API参考
      • OpenAI
        • gpt-5
          • official-format
            • gpt-5 (网络搜索 (Response))
            • gpt-5 (文本转文本)
            • gpt-5 (文本转文本)
            • gpt-5 (图像转文本 (Chat))
            • gpt-5 (图像转文本 (Response))
            • gpt-5 (文件分析)
        • gpt-4o
          • official-format
            • gpt-4o (网络搜索 (Response))
            • gpt-4o (文本转文本 (Response))
            • gpt-4o (文本转文本 (Chat))
            • gpt-4o (图像转文本 (Chat))
            • gpt-4o (图像转文本 (Response))
            • gpt-4o (文件分析 (Response))
        • gpt-4.1
          • official-format
            • gpt-4.1 (联网搜索)
            • gpt-4.1 (文本转文本)
            • gpt-4.1 (文本转文本)
            • gpt-4.1 (图像分析)
            • gpt-4.1 (图像分析)
            • gpt-4.1 (文件分析)
      • Vidu
        • viduq3-pro
          • gptproto-format
            • viduq3-pro (Image To Video)
            • viduq3-pro (Text To Video)
        • viduq2-pro
          • gptproto-format
            • viduq2-pro (Image To Video)
            • viduq2-pro (Text To Video)
      • Suno
        • suno-music
          • official-format
            • official-format (查询任务)
            • official-format (文本转音频)
      • Midjourney
        • Midjourney
          • task-submission
            • midjourney (imagine)
          • task-query
            • midjourney (fetchfromtask)
      • Grok
        • grok-3
          • openai-format
            • grok-3 (文本转文本 (聊天))
        • grok-4
          • openai-format
            • grok-4 (文本转文本 (聊天))
      • DeepSeek
        • deepseek-v3.2
          • openai-format
            • deepseek-v3.2 (文本转文本)
      • Alibaba
        • qwen-plus
          • openai-format
            • qwen-plus (文本转文本)
        • qwen3-max
          • openai-format
            • qwen3-max (文本转文本)
        • wan-2.5-preview
          • gptproto-format
            • wan-2.5-preview (图片编辑)
            • wan-2.5-preview (查询任务)
            • wan-2.5-preview (图生视频)
            • wan-2.5-preview (文生图)
            • wan-2.5-preview (文生视频)
        • qwen-turbo
          • openai-format
            • qwen-turbo (文本转文本)
      • MiniMax
        • hailuo-02-pro
          • gptproto-format
            • hailuo-02-pro (图生视频)
            • hailuo-02-pro (文生视频)
      • Kling
        • kling-v2.1-pro
          • gptproto-format
            • kling-v2.1-pro (图生视频)
            • kling-v2.1-pro (文生视频)
        • kling-v3.0-pro
          • gptproto-format
            • kling-v3.0-pro (图生视频)
            • kling-v3.0-pro (文生视频)
      • Claude
        • claude-haiku-4-5-20251001
          • official-format
            • claude-haiku-4-5-20251001 (联网搜索)
            • claude-haiku-4-5-20251001 (文件分析)
            • claude-haiku-4-5-20251001 (文本生成)
          • openai-format
            • claude-haiku-4-5-20251001 (联网搜索)
            • claude-haiku-4-5-20251001 (文件分析)
            • claude-haiku-4-5-20251001 (文本生成)
      • Google
        • gemini-2.5-flash
          • official-format
            • gemini-2.5-flash (联网搜索)
            • gemini-2.5-flash (文件分析)
            • gemini-2.5-flash (文本生成)
            • gemini-2.5-flash (图像理解)
        • gemini-2.5-pro
          • official-format
            • gemini-2.5-pro (联网搜索)
            • gemini-2.5-pro (文件分析)
            • gemini-2.5-pro (文本生成)
            • gemini-2.5-pro (图像理解)
      • Runway
        • runwayml-gen3a_turbo-5
          • official-format
            • official-format (提交视频生成任务)
            • official-format (查询任务)
  1. gptproto-format

viduq3-pro (Image To Video)

来源: https://docs.surgeai.one/docs/allapi/Vidu/viduq3-pro/surgeai-format/image-to-video

SurgeAI 格式的图像生成视频 API。

身份验证#

1.
在 https://surgeai.one 注册 SurgeAI 账户
2.
进入控制面板的 API Keys 部分
3.
生成新的 API key (sk-xxxxx)
4.
复制并安全存储您的 API key
有关身份验证详情,请参阅身份验证部分。

发起请求#

查询结果#

如果生成内容的请求中包含参数 enable_sync_mode 设置为 true(某些模型不支持此参数,但您仍需要通过 id 查询结果),您必须调用查询结果接口来获取最终输出。
提交预测请求后,响应将包含您需要的 id。
您可以在以下位置找到它:
data.id – 预测的唯一标识符
data.urls[0].get – 一个现成的 GET URL,已嵌入 id

响应示例#

{
  "data": {
    "id": "abc",
    "model": "model_name",
    "outputs": [],
    "urls": {
      "get": "https://surgeai.one/api/v3/predictions/abc/result"
    },
    "status": "completed",
    "error": null,
    "executionTime": 0,
    "timings": {
      "inference": 0
    },
    "has_nsfw_contents": [],
    "created_at": "2026-01-01 00:00:00"
  },
  "message": "success",
  "code": 200
}

参数#

路径参数#

接口地址: https://surgeai.one/api/v3/vidu/{model}/{scene}
scene示例可用模型
text-to-videohttps://surgeai.one/api/v3/vidu/{model}/text-to-videoviduq2 viduq3-pro
reference-to-videohttps://surgeai.one/api/v3/vidu/{model}/reference-to-videoviduq2
image-to-videohttps://surgeai.one/api/v3/vidu/{model}/image-to-videoviduq3-pro viduq2-pro-fast viduq2-pro viduq2-turbo
start-end-framedhttps://surgeai.one/api/v3/vidu/{model}/start-end-frameviduq2-pro-fast viduq2-pro viduq2-turbo

核心参数#

参数类型必填默认值范围描述
promptstring是--生成的正向提示词。
resolutionstring否720p540p, 720p, 1080p生成媒体的分辨率。
durationnumber否51 ~ 10生成媒体的时长,以秒为单位。
aspect_ratiostring否4:33:4, 4:3生成媒体的宽高比。
bgmboolean否falsetrue, false生成输出的背景音乐。
audioboolean否falsetrue, false生成输出的音频。
seedinteger否11 ~ 2147483647生成使用的随机种子。1 表示将使用随机种子。

图像输入参数#

参数类型必填默认值范围描述
imagestring是--生成输出的起始图像。
last_imagestring是--生成输出的结束图像。
subjectsarray是-1~7图像中主体的信息。
>>subjects.idstring是--可在提示词中通过 @subjectId 使用。
>>subjects.imagesarray是-1~3对应主体的图像 URL。每个主体最多支持 3 张图像。
>>subjects.voice_idstring否--用于确定视频中的声音角色。系统会自动推荐合适的声音,可选值可在声音列表中找到。如果指定了 voice_id,则 audio 参数必须设置为 true。

模型场景兼容性矩阵#

下表显示了每种模型和场景组合支持的参数。D = 默认值,R = 支持的值范围。
Modeltext-to-videoreference-to-videoimage-to-videostart-end-framed
viduq2• duration: D=5, R=1-10 • resolution: D=720p, R=540p/720p/1080p • aspect_ratio: D=16:9, R=16:9/9:16/3:4/4:3/1:1 • audio: 无效 • bgm: D=false,duration=9-10 时无效• duration: D=5, R=1-10 • resolution: D=720p, R=540p/720p/1080p • aspect_ratio: D=16:9, R=任意支持的比率 • audio: D=false • bgm: 无效不支持不支持
viduq2-pro-fast不支持不支持• duration: D=5, R=1-10 • resolution: D=720p, R=720p/1080p • aspect_ratio: 无效 • audio: D=false • bgm: D=false,duration=9-10 时无效• duration: D=5, R=1-8 • resolution: D=720p, R=540p/720p/1080p • aspect_ratio: 无效 • audio: 无效 • bgm: D=false,duration=9-10 时无效
viduq2-turbo不支持不支持• duration: D=5, R=1-10 • resolution: D=720p, R=540p/720p/1080p • aspect_ratio: 无效 • audio: D=false • bgm: D=false,duration=9-10 时无效• duration: D=5, R=1-8 • resolution: D=720p, R=540p/720p/1080p • aspect_ratio: 无效 • audio: 无效 • bgm: D=false,duration=9-10 时无效
viduq2-pro不支持不支持• duration: D=5, R=1-10 • resolution: D=720p, R=540p/720p/1080p • aspect_ratio: 无效 • audio: D=false • bgm: D=false,duration=9-10 时无效• duration: D=5, R=1-8 • resolution: D=720p, R=540p/720p/1080p • aspect_ratio: 无效 • audio: 无效 • bgm: D=false,duration=9-10 时无效
viduq3-pro• duration: D=5, R=1-16 • resolution: D=720p, R=540p/720p/1080p • aspect_ratio: D=16:9, R=16:9/9:16/3:4/4:3/1:1 • audio: D=true • bgm: 无效不支持• duration: D=5, R=1-16 • resolution: D=720p, R=540p/720p/1080p • aspect_ratio: 无效 • audio: D=true • bgm: 无效不支持

关键特性#

viduq2: 仅支持 text-to-video 和 reference-to-video 场景
viduq2-pro/pro-fast/turbo: 专用于 image-to-video 和 start-end-framed 模式
viduq3-pro: 最通用,支持 text-to-video 和 image-to-video,支持音频,最长可达 16 秒

错误码#

常见错误码#

错误码错误名称描述
401UnauthorizedAPI key 缺失或无效
403Forbidden您的 API key 没有权限访问此资源,或余额不足以执行请求的操作
429Too Many Requests您已超出速率限制
500Internal server error服务器内部错误
503Content policy violation内容因安全问题被拦截(实际状态码为 400)
修改于 2026-03-11 06:24:05
上一页
gpt-4.1 (文件分析)
下一页
viduq3-pro (Text To Video)
Built with