SurgeAI
  1. official-format
SurgeAI
  • SurgeAI
    • SurgeAI核心优势
    • 快速开始
    • 认证
    • 如何使用
      • OpenClaw
      • Codex
      • 聊天应用
      • Claude Code
      • Dify
    • API参考
      • OpenAI
        • gpt-5
          • official-format
            • gpt-5 (网络搜索 (Response))
            • gpt-5 (文本转文本)
            • gpt-5 (文本转文本)
            • gpt-5 (图像转文本 (Chat))
            • gpt-5 (图像转文本 (Response))
            • gpt-5 (文件分析)
        • gpt-4o
          • official-format
            • gpt-4o (网络搜索 (Response))
            • gpt-4o (文本转文本 (Response))
            • gpt-4o (文本转文本 (Chat))
            • gpt-4o (图像转文本 (Chat))
            • gpt-4o (图像转文本 (Response))
            • gpt-4o (文件分析 (Response))
        • gpt-4.1
          • official-format
            • gpt-4.1 (联网搜索)
            • gpt-4.1 (文本转文本)
            • gpt-4.1 (文本转文本)
            • gpt-4.1 (图像分析)
            • gpt-4.1 (图像分析)
            • gpt-4.1 (文件分析)
      • Vidu
        • viduq3-pro
          • gptproto-format
            • viduq3-pro (Image To Video)
            • viduq3-pro (Text To Video)
        • viduq2-pro
          • gptproto-format
            • viduq2-pro (Image To Video)
            • viduq2-pro (Text To Video)
      • Suno
        • suno-music
          • official-format
            • official-format (查询任务)
            • official-format (文本转音频)
      • Midjourney
        • Midjourney
          • task-submission
            • midjourney (imagine)
          • task-query
            • midjourney (fetchfromtask)
      • Grok
        • grok-3
          • openai-format
            • grok-3 (文本转文本 (聊天))
        • grok-4
          • openai-format
            • grok-4 (文本转文本 (聊天))
      • DeepSeek
        • deepseek-v3.2
          • openai-format
            • deepseek-v3.2 (文本转文本)
      • Alibaba
        • qwen-plus
          • openai-format
            • qwen-plus (文本转文本)
        • qwen3-max
          • openai-format
            • qwen3-max (文本转文本)
        • wan-2.5-preview
          • gptproto-format
            • wan-2.5-preview (图片编辑)
            • wan-2.5-preview (查询任务)
            • wan-2.5-preview (图生视频)
            • wan-2.5-preview (文生图)
            • wan-2.5-preview (文生视频)
        • qwen-turbo
          • openai-format
            • qwen-turbo (文本转文本)
      • MiniMax
        • hailuo-02-pro
          • gptproto-format
            • hailuo-02-pro (图生视频)
            • hailuo-02-pro (文生视频)
      • Kling
        • kling-v2.1-pro
          • gptproto-format
            • kling-v2.1-pro (图生视频)
            • kling-v2.1-pro (文生视频)
        • kling-v3.0-pro
          • gptproto-format
            • kling-v3.0-pro (图生视频)
            • kling-v3.0-pro (文生视频)
      • Claude
        • claude-haiku-4-5-20251001
          • official-format
            • claude-haiku-4-5-20251001 (联网搜索)
            • claude-haiku-4-5-20251001 (文件分析)
            • claude-haiku-4-5-20251001 (文本生成)
          • openai-format
            • claude-haiku-4-5-20251001 (联网搜索)
            • claude-haiku-4-5-20251001 (文件分析)
            • claude-haiku-4-5-20251001 (文本生成)
      • Google
        • gemini-2.5-flash
          • official-format
            • gemini-2.5-flash (联网搜索)
            • gemini-2.5-flash (文件分析)
            • gemini-2.5-flash (文本生成)
            • gemini-2.5-flash (图像理解)
        • gemini-2.5-pro
          • official-format
            • gemini-2.5-pro (联网搜索)
            • gemini-2.5-pro (文件分析)
            • gemini-2.5-pro (文本生成)
            • gemini-2.5-pro (图像理解)
      • Runway
        • runwayml-gen3a_turbo-5
          • official-format
            • official-format (提交视频生成任务)
            • official-format (查询任务)
  1. official-format

gpt-4o (图像转文本 (Response))

来源: https://docs.surgeai.one/docs/allapi/OpenAI/gpt-4o/official-format/image-to-text-response
使用 OpenAI Response API 进行图像分析

OpenAI 图像分析 API 的官方格式(response)。

身份验证#

1.
在 https://surgeai.one 注册 SurgeAI 账户
2.
进入控制面板的 API Keys 部分
3.
生成新的 API key (sk-xxxxx)
4.
复制并安全存储您的 API key

端点#

POST /v1/responses

响应示例#

{
  "id": "resp-abc123",
  "object": "response",
  "created": 1699896916,
  "model": "gpt-4o",
  "output": "The image shows a wooden boardwalk path extending through a lush green grassland.",
  "usage": {
    "prompt_tokens": 3500,
    "completion_tokens": 245,
    "total_tokens": 3745
  }
}

核心参数#

参数类型必填默认值范围描述
modelstring是--用于生成响应的模型 ID,如 gpt-4o 或 o3。
inputstring/array是--模型的输入内容。
input.rolestring是-user, assistant, system, developer消息输入的角色。
input.contentstring/array是--字符串时为模型的文本输入;数组时为包含不同内容类型的一个或多个输入项列表。

高级参数#

参数类型必填默认值范围描述
streamboolean否falsetrue, false是否以增量方式流式返回响应。默认为 false。
max_output_tokensinteger否--响应可生成的 token 数量的上限,包括可见输出 token 和推理 token。
reasoningobject否--推理模型的配置选项(仅限 gpt-5 和 o 系列模型)。
reasoning.effortstring否mediumnone, minimal, low, medium, high, xhigh限制推理模型的推理努力程度。
reasoning.summarystring否-auto, concise, detailed模型执行的推理摘要。
toolsarray否--模型可能调用的工具列表。

多模态输入#

参数类型必填默认值范围 / 示例描述
content.typestring是—input_text, input_image, input_file标识多模态输入的内容块类型。
content.textstring否—-模型的文本输入。
content.file_idstring否--要发送给模型的文件 ID。
content.detailstring否autohigh, low, auto图像的详细程度。仅在 type=input_image 时需要。
content.image_urlstring否--图像的 URL。仅在 type=input_image 时需要。
content.file_urlstring否--文件的 URL。仅在 type=input_file 时需要。
content.file_datastring否--文件的内容。仅在 type=input_file 时需要。
content.filenamestring否--文件的名称。仅在 type=input_file 时需要。

错误码#

错误码错误名称描述
401UnauthorizedAPI key 缺失或无效
403Forbidden您的 API key 没有权限访问此资源,或请求操作的余额不足
429Too Many Requests您已超出速率限制
500Internal server error服务器内部错误
503Content policy violation内容因安全原因被阻止(实际状态码为 400)
修改于 2026-03-11 06:24:05
上一页
gpt-4o (图像转文本 (Chat))
下一页
gpt-4o (文件分析 (Response))
Built with