Skip to main content

Documentation Index

Fetch the complete documentation index at: https://docs.geeknow.top/llms.txt

Use this file to discover all available pages before exploring further.

图像模型支持矩阵

当前对外图像能力并不只有 gpt-image-1。从现有脚本和网关适配逻辑看,图像侧实际覆盖了 Gemini、豆包 Seedream、Grok Image、GPT Image 等多条模型线,但它们对入口、参考图、尺寸和返回格式的要求并不完全一致。
如果你只想找“该用哪个接口”,优先看“推荐入口”这一列;如果你只想找“这个模型能不能图生图”,优先看“参考图输入”这一列。

模型总表

模型家族代表模型推荐入口参考图输入典型返回
Gemini 原生图像gemini-3-pro-image-previewgemini-2.5-flash-image-previewgemini-3.1-flash-image-preview/v1beta/models/{model}:generateContentinlineData 多 partinlineData 或 URL
GPT Imagegpt-image-2gpt-image-2-pro/v1/images/generationsJSON image,支持多张 Base64urlb64_json
豆包 Seedreamdoubao-seedream-4-5-251128doubao-seedream-5-0-260128/v1/images/generationsJSON image,通常为 Base64 数组urlb64_json
Grok Imagegrok-4-2-image/v1/images/generationsJSON image,通常为 Base64 数组主要是 url
OpenAI Images 兼容gpt-image-1dall-e-3dall-e-2/v1/images/generations/v1/images/editsimage / maskurlb64_json

分家族说明

Gemini 原生图像

项目说明
推荐接口POST /v1beta/models/{model}:generateContent
模型示例gemini-3-pro-image-previewgemini-2.5-flash-image-previewgemini-3.1-flash-image-preview
请求风格Gemini 原生 contents[].parts[]
参考图通过 inlineData 传图片二进制内容
比例参数generationConfig.imageConfig.aspectRatio
尺寸参数generationConfig.imageConfig.imageSize
注意事项只有 gemini-3-pro-image-preview 明确支持脚本里暴露的 2K;其它预览模型会回退到 1K

GPT Image

项目说明
推荐接口POST /v1/images/generations
模型示例gpt-image-2gpt-image-2-pro
请求风格OpenAI Images 兼容 JSON
参考图image: ["<base64>", ...]
返回格式response_format = urlb64_json
尺寸特点脚本会先把比例映射到尺寸,再根据模型是否支持该尺寸做回退
注意事项非官方尺寸会通过 prompt 附加比例提示,而不是保证上游严格按该尺寸输出

豆包 Seedream

项目说明
推荐接口POST /v1/images/generations
模型示例doubao-seedream-4-5-251128doubao-seedream-5-0-260128
请求风格OpenAI Images 兼容 JSON
参考图image: ["<base64>", ...]
比例到尺寸映射16:9 -> 2560x14409:16 -> 1440x25601:1 -> 2048x2048
返回格式优先 b64_json,也可能只给 url

Grok Image

项目说明
推荐接口POST /v1/images/generations
模型示例grok-4-2-image
请求风格OpenAI Images 兼容 JSON
参考图image: ["<base64>", ...]
比例到尺寸映射16:9 -> 2560x14409:16 -> 1440x25601:1 -> 2048x2048
返回格式主要返回 url,不应依赖 b64_json

OpenAI Images 兼容

项目说明
推荐接口POST /v1/images/generationsPOST /v1/images/edits
模型示例gpt-image-1dall-e-3dall-e-2
请求风格OpenAI Images 原生字段
参考图imagemask
返回格式urlb64_json
注意事项这组模型的公共语义已经在现有 gpt-image-1 家族文档里说明,适合做兼容接入

比例与尺寸

常见比例

比例常见家族
1:1Gemini、GPT Image、Seedream、Grok
16:9Gemini、GPT Image、Seedream、Grok
9:16Gemini、GPT Image、Seedream、Grok
4:3 / 3:4GPT Image、Seedream、Grok
3:2 / 2:3GPT Image、Seedream、Grok
21:9Seedream、Grok

GPT Image 完整比例与尺寸档位

gpt-image-2 / gpt-image-2-pro 在插件里实际暴露的比例和尺寸选项比当前文档里常见示例更多。其中基础档位和 gpt-image-2-pro 专属高分档位如下:
预设实际目标尺寸备注
1:11024x1024基础档位
4:31536x1152基础档位
3:21536x1024基础档位
2:31024x1536基础档位
16:91920x1080基础档位
9:161080x1920基础档位
1:1(2K)2048x2048gpt-image-2-pro 扩展档位
4:3(2K)2048x1536gpt-image-2-pro 扩展档位
3:2(2K)2560x1712gpt-image-2-pro 扩展档位
2:3(2K)1712x2560gpt-image-2-pro 扩展档位
16:9(2K)2048x1152gpt-image-2-pro 扩展档位
9:16(2K)1152x2048gpt-image-2-pro 扩展档位
1:1(4K)2880x2880gpt-image-2-pro 扩展档位
4:3(4K)3840x2880gpt-image-2-pro 扩展档位
3:2(4K)3840x2560gpt-image-2-pro 扩展档位
2:3(4K)2560x3840gpt-image-2-pro 扩展档位
16:9(4K)3840x2160gpt-image-2-pro 扩展档位
9:16(4K)2160x3840gpt-image-2-pro 扩展档位
但要注意,这不代表所有上游都原生接受这些尺寸。脚本会在必要时自动回退到更接近的官方尺寸,并把目标比例写进 prompt。

推荐阅读

  1. 图像系列概览
  2. GPT-Image 家族概览
  3. GPT-Image 图像生成
  4. GPT-Image 图像编辑
  5. Gemini 原生格式