使用 POST /v1beta/models/{model}:generateContent 调用 Gemini 图像生成接口,统一覆盖 gemini-3-pro-image-preview、gemini-2.5-flash-image-preview 和 gemini-3.1-flash-image-preview。
Documentation Index
Fetch the complete documentation index at: https://docs.geeknow.top/llms.txt
Use this file to discover all available pages before exploring further.
generateContent 格式生图,适合直接复用 contents / parts 结构。
POST /v1beta/models/{model}:generateContent。contents[].parts[] 结构。parts[].inlineData 传入。responseModalities 默认同时请求 IMAGE 和 TEXT。inlineData.data Base64,也可能给图片 URL。gemini-3-pro-image-previewgemini-2.5-flash-image-previewgemini-3.1-flash-image-preview| 模型 | imageSize 行为 | 说明 |
|---|---|---|
gemini-3-pro-image-preview | 支持 1K、2K | 会按请求里的 imageSize 真实下发 |
gemini-2.5-flash-image-preview | 实际回落为 1K | 即使界面允许选 2K,插件最终也会发 1K |
gemini-3.1-flash-image-preview | 实际回落为 1K | 即使界面允许选 2K,插件最终也会发 1K |
contents[].parts[]。
最简单的理解是:
parts[] 里只有文字parts[] 里有文字,也有图片| 场景 | parts[] 内容 | 说明 |
|---|---|---|
| 文生图 | 只有 text | 纯提示词生成 |
| 图生图 | text + 一个或多个 inlineData | 让模型参考已有图片风格、主体或构图 |
{ "text": "..." }{ "inlineData": { "mimeType": "...", "data": "BASE64..." } }promptparts[]| 字段 | 图生图里的作用 |
|---|---|
parts[].text | 告诉模型“你要怎么改、保留什么、输出成什么风格” |
parts[].inlineData.mimeType | 声明参考图格式 |
parts[].inlineData.data | 参考图的 Base64 内容 |
imageConfig.aspectRatio | 约束最终出图比例 |
imageConfig.imageSize | 约束最终出图清晰度 |
main.py 现有实现看,插件会遍历 reference_images,把每一张图都追加到 parts[] 里,所以文档上可以理解为:
inlineDatacandidates[0].content.parts[].inlineData.dataBASE64_OR_URL 是有意这么写的。
role 和 parts。user。mimeType 和 data 两个字段。image/jpeg、image/png、image/webp。["IMAGE", "TEXT"]。1:1、16:9、9:16、4:3、3:4、3:2、2:3、21:9。gemini-3-pro-image-preview 支持插件里暴露的 1K 和 2K;gemini-2.5-flash-image-preview 与 gemini-3.1-flash-image-preview 会实际回落为 1K。