Nano Banana 图像编辑：2026 Gemini 实战指南

Q: Nano Banana 是和 Gemini 分开的 App 吗？

不是。它是 Google 给自家 Gemini 图像编辑模型起的昵称（`gemini-2.5-flash-image`、`gemini-3.1-flash-image`、`gemini-3-pro-image`）。用法就是在普通的 Gemini 对话里传图——没有独立 UI。

Q: Nano Banana 免费吗？有水印吗？

Gemini 免费档每天能改的次数很有限，分辨率只到 1K，且免费输出带一个**可见的** Gemini 星标水印加不可见的 SynthID 签名。付费档（Google AI Plus/Pro/Ultra）和 API 输出去掉可见水印，只保留不可见的 SynthID。更高分辨率（2K/4K）和更高每日额度需要付费档。

用 Nano Banana（Gemini 2.5/3 Flash 与 Pro Image）凭 prompt 改图：怎么选模型、怎么写「只改这处、其余保留」、以及 6 个最常翻车的坑。

发布于: 2026/05/17 更新于: 2026/06/09 作者: AI Productivity Guide Team 🌐 查看英文版本

一句话总结

「Nano Banana」是 Google Gemini 里那套图像编辑模型的昵称，不是一个单独的 App。截至 2026 年 6 月，它有三个成员：Nano Banana（gemini-2.5-flash-image，最早那个又快又便宜的编辑模型）、Nano Banana 2（gemini-3.1-flash-image，主打速度的继任者）、以及 Nano Banana Pro（gemini-3-pro-image，2026 年 6 月正式发布的高保真旗舰，支持 4K 输出和目前最好的图内文字）。用法都一样：在 Gemini 对话里上传一张图，用大白话说要改哪里。真正的功夫在于——写清楚「保留什么」、每轮只改一处、随手存中间版以便回退。下面讲清楚怎么选模型、完整流程、真实价格和限制，以及最容易翻车的 6 处改动。

「Nano Banana」到底是什么

Nano Banana 一开始是 lmarena.ai 上一个匿名条目，2025 年在图像编辑盲测里把一众老牌编辑器全比下去。Google 出来认领——它就是 Gemini 2.5 Flash Image——这个昵称火到现在连 Google 自己的官方宣传都直接用「Nano Banana」。它没有独立的 App 或按钮。你在 Gemini 对话里传一张图、说「把外套改成红色，脸不变」，背后干活的就是 Nano Banana 家族里的某一个。

到 2026 年 6 月，这个家族有三个成员，而选对模型比任何 prompt 技巧都重要：

模型	营销名	最适合	分辨率	参考图数量
`gemini-2.5-flash-image`	Nano Banana	大批量、低延迟改图	最高 2K	少量
`gemini-3.1-flash-image`	Nano Banana 2	日常快速改图、宽高比更全	0.5K–4K	最多 10 物体 + 4 角色
`gemini-3-pro-image`	Nano Banana Pro	最硬的编辑、清晰文字、4K 成品	1K / 2K / 4K	最多 14 物体 + 5 人

（模型名与上限以 Google Gemini API 图像文档为准，2026 年 6 月。）

简单说：在 Gemini 应用里，模型是根据你的订阅档位和 prompt 复杂度自动帮你挑的。如果你走 API，需要图内清晰文字、4K 输出、或一张图里保持最多 5 个人一致时选 Nano Banana Pro；要又快又省地反复迭代就用 Nano Banana 2。

它擅长什么、又在哪里崩

强项：

定点局部修改，其余完全不动——换上衣颜色、擦掉贴纸、换背景——全程不用碰蒙版工具。
多轮迭代在同一段对话里：“现在把天空改成橙色""现在把脸放大点”，对话会记住前几步，10 步连改也能保持一致。
图内文字（Nano Banana Pro）：标题、整段文案，甚至多语种文字和翻译都能写清楚，Google 公布的单行文字错误率大多在 10% 以下。这是相比最初那代最大的飞跃——老模型里文字基本必糊。
身份保持：同一个人 / 同一只宠物在不同场景、服装、角度下保持一致。Pro 能同时稳住最多 5 个人，还能在一张合成图里融合最多 14 个参考物体。
灯光、焦点、镜头调度：日转夜、浅景深 / 散景、换角度或换景别，在 Pro 里都是一等公民的控制项。

弱项：

像素级精度。 没有毫米级选区笔刷、图层蒙版，也不能输入精确色值。要做几何或像素精确的活，最后一步回 Photoshop 或 Affinity Photo。
多主体复杂场景仍会丢次要细节，风格改得太狠会把构图带歪。
免费档输出只有 1K，而且会带一个 可见的 Gemini「星标」水印，外加不可见的 SynthID 数字签名。付费档和 API 输出只保留不可见的 SynthID，没有可见标识。

这篇适合谁看

手上已有底图、要改局部的人——产品图、人像、社媒图、Mock-up 都算，想用自然语言改图，而不是开个桌面编辑器从头抠蒙版。

价格与限制（2026 年 6 月）

在 Gemini 应用里，图像编辑跟着你的 Google AI 订阅走，不另外收费：

档位	价格/月	Nano Banana Pro 每日图数	最高分辨率	水印
免费	$0	每日很紧（约个位数）	1K	可见星标 + SynthID
Google AI Plus	$9.99	最多 50	最高 2K	仅 SynthID
Google AI Pro	$19.99	最多 100	最高 4K	仅 SynthID
Google AI Ultra	$99.99	最多 1,000	4K	仅 SynthID

（Gemini 应用每日上限以 Google Gemini Apps 限额帮助页为准，2026 年 6 月；「Google AI Pro」就是原来的 Gemini Advanced。）

如果改走 API，Nano Banana Pro 按生成图片的分辨率计费——截至 2026 年 6 月大致是 1K 约 $0.039、2K 约 $0.134、4K 约 $0.24 一张。要大批量迭代，更便宜的 Flash 系（Nano Banana / Nano Banana 2）更划算；最后那张主视觉成品再上 Pro。

具体步骤

打开 gemini.google.com，新开一段对话（用拥有对应订阅的 Google 账号登录——你的档位也决定了能用到哪个模型和分辨率）。
用附件按钮上传底图。要在多次编辑里稳住某个人或某件产品，一开始就把干净的参考图一起传上，别等改到一半再补。
用大白话只描述这一轮要改什么，并写明要保留什么：把背景换成柔和的蓝渐变。主体、姿势、灯光完全保留。
一轮只改一处——先 现在把天空改成橙色，再 现在把脸放大点——让模型在上一版基础上接着改，而不是把好几处改动平均着做一遍。
把可能要回退的版本逐个下载。对话历史会留着，但只有重新下载才能可靠地把某个中间版以完整分辨率固定下来。

一个完整示例

假设你有一张 product-shot.jpg，瓶子上贴着价签。一条干净的三轮链路：

第 1 轮：这是 product-shot.jpg。擦掉瓶身上的价签，
标签、玻璃反光、阴影都保留不动。

第 2 轮：现在把瓶子放到大理石台面上，左侧打柔和的窗光。
瓶子和标签保持完全一致。

第 3 轮：现在给我一张 4:5 裁切版发 Instagram，
用当前可用的最高分辨率。

每一轮只改一件事，并写明要保持不变的部分——全部的功夫就在这里。

Nano Banana 与其他编辑器对比

Photoshop 生成式填充

Photoshop 长在完整的图层 + 蒙版编辑器里，所以毫米级选区、非破坏性图层、精确十六进制色值这些事它赢。Nano Banana 的强项是用自然语言整图改——「改成黄昏，模特的脸不变」——完全不用蒙版，速度也快。一句话：几何或像素精确 → Photoshop；描述性的 → Nano Banana。

Flux Kontext（Black Forest Labs）

Flux Kontext 也是指令驱动的编辑器，在硬核合成上经常更强——插进画面的物体要对上阴影和透视。但它更慢，而且通常要走自己的 API 或第三方 UI。Nano Banana 赢在速度和 Gemini 对话里的多轮迭代；某一处合成在它这儿反复跑不出来时，再切去 Flux Kontext。

Seedream-edit（字节跳动）

Seedream-edit 在中文 prompt 和亚洲人脸身份保持上表现明显更稳。Nano Banana 更通用、也更深地集成在 Gemini 整套工作流里。如果你的修改大量用中文 prompt、又以人像为主，可以把 Seedream-edit 留作第二选项。

6 个最毁图的坑

一次改多处。 模型会把多个改动平均着做，你失去控制。每轮只改一处。
没说要保留什么。 不写「保留主体、灯光、构图」，模型就有权把它们一并重画。每一轮都报一遍保留清单。
忘了对话是叠加的。 第 5 条消息是在第 1-4 步结果上接着改的。想回到原图，得另起一段对话重新上传原图——你没法在原地一步步「撤销」回去。
指望 Flash 系写长文字。 最初那代 Nano Banana 会把 logo、招牌、整段文案搞糊。要清晰文字就用 Nano Banana Pro，或者事后在真编辑器里加文字层。
拿它做毫米级排版。 精确裁切、对齐、色值这些事，留到最后回 Photoshop 收。
不存中间版本。 第 7 次迭代比第 4 次还差时，你会希望第 4 次还在硬盘上。边改边下载。

FAQ

Q：Nano Banana 是和 Gemini 分开的 App 吗？ A：不是。它是 Google 给自家 Gemini 图像编辑模型起的昵称（gemini-2.5-flash-image、gemini-3.1-flash-image、gemini-3-pro-image）。用法就是在普通的 Gemini 对话里传图——没有独立 UI。

Q：Nano Banana 和 Nano Banana Pro 有什么区别？ A：「Nano Banana」通常指最初的 Gemini 2.5 Flash Image：快、便宜，但图内文字会跑偏、输出大概到 2K 封顶。「Nano Banana Pro」是 Gemini 3 Pro Image（2026 年 6 月正式发布）：能推理着完成复杂编辑、写清晰的图内文字、输出最高 4K、并稳住最多 5 个人。主视觉成品用 Pro，快速迭代用 Flash 系。

Q：怎么让它只改一处、其余完全不动？ A：把保留清单写明白——「把上衣改成深蓝；脸、姿势、背景、灯光全部保持不变」——而且一轮只改一处。prompt 越含糊，模型越会「顺手」重画你没让它碰的地方。

Q：Nano Banana 免费吗？有水印吗？ A：Gemini 免费档每天能改的次数很有限，分辨率只到 1K，且免费输出带一个可见的 Gemini 星标水印加不可见的 SynthID 签名。付费档（Google AI Plus/Pro/Ultra）和 API 输出去掉可见水印，只保留不可见的 SynthID。更高分辨率（2K/4K）和更高每日额度需要付费档。

Q：Nano Banana 和 ChatGPT 改图有什么不同？ A：Nano Banana 在「只改局部、其余保留」上更利落，而需要图内清晰文字时 Nano Banana Pro 更强。ChatGPT 改图往往会把更多画面一起重画。要「只换这一个元素」，通常 Nano Banana 赢。

一句话总结

「Nano Banana」到底是什么

它擅长什么、又在哪里崩

这篇适合谁看

价格与限制（2026 年 6 月）

具体步骤

一个完整示例

Nano Banana 与其他编辑器对比

Photoshop 生成式填充

Flux Kontext（Black Forest Labs）

Seedream-edit（字节跳动）

6 个最毁图的坑

FAQ

相关阅读

相关文章

AI 专辑封面实操：缩略图也能识别

AI 奇幻角色设计实操：从角色卡到大场景

AI 时尚 Lookbook 实操：一个模特，六套造型，一套色系

怎么用 AI 生成 App 背景图

怎么用 AI 做品牌视觉方向（2026）

怎么做跨场景的一致 AI 角色图