Nano Banana / Gemini 图像编辑教程

Nano Banana 是 Google Gemini 2.5 Flash Image 的民间叫法,已原生整合进 Gemini。教你用纯 prompt 改局部、保留其余区域,不用画 mask,并对比 Photoshop 生成式填充和 Flux Kontext。

这篇讲什么

用 prompt 编辑已有图——改局部,保留其余。

本文涉及的工具 / 概念:

  • Gemini: Google 的多模态 AI 助手以及背后的同名模型家族,深度集成 Google Workspace、搜索、Gemini API / Vertex AI。
  • Nano Banana: 社区给 Google Gemini 2.5 Flash Image 图像编辑模型起的昵称。这个名字最早出现在 lmarena.ai 的盲测榜上,后来 Google 确认是自家模型,现在已经原生整合进 Gemini,不是单独的产品或 App。

Nano Banana 是什么,它和 Gemini 是什么关系

Nano Banana

Nano Banana 是 Gemini 2.5 Flash Image 的民间叫法。它最早是 lmarena.ai 上一个匿名条目,在图像编辑盲测里击败了一众老牌编辑器,后来 Google 出来认领,把它正式塞进 Gemini 家族。你打开 Gemini 对话、上传一张图、让它改一处,背后干活的就是这个模型——没有独立的 “Nano Banana” UI。

最适合做的事

  • 定点局部修改,其它部分不动(换上衣颜色,但脸完全不变)。
  • 在同一段对话里多轮迭代:“现在把天空改成橙色""现在把脸放大点”——对话会记住前几步的编辑结果。
  • 风格迁移但保留主体:同一张人像换成水彩 / 3D 渲染 / 线稿,人物身份不变。
  • 同一个人 / 同一只宠物在不同场景、不同服装、不同角度下的一致性变体。

典型 prompt 示例

这是我家狗在沙发上的照片。
把沙发换成秋天公园里的木长椅,
狗、灯光、姿势完全保留。
下一条消息再说:现在加点黄昏的金色光。

它做不太好的事:图里的细节文字会跑偏(logo、招牌、整段文案容易变形);多主体复杂场景的次要细节会糊掉;风格改得太重会把构图带歪;没有像 Photoshop 那种毫米级的选区 / 蒙版工具。

Gemini

Gemini 是 Google 的多模态 AI 助手和背后的模型家族,在同一段对话里能处理文字、代码、图像(生成 + 编辑)、音频。你平时拿来问问题、写代码的那个 Gemini 对话窗,正是上传图片让它改图的入口——传图、写需求、出结果、继续改。

最适合做的事

  • 文字 + 图像生成 + 图像编辑共用一个对话窗,不用切工具。
  • Gemini 应用提供免费、AI Pro、AI Ultra 三档;Google AI Studio 有开发者免费配额;Gemini API / Vertex AI 走付费程序化调用。
  • 单次会话上下文很长,10 步连改也能保持一致。
  • 和 Google Workspace、搜索、Drive 集成度高,要从自己网盘里调底图很方便。

典型 prompt 示例

打开 gemini.google.com,上传 product-shot.jpg,
然后说:"把瓶子底部的价签擦掉,
标签和反光保留,
最后给我一张正方形裁切版发 Instagram。"

它做不太好的事:图像编辑能力的局限就是上面 Nano Banana 那一块;免费档的速率限制更低、输出尺寸更小;部分地区还有功能缺口;真要毫米级抠图 / 图层 / 蒙版精度,还是得回到 Photoshop。

这篇适合谁看

已有底图、要改局部的人——产品图、人像、社媒图、Mock-up 都算,想用自然语言改图,而不是开一个桌面编辑器。

什么时候适合用

只想改一处时,不想重新生成。

开始前准备

  • 准备一个明确目标:要生成什么、修什么、审核什么,而不是只写”帮我看看”。
  • 把必要上下文放在同一次对话里:文件、链接、截图、限制条件、成功标准。
  • 先用一个小样本跑通,再把同样流程扩展到完整项目或完整素材。

具体步骤

  1. 打开 gemini.google.com,新开一段对话(用拥有相应订阅的 Google 账号登录)。
  2. 通过附件按钮上传底图。
  3. 用自然语言只描述这一步要改什么:“把背景换成蓝渐变,保留主体和灯光。“明确写出要保留什么。
  4. 在同一段对话里继续迭代——一次一处(“现在把天空改成橙色""现在脸再大一点”),让模型在上一版的基础上接着改。
  5. 把可能要回退的中间版本另存下来——对话历史会留着,但下载出来不一定能拿到完整分辨率。

建议的操作流程

底图 → 一处定向修改 → 保存 → 下一处。

Nano Banana 与其他图像编辑器对比

Photoshop 生成式填充

Photoshop 的生成式填充长在一个完整的图层 + 蒙版编辑器里,所以在毫米级选区、非破坏性图层、精确色值这些事上它是赢的。Nano Banana 的强项是用自然语言整图改——“改成黄昏,脸不变”——根本不用打开蒙版工具,速度也快很多。几何 / 像素级精度的活交给 Photoshop;描述性的、整张图调氛围的活交给 Nano Banana。

Flux Kontext(Black Forest Labs)

Flux Kontext 也是指令驱动的图像编辑器,在硬核的非破坏性合成上经常更强——比如往画面里插一个物体,且阴影、透视都要对得上——但它更慢,而且通常要走自己的 API 或第三方 UI。Nano Banana 直接长在 Gemini 对话里、支持多轮迭代,所以日常工作默认用它就行;只有当某一处合成在 Nano Banana 上反复跑不出来,才特意切去 Flux Kontext。

Seedream-edit(字节跳动)

Seedream-edit 是字节的图像编辑模型,在中文 prompt 和亚洲人脸身份保持上表现明显更稳——本地化的口语化描述它处理得更顺。Nano Banana 更通用、更深度集成在 Gemini 的整套工作流里;如果你的修改大量用中文 prompt、又以人像为主,可以把 Seedream-edit 留作第二选项备用。

容易踩的坑

  • 一次改多处:模型会把多个改动平均着做一遍,你失去控制。每轮只改一处。
  • 没说要保留什么:写明”保留主体、灯光、构图”,否则模型有权把它们一并改掉。
  • 忘了对话是多轮叠加的:第 5 条消息是在第 1-4 步的结果上接着改的——想从原图重来,得另起一段对话重新上传原图。
  • 让它在图里写长文字:logo、招牌、整段文案都会糊。文字事后用真编辑器加。
  • 用 Nano Banana 做毫米级排版:精确裁切、对齐、色值这些事,最后一步回 Photoshop 收。
  • 不存中间版本:第 7 次迭代比第 4 次还差时,你会希望第 4 次还在硬盘上。

FAQ

Q:Nano Banana 和 Gemini 是同一个东西吗? A:Nano Banana 是社区给 Google Gemini 2.5 Flash Image 起的昵称,没有独立 App 或 UI。你在 gemini.google.com 上传图、让它改一处,背后干活的就是这个模型。

Q:怎么让它只改一处、其它完全不动? A:明确写出要保留什么,例如“把上衣改成深蓝,脸、姿势、背景、灯光完全保留”。不写保留项,模型会“顺手”改其它部分。一次只下达一个改动,多个改动分多轮做。

Q:图里的文字 / logo 改完会糊,怎么办? A:Nano Banana 处理细节文字(招牌、logo、整段文案)会跑偏,这是当前模型局限。文字层在 Photoshop / Affinity 里事后另起一层加,不要让 AI 在图里写长文字。

Q:什么时候该切到 Photoshop 生成式填充或 Flux Kontext? A:要毫米级选区、精确色值、非破坏性图层时回 Photoshop。要把一个物体插进画面且阴影 / 透视都对得上时考虑 Flux Kontext。中文 prompt 加亚洲人脸身份保持,可以试字节的 Seedream-edit。

相关阅读

标签: #教程 #图像生成