这篇讲什么
Gemini 的图像生成(底层是 Imagen)很快、能力不错,但棱角分明:不出真人、不出可读文字、角色连续性差。这篇是 prompt 配方——第一或第二次就拿到能用的海报、插画或社交资产——以及要绕开的失败模式。
本文涉及的工具 / 概念:
- Gemini: Google 的多模态 AI 助手。图像生成跑在 Gemini Advanced 内的 Imagen 模型族。
- Imagen: Google 的图像模型。强:构图、灯光、物体和场景的写实。弱:文字、真人、细粒度角色连续。
- 风格锚: 指名具体风格(“Studio Ghibli 水彩”)而不是泛形容词(“日漫风”)。锚定能把输出稳定性提升 3-5 倍。
这篇适合谁看
Gemini Advanced 用户,需要图能真用:做海报草图的营销、生成 cover art 的内容写手、发社交贴的创始人、做幻灯插图的课程作者、打开 Figma 前迭代概念的设计师。
什么时候适合用
cover、海报、博客和 deck 的插画、social card、幻灯背景、概念草图。Imagen 强在扁平插画、水彩、写实静物、风格化场景。适合做”用一次就丢”或下游还要人工打磨的资产,不适合最终品牌艺术。
开始前准备
- 提示前先定比例和用途。Imagen 不原生支持所有比例;16:9 social 或 9:16 story 要显式说。
- 选风格锚:具名艺术运动、某位插画师、已知视觉参考(“扁平插画、Mailchimp 2022 营销风”)。泛描述出泛结果。
- 确认主体被允许。真实公众人物、近期政治事件、版权角色都会被拦。改成”长得像…”或原创角色。
- 预留 3-5 次迭代。一次成功是例外不是常态。
具体步骤
- 用明确结构写 prompt:
生成一张 <主体>,<风格>,<灯光>,<构图>,<情绪>。比例 <16:9>。五个槽位都重要,少一个通常出泛图。 - 用具体风格参考。“Studio Ghibli 水彩”比”日漫”好;“Mailchimp 2022 营销插画”比”扁平插画”好;“Annie Leibovitz 人像光”比”专业灯光”好。具体参考给模型清晰目标。
- 一次只改一个变量迭代:角度(“换低角度”)、灯光(“换 golden hour 暖色”)、配色(“换成沉静的绿”)。多变量同改后续指令会乱。
- 系列图保持一致:跨 prompt 复用完全相同的风格和灯光子句。角色连续性弱,绕开它——用剪影或暗示型人物,不用细致角色。
- 图里别要文字。Imagen 经常生成乱码字母。出无字图,再用 Slides、Canva、Figma 加字。
- 满意了立刻下载。同 prompt 重 roll 偶尔产出更差的第二版。
第一次实操怎么跑
- 选一个真即将到来的需求:博客 cover、social card、幻灯背景。
- 跑五槽都填的结构化 prompt。保存。
- 再迭代 3 次,每次只改一个变量。记哪个变量改动收益最大。
- 建一份自己的”什么管用”日志,存下赢得最大的 prompt 结构。下次复用结构。
完成后检查
- 图解决了 brief,还是只是好看?“好看但偏题”是 Imagen 最常见的失败。
- 全尺寸能看的细微瑕疵——多手指、字溶解、透视崩——是否会被注意到?100% 放大再批。
- 风格和项目里相邻图一致吗?一份 deck 或贴文里风格不一致是 AI 出图的一大破绽。
- 有没有不小心加了被禁主体(真人名、版权角色)?重读 prompt 找安全触发。
怎么复用这套流程
- 把赢得最大的 prompt 结构存成片段。结构通用,只换槽位。
- 维护”风格库”Doc:10-15 个测试过的风格锚配示例输出。复用为一致性。
- 失败 prompt 也存——尤其带被禁主体或文字的。模式化下次该避开的。
- 每 1-2 个月刷新。Imagen 质量和安全过滤在动;老 prompt 可能失效或行为变。
建议的操作流程
brief → 五槽结构化 prompt → 第一次生成 → 每次改一个变量迭代 3-4 次 → 满分辨率终稿 → 在 Slides 或 Canva 外加字 → 把赢家 prompt 存到风格库。总用时约 10 分钟拿到能用的资产,比”图库搜+编辑”快很多。
容易踩的坑
- 风格词堆太多。“电影感、戏剧、鲜艳、写实、超精细”自己抵消。挑两个形容词加一个具体参考。
- 指望出图里写字清晰。Imagen 只会出字形痕迹。下游工具加字。
- 用真人当主体(safety filter 会拦)。改成”长得像…”或原创角色。
- 一个 prompt 出整套系列而不是一图一 prompt。多资产 prompt 质量明显下降。
- 第一次出图当最终。Imagen 常常构图对了却漏一个细节(手指数错、颜色偏)。永远放大检查。
FAQ
- 生成图必须 Gemini Advanced 吗?: 是——图像生成在 Advanced(或付费 Workspace)。免费档图像功能很有限。
- 能生成 logo 吗?: 技术上能,实际不行。logo 需要矢量精度 Imagen 没有。用它做概念,再矢量重绘。
- safety filter 为什么拦我?: 真人、近期政治事件、版权角色、某些主题(暴力、敏感话题)被拦。改写或用原创主体。
- Imagen 比 Midjourney 如何?: Imagen 更快更易得;Midjourney 风格天花板更高、社区参考更多。Imagen 做快速资产,Midjourney 做完成态艺术。
- 生成的图能编辑吗?: Gemini 里有限的 inpainting;正经编辑下载到 Photoshop 或 Affinity。