ChatGPT 出图大多数败在同一招:30 个形容词堆成沙拉(“唯美 电影感 细节丰富 神秘 发光 奇幻 4k”)拿到一张无个性的图,然后放弃。出图老手写的是短而结构化的 prompt(主体 + 风格 + 灯光 + 镜头),每轮只改一个变量。这篇就是这套工作流——prompt 里写什么、每轮改什么、以及哪些场景 ChatGPT 出图差到该切别的工具。
这篇讲什么
用 ChatGPT 内置图像生成做配图、社交贴、博客头图、简单产品 mock。用”结构化 prompt + 单变量迭代”3-5 轮拿到能用的图,而不是 30 次乱摇。
本文涉及的工具 / 概念:
- ChatGPT: OpenAI 的对话式 AI 助手,最早把 GPT 系列模型带给普通用户的产品。
- 局部编辑(edit / inpaint): 让 ChatGPT 改上一张图的局部,而不是重画整张。能保持一致性。
- 参考图: 上传一张图配合 prompt 锚定风格或构图。被严重低估。
这篇适合谁看
想要”能用的图”而不是”随机出图”的 Plus / Team 用户——博主、营销、独立创始人、做 mock 的产品团队,以及对图库照腻味的人。
什么时候适合用
博客封面图、社媒贴、落地页 hero 变体、概念图、简单产品可视化、灵感板。不适合:精准品牌资产、需要清晰长文字的图、需要像素级布局的设计。
什么时候不建议用
真产品摄影、需要精确文字渲染(logo、招牌、截图)、品牌关键 hero 图且要 50 张一致、需要紧凑排版控制。Midjourney 风格深度更强;要精度就手设计。
开始前准备
- 一句话 brief:谁、在干什么、什么氛围、在哪用。没这句,每条 prompt 都泛。
- 找一张参考图——哪怕是你自己以前的——以便说”像这张,但 X 不一样”。
- 出图前定好比例。博客 16:9、社媒 1:1、Stories 9:16。比例错 = 浪费摇骰。
具体步骤
- 一句话写:主体 + 风格 + 灯光 + 镜头。例:“一位资深工程师在桌前工作,动漫插画风,晨光柔和,中景。”
- 出一张。看清楚。挑出”最不对”的那个点。
- 只改那一个变量再出。“同构图,灯光偏暖。” “同灯光,拉到广角。”
- 小改用编辑工具:“把背景换成淡蓝渐变” “把桌上的笔记本换成纸本”。不要重画整张。
- 系列一致:原 prompt 一字不改粘贴,只换一个短语(人物姿态、时间)。风格用词保持一致。
- 最终 prompt + 图配对存进 prompt 库。命名
topic_style_lighting.png旁边放 prompt 文本。
跑得通的 prompt 结构
主体:资深软件工程师,30 出头,神情若有所思
动作:在木桌上的笔记本里写东西
风格:编辑插画,配色柔和
灯光:晨光从窗户进来,暖色调
镜头:中景,从左侧略带角度
氛围:沉思、专注
避免:图中有文字、多人、暗背景
这 7 行结构产出可预测。漏掉一行 ChatGPT 会朝通常糟糕的方向自己脑补。
第一次实操怎么跑
- 选本周真的要用的一张图——博客头图、配图、mock。
- 用上面 7 行结构写 brief。强迫自己每行都填。
- 出图。挑出”最不对”的那一点。
- 只改那一行再出。3 轮封顶——还差太远,是 brief 本身错了,不是 prompt 错了。
完成后检查
- 图跟用途匹配吗?动漫人像配 B2B 博客头图不合适。
- 有没有幻觉伪影——多出来的手指、糊掉的字、不对的窗户数?发布前肉眼扫一遍。
- 比例对得上落点吗?比例错 = 裁剪毁构图。
- 品牌图:跟上周的图放一起,像不像同一个人做的?
怎么复用这套流程
- 维护 prompt 库:
prompts.md按用途分章节(博客头图、社媒、mock)。每条:brief、prompt、结果图、教训。 - 重复需求(周报头图):跑通的 prompt Pin 起来,每周只换主题名词。
- 给品牌视觉做个 Custom GPT:Instructions 写你的风格词、配色、“避免”清单。从此每条 prompt 都从品牌基线起步。
建议的操作流程
7 行 brief → 首图 → 找一个错点 → 只改一个变量 → 重复(最多 3 轮)→ 终版。Prompts 存进文件。每张能用图全程 5-10 分钟。
容易踩的坑
- 一句话塞 10+ 形容词——它们互相打架,结果糊一锅粥。
- 不写镜头 / 灯光——这两个比主体更决定成图,多数人都漏。
- 想让图里出现清晰文字——ChatGPT 文字渲染不稳定。文字后期加。
- 一轮改 3 个东西。改完不知道哪个起作用。
- 小改也重画整张。浪费摇骰,破坏一致性。
- 比例最后才想——1:1 出的构图裁不出干净的 16:9。
FAQ
- 图为啥老看着没个性?: 八成是漏了镜头 + 灯光行。两个都加,不会的话查电影摄影术语。
- 怎么让人物在多图里一致?: 上一条 prompt 一字粘贴,只换动作或场景。第 2 轮把第 1 轮的图上传当参考。
- 它为啥拒绝出某些图?: 内容政策。真人、名人、版权角色、某些暴力 / 露骨内容会被拒。
- 跟 DALL-E 直连和 Midjourney 比怎样?: ChatGPT 图生成更好迭代(能自然语言描述编辑),但 Midjourney 风格深度更强。两个一起用。