图为啥老看着没个性？

八成是漏了镜头或灯光行。两个都加，不会就查几个电影摄影术语（"中景""窗户柔光""伦勃朗布光"）。

怎么让人物在多图里一致？

把第 1 轮的图当参考上传进第 2 轮，风格几行原样不动，只换动作或场景。`gpt-image-2` 一条 prompt 能在约 8 张图里保持五官、服装、配色一致。

现在能渲染文字了吗？

能——这是最大的变化。ChatGPT Images 2.0 短文字渲染稳定，中文、日文、韩文、印地文都行。整段文字仍建议后期用设计工具加。

它为啥拒绝出某些图？

内容政策。涉及真人或名人、版权角色、暴力或露骨内容的请求会被拒。

每天能出多少张？

截至 2026 年 6 月，免费版每滚动 24 小时约 2-3 张，Plus 每滚动 3 小时约 50 次，Pro 基本无限且更快。"思考"模式和 2K 分辨率需要 Plus 及以上。

跟 Midjourney 比怎样？

ChatGPT 更好迭代——能用自然语言描述编辑、能直接框选区域——而且现在文字和排版已能追平甚至超过 Midjourney。Midjourney 在风格深度和绘画质感上仍更强。很多人两个一起用。

AI 工具教程

ChatGPT 图像生成实战工作流（2026 年 6 月）

用 ChatGPT Images 2.0（gpt-image-2）拿到能用的图：结构化 prompt、每轮只改一个变量、蒙版局部编辑、参考图锁人物一致性。

发布于: 2026/05/17 更新于: 2026/06/06 作者: AI Productivity Guide Team 🌐 查看英文版本

ChatGPT 出图大多败在同一招：30 个形容词堆成沙拉（“唯美电影感细节丰富神秘发光奇幻 4k”），拿到一张毫无个性的图，摇十几次就放弃。能稳定出可用图的人做法正相反——写短而结构化的 prompt（主体 + 风格 + 灯光 + 镜头），每轮只改一个变量。截至 2026 年 6 月，ChatGPT 跑的是新的 ChatGPT Images 2.0 模型（gpt-image-2，2026 年 4 月 21 日上线）：它出图前会先做规划、能只改选中区域而不重画整张、文字也终于能渲染清楚了。这篇就是把这三点都吃透的工作流。

一句话总结（TL;DR）

ChatGPT 当前的图像模型是 ChatGPT Images 2.0（gpt-image-2），2026 年 4 月 21 日上线，取代了 GPT Image 1.5；DALL-E 3 已于 2026 年 5 月 12 日停用。
写一份 7 行结构化 brief（主体、动作、风格、灯光、镜头、氛围、避免）。出一张，找出最不对的那一点，只改那一行，重复。三轮，不是三十轮。
局部修改用选区（蒙版）工具——框出区域再描述改动——不要重画整张。
“思考”模式（模型会自检、能上网找参考）和 2K 输出需要 Plus / Pro / Business 套餐。免费版大约每 24 小时 2-3 张。
文字渲染现在是真的好用了，中文、日文、韩文、印地文都行。短标签”后期再加文字”那条老规矩可以丢了。

ChatGPT Images 2.0 现在到底是什么（2026 年 6 月）

ChatGPT 内置出图是和对话模型一体的——你描述一张图、用大白话微调、在同一个对话里编辑。当前模型是 gpt-image-2。和老的扩散管线不同，它出图前会跑一小段推理循环：规划构图、可以上网找参考素材、生成候选、再对照你的 prompt 自查。所以现在哪怕 brief 写得很泛，出来的也是”平庸但能看”，而不是直接画崩；而 brief 写得精准的话，一两轮就基本到位。

能力	截至 2026 年 6 月
模型	ChatGPT Images 2.0（`gpt-image-2`），2026 年 4 月 21 日上线
”思考”模式（自查 + 上网找参考）	仅 Plus / Pro / Business
分辨率	App 内最高 2K（2048×2048）；4K 是 API 测试标志
画幅比例	从 3:1（宽）到 1:3（高）
多图一致性	一条 prompt 可出约 8 张同主体连贯图
编辑用参考图	单次最多合并 10 张上传图
文字渲染	强，含中文、日文、韩文、印地文
免费版	每滚动 24 小时约 2-3 张
Plus（$20/月）	每滚动 3 小时约 50 次出图
Pro（$200/月）	无限、更快出图（受滥用防护约束）

适合做：博客封面图、社媒贴、落地页 hero 变体、概念图、简单产品 mock、灵感板。不适合：真产品摄影、要 50 张像素级一致的品牌关键 hero 图、需要精确排版布局的设计。要更深的风格控制，Midjourney 仍更强；要精度，就手设计。

出图前先准备

写一句话 brief：谁、在干什么、什么氛围、在哪用。没这句，每条 prompt 都会跑偏成大路货。
找一张参考图——哪怕是你自己以前的——这样你能说”像这张，但 X 不一样”。这一招被严重低估，却是提升质量最大的杠杆。
先定画幅比例。博客头图 16:9、社媒 1:1、Stories 9:16。模型支持 3:1 到 1:3，所以明确写出来。比例定错，每一次摇骰都白费。

跑得通的 7 行 prompt 结构

主体：资深软件工程师，30 出头，神情若有所思
动作：在木桌上的笔记本里写东西
风格：编辑插画，配色柔和
灯光：晨光从窗户进来，暖色调
镜头：中景，从左侧略带角度
氛围：沉思、专注
避免：多余的手指、多人、暗背景

这套结构产出可预测，因为它逼你在每个轴上都做决定，否则模型就会自己脑补。漏掉一行，gpt-image-2 会把这个空填上，而且通常填到你不想要的方向。镜头和灯光对一张图”专不专业”的影响，比主体更大——多数弱图恰恰就是缺了这两行。

具体步骤

用上面 7 行结构写 brief，每行都填。
出一张。看清楚，挑出最不对的那一点（构图、灯光、配色还是姿态）。
只改那一行再出：“同构图，灯光偏暖。""同灯光，拉到广角。“一轮改三个东西，改完就分不清是哪个起的作用。
局部修改用选区工具：框出区域（拖滑块调笔刷大小），再在对话里描述改动——“把背景换成淡蓝渐变""把笔记本电脑换成纸本”。它只改蒙版内的区域，其余保持不动。小改不要重画整张。
系列里要保持同一个人物：把第 1 轮的图当参考上传进第 2 轮，风格几行原样不动，只换动作或场景。模型能在约 8 张图里保持五官、服装、配色一致。
最终 prompt 和图配对存好。用 topic_style_lighting.png 之类的命名、旁边放 prompt 文本，下个月这份素材就能直接复用。

三轮封顶。三轮还差太远，说明是 brief 写错了，不是 prompt 错了——重写 brief，别继续摇。

发布前检查

图跟落点匹配吗？动漫人像再好看，也配不了 B2B 博客头图。
扫一遍幻觉伪影——多出来的手指、糊掉的形状、不对的窗户数。推理循环减少了这类问题，但没根除。
比例对得上要放的地方吗？1:1 的构图裁成 16:9，会丢掉你搭好的取景。
品牌图：跟上周那张放一起，像不像同一个人做的？

把流程变成可复用

维护一个 prompts.md 库，按用途分章节（博客头图、社媒、mock）。每条记：brief、prompt、结果图、教训。
重复需求（每周周报头图）：把跑通的 prompt Pin 起来，每周只换主题名词。
给品牌视觉做个 Custom GPT：把风格词、配色、“避免”清单写进 Instructions。从此每条 prompt 都从品牌基线起步，而不是从零开始。

用这套循环，每张能用图全程 5-10 分钟，而不是无结构乱摇的开放式轮盘赌。

容易踩的坑

一句话塞 10+ 形容词——它们互相打架，结果糊成一锅粥。
漏写镜头和灯光行，而这两个比主体更决定成图。
小改也重画整张，而不用选区工具。既浪费摇骰，又破坏一致性。
一轮改三个变量，然后不知道是哪个起的作用。
比例拖到最后才想。1:1 出的构图裁不出干净的 16:9。
还以为文字渲染是坏的。在 gpt-image-2 上，短标签和标题渲染稳定，只有整段长文字仍有风险。

FAQ

图为啥老看着没个性？: 八成是漏了镜头或灯光行。两个都加，不会就查几个电影摄影术语（“中景""窗户柔光""伦勃朗布光”）。
怎么让人物在多图里一致？: 把第 1 轮的图当参考上传进第 2 轮，风格几行原样不动，只换动作或场景。gpt-image-2 一条 prompt 能在约 8 张图里保持五官、服装、配色一致。
现在能渲染文字了吗？: 能——这是最大的变化。ChatGPT Images 2.0 短文字渲染稳定，中文、日文、韩文、印地文都行。整段文字仍建议后期用设计工具加。
它为啥拒绝出某些图？: 内容政策。涉及真人或名人、版权角色、暴力或露骨内容的请求会被拒。
每天能出多少张？: 截至 2026 年 6 月，免费版每滚动 24 小时约 2-3 张，Plus 每滚动 3 小时约 50 次，Pro 基本无限且更快。“思考”模式和 2K 分辨率需要 Plus 及以上。
跟 Midjourney 比怎样？: ChatGPT 更好迭代——能用自然语言描述编辑、能直接框选区域——而且现在文字和排版已能追平甚至超过 Midjourney。Midjourney 在风格深度和绘画质感上仍更强。很多人两个一起用。

一句话总结（TL;DR）

ChatGPT Images 2.0 现在到底是什么（2026 年 6 月）

出图前先准备

跑得通的 7 行 prompt 结构

具体步骤

发布前检查

把流程变成可复用

容易踩的坑

FAQ

相关阅读

相关文章

ChatGPT Canvas 工作流：改长文档不用整篇重写

ChatGPT Deep Research：经得起挑刺的工作流

ChatGPT 键盘快捷键：2026 年值得记的那一份清单

ChatGPT 整理会议纪要：从转录到行动项（2026）

手机上的 ChatGPT：真正适合手机的几种用法

ChatGPT 定时任务：把重复 AI 工作排进时间表（2026 指南）