AI 图片构图太杂:5 类原因 + 6 步修复路径

主体太多互相打架?砍到一个主角 + 最多两个配角,加景深把其他元素推到背景。

你想要的东西画面里都有——猫、咖啡杯、书、笔记本、窗户、绿植、晨光——但整张图就是”视觉一团乱”。眼睛不知道该看哪里。每个对象同等大小、同等清晰、同等显眼,大脑读到的不是”场景”而是”噪声”。

构图杂很少是”模型不会构图”,几乎一定是 Prompt 问题:你列了七样东西,但没给模型任何”哪个最重要”的信号。

常见原因

按命中率从高到低:

1. 对象太多,Prompt 里权重相等

cat, coffee, book, laptop, plant, window light, cozy morning——七个名词、零层次。模型把它们当成同等重要,全部放到画面中央显眼位置。

如何判断:数 Prompt 里的具体名词。超过 3 个且没加权重——输出大概率是杂的。

2. 没写景深

不写景深,模型默认中等光圈——什么都清晰。结果是即使边缘的元素也在和主角抢眼球。

如何判断:Prompt 里没有 shallow depth of fieldbokehf/1.4out of focusblurred background——加一个。

3. 没说”主角是谁”

你说”猫在场景里”,但没说”猫是主角”。模型尤其在多名词时需要这种层次提示。

如何判断:Prompt 里没有 hero subjectmain subjectcentereddominant,也没有”大猫”或”小杯子在背景”这种大小修饰词。

4. 取景广 + 场景类词

大全景 + cozyinteriorroomstill lifelifestyle scene 这种词,是在邀请模型把画面填满。改成紧框、单名词构图,杂乱立刻减半。

如何判断:Prompt 是大全景且用了场景 / 生活类词。

5. 风格本身就杂

某些风格自带”杂”基因:

  • still life painting — 桌上一堆静物
  • cozy aesthetic — 大量道具、柔光分层细节
  • flat lay photography — 定义上就是杂
  • wes anderson — 对称式最大主义
  • studio ghibli interior — 居家场景物件多

如何判断:风格锚词单独一念脑海里就是”热闹场景”。

最短修复路径

Step 1:砍到一个主角 + 最多两个配角

修改前:

a cat, a coffee cup, a book, a laptop, a houseplant, a window with morning light, a cozy desk scene

修改后:

a ginger cat sitting on a desk, soft morning window light in the background,
one out-of-focus coffee cup beside the cat

一个主角(猫)、一个配角(明确写”虚焦”的咖啡杯)、一个氛围词(窗光,不再算作具体物)。

Step 2:显式写”主角是谁” + 大小修饰

通用模板:

"[hero] is the main subject, centered, large in frame"
"close-up of [hero], everything else small and out of focus"
"[hero] in sharp focus, [other objects] blurred in the background"

Step 3:加景深

一行就能让大部分”啥都清晰”的杂乱图变成”主体凸出”:

"shallow depth of field, f/1.4, creamy bokeh, only [hero] in focus"

Midjourney 专用:

"... --style raw --ar 4:5"

--style raw 减少模型主动加料的倾向;竖向比例减少背景面积。

Step 4:加留白词

挑 1-2 个加进去:

  • minimalist composition
  • large negative space
  • breathing room around the subject
  • clean composition with simple background
  • Japanese minimalist aesthetic(如果风格合适)

Step 5:负向 Prompt 拦杂(仅 SD 系)

cluttered, busy composition, many objects, crowded scene,
multiple subjects, ornate, baroque, maximalist, busy background,
overlapping objects

Step 6:先画构图,再用 ControlNet 锁

需要美术指导级的构图,先手绘草图(纸 / iPad / ControlNet Scribble),喂给 ControlNet。模型只填充细节,不会偏离你的构图。

# ComfyUI / Forge ControlNet
- 加载 ControlNet Scribble 或 Canny
- 喂构图草图
- 强度 0.6-0.8(低=给模型更多自由,高=严格按草图)

预防建议

  • 写 Prompt 之前先定主角,主角放句子最前
  • 默认每张图最多 3 个名词;要更多就拆成系列
  • 立一条规矩:Prompt 含 3+ 名词必须配景深 / 焦点修饰词
  • 系列项目里在每个 Prompt 末尾固定加一段 “minimalist composition” 模板

相关阅读

标签: #图像生成 #排查 #排查