AI 产品图主体形变怎么解

AI hero 图里瓶身歪、包装弯、logo 边缘糊?修复方法:用真品照走 ControlNet、对产品轮廓 mask、必要时直接把真产品合成到 AI 背景上。

你出了一张产品 hero 图,灯光高级、背景像 agency 拍的——但瓶身本该是直边的地方有弧度,包装盒侧面有点波浪,正面 logo 糊成一个近似形。对真实产品来说,AI 没办法凭空准确画出你的包装。修复不是改 prompt,而是用 ControlNet 锁轮廓、对产品区域 mask 重画,或者直接把真品照片合成到 AI 出的背景里。

常见原因

按命中率排序。

1. 模型从没见过你的产品(最常见根因)

扩散模型只知道”瓶子""盒子""手机”这些抽象类别,没办法仅凭文字还原你具体产品的轮廓、压花、标签布局。任何纯文字生成的有品牌产品图,都是模型在幻想一个合理的包装。

如何判断:在用纯文字 prompt 出真实有品牌的产品吗?是 = 根因就是这个,调多少 prompt 都修不了。

2. 没有任何轮廓约束

模型从”瓶子”或”盒子”里挑一个泛型形状自由发挥。没有 ControlNet Canny / Depth / 参考图,每张图轮廓都不同。

3. 风格化和写实打架

“安迪沃霍尔风格的可乐瓶照”——模型会把瓶身往沃霍尔方向变形,轮廓就垮了。

4. 分辨率不够画清细节

压花 logo、标签上的小字、产品的细长部分(手柄、瓶嘴、瓶盖)需要像素预算。1024x1024 的瘦高瓶 hero 图,瓶子只有大约 200 像素宽,根本撑不起标签清晰度。

5. 相机角度 / 透视不在训练数据里

模型熟悉目录式正面和四分之三侧产品图。俯拍、虫眼仰拍、极端角度推到训练稀疏区,形状就变形。

6. 一张里有多个产品

六瓶装组合图、starter set 套件。每个单品都要正确,即使有约束,单品之间也在抢精度预算。

动手前先确认

  • 想清楚到底要不要”真产品本人”出镜,还是”像产品的占位”够用。概念图能接受占位,商用稿不行。
  • 把出问题那张图的 seed、prompt、模型、档位存下来。
  • 至少准备一张干净背景的真品参考照。
  • 用途确认。印刷比网页要求高;包装 mockup 要像素级正确的标签。

需要收集的信息

  • 完整 prompt、模型、seed、sampler、步数、宽高比。
  • 一张干净背景的真品参考照。
  • 必须读对的关键特征(logo 位置、标签颜色、轮廓曲线)。
  • 交付尺寸和用途(网页 hero、印刷海报、社交卡片)。

一步步修复

按 ROI 排序。Step 1 + Step 4 就是商用稿的标准生产流程。

Step 1:用 ControlNet 锁轮廓

最大幅度的动作是把纯文字换成从真品照上来的结构约束:

  • SDXL / A1111 / ComfyUI:用产品照(轮廓干净)做 Canny ControlNet,权重 1.0 严格遵循。
  • SDXL 备选:瓶 / 罐这种圆弧表面用 Depth ControlNet。
  • Flux:ComfyUI 里用 Flux ControlNet(Union 变体),支持 Canny 和 Depth。
  • Midjourney:用 --sref + --sw 100 锁风格,配合 --cref 做对象引用。

这一步锁住了轮廓。模型负责灯光、环境、表面质感,形状是你的。

Step 2:给产品区域更多像素

挑能让产品占更多像素的构图:

  • 瘦高产品 → 竖比例。
  • 横长产品 → 横比例。
  • 方正产品 → 方比例。
  • 环境不是主角的话,构图更紧。

Step 3:去掉 prompt 里的风格打架

砍掉重风格修饰。先放摄影描述:

product photography, studio lighting, sharp focus, clean background,
[产品描述], shot on Hasselblad

风格修饰留给背景和灯光,不要落到产品表面上。

Step 4:直接把真产品合成进去

商业 hero 图的标准生产流程:

  1. AI 出图时用产品占位(空白白瓶 / 空白盒)。
  2. 拿到 AI 的背景和灯光。
  3. 从真品照里把产品抠出来。
  4. 把抠出来的真品摆进 AI 背景里。
  5. 用一层柔投影和整体调色把灯光方向和色调对上。

90% 的商业 hero 活,这种做法比硬怼 ControlNet 到完美要更快、更准。

Step 5:对产品区域 mask 重画

构图锁死、但形状还差:

  • mask 罩住产品区域。
  • 走 img2img inpaint,保留 ControlNet。
  • denoise 降到 0.3-0.4,在保留轮廓的同时精修表面细节。

Step 6:换更强的模型

Flux Pro、Midjourney v7、Imagen 3 在产品轮廓上明显强于 SDXL 原版和老模型。标签清晰度 Ideogram 2 最强,因为它对短文字最稳。

怎么确认已经修好

  • 把生成图按同比例叠到参考图上。轮廓边缘应在 2-3 像素以内对齐。
  • 100% 看 logo 和标签。字母能读、拼写对。
  • 包装盒的直边应该是直的,不能有波浪。
  • 瓶 / 罐这种轴对称物,轮廓两侧应该镜像。
  • 多单品组合,每一个都过上面这些检查。

长期预防

  • 任何商业产品稿,默认走 ControlNet + 合成,不要靠纯文字。
  • 给每个会做 hero 图的产品维护一组干净参考照。
  • 产品稿默认 Flux Pro 或 Midjourney v7。SD 1.5 直接弃用。
  • 准备一段产品摄影 prompt 模板,把重风格修饰从产品本身上踢出去。
  • 标签和 logo 永远走合成,从真品图或矢量文件里拿,不要相信模型。

常见坑

  • 重摇 20 次等模型把你产品画对。它不会的。
  • 在 prompt 里加 “accurate product shape” 期待奇迹,没什么用。
  • 合成产品时不对齐灯光方向。合成感一眼能看出来。
  • 忘了 100% 看标签。标签错在缩略图下是看不出的。

FAQ

Q:训一个 LoRA 能让模型学会我的产品吗? A:SDXL 和 Flux 都行。20-50 张产品照训出来的 LoRA,对轮廓和标签的保真度都很稳。如果是经常出 hero 图的产品,值得搭这个工作流。

Q:ControlNet Canny 对透明玻璃瓶管用吗? A:部分管用。Canny 检的是边缘,透明物的边缘弱。改用 Depth ControlNet 或训 LoRA。

Q:从零做包装 mockup 怎么办? A:用专门的 mockup 工作流(Smart Mockups、Placeit、或 Photoshop smart object 模板)+ 叠 AI 出的标签。比让模型凭空发明包装干净得多。

Q:为什么我的 logo 出得几乎对但就是差一点? A:logo 在模型里是被光栅化、近似还原的图像特征。品牌关键的稿子,永远在 AI 渲染之上叠真矢量 logo。

相关阅读

标签: #ai-image #排查 #产品 #controlnet