你出了一张产品 hero 图,灯光高级、背景像 agency 拍的——但瓶身本该是直边的地方有弧度,包装盒侧面有点波浪,正面 logo 糊成一个近似形。对真实产品来说,AI 没办法凭空准确画出你的包装。修复不是改 prompt,而是用 ControlNet 锁轮廓、对产品区域 mask 重画,或者直接把真品照片合成到 AI 出的背景里。
常见原因
按命中率排序。
1. 模型从没见过你的产品(最常见根因)
扩散模型只知道”瓶子""盒子""手机”这些抽象类别,没办法仅凭文字还原你具体产品的轮廓、压花、标签布局。任何纯文字生成的有品牌产品图,都是模型在幻想一个合理的包装。
如何判断:在用纯文字 prompt 出真实有品牌的产品吗?是 = 根因就是这个,调多少 prompt 都修不了。
2. 没有任何轮廓约束
模型从”瓶子”或”盒子”里挑一个泛型形状自由发挥。没有 ControlNet Canny / Depth / 参考图,每张图轮廓都不同。
3. 风格化和写实打架
“安迪沃霍尔风格的可乐瓶照”——模型会把瓶身往沃霍尔方向变形,轮廓就垮了。
4. 分辨率不够画清细节
压花 logo、标签上的小字、产品的细长部分(手柄、瓶嘴、瓶盖)需要像素预算。1024x1024 的瘦高瓶 hero 图,瓶子只有大约 200 像素宽,根本撑不起标签清晰度。
5. 相机角度 / 透视不在训练数据里
模型熟悉目录式正面和四分之三侧产品图。俯拍、虫眼仰拍、极端角度推到训练稀疏区,形状就变形。
6. 一张里有多个产品
六瓶装组合图、starter set 套件。每个单品都要正确,即使有约束,单品之间也在抢精度预算。
动手前先确认
- 想清楚到底要不要”真产品本人”出镜,还是”像产品的占位”够用。概念图能接受占位,商用稿不行。
- 把出问题那张图的 seed、prompt、模型、档位存下来。
- 至少准备一张干净背景的真品参考照。
- 用途确认。印刷比网页要求高;包装 mockup 要像素级正确的标签。
需要收集的信息
- 完整 prompt、模型、seed、sampler、步数、宽高比。
- 一张干净背景的真品参考照。
- 必须读对的关键特征(logo 位置、标签颜色、轮廓曲线)。
- 交付尺寸和用途(网页 hero、印刷海报、社交卡片)。
一步步修复
按 ROI 排序。Step 1 + Step 4 就是商用稿的标准生产流程。
Step 1:用 ControlNet 锁轮廓
最大幅度的动作是把纯文字换成从真品照上来的结构约束:
- SDXL / A1111 / ComfyUI:用产品照(轮廓干净)做 Canny ControlNet,权重 1.0 严格遵循。
- SDXL 备选:瓶 / 罐这种圆弧表面用 Depth ControlNet。
- Flux:ComfyUI 里用 Flux ControlNet(Union 变体),支持 Canny 和 Depth。
- Midjourney:用
--sref+--sw 100锁风格,配合--cref做对象引用。
这一步锁住了轮廓。模型负责灯光、环境、表面质感,形状是你的。
Step 2:给产品区域更多像素
挑能让产品占更多像素的构图:
- 瘦高产品 → 竖比例。
- 横长产品 → 横比例。
- 方正产品 → 方比例。
- 环境不是主角的话,构图更紧。
Step 3:去掉 prompt 里的风格打架
砍掉重风格修饰。先放摄影描述:
product photography, studio lighting, sharp focus, clean background,
[产品描述], shot on Hasselblad
风格修饰留给背景和灯光,不要落到产品表面上。
Step 4:直接把真产品合成进去
商业 hero 图的标准生产流程:
- AI 出图时用产品占位(空白白瓶 / 空白盒)。
- 拿到 AI 的背景和灯光。
- 从真品照里把产品抠出来。
- 把抠出来的真品摆进 AI 背景里。
- 用一层柔投影和整体调色把灯光方向和色调对上。
90% 的商业 hero 活,这种做法比硬怼 ControlNet 到完美要更快、更准。
Step 5:对产品区域 mask 重画
构图锁死、但形状还差:
- mask 罩住产品区域。
- 走 img2img inpaint,保留 ControlNet。
- denoise 降到 0.3-0.4,在保留轮廓的同时精修表面细节。
Step 6:换更强的模型
Flux Pro、Midjourney v7、Imagen 3 在产品轮廓上明显强于 SDXL 原版和老模型。标签清晰度 Ideogram 2 最强,因为它对短文字最稳。
怎么确认已经修好
- 把生成图按同比例叠到参考图上。轮廓边缘应在 2-3 像素以内对齐。
- 100% 看 logo 和标签。字母能读、拼写对。
- 包装盒的直边应该是直的,不能有波浪。
- 瓶 / 罐这种轴对称物,轮廓两侧应该镜像。
- 多单品组合,每一个都过上面这些检查。
长期预防
- 任何商业产品稿,默认走 ControlNet + 合成,不要靠纯文字。
- 给每个会做 hero 图的产品维护一组干净参考照。
- 产品稿默认 Flux Pro 或 Midjourney v7。SD 1.5 直接弃用。
- 准备一段产品摄影 prompt 模板,把重风格修饰从产品本身上踢出去。
- 标签和 logo 永远走合成,从真品图或矢量文件里拿,不要相信模型。
常见坑
- 重摇 20 次等模型把你产品画对。它不会的。
- 在 prompt 里加 “accurate product shape” 期待奇迹,没什么用。
- 合成产品时不对齐灯光方向。合成感一眼能看出来。
- 忘了 100% 看标签。标签错在缩略图下是看不出的。
FAQ
Q:训一个 LoRA 能让模型学会我的产品吗? A:SDXL 和 Flux 都行。20-50 张产品照训出来的 LoRA,对轮廓和标签的保真度都很稳。如果是经常出 hero 图的产品,值得搭这个工作流。
Q:ControlNet Canny 对透明玻璃瓶管用吗? A:部分管用。Canny 检的是边缘,透明物的边缘弱。改用 Depth ControlNet 或训 LoRA。
Q:从零做包装 mockup 怎么办? A:用专门的 mockup 工作流(Smart Mockups、Placeit、或 Photoshop smart object 模板)+ 叠 AI 出的标签。比让模型凭空发明包装干净得多。
Q:为什么我的 logo 出得几乎对但就是差一点? A:logo 在模型里是被光栅化、近似还原的图像特征。品牌关键的稿子,永远在 AI 渲染之上叠真矢量 logo。
相关阅读
标签: #ai-image #排查 #产品 #controlnet