你用 Runway / Pika / Kling 出了一段片。前景主体还行,但背景坐不住——树叶在不同形状之间频闪、霓虹灯字几帧就换、远处人物忽隐忽现、砖墙扭曲。背景闪烁是最干扰观感、最难忽略的 AI 视频伪影。修复几乎一定是简化背景、只留一个运动源、或者换一个时间一致性更强的模型。
常见原因
按命中率排序。
1. 背景描述太细
Crowded bustling night market with neon signs, steam, hanging lanterns, motorbikes, food stalls, crowds of people, rainy ground reflections——每个元素都被模型每帧独立重渲,因为没有时间锚点。高频元素(树叶、人群、图案墙)最先闪、闪得最厉害。
如何判断:数背景描述里的独立元素。超过 3 个就在闪烁区间。
2. 镜头运动和主体运动打架
prompt 写 “tracking shot following a runner”。模型既要让背景跟随镜头一致地动,又要让主体动。两个运动源同时活跃,模型容易搞不清背景像素该去哪、各帧重渲不一致。
如何判断:每 5 帧暂停一次,看背景元素。建筑边缘或树枝位置不一致,就是镜头 + 主体运动在打架。
3. Motion 强度太高
和漂移同源:高 motion 设置下模型发明运动,背景里发明运动就意味着发明新像素,本质就是闪烁。
4. 模型对高频纹理弱
树叶、头发、布料织纹、砖纹、人群特写——这些是高频信息区。当前大多数视频模型在高频区时间一致性更弱。砖墙和树叶是”永远会闪”的经典区域。
5. 宽高比和模型训练不匹配
部分模型主要用 16:9 横屏视频训练。要求 9:16 竖屏会在训练较少的区域降低时间一致性。Pika 在极端比例下尤其明显。
6. 场景和工具不匹配
Runway、Pika、Kling、Sora 各有强项。有的擅长静态背景 + 主体运动;有的擅长运动镜头 + 锁定主体。场景类型选错工具就是闪烁。
7. 短片塞了太多运动预算
3 秒片要大幅镜头或场景变化,会强行塞进大量空间过渡,时间一致性必然崩。
动手前先确认
- 把 prompt、模型、闪烁输出片段都存好。
- 找出闪得最厉害的背景元素(招牌、树叶、人群、墙)。
- 想清楚用例能不能裁掉或者模糊闪的那块。
- 记下宽高比和片长。
- 改 prompt 前先备份。
需要收集的信息
- 完整 prompt、模型名、版本、motion 设置。
- 片长、宽高比、fps。
- 闪烁最明显的具体时间点。
- 同一 prompt 换简化背景还会不会闪。
最短修复路径
Step 1:背景砍成一个短名词短语
把:
crowded bustling night market with neon signs, steam, hanging lanterns,
motorbikes, food stalls, crowds of people, rainy ground reflections
换成:
soft out-of-focus city lights at night, blurred background
背景高频元素越少,闪得越少。加 bokeh、blurred background、shallow depth of field 把背景推到失焦——模型要渲染的细节少了,一致性就上来了。
Step 2:只留一个运动源
镜头动就锁住背景:
slow camera push-in, static background, no parallax movement,
background remains still
背景动(雨、风、烟)就锁住镜头:
static camera, no pan, no zoom, gentle rain falling in background
3 秒片绝不让两边都动。5+ 秒更难。
Step 3:降 motion 强度
用最低 motion 重渲。闪烁大幅下降就是 motion 在贡献闪。然后小步往上调。
- Runway:Camera Motion
static或slow - Pika:motion 滑条 0.3-0.5
- Kling:
subtle档 - Sora:最短档
Step 4:换模型
各模型背景稳定性默认差很多。2025-2026 大致强项:
- Runway Gen-3 Alpha:静态背景 + 主体运动强
- Kling 1.6:中等镜头运动下背景一致性强
- Pika 1.5:风格化背景强,写实人群弱
- Sora:简单场景最强,人群挣扎
Runway 上场景需要动人群,换 Kling。Pika 上需要写实砖石,换 Runway。
Step 5:转图生视频 + 静态参考
先用 Midjourney / Imagen / Flux 出一张场景的静态图,再把这张 PNG 当参考喂给视频工具。参考图给模型一个强背景锚点,闪烁大幅下降。
Step 6:用背景蒙版 / motion brush
Runway Motion Brush 和 Kling 参考锁允许你刷出哪块该不动、哪块该动。把背景刷成”不动”,只让主体动。刷过的区域闪烁消失。
Step 7:背景静态化 + 后期合成
场景允许的话,背景出成静态图,主体在简洁底色(类似绿幕)上生成,剪辑器(Premiere、DaVinci Resolve)里合成。背景就是一张 JPEG,不会闪。
怎么确认已经修好
- 25% 速度看片,背景元素帧间不应该明显变形或位移。
- 每 12 帧暂停一次,背景应该几乎一样。
- 同设置出 3 段,3 段都稳,不只是运气好那一次。
- 注意力放在主体上的观众,不会被背景运动分心。
如果还是没修好
- 片长缩到 2 秒。闪烁随时间累积,2s 能看出模型本身的稳定性上限。
- prompt 砍到主体 + 极简背景,重生成。然后每次加回一个背景元素,定位触发的那个。
- 换一个根本不同的工具。有些场景在某些模型里就是不行。
- 终交付改成静态背景 + 动态主体合成。
- 求助前打包 prompt、模型、输出、闪烁时间点。
预防建议
- 视频背景默认简单、失焦、模糊。
- 每段片只允许一个运动源(镜头或主体),永不同时。
- 需要特定背景的场景,用静态图 + 图生视频的组合。
- 背景稳定性关键时,片长卡在 3 秒以内,更长就拼接。
- 品牌 / 商业用途,走静态背景 + 动态主体合成,不要靠单遍视频生成。