你生成 6 秒人物片段——到第 4 秒人脸已经悄悄变了。眼睛略不同、下巴更宽、头发分缝换了边。还认得出是同一个人,但不完全。多段累积更糟:第 5 段已经是完全不同的人。
视频模型没有显式的”身份追踪”。它根据前一帧 denoise 下一帧,小误差累积。片段越长、动作越大,漂得越快。
常见原因
按命中率从高到低:
1. 片段太长,超出模型一致性窗口
Runway Gen-3、Pika、Kling、Luma 大致 3-4 秒内身份稳定;超过就累积漂。某些工具号称 10s 但实际只在前 4-5s 保持干净身份。
如何判断:第 2 秒还好,第 5 秒后开始漂——片段太长。
2. 没参考图(仅文生视频)
纯文生视频零身份锚。模型每次 denoise 自己造一张脸,任其漂。
如何判断:你在用文生视频且没起始帧——换图生视频。
3. 每段用不同的参考图
第 1 段用参考 A,第 2 段用”重新生成的同一角色”参考 B。每次重新生成相似度即使 90%,跨项目也累积。
如何判断:每段用了不同参考——所有段必须用同一张。
4. 动作强度过高
高动作 = 每帧 denoising 偏移更大 = 身份漂得更快。轻动作给模型更多机会保留特征。
如何判断:Runway 动作 5+、Pika 0.6+、Kling “intense”——降一档。
5. 主体侧脸或部分被遮挡
脸侧面、被遮挡、或动得快时,模型可锚定的特征少了。漂加速。
如何判断:片段里人物转头、走过遮挡物、或极端角度拍摄。
6. 工具 / 模型版本身份保留弱
某些版本(Pika v1.0、早 Runway Gen-2)身份保留弱。新版明显更好。
如何判断:同 Prompt 跑新版本身份稳定——升级。
最短修复路径
Step 1:整个项目锁一张”基准参考图”
# 流程
1. 跑或挑一张高质量角色参考图
(正面、表情中性、光线均匀、≥1024×1024)
2. 存为 `character_REFERENCE.png` —— 不要重新生成
3. 项目里每段都用这张 PNG
4. 不要为第 2 段"重新生成另一张相似参考"——必须用同一张
单这一条消除跨段 60-70% 的身份漂。
Step 2:单段控制在 4 秒内
# Runway Gen-3 Alpha
- 4s 单段最稳
- 需要 8s 就生成两个 4s 再拼
# Pika 2.0
- 5s 最大推荐
- 慎用 "extend",extend 会漂身份
# Kling 1.6
- 5s 标准、10s 高端
- 人物工作保持 5s
# 长序列策略
- 把叙事拆成 3-5s 镜头
- 每个镜头用同一张参考
- CapCut / Premiere / DaVinci 拼接
Step 3:动作强度降一档
# Runway: 5 → 3
# Pika: 0.6 → 0.4
# Kling: "intense" → "moderate"
# Luma: high → medium
动作小 = 每帧偏移小 = 身份稳。
Step 4:构图让脸尽量正面
# 角色片段的姿态 / 构图
- 脸大致面向镜头(不全侧脸)
- 不要快转头
- 不要走过大前景物体
- 半身或中景特写(脸在画面里大)
剧本必须用侧脸镜头时,控制在 2s 内。
Step 5:每段生成后并排 QC
每次生成后:
1. 打开片段
2. 截首帧和末帧
3. 并排看
4. 像不同人就重生成
5. 不要在已知漂的段后接 N+1
段级 QC 防止项目级漂。
Step 6:升级到新版本 / 用角色锁功能
# 用新版
- Runway Gen-3 Alpha v2+
- Kling 1.6(比 1.0 好)
- Pika 2.0(比 1.x 好)
# 带角色锁功能的工具
- Runway "Character Consistency" 模式(Gen-3)
- Kling "Character Reference" 模式
- HeyGen "Avatar" 功能
预防建议
- 前期规划多段叙事:列每个镜头、标记哪些用同一角色、存参考图
- 人物工作默认用图生视频;B-roll 才用文生视频
- 设计上保持镜头短;长 = 更漂;按短镜头剪辑设计整体
- 每段都 QC 身份再做下一段