AI 视频人物中途漂移:6 类原因 + 6 步修复路径

同一人物几秒后五官就变了?单段控制在 4s 内、永远用同一张基准参考图、动作强度降一档。

你生成 6 秒人物片段——到第 4 秒人脸已经悄悄变了。眼睛略不同、下巴更宽、头发分缝换了边。还认得出是同一个人,但不完全。多段累积更糟:第 5 段已经是完全不同的人。

视频模型没有显式的”身份追踪”。它根据前一帧 denoise 下一帧,小误差累积。片段越长、动作越大,漂得越快。

常见原因

按命中率从高到低:

1. 片段太长,超出模型一致性窗口

Runway Gen-3、Pika、Kling、Luma 大致 3-4 秒内身份稳定;超过就累积漂。某些工具号称 10s 但实际只在前 4-5s 保持干净身份。

如何判断:第 2 秒还好,第 5 秒后开始漂——片段太长。

2. 没参考图(仅文生视频)

纯文生视频零身份锚。模型每次 denoise 自己造一张脸,任其漂。

如何判断:你在用文生视频且没起始帧——换图生视频。

3. 每段用不同的参考图

第 1 段用参考 A,第 2 段用”重新生成的同一角色”参考 B。每次重新生成相似度即使 90%,跨项目也累积。

如何判断:每段用了不同参考——所有段必须用同一张。

4. 动作强度过高

高动作 = 每帧 denoising 偏移更大 = 身份漂得更快。轻动作给模型更多机会保留特征。

如何判断:Runway 动作 5+、Pika 0.6+、Kling “intense”——降一档。

5. 主体侧脸或部分被遮挡

脸侧面、被遮挡、或动得快时,模型可锚定的特征少了。漂加速。

如何判断:片段里人物转头、走过遮挡物、或极端角度拍摄。

6. 工具 / 模型版本身份保留弱

某些版本(Pika v1.0、早 Runway Gen-2)身份保留弱。新版明显更好。

如何判断:同 Prompt 跑新版本身份稳定——升级。

最短修复路径

Step 1:整个项目锁一张”基准参考图”

# 流程
1. 跑或挑一张高质量角色参考图
   (正面、表情中性、光线均匀、≥1024×1024)
2. 存为 `character_REFERENCE.png` —— 不要重新生成
3. 项目里每段都用这张 PNG
4. 不要为第 2 段"重新生成另一张相似参考"——必须用同一张

单这一条消除跨段 60-70% 的身份漂。

Step 2:单段控制在 4 秒内

# Runway Gen-3 Alpha
- 4s 单段最稳
- 需要 8s 就生成两个 4s 再拼

# Pika 2.0
- 5s 最大推荐
- 慎用 "extend",extend 会漂身份

# Kling 1.6
- 5s 标准、10s 高端
- 人物工作保持 5s

# 长序列策略
- 把叙事拆成 3-5s 镜头
- 每个镜头用同一张参考
- CapCut / Premiere / DaVinci 拼接

Step 3:动作强度降一档

# Runway: 5 → 3
# Pika: 0.6 → 0.4
# Kling: "intense" → "moderate"
# Luma: high → medium

动作小 = 每帧偏移小 = 身份稳。

Step 4:构图让脸尽量正面

# 角色片段的姿态 / 构图
- 脸大致面向镜头(不全侧脸)
- 不要快转头
- 不要走过大前景物体
- 半身或中景特写(脸在画面里大)

剧本必须用侧脸镜头时,控制在 2s 内。

Step 5:每段生成后并排 QC

每次生成后:

1. 打开片段
2. 截首帧和末帧
3. 并排看
4. 像不同人就重生成
5. 不要在已知漂的段后接 N+1

段级 QC 防止项目级漂。

Step 6:升级到新版本 / 用角色锁功能

# 用新版
- Runway Gen-3 Alpha v2+
- Kling 1.6(比 1.0 好)
- Pika 2.0(比 1.x 好)

# 带角色锁功能的工具
- Runway "Character Consistency" 模式(Gen-3)
- Kling "Character Reference" 模式
- HeyGen "Avatar" 功能

预防建议

  • 前期规划多段叙事:列每个镜头、标记哪些用同一角色、存参考图
  • 人物工作默认用图生视频;B-roll 才用文生视频
  • 设计上保持镜头短;长 = 更漂;按短镜头剪辑设计整体
  • 每段都 QC 身份再做下一段

相关阅读

标签: #视频生成 #排查 #排查