AI 视频音画不同步修复

嘴在动、鼓在响,但音轨比画面早或晚。在 CapCut、Premiere 用音频偏移修,或换音画一体的模型,或干脆剥掉重 mux。

你生成了一段带音频的视频,结果音轨明显跟画面对不上。鼓点早了半拍、台词在嘴动完之后才出来、走到一半脚步声直接没了。这跟人脸生成器的嘴型不准不一样——这是音频和视频本来就是两次独立生成、然后硬拼在一起,没有共享时码。修复方式要么换一个能一次性产出音画同步的模型重渲,要么在 CapCut、Premiere 或 DaVinci Resolve 里手动把音频前后挪。

常见原因

按踩坑频率排序。

1. 音频是单独一次生成

Runway Gen-3、Pika 2.0、Kling 1.6 这类工具只出无声视频,你后来用 ElevenLabs、Suno 或素材库的音频加上去。两次生成没有共享时码,任何节拍点之间的延迟都会在整段里累积放大。

怎么判断:打开工程文件。如果音频轨是单独导入的,那就是两段拼接结构,漂移一定会累积。

2. 导出时帧率不一致

模型按 24 fps 渲染,但导出管线按 30 fps 处理。音频走真实时间,视频被拉慢或拉快,两者线性发散。10 秒之内就能听出来。

怎么判断:用 ffprobe -v error -show_entries stream=r_frame_rate input.mp4 看源帧率,跟你剪辑序列的 fps 对比。

3. 带音频的模型中途丢掉音频

Sora with audio、Veo 3、Kling Audio 偶尔会在 8 秒的片子里只出 4 秒音频,后面视频继续播但是哑的。

怎么判断:拉音频波形。如果画面还在跑,音频波形已经平了,那是生成端缺陷,不是同步问题。

4. 源文件是可变帧率(VFR)

手机录屏生成界面、或者从某些平台下载的片源,往往是 VFR。剪辑软件转换不好就会累积漂移。

怎么判断ffprobe -select_streams v -show_entries frame=pkt_pts_time 看帧间隔是否恒定。不恒定就是 VFR。

5. 转码或封装把时间戳改坏了

你用 HandBrake 或在线转换器跑了一遍,音频 PTS 被改错。

怎么判断:原下载文件同步是好的,转换后变坏。永远先测原始文件。

最短修复路径

Step 1:先量出漂移方向和大小

挑一个显眼的视觉节拍(一个拍手、关门、鼓点),在音频波形上找对应峰值,量帧偏移。

# Premiere / Resolve / CapCut
- 时间线放大到单帧
- 在 V1 视觉事件位置打 marker
- 在 A1 音频峰值位置打 marker
- 差值就是漂移帧数
- 除以 fps 换算秒:24 fps 下 6 帧 = 0.25 秒

漂移恒定就是 offset 问题,漂移随时间增长就是 fps 不匹配。

Step 2:恒定漂移用音频偏移

# CapCut
- 右键音频 -> 分离
- 按测得的帧数前后拖
- 或选中后按 . , 单帧推

# Premiere Pro
- 选中音频,Shift+方向键推 5 帧
- 或 Effect Controls -> Time 里直接设 offset

# DaVinci Resolve
- 选中音频,+ - 键单帧滑
- 或右键 -> Change Clip Speed 精确偏移

Step 3:帧率不齐就先转固定帧率

# ffmpeg 把 VFR 转 CFR
ffmpeg -i input.mp4 -vf fps=24 -c:a copy output.mp4

# 或者用 HandBrake
- Framerate -> Constant Framerate
- Same as source -> 24 fps

# 然后重新导入剪辑,序列也设成 24 fps

Step 4:换音画一体模型重渲

预算够就直接换一次性出同步音频的模型:

# Veo 3 / Veo 3.1
- 每段原生带音频生成
- 环境音 + 对白 + 拟音都锁画面

# Sora with audio
- storyboard prompt 出同步对白
- talking head 嘴型稳定

# Kling Audio (Kling 1.6 Audio 模式)
- 一次性出视频 + 环境音
- 对白不稳,sfx 还行

重写 prompt 示例:

A wooden door slams shut as a person enters a quiet room. 
Synced audio: the slam should land on the visual contact frame. 
Ambient room tone after, no music.

Step 5:兜底是剥音频重 mux

同步音频还是漂、但你有一条更干净的替代音轨:

# 剥掉坏音频
ffmpeg -i broken.mp4 -an -c:v copy video_only.mp4

# 装上新音频
ffmpeg -i video_only.mp4 -i new_audio.wav -c:v copy -c:a aac -shortest final.mp4

AI 音频不行但画面要留的时候很好用。

预防

  • 导入前先把工程序列 fps 锁成源 fps。
  • 对白、sfx 关键的片用 Veo 3、Sora 这种一次性同步音频的模型。
  • 在剪辑软件里用全分辨率回放测同步,不要只看代理预览。
  • VFR 源一律先用 ffmpeg -vf fps=24 转成 CFR。
  • 把原始下载保留在母版文件夹,不要在 HandBrake 转换文件上剪。

标签: #ai-video #排查 #audio-sync