这篇主要解决什么问题
用图片 prompt 思路写视频 prompt 出来的片像静帧。视频要”运动语言、镜头语言、时间语言”——这是图片 prompt 没有的。
这篇适合谁看
用 Sora、Veo、Kling、Runway、Pika 或任何现代 AI 视频模型的人。
什么时候适合用
要拿到能用的片,不是”试试这工具”。
什么时候不建议用
纯探索;长篇叙事视频(2026 年中仍超出 AI 能力)。
具体步骤
- 主体 + 动作(动词最重要):“一只红狐狸正在草地上走”——不是”草地上的红狐狸”。
- 镜头运动:“固定镜头”、“缓推”、“低空向左漂移”、“手持跟拍”。镜头语言是”AI vs 业余”最大区分。
- 时长 / 时间指示:“5 秒,一镜到底,主体在第 1 秒入画”。部分工具吃时间提示。
- 光线 + 风格:“黄金时段,暖逆光,轻雾,胶片颗粒”。
- 运动强度:大多数工具有调节。高 = 变化大。锁定的产品镜头用低运动。
- 构图:“全景,主体右下,左侧给主体走进去的空间”。
- 生成后看:运动漂移、主体跳变、镜头 glitch。任何一个出现就重 roll。
建议的操作流程
5 秒产品 b-roll:主体 + 动作 + 缓推 + 柔窗光 + 5 秒 + 中等运动 → 3 次生成 → 1 个能用 → 剪到 3 秒。
容易踩的坑
- 写一大段。多数视频模型超过 60-80 词开始忽略。
- 只说 “cinematic” 不指镜头——拿到随机的”看着电影感”默认。
- 高运动 + 长片 + 复杂主体 = 漂移泥潭。
- 把第一次生成当最终结果。视频的废片率比图片高。
进阶技巧
- 一组片:镜头语言跨片保持一致。剪辑会顺很多。
- 主体跨片一致:image-to-video 比纯文本好用。
- 好用 prompt 存模板,换变量复用。
可直接复制的 Prompt
主体:{一个事物}
动作:{单一动词 / 运动}
镜头:{固定 / 推 / 摇 / 航拍}
时长:{秒},一镜到底
光线:{方向 + 情绪 + 氛围}
运动:{低 / 中 / 高}
构图:{取景 + 主体位置 + 留白}
FAQ
- 哪个 AI 视频工具最好?: 看场景。Sora / Veo 跟 prompt 跟质量;Kling / Pika 易接入;Runway 编辑器集成。在你风格上实测。
- 为什么最后一秒崩?: 模型经常在尾秒退化。生比需要长,剪掉尾巴。