电影感视频和”AI 拍出一段好看的画面”是两码事。前者关心的是镜头语言、调度、节奏、色调;后者只是一帧好看的图动起来。本文给出 10 套可直接复制的 AI 电影感视频 Prompt 模板,覆盖一镜到底、长镜头跟随、Dutch Angle、慢动作、对话戏等典型场景。
AI 电影感视频 Prompt 的七层结构
- 场景:地点 / 时间 / 氛围
- 主体动作:人物或物体在做什么
- 镜头语言:dolly in、tracking shot、orbit、Dutch angle、whip pan
- 机位与焦段:35mm wide / 50mm / 85mm anamorphic
- 光线:自然光 / 实景光(practical lights)/ 影棚布光
- 色调与胶片感:anamorphic、film grain、color grade 引用
- 节奏与时长:起手、动作、收尾的 3 段叙事
经验:电影感视频 Prompt 里,对镜头语言的描述比对画面的描述权重大得多。写
slow dolly in比写cinematic重要 5 倍。
10 个可直接复制的 Prompt 模板
1. 缓推近景(人物注视镜头)
最适合模型: Veo(写实人物 + 微表情 + 自然窗光,Veo 3 最稳)。
Slow cinematic dolly-in toward a 28-year-old woman sitting at a rain-lit window, her gaze gradually meeting the camera in the last second
Camera: 50mm anamorphic, shallow depth of field, slow steady push
Lighting: cool blue evening light through window, single warm practical lamp on her face
Color: teal-and-amber grade, deep shadows, slight film grain
Mood: introspective, quiet, narrative beat
Duration: 5 seconds, slow paced
Aspect: 2.39:1 anamorphic
适合:开篇镜头、情感铺垫、片头氛围。
2. 一镜到底跟随(行走中)
最适合模型: Sora(霓虹 + 湿地反光 + 跟随长镜头是 Sora 的招牌组合)。
Cinematic tracking shot following a young man walking through a Tokyo back alley at dusk, camera follows from behind at hip height, steady gimbal motion
Camera: 35mm wide, slight handheld feel, smooth follow
Lighting: warm neon signs reflecting on wet pavement, mixed magenta and cyan glow
Color: high contrast night cinema, slight teal shadows, warm highlights
Mood: contemplative urban wander, In the Mood for Love-style
Duration: 8 seconds, walking pace
Aspect: 2.39:1
镜头描述用 tracking shot following from behind, hip height 比 cinematic 更有用。
3. 慢动作动作戏
最适合模型: Sora(慢动作物理 + 水滴飞溅 + 风格化光线,Sora 表现最稳)。
Slow-motion cinematic shot of water splashing as a runner sprints through a shallow puddle
Camera: 50mm, low angle close to ground, slight tilt up, smooth tracking
Lighting: golden hour backlight, water droplets glistening
Frame rate: 240fps slow motion playback, hyper-real detail
Color: warm cinematic grade, subtle teal in shadows
Mood: kinetic, epic, sport commercial energy
Duration: 4 seconds slow-mo, single hero motion
Aspect: 2.39:1
240fps slow motion playback 是关键,比 slow motion 单独写权重大。
4. 对话双人镜头(OTS 过肩)
最适合模型: Veo(带台词、口型同步、环境音都能一次生成,Sora 和 Kling 做不到)。
Cinematic over-the-shoulder shot of two people having an intense conversation at a small wooden table in a dim cafe, focus on the listener's face
Camera: 85mm shallow depth, OTS framing, listener in focus, speaker's shoulder soft in foreground
Lighting: single warm practical pendant lamp overhead, cool ambient blue from window
Color: classic cinema grade, warm-cool split
Mood: emotional tension, quiet conflict, A24 film feel
Duration: 6 seconds, subtle micro-expression change
Aspect: 2.39:1
dialogue: speaker — "你早就知道了,对吧?"
ambient: low cafe murmur, coffee machine hiss
A24 film feel 这类参考词模型识别度很高。
5. Dutch Angle / 倾斜构图
最适合模型: Sora(风格化、超现实、低饱和恐怖片调色,Sora 最对路)。
Cinematic Dutch angle shot of a corridor in an abandoned hospital, camera tilted 20 degrees, slow dolly forward into the depth
Camera: 35mm wide, anamorphic flare, tilted frame
Lighting: flickering fluorescent overhead, deep shadow pockets, cold blue temperature
Color: desaturated horror cinema grade, slight green tinge in shadows
Mood: unsettling, ominous, tension building
Duration: 6 seconds, slow forward
Aspect: 2.39:1
Dutch Angle 一定要写明 tilted X degrees,模型才能稳定输出。
6. Epic 风景广角
最适合模型: Sora 或 Kling(西方山脉用 Sora;如果是黄山、张家界等中国山景,Kling 识别度更高,也能跑 10 秒以上长镜头)。
Sweeping aerial cinematic shot rising up over a misty mountain range at dawn, slowly revealing a lone figure on a cliff edge
Camera: drone, wide 24mm, slow vertical rise and slight push forward
Lighting: dawn golden hour, mist filling valleys, sun cresting horizon behind
Color: warm pastel grade with deep blue shadow valleys, cinematic LUT
Mood: epic, contemplative, opening title card
Duration: 8 seconds, slow ascend
Aspect: 2.39:1
drone, wide 24mm, slow vertical rise 这种”航拍 + 起势”的描述对 Sora / Veo 反应很好。
7. 城市夜景空镜
最适合模型: Sora(赛博朋克霓虹 + 高饱和洋红青色,Sora 的风格化色彩最强;如果是香港、上海等中国都市,Kling 也行)。
Cinematic time-lapse of Hong Kong skyline at dusk turning into night, camera locked off, neon signs gradually intensifying
Camera: static tripod, 35mm, deep focus
Lighting: natural dusk transition to night, neon signs and car trails accelerating
Color: cyberpunk neon grade, high saturation magenta and cyan
Mood: city pulse, energy, atmospheric opener
Duration: 6 seconds, dusk-to-night transition
Aspect: 2.39:1
时延镜头(time-lapse)适合做开场和过场,比生成动作镜头稳得多。
8. 主观视角(POV)
最适合模型: Sora(POV 风格化 + 火把光晕 + 复杂运动镜头,Sora 最稳)。
Cinematic POV shot from a character walking up a stone spiral staircase in an ancient castle, torchlight flickering on walls, hand holding torch enters frame from below
Camera: 24mm wide, slight handheld feel, gimbal-stabilized
Lighting: warm torchlight only, deep shadows in stone walls
Color: warm orange highlights, deep blue shadows, slight grain
Mood: tense exploration, dungeon crawl, RPG cinematic
Duration: 7 seconds, walking up
Aspect: 16:9
POV 视角 Sora 和 Runway 都能稳定,关键词是 POV from character + hand entering frame。
9. 静物特写(产品广告感)
最适合模型: Veo(写实物理 + 液体折射 + 商业感写实质感,Veo 3 默认就能跑)。
Cinematic macro shot of a single drop of water falling into black coffee in slow motion, ripple expands across surface
Camera: 100mm macro, dead-center, extreme close-up
Lighting: hard top key light, deep black background, single rim light from behind cup
Color: rich amber and black, high contrast, premium commercial grade
Mood: luxurious, slow, indulgent
Duration: 3 seconds, single hero action
Aspect: 16:9
广告类静物镜头,加 100mm macro 和 single hero action 几乎不会翻车。
10. 双人快慢节奏交替
最适合模型: Kling(10 秒长单镜头是 Kling 的强项;Sora Pro 也行,但 Plus 不够长)。
Cinematic sequence of a young couple dancing in a sunlit empty ballroom, sequence transitions from slow waltz close-up to spinning wide shot, motion-matched cuts
Camera: starts 85mm shallow close on hands, transitions to 24mm wide spinning around the couple, smooth steadicam
Lighting: warm afternoon sunlight through tall windows, soft golden particles in air
Color: dreamy warm grade, soft highlights, slight film bloom
Mood: nostalgic, romantic, La La Land aesthetic
Duration: 10 seconds, two-shot sequence
Aspect: 2.39:1
电影长片才有的”镜头切换”模型逐渐能做,关键写明 transitions from X to Y, motion-matched cuts。
Sora vs Veo vs Kling:哪个模型擅长哪种镜头
上面每个模板都标了”最适合模型”,原因如下:
- Sora:风格化电影感。复杂镜头运动(dolly、tracking、航拍、一镜到底)、超现实 / 抽象主体、霓虹和黄金时刻色彩、城市夜景、低多边形风格化。Plus 单段 5 秒,Pro 可到约 20 秒。1080p。没有原生音频,需要在后期配音。
- Veo(2026 年是 Veo 3):真实物理、自然光、对话与口型同步、写实人物、原生同步音频(对话 + 环境音 + 配乐一次生成)。默认约 8 秒。1080p。风格化和超现实变形偏保守。
- Kling:中国地理和文化场景特别强(黄山、张家界、梯田、灯笼节、雪山、传统建筑),单段时长可到 10 秒以上,队列费用通常最便宜。720p–1080p。西方明星脸和复杂西方建筑较弱。
选模型时的快速规则:
- 镜头需要对话、口型同步或环境音 → Veo。
- 镜头是风格化、超现实、或围绕复杂运动展开 → Sora。
- 镜头是中国场景 / 长单镜头 / 预算敏感 → Kling。
三家的镜头工程小差异
| Sora | Veo 3 | Kling | |
|---|---|---|---|
| 支持比例 | 16:9, 9:16, 1:1 | 16:9, 9:16 | 16:9, 9:16, 1:1 |
| 单段最长时长 | 约 5 秒(Plus),Pro 可到约 20 秒 | 约 8 秒 | 10 秒,更长档位可选 |
| 分辨率 | 1080p | 1080p | 720p–1080p |
| 原生音频 | 无 | 有(对话 + 环境音 + 配乐) | 无 |
| 音频 Prompt 语法 | n/a | 可加 dialogue: 和 ambient: 行,模型会同步生成音轨 | n/a |
| 单次生成成本 | 中等 | 最高 | 通常最便宜 |
| 弱项 | 手指、画面文字、人声同步 | 重风格化、超现实变形 | 西方人脸、复杂西方建筑 |
实际应用:如果分镜里只有一两个镜头需要同步台词,把那一两个镜头放到 Veo 生成,其余镜头放到 Sora 或 Kling,不要逼一个模型全做。
镜头语言速查表(最常用)
| 想要 | 关键词 |
|---|---|
| 缓慢推进 | slow dolly in |
| 后撤拉远 | slow dolly out / pull back reveal |
| 跟随人物 | tracking shot following [subject] |
| 环绕 | slow orbital shot around [subject] |
| 仰拍英雄镜头 | hero low-angle shot |
| 俯拍上帝视角 | top-down god's-eye view |
| 摇镜头 | slow pan from left to right |
| 急转镜头 | whip pan transition |
| 手持感 | handheld shaky feel, slight motion |
| 升降 | crane shot, slow vertical rise |
色调引用速查
| 想要 | 写法 |
|---|---|
| 王家卫 | In the Mood for Love color grade, warm reds, deep teals |
| Drive 电影 | Drive movie grade, magenta and cyan neon |
| Wes Anderson | Wes Anderson color palette, pastel symmetry |
| Blade Runner 2049 | Blade Runner 2049 grade, amber haze and cyan |
| Christopher Nolan | Nolan film grade, desaturated, clinical |
| A24 | A24 film aesthetic, naturalistic |
| Studio Ghibli | Studio Ghibli color palette, warm pastoral |
容易踩的坑
- 只写”电影感”:
cinematic这个词单独使用模型基本忽略。要给具体镜头 / 色调 / 参考。 - 动作太复杂:5 秒镜头里写”走到桌前,拿起杯子,转身看窗外”——AI 视频生成几乎做不到。一个镜头一个动作。
- 不指定时长 / 节奏:写
duration: 5 seconds, slow paced比不写好得多。 - 机位漂移:要么明确
static tripod,要么明确slow dolly in。不写的话模型自己乱晃。 - 多镜头切换:当前主流 AI 视频模型还不能稳定做多镜头剪辑。建议生成单镜头,再用剪辑软件拼。
下一步怎么改得更好
- 分镜先行:先在纸上画 4-6 个分镜,每个分镜单独生成 5 秒视频,最后拼起来。
- 音乐先做:先决定音乐和节奏,每个镜头按音乐节拍设计动作时长。
- 同色调一致:所有镜头的 Color 段保持一致,避免成片色调断层。
- 稳定的镜头优先:dolly in / static / slow tracking 比复杂运动稳定得多。复杂镜头放在 hero shot 单点突破。
FAQ
Q:Sora / Runway / Veo / Kling 哪个对电影感最好? 截至 2026 年中,Sora 和 Veo 在镜头语言和物理一致性上最强,Kling 在长镜头和人物动作上不错,Runway Gen-3 在艺术风格化镜头上灵活。具体选哪个看预算和访问权限。
Q:怎么避免人物变形? 减少剧烈动作、避免脸部特写大幅旋转、动作时长 ≤ 5 秒。详见 AI 视频动作不连贯怎么办。
Q:怎么让多个镜头风格统一? 所有镜头的 Lighting + Color + Aspect 三层保持一致,每个 Prompt 末尾贴同一段”color grade reference”。
Q:可以用这些 Prompt 商用吗? 看各模型的许可证:Sora(OpenAI)通常允许付费用户商用、Veo(Google)按计划而定、Runway 付费允许、Kling 国内商用见其条款。商用前请核对当前条款。
Q:怎么生成图转视频(保留人物特征)? 看 AI 图片转视频 Prompt。从图开始能极大稳定人物一致性。