电影感 AI 视频 Prompt:Sora / Veo / Kling 模板

Sora、Runway、Veo、Kling、Pika 上做出电影感短片的 Prompt 模板:镜头语言、灯光、色调、动作设计、节奏控制——10 套结构化模板可直接复制。

电影感视频和”AI 拍出一段好看的画面”是两码事。前者关心的是镜头语言、调度、节奏、色调;后者只是一帧好看的图动起来。本文给出 10 套可直接复制的 AI 电影感视频 Prompt 模板,覆盖一镜到底、长镜头跟随、Dutch Angle、慢动作、对话戏等典型场景。

AI 电影感视频 Prompt 的七层结构

  1. 场景:地点 / 时间 / 氛围
  2. 主体动作:人物或物体在做什么
  3. 镜头语言:dolly in、tracking shot、orbit、Dutch angle、whip pan
  4. 机位与焦段:35mm wide / 50mm / 85mm anamorphic
  5. 光线:自然光 / 实景光(practical lights)/ 影棚布光
  6. 色调与胶片感:anamorphic、film grain、color grade 引用
  7. 节奏与时长:起手、动作、收尾的 3 段叙事

经验:电影感视频 Prompt 里,对镜头语言的描述比对画面的描述权重大得多。写 slow dolly in 比写 cinematic 重要 5 倍。

10 个可直接复制的 Prompt 模板

1. 缓推近景(人物注视镜头)

最适合模型: Veo(写实人物 + 微表情 + 自然窗光,Veo 3 最稳)。

Slow cinematic dolly-in toward a 28-year-old woman sitting at a rain-lit window, her gaze gradually meeting the camera in the last second
Camera: 50mm anamorphic, shallow depth of field, slow steady push
Lighting: cool blue evening light through window, single warm practical lamp on her face
Color: teal-and-amber grade, deep shadows, slight film grain
Mood: introspective, quiet, narrative beat
Duration: 5 seconds, slow paced
Aspect: 2.39:1 anamorphic

适合:开篇镜头、情感铺垫、片头氛围。

2. 一镜到底跟随(行走中)

最适合模型: Sora(霓虹 + 湿地反光 + 跟随长镜头是 Sora 的招牌组合)。

Cinematic tracking shot following a young man walking through a Tokyo back alley at dusk, camera follows from behind at hip height, steady gimbal motion
Camera: 35mm wide, slight handheld feel, smooth follow
Lighting: warm neon signs reflecting on wet pavement, mixed magenta and cyan glow
Color: high contrast night cinema, slight teal shadows, warm highlights
Mood: contemplative urban wander, In the Mood for Love-style
Duration: 8 seconds, walking pace
Aspect: 2.39:1

镜头描述用 tracking shot following from behind, hip heightcinematic 更有用。

3. 慢动作动作戏

最适合模型: Sora(慢动作物理 + 水滴飞溅 + 风格化光线,Sora 表现最稳)。

Slow-motion cinematic shot of water splashing as a runner sprints through a shallow puddle
Camera: 50mm, low angle close to ground, slight tilt up, smooth tracking
Lighting: golden hour backlight, water droplets glistening
Frame rate: 240fps slow motion playback, hyper-real detail
Color: warm cinematic grade, subtle teal in shadows
Mood: kinetic, epic, sport commercial energy
Duration: 4 seconds slow-mo, single hero motion
Aspect: 2.39:1

240fps slow motion playback 是关键,比 slow motion 单独写权重大。

4. 对话双人镜头(OTS 过肩)

最适合模型: Veo(带台词、口型同步、环境音都能一次生成,Sora 和 Kling 做不到)。

Cinematic over-the-shoulder shot of two people having an intense conversation at a small wooden table in a dim cafe, focus on the listener's face
Camera: 85mm shallow depth, OTS framing, listener in focus, speaker's shoulder soft in foreground
Lighting: single warm practical pendant lamp overhead, cool ambient blue from window
Color: classic cinema grade, warm-cool split
Mood: emotional tension, quiet conflict, A24 film feel
Duration: 6 seconds, subtle micro-expression change
Aspect: 2.39:1
dialogue: speaker — "你早就知道了,对吧?"
ambient: low cafe murmur, coffee machine hiss

A24 film feel 这类参考词模型识别度很高。

5. Dutch Angle / 倾斜构图

最适合模型: Sora(风格化、超现实、低饱和恐怖片调色,Sora 最对路)。

Cinematic Dutch angle shot of a corridor in an abandoned hospital, camera tilted 20 degrees, slow dolly forward into the depth
Camera: 35mm wide, anamorphic flare, tilted frame
Lighting: flickering fluorescent overhead, deep shadow pockets, cold blue temperature
Color: desaturated horror cinema grade, slight green tinge in shadows
Mood: unsettling, ominous, tension building
Duration: 6 seconds, slow forward
Aspect: 2.39:1

Dutch Angle 一定要写明 tilted X degrees,模型才能稳定输出。

6. Epic 风景广角

最适合模型: Sora 或 Kling(西方山脉用 Sora;如果是黄山、张家界等中国山景,Kling 识别度更高,也能跑 10 秒以上长镜头)。

Sweeping aerial cinematic shot rising up over a misty mountain range at dawn, slowly revealing a lone figure on a cliff edge
Camera: drone, wide 24mm, slow vertical rise and slight push forward
Lighting: dawn golden hour, mist filling valleys, sun cresting horizon behind
Color: warm pastel grade with deep blue shadow valleys, cinematic LUT
Mood: epic, contemplative, opening title card
Duration: 8 seconds, slow ascend
Aspect: 2.39:1

drone, wide 24mm, slow vertical rise 这种”航拍 + 起势”的描述对 Sora / Veo 反应很好。

7. 城市夜景空镜

最适合模型: Sora(赛博朋克霓虹 + 高饱和洋红青色,Sora 的风格化色彩最强;如果是香港、上海等中国都市,Kling 也行)。

Cinematic time-lapse of Hong Kong skyline at dusk turning into night, camera locked off, neon signs gradually intensifying
Camera: static tripod, 35mm, deep focus
Lighting: natural dusk transition to night, neon signs and car trails accelerating
Color: cyberpunk neon grade, high saturation magenta and cyan
Mood: city pulse, energy, atmospheric opener
Duration: 6 seconds, dusk-to-night transition
Aspect: 2.39:1

时延镜头(time-lapse)适合做开场和过场,比生成动作镜头稳得多。

8. 主观视角(POV)

最适合模型: Sora(POV 风格化 + 火把光晕 + 复杂运动镜头,Sora 最稳)。

Cinematic POV shot from a character walking up a stone spiral staircase in an ancient castle, torchlight flickering on walls, hand holding torch enters frame from below
Camera: 24mm wide, slight handheld feel, gimbal-stabilized
Lighting: warm torchlight only, deep shadows in stone walls
Color: warm orange highlights, deep blue shadows, slight grain
Mood: tense exploration, dungeon crawl, RPG cinematic
Duration: 7 seconds, walking up
Aspect: 16:9

POV 视角 Sora 和 Runway 都能稳定,关键词是 POV from character + hand entering frame

9. 静物特写(产品广告感)

最适合模型: Veo(写实物理 + 液体折射 + 商业感写实质感,Veo 3 默认就能跑)。

Cinematic macro shot of a single drop of water falling into black coffee in slow motion, ripple expands across surface
Camera: 100mm macro, dead-center, extreme close-up
Lighting: hard top key light, deep black background, single rim light from behind cup
Color: rich amber and black, high contrast, premium commercial grade
Mood: luxurious, slow, indulgent
Duration: 3 seconds, single hero action
Aspect: 16:9

广告类静物镜头,加 100mm macrosingle hero action 几乎不会翻车。

10. 双人快慢节奏交替

最适合模型: Kling(10 秒长单镜头是 Kling 的强项;Sora Pro 也行,但 Plus 不够长)。

Cinematic sequence of a young couple dancing in a sunlit empty ballroom, sequence transitions from slow waltz close-up to spinning wide shot, motion-matched cuts
Camera: starts 85mm shallow close on hands, transitions to 24mm wide spinning around the couple, smooth steadicam
Lighting: warm afternoon sunlight through tall windows, soft golden particles in air
Color: dreamy warm grade, soft highlights, slight film bloom
Mood: nostalgic, romantic, La La Land aesthetic
Duration: 10 seconds, two-shot sequence
Aspect: 2.39:1

电影长片才有的”镜头切换”模型逐渐能做,关键写明 transitions from X to Y, motion-matched cuts

Sora vs Veo vs Kling:哪个模型擅长哪种镜头

上面每个模板都标了”最适合模型”,原因如下:

  • Sora:风格化电影感。复杂镜头运动(dolly、tracking、航拍、一镜到底)、超现实 / 抽象主体、霓虹和黄金时刻色彩、城市夜景、低多边形风格化。Plus 单段 5 秒,Pro 可到约 20 秒。1080p。没有原生音频,需要在后期配音。
  • Veo(2026 年是 Veo 3):真实物理、自然光、对话与口型同步、写实人物、原生同步音频(对话 + 环境音 + 配乐一次生成)。默认约 8 秒。1080p。风格化和超现实变形偏保守。
  • Kling中国地理和文化场景特别强(黄山、张家界、梯田、灯笼节、雪山、传统建筑),单段时长可到 10 秒以上,队列费用通常最便宜。720p–1080p。西方明星脸和复杂西方建筑较弱。

选模型时的快速规则:

  • 镜头需要对话、口型同步或环境音 → Veo
  • 镜头是风格化、超现实、或围绕复杂运动展开 → Sora
  • 镜头是中国场景 / 长单镜头 / 预算敏感 → Kling

三家的镜头工程小差异

SoraVeo 3Kling
支持比例16:9, 9:16, 1:116:9, 9:1616:9, 9:16, 1:1
单段最长时长约 5 秒(Plus),Pro 可到约 20 秒约 8 秒10 秒,更长档位可选
分辨率1080p1080p720p–1080p
原生音频有(对话 + 环境音 + 配乐)
音频 Prompt 语法n/a可加 dialogue:ambient: 行,模型会同步生成音轨n/a
单次生成成本中等最高通常最便宜
弱项手指、画面文字、人声同步重风格化、超现实变形西方人脸、复杂西方建筑

实际应用:如果分镜里只有一两个镜头需要同步台词,把那一两个镜头放到 Veo 生成,其余镜头放到 Sora 或 Kling,不要逼一个模型全做。

镜头语言速查表(最常用)

想要关键词
缓慢推进slow dolly in
后撤拉远slow dolly out / pull back reveal
跟随人物tracking shot following [subject]
环绕slow orbital shot around [subject]
仰拍英雄镜头hero low-angle shot
俯拍上帝视角top-down god's-eye view
摇镜头slow pan from left to right
急转镜头whip pan transition
手持感handheld shaky feel, slight motion
升降crane shot, slow vertical rise

色调引用速查

想要写法
王家卫In the Mood for Love color grade, warm reds, deep teals
Drive 电影Drive movie grade, magenta and cyan neon
Wes AndersonWes Anderson color palette, pastel symmetry
Blade Runner 2049Blade Runner 2049 grade, amber haze and cyan
Christopher NolanNolan film grade, desaturated, clinical
A24A24 film aesthetic, naturalistic
Studio GhibliStudio Ghibli color palette, warm pastoral

容易踩的坑

  1. 只写”电影感”cinematic 这个词单独使用模型基本忽略。要给具体镜头 / 色调 / 参考。
  2. 动作太复杂:5 秒镜头里写”走到桌前,拿起杯子,转身看窗外”——AI 视频生成几乎做不到。一个镜头一个动作。
  3. 不指定时长 / 节奏:写 duration: 5 seconds, slow paced 比不写好得多。
  4. 机位漂移:要么明确 static tripod,要么明确 slow dolly in。不写的话模型自己乱晃。
  5. 多镜头切换:当前主流 AI 视频模型还不能稳定做多镜头剪辑。建议生成单镜头,再用剪辑软件拼。

下一步怎么改得更好

  • 分镜先行:先在纸上画 4-6 个分镜,每个分镜单独生成 5 秒视频,最后拼起来。
  • 音乐先做:先决定音乐和节奏,每个镜头按音乐节拍设计动作时长。
  • 同色调一致:所有镜头的 Color 段保持一致,避免成片色调断层。
  • 稳定的镜头优先:dolly in / static / slow tracking 比复杂运动稳定得多。复杂镜头放在 hero shot 单点突破。

FAQ

Q:Sora / Runway / Veo / Kling 哪个对电影感最好? 截至 2026 年中,Sora 和 Veo 在镜头语言和物理一致性上最强,Kling 在长镜头和人物动作上不错,Runway Gen-3 在艺术风格化镜头上灵活。具体选哪个看预算和访问权限。

Q:怎么避免人物变形? 减少剧烈动作、避免脸部特写大幅旋转、动作时长 ≤ 5 秒。详见 AI 视频动作不连贯怎么办

Q:怎么让多个镜头风格统一? 所有镜头的 Lighting + Color + Aspect 三层保持一致,每个 Prompt 末尾贴同一段”color grade reference”。

Q:可以用这些 Prompt 商用吗? 看各模型的许可证:Sora(OpenAI)通常允许付费用户商用、Veo(Google)按计划而定、Runway 付费允许、Kling 国内商用见其条款。商用前请核对当前条款。

Q:怎么生成图转视频(保留人物特征)?AI 图片转视频 Prompt。从图开始能极大稳定人物一致性。

相关文章

标签: #电影感 #视频生成 #Prompt #镜头运动