任务场景
手机在手、补光灯开着、B-roll 剪好了,准备录一条 TikTok 的 talking-head——主题是砍 AI 订阅栈。你知道最终片子的前 1 秒是分水岭——TikTok 的 auto-skip 数据说大约 35-40% 的观众在那个窗口里划走,到第 3 秒又再走 25%。你最近 8 条 3 秒留存平均 28%;数据说明问题在钩子,不在 body。你要 6 套”钩子 + 首镜”组合,对同一段 B-roll 拍,按模式族打标签,方便 A/B 看哪个模式真能在你这个赛道里停下来。
什么时候适合让 AI 来做
AI 懂钩子模式族——反直觉、stake、数字、承认、open-loop、行动中——能输出符合 TikTok 1 秒认知负担的变体(视觉信号 + 4-7 字屏字 + 口播开头同时落地)。它也能避开 2026 年 TikTok 上已经隐形的几种钩子:“看到最后绝对惊呆了”、“POV:”、“如何不用说出 [X] 让你知道我 [X]”、“this is your sign”。
AI 做不到:知道哪种模式在你这个细分领域已经疲劳。同样反直觉开头在 finance TikTok 有效,在美妆 TikTok 就死。把过去 20 条 3 秒留存拉出来,找出表现最弱的钩子风格,让模型轮换掉。AI 也判断不了你的钩子是不是 over-promise——3 秒留存高、15 秒留存崩,钩子骗人、观众走了。
常见失败模式:AI 偏爱口播钩子,把屏字和首个 B-roll 镜头当附属。TikTok 上三个信号必须在第 1 秒同时落地——大约 50% 观众默认静音,需要屏字承担钩子;B-roll 是真正让拇指停下来的东西。
需要先给 AI 的信息
- 视频真正交付的一句话(观众带走的具体收获)
- 你的赛道 + 你注意到那里疲劳的一种钩子风格(比如美妆 TikTok 的”POV: 你走进 Sephora”)
- 格式——出镜(第一帧是你的脸)还是只配音(只 B-roll)
- 最近 5-10 条的 3 秒和 15 秒留存(差距告诉你钩子是否 over-promise)
- 你历史上 top 2 表现最好的钩子(让模型照 pattern match 结构)
- 你想突破的 3 秒留存底线(平均)和值得瞄准的天花板(top 10%)
- 你已经剪好的 B-roll(让模型把首镜匹配到你真有的素材)
- 字幕是自动生成还是 burned-in(burned-in 留存更好;auto 更快更轻)
可直接复制的 Prompt
为 1 秒决策窗口写 6 个 TikTok 钩子。
视频 payoff(一句话具体收获):{paste}
赛道 + 那里疲劳的一种钩子风格:{paste}
格式:{出镜 / 只配音}
我最近 3 秒留存平均:{%}。15 秒留存:{%}。
我历史上 top 2 钩子:{paste}
我已经剪好的 B-roll:{简描述}
6 个钩子,每个返回:
1)屏字(4-7 字内——静音观众只看到这个)。
2)口播第一句(≤10 字——第 1 秒落地)。
3)首个 B-roll 镜头点——一个能跟文字配对的具体画面。
4)模式 tag——反直觉 / stake / 数字 / 承认 / open-loop / 行动中。
规则:
- 三个信号(屏字 + 口播 + 首镜)必须在第 1 秒同时落地。
- 避开我指定的疲劳风格,以及:「看到最后绝对惊呆」、「POV:」、「如何不用说出」、「this is your sign」、所有最高级(「难以置信」、「绝绝子」)。
- 每个钩子再写一个 5 字"测试变体"——同 pattern、不同句子——这样我对同一 B-roll 录 2 take 互相 A/B。
- 确认屏字在画面上三分之一能舒服放下(TikTok 评论 overlay 挡下半部分)。
结尾一句话:6 个里哪个最可能突破我 {%} 的 3 秒留存底线、为什么。
短版本——单钩子快速迭代
下面是一条 3 秒留存 {x}% 的钩子。改成 5 个变体,针对它可能的弱点修。每条:5 字屏字 + 10 字口播 + 一帧 B-roll 镜头。Pattern:{一个具体 pattern 族}。
原钩子:{paste}
输出示例
一套好用的三信号组合(反直觉 pattern):
- 屏字:“你每月多花 ¥150”
- 口播第一句:“你已经买了 ChatGPT Plus 还在买这些工具的——停。”
- 首个 B-roll:手指在手机上取消订阅,近景。
- 模式 tag:反直觉 + stake。
- 测试变体:“这 ¥150 你不用再花。”
一套好用的 stake pattern:
- 屏字:“大多数 AI 工具在双重计费”
- 口播第一句:“你的 AI 工具栈几乎肯定重了——90 秒教你查。”
- 首个 B-roll:两个 app 图标并排、功能重叠部分高亮。
- 模式 tag:stake。
- 测试变体:“你在为同一件事付两遍。”
一段好用的”预测胜者”:“钩子 1 最可能突破你 28% 留存底线。屏字含数字 + stake,两者在你赛道都验证过;B-roll 是触觉动作(取消),能 hold 住拇指。钩子 4(承认 pattern)是风险更高的押注——上限高(如果你受众最近没见过承认型钩子)、下限低(如果他们已经见过了)。“
怎么改输出
- 屏字砍到 5 字 —— “如果某条钩子的屏字超 5 字,重写。静音观众要在 1 秒内读完;5 字是现实上限,4 字更好。”
- 三信号同时落地 —— “复查每个组合:屏字、口播、首镜应该在第 1 秒内传递同一方向。如果口播要 3 秒才落地、屏字快,慢的那个就是瓶颈。”
- 首镜匹配我有的素材 —— “再读首镜。任何一条需要我没有的素材,就换成我已经剪过的镜头里的一个。不会为了一个变体重新拍。”
- 删疲劳 pattern —— “对照我指定的疲劳风格 + 2026 通用死 pattern。如果有变体用了’看到最后’、‘POV:‘或最高级,重写。”
- 预测胜者并说理由 —— “结尾给一句预测:6 个里哪个最可能突破留存底线、引用 pattern + 赛道信号。没有预测,A/B 测试没校准。“
容易踩的坑
- “看到最后绝对惊呆”、“POV:”、“如何不用说出 [X] 让你知道我 [X]“——2026 年 TikTok 通用疲劳;算法识别 + 观众预划
- 屏字 3 秒才读完——字数必须装进 1 秒决策窗;4-7 字上限,4 更好
- 没配 B-roll 计划——光声音停不下来 TikTok 拇指;视觉才是真 hold
- 屏字被评论 overlay 挡——TikTok 下半 20% 被 UI 覆盖;屏字放上三分之一
- 承诺视频没交付的东西——3 秒留存高、15 秒崩,是经典特征;观众走了、算法连带罚下一条
- 所有视频用同一种钩子模式——算法读成 signal 老化;跨 post 轮换 pattern 族,即使当下某个 pattern 在打
- 一条钩子只录一 take——同一 body 永远录 2 个钩子变体;A/B 揭示观众真奖励什么
- 忽略静音观众——TikTok 大约 50% 默认静音;屏字必须独立承担钩子
FAQ
- TikTok 一定要把笑点前置吗? —— 是。TikTok 奖励 watch-time 和完播;前 3 秒没拿到价值的观众不会再来。悬念 / open loop 留给长视频(YouTube、播客)——你已经赢得了注意力。
- 一周 A/B 几个钩子? —— 每内容主题 2 个不同 pattern 族。更少是噪音(2 周无信号)。更多是疲劳(你受众跨所有钩子风格 pattern match 你)。跑 2 周再轮换。
- 3 秒留存高但 15 秒崩怎么办? —— 钩子 over-promise 了。改写诚实版——钩子要为 body 真交付的东西铺路。AI 在这件事上可以:“钩子必须对应视频 payoff;不要写视频不交付的钩子。”
- Burned-in 字幕 vs 自动生成? —— Burned-in 留存可测量更好(自选字体、时机、强调),但每条视频多花约 10 分钟。在意的 post 用 burned-in。日常量产用 auto 就够。
- 模型一直建议疲劳 pattern 怎么办? —— 加:“以下 pattern 2026 年已死、禁止使用:‘看到最后’、‘POV:’、‘如何不用说出’、‘this is your sign’、所有最高级(‘难以置信’、‘绝绝子’)。变体用了任一就重写。目标是平实但反预期,不是标题党语气。“