TikTok 一定要把笑点前置吗？

— 是。大约 71% 的观众在前 3 秒就决定要不要继续看，而 TikTok 奖励 watch-time 和完播；前面没拿到价值的观众不会再来。悬念 / open loop 留给长视频（YouTube、播客）——那里你已经赢得了注意力。

3 秒留存该瞄多少？

— 低于 60% 会被压制；65-70% 是任何自然推送的大致最低线；70-85% 是强钩子（约为跌破 60% 视频播放的 2.2 倍），85% 以上是顶级（约 2.8 倍）。先突破你自己最近的平均值，再去够这一档的上沿。

一周 A/B 几个钩子？

— 每内容主题 2 个不同 pattern 族。更少是噪音（2 周无信号）。更多是疲劳（你受众跨所有钩子风格 pattern match 你）。跑 2 周再轮换。

3 秒留存高但 15 秒崩怎么办？

— 钩子 over-promise 了。改写诚实版——钩子要为 body 真交付的东西铺路。AI 在这件事上可以："钩子必须对应视频 payoff；不要写视频不交付的钩子。"

用哪个模型写钩子？

— 任何前沿模型都够，重活是 prompt 在做。ChatGPT（GPT-5.5）和 Claude（Sonnet 4.6）都能产出贴 brief、紧凑的变体；Gemini 3.1 Pro 也行。免费档跑每天一批足够——瓶颈是你的留存数据，不是模型。

Burned-in 字幕 vs 自动生成？

— Burned-in 留存可测量更好（自选字体、时机、强调），但每条视频多花约 10 分钟。在意的 post 用 burned-in。日常量产用 auto 就够。无论哪种，屏字都放上三分之一——TikTok 底部 UI 会吃掉画面下方约 320px。

AI 场景化应用

用 AI 写让人停下的 TikTok 钩子

为 3 秒决策窗口生成 6 套钩子组合——4-7 字屏字 + 10 字口播 + 首个 B-roll 镜头——并按模式族打标签方便 A/B。

发布于: 2026/05/17 更新于: 2026/06/09 作者: AI Productivity Guide Team 🌐 查看英文版本

一句话总结

TikTok 钩子不是一句话，而是前 3 秒同时打出的三个信号：屏字（4-7 字）、口播第一句（≤10 字）、首个 B-roll 镜头。大约 71% 的观众在这 3 秒内就决定要不要继续看，而约 80% 的人是静音刷——所以屏字和镜头得能独立扛起钩子。这篇给你一段可直接复制的 prompt，产出 6 套按模式族（反直觉、stake、数字、承认、open-loop、行动中）打标签的钩子组合，方便你 A/B 看哪个模式在你的赛道里能停住拇指——外加要喂模型什么、怎么改输出。ChatGPT（GPT-5.5）、Claude（Sonnet 4.6）、Gemini 3.1 Pro 都能跑。

任务场景

手机在手、补光灯开着、B-roll 剪好了，准备录一条 TikTok 的 talking-head——主题是砍 AI 订阅栈。你知道最终片子的前 3 秒就是分水岭：截至 2026 年年中，大约 71% 的观众在这个窗口里就决定要不要继续看。在前 3 秒能留住 70-85% 观众的视频，总播放量大约是跌破 60% 的视频的 2.2 倍；而算法愿意往外推的大致门槛，落在 3 秒留存 65-70% 附近。你最近 8 条 3 秒留存平均 28%；数据说明问题在钩子，不在 body。你要 6 套”钩子 + 首镜”组合，对同一段 B-roll 拍，按模式族打标签，方便 A/B 看哪个模式真能在你这个赛道里停下来。

什么时候适合让 AI 来做

AI 懂钩子模式族——反直觉、stake、数字、承认、open-loop、行动中——能输出符合 TikTok 开头几秒认知负担的变体（视觉信号 + 4-7 字屏字 + 口播开头同时落地）。它也能避开 2026 年年中 TikTok 上已经隐形的几种钩子：“看到最后绝对惊呆了”、“POV：”、“如何不用说出 [X] 让你知道我 [X]”、“this is your sign”、“你有没有想过”，还有”嗨大家好欢迎回来”这种以创作者为中心的开场（在每份钩子排名里都垫底——空洞、慢、讲的是创作者而不是观众）。

AI 做不到：知道哪种模式在你这个细分领域已经疲劳。同样反直觉开头在 finance TikTok 有效，在美妆 TikTok 就死。把过去 20 条 3 秒留存拉出来，找出表现最弱的钩子风格，让模型轮换掉。AI 也判断不了你的钩子是不是 over-promise——3 秒留存高、15 秒留存崩，钩子骗人、观众走了。

常见失败模式：AI 偏爱口播钩子，把屏字和首个 B-roll 镜头当附属。TikTok 上三个信号必须在前 3 秒同时落地——而因为大约 80% 的短视频播放是静音的，屏字和 B-roll 得能独立扛起钩子。B-roll 是真正让拇指停下来的东西；屏字是静音的大多数真正在读的内容。

3 秒留存：好的标准长什么样

整套动作都围着一个数字校准——你的 3 秒留存。下笔写钩子之前，先用这组 2026 年年中的基准定好你的底线和天花板。

3 秒留存	含义	算法信号
低于 60%	钩子弱；多数拇指已经走了	被压制，几乎不推
65-70%	最低可行	任何自然分发的大致门槛
70-85%	强钩子	总播放约为跌破 60% 视频的 2.2 倍
85% 以上	顶级钩子	总播放约为跌破 60% 视频的 2.8 倍

你要”突破的底线”是自己最近的平均值；“值得瞄准的天花板”是这一档的上沿。两个都喂给模型。

需要先给 AI 的信息

视频真正交付的一句话（观众带走的具体收获）
你的赛道 + 你注意到那里疲劳的一种钩子风格（比如美妆 TikTok 的”POV: 你走进 Sephora”）
格式——出镜（第一帧是你的脸）还是只配音（只 B-roll）
最近 5-10 条的 3 秒和 15 秒留存（差距告诉你钩子是否 over-promise）
你历史上 top 2 表现最好的钩子（让模型照 pattern match 结构）
你想突破的 3 秒留存底线（平均）和值得瞄准的天花板（top 10%）
你已经剪好的 B-roll（让模型把首镜匹配到你真有的素材）
字幕是自动生成还是 burned-in（burned-in 留存更好；auto 更快更轻）

可直接复制的 Prompt

为前 3 秒决策窗口写 6 个 TikTok 钩子。
视频 payoff（一句话具体收获）：[paste]
赛道 + 那里疲劳的一种钩子风格：[paste]
格式：[出镜 / 只配音]
我最近 3 秒留存平均：[%]。15 秒留存：[%]。
我历史上 top 2 钩子：[paste]
我已经剪好的 B-roll：[简描述]

6 个钩子，每个返回：
1）屏字（4-7 字内——静音观众只看到这个）。
2）口播第一句（10 字内——第 1 秒落地）。
3）首个 B-roll 镜头点——一个能跟文字配对的具体画面。
4）模式 tag——反直觉 / stake / 数字 / 承认 / open-loop / 行动中。

规则：
- 三个信号（屏字 + 口播 + 首镜）必须在前 3 秒同时落地。
- 避开我指定的疲劳风格，以及：「看到最后绝对惊呆」、「POV：」、「如何不用说出」、「this is your sign」、「你有没有想过」、「嗨大家好欢迎回来」、所有最高级（「难以置信」、「绝绝子」）。
- 每个钩子再写一个 5 字"测试变体"——同 pattern、不同句子——这样我对同一 B-roll 录 2 take 互相 A/B。
- 屏字放画面上三分之一。TikTok 底部 UI（字幕、声音、点赞/评论/分享）在 1920px 高画面里大约占下方 320px，右侧约 120px 是按钮列——所以屏字居中靠上、避开右边缘。

结尾一句话：6 个里哪个最可能突破我 [%] 的 3 秒留存底线、为什么。

短版本——单钩子快速迭代

下面是一条 3 秒留存 [x]% 的钩子。改成 5 个变体，针对它可能的弱点修。每条：5 字屏字 + 10 字口播 + 一帧 B-roll 镜头。Pattern：[一个具体 pattern 族]。

原钩子：[paste]

输出示例

一套好用的三信号组合（反直觉 pattern）：

屏字：“你每月多花 ¥150”
口播第一句：“你已经买了 ChatGPT Plus 还在买这些工具的——停。”
首个 B-roll：手指在手机上取消订阅，近景。
模式 tag：反直觉 + stake。
测试变体：“这 ¥150 你不用再花。”

一套好用的 stake pattern：

屏字：“大多数 AI 工具在双重计费”
口播第一句：“你的 AI 工具栈几乎肯定重了——90 秒教你查。”
首个 B-roll：两个 app 图标并排、功能重叠部分高亮。
模式 tag：stake。
测试变体：“你在为同一件事付两遍。”

一段好用的”预测胜者”：“钩子 1 最可能突破你 28% 的 3 秒留存底线，也最有机会进 65-70% 最低可行区间。屏字含数字 + stake，两者在你赛道都验证过；B-roll 是触觉动作（取消），能 hold 住拇指。钩子 4（承认 pattern）是风险更高的押注——上限高（如果你受众最近没见过承认型钩子）、下限低（如果他们已经见过了）。“

怎么改输出

屏字砍到 5 字 —— “如果某条钩子的屏字超 5 字，重写。静音观众要在大约 1 秒内读完；5 字是现实上限，4 字更好。”
三信号同时落地 —— “复查每个组合：屏字、口播、首镜应该在前 3 秒内传递同一方向。如果口播要满 3 秒才落地、屏字快，慢的那个就是瓶颈。”
首镜匹配我有的素材 —— “再读首镜。任何一条需要我没有的素材，就换成我已经剪过的镜头里的一个。不会为了一个变体重新拍。”
删疲劳 pattern —— “对照我指定的疲劳风格 + 2026 通用死 pattern。如果有变体用了’看到最后’、‘POV:‘或最高级，重写。”
预测胜者并说理由 —— “结尾给一句预测：6 个里哪个最可能突破留存底线、引用 pattern + 赛道信号。没有预测，A/B 测试没校准。“

容易踩的坑

“看到最后绝对惊呆”、“POV：”、“如何不用说出 [X] 让你知道我 [X]”、“你有没有想过”——2026 年 TikTok 通用疲劳；观众一眼 pattern match 然后预划
屏字要超过一拍才读完——字数必须在 3 秒决策窗里识别完；4-7 字上限，4 更好
没配 B-roll 计划——光声音停不下来 TikTok 拇指；视觉才是真 hold
屏字被底部 UI 挡——TikTok 的字幕、声音、互动按钮在 1920px 画面里占下方约 320px（右侧约 120px 是按钮列）；屏字放上三分之一
承诺视频没交付的东西——3 秒留存高、15 秒崩，是经典特征；观众走了、算法连带罚下一条
所有视频用同一种钩子模式——算法读成 signal 老化；跨 post 轮换 pattern 族，即使当下某个 pattern 在打
一条钩子只录一 take——同一 body 永远录 2 个钩子变体；A/B 揭示观众真奖励什么
忽略静音观众——短视频大约 80% 静音播放；屏字必须独立承担钩子

FAQ

TikTok 一定要把笑点前置吗？ —— 是。大约 71% 的观众在前 3 秒就决定要不要继续看，而 TikTok 奖励 watch-time 和完播；前面没拿到价值的观众不会再来。悬念 / open loop 留给长视频（YouTube、播客）——那里你已经赢得了注意力。
3 秒留存该瞄多少？ —— 低于 60% 会被压制；65-70% 是任何自然推送的大致最低线；70-85% 是强钩子（约为跌破 60% 视频播放的 2.2 倍），85% 以上是顶级（约 2.8 倍）。先突破你自己最近的平均值，再去够这一档的上沿。
一周 A/B 几个钩子？ —— 每内容主题 2 个不同 pattern 族。更少是噪音（2 周无信号）。更多是疲劳（你受众跨所有钩子风格 pattern match 你）。跑 2 周再轮换。
3 秒留存高但 15 秒崩怎么办？ —— 钩子 over-promise 了。改写诚实版——钩子要为 body 真交付的东西铺路。AI 在这件事上可以：“钩子必须对应视频 payoff；不要写视频不交付的钩子。”
用哪个模型写钩子？ —— 任何前沿模型都够，重活是 prompt 在做。ChatGPT（GPT-5.5）和 Claude（Sonnet 4.6）都能产出贴 brief、紧凑的变体；Gemini 3.1 Pro 也行。免费档跑每天一批足够——瓶颈是你的留存数据，不是模型。
Burned-in 字幕 vs 自动生成？ —— Burned-in 留存可测量更好（自选字体、时机、强调），但每条视频多花约 10 分钟。在意的 post 用 burned-in。日常量产用 auto 就够。无论哪种，屏字都放上三分之一——TikTok 底部 UI 会吃掉画面下方约 320px。
模型一直建议疲劳 pattern 怎么办？ —— 加：“以下 pattern 2026 年已死、禁止使用：‘看到最后’、‘POV：’、‘如何不用说出’、‘this is your sign’、‘你有没有想过’、‘嗨大家好欢迎回来’、所有最高级（‘难以置信’、‘绝绝子’）。变体用了任一就重写。目标是平实但反预期，不是标题党语气。“

一句话总结

任务场景

什么时候适合让 AI 来做

3 秒留存：好的标准长什么样

需要先给 AI 的信息

可直接复制的 Prompt

短版本——单钩子快速迭代

输出示例

怎么改输出

容易踩的坑

FAQ

相关阅读

相关文章

用 AI 给评论和私信分级：一套回复系统

AI 评论回复风格指南：让每一条回复都是同一个声音

用 AI 做月度内容日历（2026 年 6 月实操流程）

用 AI 写创作者合作 pitch

用 AI 写 Instagram Carousel 脚本

AI 写 LinkedIn 思考贴的 Prompt（能被分享，不油腻）