你订阅了 Claude Pro 或 Max,正在赶一个东西,弹窗突然蹦出来:“You’ve reached your usage limit. Limit resets at 14:00.”——明明你才聊了一上午,怎么就到了?而且每次到 limit 的时间还不一样:有时候 3 小时撞墙,有时候 8 小时还没事。这是因为 Claude 的 usage limit 不是”每天 N 条消息”那种简单计数,而是按 token 消耗的滚动窗口动态判定。
理解 Claude 怎么算额度,比死记”5 小时 reset 一次”更有用——同样的订阅,懂得调度的人能多用 3 倍。
常见原因(为什么这么快撞限)
按命中率从高到低:
1. 模型选了 Opus,token 权重最高
Opus 在限流计算上的权重是 Sonnet 的 ~5 倍。同样的对话,Opus 撞限的速度是 Sonnet 的 5 倍。
如何判断:左上角模型选择器看是不是 Opus;如果不是必须 Opus 的任务(深度推理、复杂代码),换 Sonnet。
2. 长对话每轮重新计费整段历史
Claude 是无状态的:第 30 轮你只发了 50 字,但 Claude 接到的是前 29 轮全部内容 + 你这 50 字。input token 累计可能 50K+。
如何判断:是不是在一个会话里聊了几十轮?
3. 上传了大 PDF / 长文档
100 页 PDF ≈ 80K input token。每轮对话都带在 context 里,10 轮就用 800K input。
如何判断:会话里是否上传过大文件?
4. 频繁生成 / 改 Artifact
每个 Artifact 渲染都是完整 output token。改 10 次 = 10 倍输出。
如何判断:单个会话里有几个 Artifact?反复”再改改”过几次?
5. Extended Thinking 一直开着
Thinking 模式的 reasoning 算 output token,开启时输出可能是 3-5 倍。
如何判断:模型选择器附近有没有 “thinking” badge?
6. 5 小时窗口内重复 burst
Pro 限制是 5 小时滚动。如果你 12 点跑了大任务、3 点又跑、5 点再跑——5 小时窗里包了 3 次峰值,必然撞限。
如何判断:回想最近 5 小时的使用节奏。
额度怎么计算(机制简化版)
每条消息消耗 ≈ (input token + output token) × 模型权重 × thinking 系数
模型权重(相对):
Haiku = 1x
Sonnet = ~3-5x
Opus = ~15-25x
Thinking:
关闭 = 1x
开启 = 大约 1.5-3x(看推理深度)
5 小时滚动窗口的 cap(订阅档 + 模型组合)有个软上限。
超过就 "usage limit reached",等窗口滑出去再恢复。
短消息少 → 长上下文多。换句话说:拉长会话 + 高权重模型 + thinking = 最快撞限。
什么时候重置
Free / Pro / Max 都是滚动 5 小时窗口,不是固定每天午夜。Banner 会显示具体时间(“resets at 14:00”)。
实操含义:
- 早上 9 点撞限 → 下午 2 点才完全释放(你 9 点之前的消耗也算进去)
- 想”明天再用”是错的——是 5 小时后,不是 24 小时后
- 多次小 burst 比一次大 burst 更早撞限(窗口里峰值持续)
6 个最有效的省额度方法
1. 拆会话
不相关任务开新会话。debug 网页 bug 一个会话,写邮件另一个,研究产品再一个。每个新会话 input token 重置。
2. 默认用 Sonnet
只有需要深度推理 / 复杂代码理解的任务才上 Opus。日常 80% 的工作 Sonnet 完全够,且消耗低数倍。
3. 大文件用 Projects Knowledge,不要在 chat 里反复贴
低效:把规范文档贴到每个新会话开头
高效:放到 Project 的 Knowledge 区,按需检索
4. 用 diff 而非整份重输出
不要说:把整个文件重写
而是说:在第 N 行替换为 ...,其他不变,只回复修改的部分
5. 关掉 Extended Thinking 做日常任务
写邮件、起草大纲、回答简单问题不需要 thinking。复杂 debug 才开。
6. 一次想清楚再发,不要”边发边改”
低效:发 → 看到结果 → 再调整 → 再调整...(每次都重计 input)
高效:写完整版 prompt → 一次发 → 直接用
预防建议
- 把 Opus 当稀缺资源,只用在 5 倍价值的任务上
- 长项目维护 Project Knowledge 而不是不断贴文件到 chat
- 每 20-30 轮主动开新会话,不要硬撑长 session
- 高强度使用日提前安排:早上做最 token 重的任务,下午留给小任务
- 监控 5 小时窗口节奏:如果上午 burst 了,下午自然要省着用
- 真的不够用,考虑升 Max 或加 API(按 token 付费,无 5 小时 cap)
- 重要 deadline 前 1 天就别再 burst,避免高峰撞墙