Cursor 计费疑问：Fast/Slow 旧机制 vs 新的额度池

Q: Pro 上 Auto 真的无限量吗？

日常用途基本算是：Auto 不扣那 `$20` 额度池，按很低的内部费率计，所以大多数一直用 Auto 的开发者从不撞上限。高峰期的重度使用仍可能被限速（排队），但那是节流，不是额度耗尽。

Q: 为什么我"用完了"反而被额外扣费？

你几乎肯定开着 on-demand（按量）后付。`$20` 池一空，on-demand 就继续给你前沿模型并把超额计费。想硬停就在 Billing 里关掉它，或设月度花费上限。

Q: 从 Pro 升到 Pro+ 为了额度值不值？

Pro `$20` 含 `$20` 用量；Pro+ `$60` 含 `$60`；Ultra `$200` 含 `$400`。如果你只是偶尔冲高，在 Pro 上开 on-demand 并设花费上限，通常比升档更省。如果每个月都稳定超额，高档自带的额外用量更划算。

$20 Pro 额度月中突然耗尽、Cursor 提示已达上限。讲清 Cursor 现在的用量计费怎么算（2025 年已废除 fast/slow request），以及日常省额度方法。

发布于: 2026/05/21 更新于: 2026/06/18 作者: AI Productivity Guide Team 🌐 查看英文版本

最快修复： 把默认模型设为 Auto（Composer 输入框的模型下拉里选）。Pro 计划下 Auto 基本无限量、不扣你那 $20 的额度池，“You’ve hit your usage limit” 这道墙就不会再出现。只有当 Auto 确实给不出对的结果时，再手动切到 Claude Opus 4.7、GPT-5.5 这类前沿模型。

先纠正一个关键点：Cursor 已于 2025 年 6 月废除了旧的 “fast request / slow request” 机制。如果你看的是旧攻略说”500 fast 用完后无限 slow”，那套已经不存在了。截至 2026 年 6 月，每个付费计划都自带一个等于计划价格的月度额度池（Pro = $20 的模型用量），额度按各模型的真实 API 价格扣减，池子见底后要么停用、要么转入 pay-as-you-go 按量后付。再也没有那个免费的 “slow” 排队池可以兜底了。

所以当年那个抱怨的现代版本是：“我的 $20 Pro 额度看着挺多，结果月中 Cursor 就提示达到上限，开始扣我钱 / 拒绝请求。” 这正是本文要解决的。

现在的计费到底怎么算（2026 年 6 月）

层级	是什么	扣额度吗？
Auto	Cursor 自动把你的 prompt 路由到一个性价比模型	不扣——Pro 下基本无限量，按很低的内部费率单独计
Composer 2.5	Cursor 自家的 agent 模型	很便宜；自带很大额度
前沿模型（Claude Sonnet 4.6、Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro）	手动指定的高端模型	扣——按各模型真实 API 价
Tab / 自动补全	行内补全	不扣——无限量
On-demand	超出额度池的部分	扣——按量后付

那 $20 的 Pro 额度池是按美元 API 用量算的，不是按请求次数。Sonnet 4.6 上随手问一行只要几美分；而在大文件上跑一次 Opus 4.7 多步 agent，单个 prompt 就可能花掉一美元以上。这就是为什么池子感觉”说没就没”——你花的是真金白银的 API 美元，不是”次数”。

常见原因

1. 把前沿模型当默认，而不是 Auto

把 Claude Opus 4.7 或 GPT-5.5 设成日常默认，会让每个 prompt 都按全额 API 价扣那 $20 池（截至 2026 年 6 月，Opus 4.7 是 $5/$25 每百万输入/输出 token，GPT-5.5 是 $5/$30）。几次大型 agent 跑动就能在一周内清空 $20。

如何判断： 打开下文的 Usage 页面按 model 分组——大多数人会发现 60-80% 的花费集中在某一个高端模型上。

2. 一个 agent turn 内部触发多次模型调用

Agent 模式下模型会把 read_file → grep → edit_file → run_terminal_cmd 串起来，每一步都是一次计费的模型调用。一句”帮我修这个 bug”可能是 3-8 次调用，不止一次——而且每次调用的输入会随上下文累积变长，token 成本越滚越大。

如何判断： 对比 Usage 仪表盘的请求次数与你今天实际敲下的 prompt 数。差距 3 倍以上，就是 agent 多步在烧。

3. Max Mode 把 token 成本翻倍

Composer 的 Max Mode 每次调用给模型塞进大得多的上下文窗口，于是每次调用计费的 token 也多得多。在 Max Mode 下做一次大重构，单个 prompt 就能花掉好几美元。

如何判断： 看 Composer 输入框里的模型名——带 Max 标签就是开着。Max Mode 是按模型逐个手动开启的。

4. 你撞的是额度上限，不是限速（两者不是一回事）

有两件不同的事都能卡住你，很多人会搞混：

额度上限： 你的 $20 池空了。会看到 “You’ve hit your usage limit”，附带开启 on-demand 后付或升级的选项。不会排队；手动选的模型直接停用，直到你付费或月度重置。
限速： 高峰时段即便是 Pro 请求也可能排队几十秒而非失败。这跟旧的 “slow pool” 不是一回事——它是临时节流，不代表你额度耗尽。

如何判断： Settings → Usage（或 cursor.com/dashboard）。额度条还满但回复慢，是限速；额度条空了，才是上限。

5. On-demand 后付一直开着，于是”用完”悄悄变成了”被扣费”

如果你开了 on-demand（按量）计费，就永远撞不到硬墙——Cursor 会继续给你前沿模型，把超出部分按量后付。这就是意外账单的来源。

如何判断： Settings → Billing → 找 on-demand / usage-based 的开关和你的月度花费上限。

6. 跨设备统计延迟几分钟

切换机器或网络后，Usage 数字可能比实际花费落后几分钟，造成”我没用啊”的错觉。

如何判断： 刷新 cursor.com/dashboard 或等 5 分钟；网页仪表盘比 IDE 内面板更新更快。

动手前先确认

确认是哪个入口在花钱：Chat、Composer/agent、还是 Cmd+K。计费规则一样，但触发频率差很多。
在网页仪表盘 cursor.com/dashboard 看 Usage，而不是 IDE 内面板——数字更新更快，还能按模型拆分。
记下 Cursor 版本和当前默认模型（Composer 输入框下拉）。不同模型费率差异很大。

需要收集的信息

Cursor 版本、当前订阅档（Hobby 免费 / Pro $20 / Pro+ $60 / Ultra $200 / Teams Standard $40 每席）、以及是否开了 on-demand 后付。
cursor.com/dashboard → Usage 的截图，分别按 model 和按 day 看。
一天里大概发了多少 prompt、用了哪些模型、是否开了 Max Mode。
是否用自带 API key（BYOK）；如用，确认对应模型走的是你的 key，而不是 Cursor 的额度池。

最短修复路径

按”省额度”收益排序。

Step 1：先看清自己的实际花费

打开 cursor.com/dashboard → Usage，按 model 分组，看过去 30 天。重点找出吃掉大部分 $20 的那一两个模型。这一个页面通常就能解释整个月的去向。

Step 2：把 Auto 设为默认

把默认设成 Auto（Composer 输入框 → 模型下拉 → Auto）。Pro 下 Auto 基本无限量，按很低的内部费率计，而不是扣你那 $20 池。对大多数日常编码，光这一步就能终结月中那道墙。

单次切换：Composer 输入框 -> 模型下拉 -> Auto
设为默认：同一下拉 -> 选 Auto，仅在 Auto 给不出结果时再升级到前沿模型

Step 3：agent 任务优先用 Composer 2.5

确实想用具名模型跑 agent 任务时，优先 Cursor 自家的 Composer 2.5——它自带很大额度，单任务成本远低于 Opus 4.7 或 GPT-5.5。把前沿模型留给真正难的推理。

Step 4：不需要时关掉 Max Mode

默认让 Max Mode 处于关闭。只在必须把超大文件或全仓上下文喂给模型时开一次，用完立刻关——它会把每次调用计费的 token 翻倍。

Step 5：多用 Tab + Cmd+K

Cursor Tab 自动补全和 Cmd+K 行内编辑不扣额度池。常规补全和”改这一行”这类编辑用 Tab/Cmd+K，把 Composer/agent 跑动留给真正的任务。

Step 6：明确决定要不要开 on-demand 后付

cursor.com/dashboard → Billing → on-demand（按量）计费。关掉它，会在 $20 处硬停（可预期、不会有意外账单）。开启并设花费上限，则能在需要时按 API 价超出额度池，而无需升级计划——通常比为某个忙月跳到更高档更划算。

Step 7：重度用前沿模型可考虑 BYOK

Settings → Models → 填入你自己的 Anthropic / OpenAI / Google API key。这时调用计到你自己的服务商账户，而不是 Cursor 额度池。代价：部分较新的 Cursor agent 特性需要 Cursor 自家路由，BYOK 下功能可能略滞后。

怎么确认已经修好

切到 Auto 用几天，再看 cursor.com/dashboard，确认 $20 池消耗够慢、能撑到月底。
在另一台设备登录同账号看 Usage 数字一致，排除前端 cache 误差。
如果关了 on-demand，确认 Billing 现在显示硬上限、没有待结的超额。

如果还是没修好

把复现缩到最小：单 prompt、单模型，在仪表盘上看一次 agent turn 到底花了几美元。
看看最近一次 Cursor 升级是否改了你的默认模型、或升级后重新打开了 Max Mode。
在 forum.cursor.com 搜你那个模型的当前价格，带上 Usage 截图。
抓 View → Output → Cursor 日志贴到 Bug Reports 论坛；billing 团队会盯那个频道。

常见问题

“500 fast requests” 去哪了？ Cursor 已在 2025 年 6 月废除 fast/slow request 机制，并就推行方式道歉。现在每个计划自带一个美元额度池（Pro $20），按真实 API 价扣减。如果你还看到 “slow request” 字样，说明你的客户端过旧或看的是旧攻略——升级 Cursor 即可。

Pro 上 Auto 真的无限量吗？ 日常用途基本算是：Auto 不扣那 $20 额度池，按很低的内部费率计，所以大多数一直用 Auto 的开发者从不撞上限。高峰期的重度使用仍可能被限速（排队），但那是节流，不是额度耗尽。

为什么我”用完了”反而被额外扣费？ 你几乎肯定开着 on-demand（按量）后付。$20 池一空，on-demand 就继续给你前沿模型并把超额计费。想硬停就在 Billing 里关掉它，或设月度花费上限。

为什么一句”帮我修 bug”花这么多？ Agent 模式会串起多次模型调用（读取、搜索、编辑、运行），Max Mode 又放大每次调用的上下文。账单是所有这些步骤累计消耗的 token，而不是一次定额请求。

从 Pro 升到 Pro+ 为了额度值不值？ Pro $20 含 $20 用量；Pro+ $60 含 $60；Ultra $200 含 $400。如果你只是偶尔冲高，在 Pro 上开 on-demand 并设花费上限，通常比升档更省。如果每个月都稳定超额，高档自带的额外用量更划算。

预防建议

每周看一次 cursor.com/dashboard，好把花费节奏匀到整个月。
默认用 Auto / Composer 2.5；把 Opus 4.7 和 GPT-5.5 当成只对难题升级的模型。
把 Max Mode 当成显式、临时的动作——绝不默认开。
用 .cursorrules 让回复更聚焦，间接减少多 turn 的 agent 调用。
大重构先在 Chat 里把方案敲定，再让 agent 一次性执行——避免昂贵的 agent 空转。