怎么知道思考真的跑了？

看回复上方的 `Thinking` 指示（运行时带计时器）。回复花了好几秒、读起来像有推理分析，也是个信号。

为啥把思考调高也不一定出 trace？

自适应思考是按轮决定的。`High`/`Max` 下它几乎总会思考，但极简单的 prompt 仍可能被直接回答。给它一条难 prompt 验证。

Effort 和旧的 Extended Thinking 开关有啥区别？

Opus 4.7、Opus 4.6、Sonnet 4.6 把固定思考 token 预算换成了 `Effort` 等级（`Low`/`Medium`/`High`/`Max`，Opus 4.7 多一个 `Xhigh`）。`High` 是默认，等同于不设。

是。Effort 越高，吃的 token 越多（思考加回复），会算进 Free、Pro、Max 的用量限制，API 上算进计费。

怎么用 API 强制开启思考？

在 Opus 4.7/4.6 和 Sonnet 4.6 上，设 `thinking: {type: "adaptive"}` 加 `output_config: {effort: "high"}`（或 `"max"`）。Opus 4.7 上旧的 `thinking: {type: "enabled", budget_tokens: N}` 已不再支持，改用自适应思考加 effort。

思考能跟工具一起用吗？

能，但可见 trace 可能被工具调用替代。推理还是会发生，只是移进了工具规划里。

常见问题解决库

Claude 思考开关开着但看不到推理过程

打开了思考，Claude 秒回、上面没有推理 trace。截至 2026 年 6 月，多半是 Effort 调太低、prompt 在自适应思考下太简单、trace 被折叠、或套餐限制。诊断并强制让思考回来。

发布于: 2026/05/24 更新于: 2026/06/15 作者: AI Productivity Guide Team 🌐 查看英文版本

你打开思考，问一个明显需要推理的问题，Claude 一两秒就甩回一个答案，上面没有 Thinking trace。开关看着还是开的，你开始怀疑思考是不是悄悄坏了。

最快的修法： 点发送按钮旁边的模型名，把鼠标移到 Effort 上，调成 High 或 Max，然后重发一条真正难的 prompt。当前几个 Claude 模型（Opus 4.7、Opus 4.6、Sonnet 4.6）的思考是自适应的——模型每一轮自己决定要不要思考，在 Low/Medium 这种低 Effort 下，简单 prompt 它会跳过思考。High（默认）和 Max 才会几乎每次都思考。

要先知道一个大变化：截至 2026 年 6 月，这几个模型上已经没有那种单一的、按 token 预算的「Extended Thinking」开关了。思考深度由 Effort 设置控制，而一个被遗忘的 Low Effort，如今是难 prompt 看不到 trace 的头号原因。

常见原因

按 2026 年 6 月在 Claude.ai 上的命中率从高到低排。

#	原因	最快验证
1	Effort 设成了 `Low`/`Medium`，自适应思考跳过了这条 prompt	模型名 → Effort → 调 `High` 或 `Max`，重发
2	prompt 太简单，模型选择不思考	故意发一条难 prompt（见 Step 3）
3	trace 渲染了但 `Thinking` accordion 折叠着	回复正上方找 `Thinking` 小条，点开
4	工具调用（网页搜索、代码）替代了可见 trace	回复里跑工具了吗？推理移进工具规划里了
5	非 Effort/旧模型上，`Extended` 开关没开	模型名 → 把 `Extended` 开关打开
6	套餐用量限制把你压到了更轻的路由	查套餐/用量；Pro 过期会回落到 Free 路由
7	对话非常长，思考步骤被挤掉	开新对话重发

1. Effort 调太低（现在最常见）

Opus 4.7、Opus 4.6、Sonnet 4.6 用的是自适应思考：不再是固定的思考预算，而是你挑一个 Effort 等级（Low、Medium、High、Max，Opus 4.7 还多一个 Xhigh）。按 Anthropic 文档的说法，在 High（默认）和 Max 下「Claude 几乎总会思考」，但「在更低的 Effort 等级，对简单问题它可能跳过思考」。如果你的 Effort 在 Low 或 Medium，单这一点就能解释 trace 不见了。

怎么判断： 点发送按钮旁边的模型名，鼠标移到 Effort 上，看当前等级。是 Low 或 Medium 就调到 High 或 Max。

2. Prompt 太简单，没触发思考

就算在 High Effort 下，自适应思考也可能不经过可见推理就回答一条又短又直接的 prompt（What is 2+2?）。模型会把工作量收敛到你问的范围。

怎么判断： 换一条明显难的 prompt：Walk me through how you would design a rate limiter that handles 10k QPS with burst absorption. 这种能出现 trace 的话，说明上一条只是不够难、不值得思考。

3. Thinking trace 渲染了但 accordion 折叠着

trace 显示成回复正上方一个小小的 Thinking 指示（运行时还带个计时器）。很容易漏，手机上尤其。点一下就能展开看到摘要后的推理。

怎么判断： 助手回复上方是不是有一条折叠的 Thinking 小 banner，点开看看。

4. 工具调用替代了思考步骤

Claude 决定跑工具（网页搜索、代码执行）时，可见推理常常移进工具规划里，而不是单独一个 Thinking 块。

怎么判断： 回复里跑工具了吗？跑了的话，这就是没看到独立 thinking trace 的原因。

5. 旧/非 Effort 模型上是个普通的 `Extended` 开关

没有 Effort 控制的模型，给的是一个简单的 Extended 开关，而不是 Effort 子菜单。如果你切过模型，你印象里的那个控件可能不在你以为的地方。

怎么判断： 点发送按钮旁边的模型名。看到的是 Extended 开关（不是 Effort 子菜单）的话，确认它是开着的。

6. 套餐或用量限制压低了路由

Free 套餐现在也带 Sonnet 4.6 加自适应思考，但用量有限；用多了会被限流。Pro/Max 订阅过期会静默回落到 Free 路由和限制。

怎么判断： Profile → Settings，确认订阅是 active 的，再看看是不是撞到用量上限了。

7. 上下文非常长

很长的线程里，模型会一边继续回、一边精简显式思考步骤来保持高效。

怎么判断： 线程大概多长？超过约 50 轮、或者六位数的 token，思考是最先被挤掉的。开条新对话验证一下。

开始前

确认对话选的是哪个模型（Opus 4.7、Opus 4.6 还是 Sonnet 4.6），路由决定你看到的是哪种思考控件。
想清楚这次是只想让这一条 prompt 思考、还是想默认把 Effort 调高。
准备一条明显难的测试 prompt，验证思考是否真的触发。

需要收集的信息

账号套餐（Free、Pro、Max、Team、Enterprise）。
对话顶部选中的模型。
当前 Effort 等级（或 Extended 开关是否显示打开）。
对话长度（大致 token 或消息数）。
触发了思考和没触发思考的 prompt 各一例。
浏览器、设备，以及可能干扰 UI 状态的扩展。

一步一步修复

Step 1：把 Effort 调高

点发送按钮旁边的模型名，鼠标移到 Effort 上，选 High 或 Max。Opus 4.7 上还可以选 Xhigh（它在 High 和 Max 之间，适合长时、需要大量探索的任务）。设置从 Claude 下一条回复开始生效，所以重发你的 prompt。

Step 2：确认模型支持思考

还在模型菜单里，确认你在 Opus 4.7、Opus 4.6 或 Sonnet 4.6 上。如果某个模型给的是普通 Extended 开关而不是 Effort 子菜单，把那个开关打开。两者都没有的模型，就切到上面三个之一。

Step 3：发一个故意难的 prompt

测：Explain the trade-offs between optimistic locking and pessimistic locking for a 10-tenant SaaS, with examples. 在 High 或 Max Effort 下，明显难的 prompt 应该在开始后几秒内就出现可见的 Thinking 指示。

Step 4：把 thinking accordion 展开

回复上方找小 Thinking banner 点开。trace 在里面就说明思考一直开着，你只是漏看了折叠 UI。

Step 5：开新对话

老线程把思考步骤挤掉了，那就开一条新对话，把 Effort 设成 High 或 Max，把 prompt 重发。新对话拿到的路由最干净。

Step 6：核对套餐和用量状态

Profile → Settings，确认订阅 active、没撞到用量上限。Pro/Max 过期会静默回落到 Free 路由和限制，思考深度会被压低。

Step 7：长期不触发就反馈

新对话、High/Max Effort 下的难 prompt、确认套餐 active 的情况下还是不触发，去 support.claude.com 提工单，附上对话 ID、模型名、Effort 等级、开关状态截图。

怎么确认修好了

难 prompt 上回复上方出现 Thinking 指示（运行时带计时器）。
展开后里面是多步推理，不是一句话。
回复延迟明显更高（大约 5-30 秒），跟非思考回复有区别。
在新对话里、同样 Effort 等级下重发同一条 prompt，也能出现思考。

长期预防

如果你经常需要思考，把默认 Effort 设高一点（High 或 Max；Opus 4.7 上用 Xhigh），因为自适应思考只有在 High 及以上才稳定触发。
把难 prompt 写成明显奖励推理的形式（walk me through、compare and contrast、design and justify）。
Project 里默认要推理的话，加自定义指令：For any prompt requiring multi-step reasoning or trade-off analysis, think carefully before responding.
长线程定期复查 Effort 等级，切模型时它可能漂移。
API 自动化流程里，per-request 显式设置 effort 和 thinking（见常见问答）。

容易踩的坑

Effort 留在 Low/Medium，然后断定思考坏了——其实只是自适应思考跳过了一条简单 prompt。
看开关亮就信，不发真正难的 prompt 验证。
漏掉折叠的 Thinking accordion，手机屏幕上尤其。
忘了工具调用会替代可见的思考步骤。
以为还有固定 token 预算；在 Opus 4.7 和 Sonnet 4.6 上它已经被 Effort 取代。

常见问答

怎么知道思考真的跑了？ 看回复上方的 Thinking 指示（运行时带计时器）。回复花了好几秒、读起来像有推理分析，也是个信号。
为啥把思考调高也不一定出 trace？ 自适应思考是按轮决定的。High/Max 下它几乎总会思考，但极简单的 prompt 仍可能被直接回答。给它一条难 prompt 验证。
Effort 和旧的 Extended Thinking 开关有啥区别？ Opus 4.7、Opus 4.6、Sonnet 4.6 把固定思考 token 预算换成了 Effort 等级（Low/Medium/High/Max，Opus 4.7 多一个 Xhigh）。High 是默认，等同于不设。
思考更贵吗？ 是。Effort 越高，吃的 token 越多（思考加回复），会算进 Free、Pro、Max 的用量限制，API 上算进计费。
怎么用 API 强制开启思考？ 在 Opus 4.7/4.6 和 Sonnet 4.6 上，设 thinking: {type: "adaptive"} 加 output_config: {effort: "high"}（或 "max"）。Opus 4.7 上旧的 thinking: {type: "enabled", budget_tokens: N} 已不再支持，改用自适应思考加 effort。
思考能跟工具一起用吗？ 能，但可见 trace 可能被工具调用替代。推理还是会发生，只是移进了工具规划里。