把 Extended Thinking 开关打开,问一个明显需要推理的问题,Claude 两秒内甩回一个答案,上面没有「thinking」trace 展开。开关看着还是开着的。你开始怀疑扩展思考是不是被静默关了、套餐不包含、或者跑了但 trace 被折叠了。原因常见这么几种:开关 UI 状态和服务端实际模型路由不同步;你的套餐在当前模型上不包含扩展思考;prompt 太短没触发思考;或者 trace 其实渲染出来了、只是被折叠在 accordion 里。每种都有一种快速验证方式。
常见原因
按命中率从高到低。
1. 开关视觉上是开的、服务端被重置了
扩展思考开关是按对话维度持久化的。刷新页面或者切换模型偶尔会把服务端 flag 重置,但 UI 按钮看着还在亮。
怎么判断:关掉、保存、再打开,发一条新的测试 prompt。
2. 套餐在这个模型上不包含扩展思考
Free 套餐和部分 Pro 模型不开放扩展思考。开关显示出来但路由到那些模型上是没用的。
怎么判断:Profile → Settings → Plan,确认扩展思考列在你的套餐内。看对话顶部选的是哪个模型。
3. Prompt 太简单,模型决定不思考
就算开关开着,prompt 又短又直接(「2+2 等于几?」),Claude 也会跳过思考步骤。模型是 per-turn 决定要不要思考的。
怎么判断:换一个明显难的 prompt:「带我走一遍:设计一个能扛 10k QPS、有 burst 吸收能力的限流器。」这种 prompt 能出现 trace 的话,说明上一条只是不值得思考。
4. Thinking trace 渲染了但 accordion 是折叠的
trace 显示成回复上方一个小小的「Thinking」横条。手机上特别容易漏掉,点一下就能展开看完整推理。
怎么判断:助手回复上方是不是有一条小折叠 banner,点开看看。
5. 上下文太长,思考预算被吃光
很长的对话里,思考预算会被上下文吃掉。模型继续回,但跳过显式思考步骤以保持在预算内。
怎么判断:对话有多长?超过 50 轮或者 10 万 token,思考经常被挤掉。
6. 工具调用替代了思考步骤
Claude 决定用工具(网页搜索、代码执行)时,工具调用有时会替代可见的 thinking trace。推理在工具规划里发生,但 UI 不展示出来。
怎么判断:回复里是不是有工具调用?有的话,这就是没看到独立 thinking trace 的原因。
开始前
- 确认对话用的是哪个模型(Claude 4 Opus、Sonnet 等),路由会影响思考是否可用。
- 想清楚这次是只想让这一条 prompt 思考、还是想默认都开。
- 准备一条明显难的测试 prompt 验证思考是否真的触发。
需要收集的信息
- 账号套餐(Free、Pro、Team、Enterprise)。
- 对话顶部选中的模型。
- 输入框区域开关是不是显示打开。
- 对话长度(大致 token 或消息数)。
- 触发了思考和没触发思考的 prompt 各一例。
- 浏览器、设备,以及可能干扰 UI 状态的扩展。
一步一步修复
Step 1:强制重置开关
输入框里把 Extended Thinking 关掉,发一条短测试。再打开,发另一条。重置一次能把服务端 flag 和 UI 同步上。
Step 2:确认模型支持思考
点对话顶部的模型名。确认是支持扩展思考的模型(Claude 4 Opus、Sonnet 各变体)。不支持就切。
Step 3:发一个故意难的 prompt
测:「解释 10 租户 SaaS 场景下乐观锁和悲观锁的权衡,举例说明。」明显难的 prompt 5 秒内应该看到 thinking trace。
Step 4:把 thinking accordion 展开
回复上方找小「Thinking」banner 点开。trace 在里面就说明思考一直开着,你只是漏看了折叠 UI。
Step 5:开新对话
老线程把思考预算吃光了,那就开一条新对话,把开关打开,把 prompt 重发。新对话拿全预算。
Step 6:核对套餐和账单状态
Profile → Settings → Plan,确认订阅 active、套餐在你选的模型上包含扩展思考。Pro 过期了会静默回落到 Free 路由。
Step 7:长期不触发就反馈
新对话、难 prompt、确认套餐都对的情况下还是不触发,去 support.anthropic.com 提工单,附上对话 ID、模型名、开关状态截图。
怎么验证修好了
- 难 prompt 上回复上方出现 Thinking banner。
- 展开 banner 里是多段推理、不是一句话。
- 回复延迟明显更高(5-30 秒),跟非思考回复有区别。
- 新对话里同样的 prompt 也能出现思考。
长期预防
- 培养把难 prompt 写成明显奖励推理的形式(「带我走一遍」「对比」「设计并论证」)。
- Project 里默认要思考的话,加自定义指令:「需要多步推理或权衡分析的 prompt 都使用 extended thinking。」
- 长线程定期检查开关有没有被重置。
- 设置里把你常用、支持思考的模型 pin 上。
- API 自动化流程里 per-request 显式设置 thinking 参数。
容易踩的坑
- 看开关亮就信,不发难 prompt 验证。
- 拿简单问题测、然后说思考坏了——其实只是不需要思考。
- 漏掉折叠的 accordion,手机屏幕上尤其。
- 忘了工具调用会替代可见的思考步骤。
- 以为所有模型都支持思考。Free 和部分轻量模型不支持。
常见问答
- 怎么知道扩展思考真的跑了? 回复上方的 Thinking banner。回复延迟 5 秒以上且答案明显有推理也是好信号。
- 扩展思考更贵吗? 是,吃更多 token,会按 Pro 和 Team 的使用预算计费。
- 能强制每次都思考吗? 不能,是否思考由模型 per-turn 决定,开关开着也一样。可以通过 prompt 写法鼓励。
- 思考和 Constitutional AI 安全推理是一回事吗? 不是,是不同层。扩展思考是暴露给你看的可见推理;安全审查不是。
- trace 为啥被截短? 长 trace 在 UI 里会被摘要。可以问「把你的完整推理给我看」拿更多。
- 思考能跟工具一起用吗? 能,但可见 trace 可能被工具调用替代。推理还是会发生在内部。