Plus 用户常见两种用法:要么永远默认,要么”为了保险”永远用最重的推理模型。两种都浪费——前者把硬任务的质量留在桌上,后者把分钟数烧在等思考,而快模型 2 秒就答完了。这是一张真正把任务对到模型的决策表。
这篇讲什么
闲聊和起稿用快模型,数学和复杂代码用推理模型,简单查询用轻量模型。关键是按任务选,不是按反射选。
本文涉及的工具 / 概念:
- ChatGPT: OpenAI 的对话式 AI 助手,最早把 GPT 系列模型带给普通用户的产品。
- 推理模型: 答前会显式”思考”的模型。多步问题更稳,每条响应慢得多。
- 快 / 默认模型: 为延迟和对话质量调优,70-80% 的请求用它就够。
这篇适合谁看
能在 UI 里看到模型选择器的 Plus / Team / Enterprise 用户。免费档可以用同一套思维框架,只是菜单不全。
什么时候适合用
每次准备发一条非琐碎请求、手在模型选择器上犹豫时。也可以当成”每月一次”的校准习惯,OpenAI 推新模型时跑一遍。
开始前准备
- 列出你一周里的常见任务桶——闲聊、起稿、数学、写代码、调研、图、查询。桶的数量比名字重要。
- 知道你的消息上限。推理模型耗配额;用力过猛中午 2 点就把日上限烧完。
- 准备一个真任务来测,不是 trivia。“法国首都是哪”区分不出模型差异。
决策矩阵
| 任务 | 先试 | 不行升 | 跳过 |
|---|---|---|---|
| 闲聊、总结、快速改写 | 快 / 默认 | 在意准确性时升推理 | 轻 / nano(更差) |
| 起邮件、起文档 | 快 | 敏感语气调优时升推理 | 轻 |
| 数学、多步逻辑 | 推理 | — | 快(微妙错误) |
| 代码审查、debug | 推理 | — | 快只用于琐碎修复 |
| 简单查询、格式转换 | 轻 / nano | 错了就升快 | 推理(浪费) |
| 图片 prompt | 快 / 多模态 | — | 推理(无收益) |
| 带来源的调研 | 联网搜索 | >5 个来源升 Deep Research | 纯快(没引用) |
具体步骤
- 输入 prompt 前先识别任务桶。2 秒的思考能省 2 分钟的等待。
- 闲聊型请求默认用快模型。大多数任务在这。
- 出现这些信号时升推理:数学、多步规划、必须正确的代码、自己不容易验证的答案。
- 这些情况降轻模型:一次性查询、格式转换、速度比深度更重要。
- 中途换模型时下条消息重述目标。换模型时上下文不完整传递。
- 用 3 周后回看撞到的 rate-limit 提示——它在告诉你哪儿反射用错了。
第一次实操怎么跑
- 选一个你上周用错模型的任务(等太久 / 答案太弱)。
- 按矩阵推荐的模型重跑。对比时间和质量。
- 给自己写一条规则:“以后 [这类任务] 走 [这个模型]。“
完成后检查
- 推理任务:模型展示了思考步骤吗?步骤对吗?答案对但步骤错,下次抛硬币。
- 快模型任务:答得够快没打断你的 flow 吗?快模型 8 秒,推理要 60 秒。
- 轻模型任务:真的省了时间,还是因为第一版错了又升到快模型重跑?
怎么复用这套流程
- 把矩阵存成个人笔记,每月更新——OpenAI 出新模型比博客更新快。
- Settings → Personalization → 把默认模型设成你最常的那一桶。多数人留在出厂值,永远多付这个税。
- 重复任务做成 Custom GPT,把对应模型预选好,从此不用再戳选择器。
建议的操作流程
判断任务复杂度(闲聊 / 推理 / 查询)→ 匹配模型 → 跑 → 检查这次档是不是选对了。一周内会变成反射,从此不用思考。
容易踩的坑
- “保险起见”什么都用推理模型——忙的那天中午前就撞 rate limit。
- 数学 / 代码长期留在快模型——输出看着对,里面有微妙错误,上线才暴露。
- 把”慢”和”聪明”混淆。推理模型在闲聊上不更好,它在需要步骤的问题上更好。
- 中途换模型不重述目标。上下文会以意外方式漂移。
- 只看模型名字(“4” / “5” / “o-something”),不在自己任务上实测。名字几个月就变。
- 忽略 rate-limit 提示。它精确告诉你哪个习惯错了。
FAQ
- 哪个模型”最好”?: 没有最好,只有”在这成本 / 延迟下,这任务最好”。在自己工作上实测。
- 写代码永远用推理吗?: 上线代码一般是的。一行小脚本、正则没必要。
- 撞上限怎么办?: ChatGPT 自动降到轻模型或让你等。预案:开两个 tab,分别在不同档。
- 怎么知道某对话用的是哪个模型?: 消息头或对话信息里会显示。每档存一两个”用得很好”的对话当参照。