多数 ChatGPT 用户卡在两种习惯里:永远默认,或者”保险起见”永远最重的推理模型。两种都浪费——前者把硬任务的准确性留在桌上,后者把分钟数和 rate limit 烧在快模型 2 秒能答完的问题上。这篇就是终结这种 rut 的”按任务决策”框架,外加每月一次的重校准习惯——OpenAI 的模型阵容要求你这么做。
这篇主要解决什么问题
很多人要么永远用默认模型,要么永远用最重的——都是错的。按任务选模型省钱省时间,结果还更好。
这篇适合谁看
能选模型的 Plus / Team / Enterprise 用户。免费档判断要不要升级时也用得上。
什么时候适合用
感觉简单任务等太久、或难任务答得太烂时。
什么时候不建议用
免费档没模型可选——挑别的指南看。或者你一周只用一次 ChatGPT、也不在乎成本时跳过。
具体步骤
- 列出你的常见任务桶:快速查询、起稿、深度推理、写代码、数学、创意。
- 每桶映射到模型档:查询 + 起稿 → 最轻最快。深度推理 + 数学 + 复杂代码 → 推理强的。图 / 多模态 → 多模态模型。
- 在 Settings 里把默认设为你最常用的那一档。少数情况单聊里再换。
- 长对话里先用轻模型,碰壁了再升。
- 记下哪些任务一定要重模型。存成模板,自动用对模型。
建议的操作流程
一次研究会话:用轻模型探关键词 → 缩小到具体主张时切重模型 → 最后格式化总结切回轻模型。一个对话三次换模型。
容易踩的坑
- 什么都用最贵模型——慢且很快撞上限。
- 硬推理用最轻模型——输出看起来还行,里面有微妙错误。
- 中途换模型不告诉它。上下文有时传递不完整。
- 只看模型名(“4”、“5”),不在自己的任务上实测。
- OpenAI 出新模型时不重跑你的小基准。能力会变;半年前的经验大概率错。
- 把 rate-limit 警告当噪音忽略,不当数据看。它正在告诉你本周哪一档用过头。
进阶技巧
- OpenAI 每次换型号阵容时跑一份 5 个任务的小基准。名字和能力都在变。
- 写代码值得多等推理模型。写文字一般轻模型够。
- 图片生成里模型档不如 prompt 质量重要。
怎么验收输出
- 能说出 3 档模型 + 每档最擅长的一个任务。
- 默认模型对应你最常的任务。
- 至少撞过一次上限——压力下知道切档会发生什么。
FAQ
- 哪个模型”最好”?: 没有”最好”,只有”在这成本 / 延迟下,对这任务最好”。在你自己的工作上实测。
- 为什么模型名这么乱?: OpenAI 迭代比起名字还快。labels 几个月就变一次。能力描述比版本号靠谱。
- 撞了推理模型 rate limit 怎么办?: ChatGPT 要么自动降档要么让你等。备一个”Plan B 模型”,思路接不上时能切。
- 能中途换模型吗?: 偶尔可以——但下一条消息重述目标。换模型时上下文传递不完整,从推理切到快尤其。