和普通 ChatGPT 调研有什么区别？

普通调研是一发一发打的，你在常规对话里逐轮引导。Deep Research 是有额度的批处理，读几十到几百个来源、写一份带引用的报告。当"浅"是你真正的问题时，才上慢车道。

Deep Research 一个月能跑几次？

2026 年 6 月数据：Free 每月 5 次轻量版，Plus、Team、Enterprise 每月 25 次（之后回落到轻量版），Pro 每月 250 次。额度变动频繁，请以 OpenAI 套餐页为准。

现在用的是什么模型？

自 2026 年 2 月起，标准额度跑在基于 GPT-5.2 的研究模型上；超额后回落到更轻、更便宜的模型。正因为推理够深，一次才要跑几分钟，而不是几秒。

URL 存在的概率比"它真说了那句话"高。点进去核实来源是否真说了被转述的内容——转述漂移是主要失败模式，链接还可能在 PDF/DOCX 导出时断掉。

如果跑超过 30 分钟还没完？

大多数在 5-30 分钟内结束。如果明显远超还卡着，用实时干预把范围收窄，或取消重定题——通常是题太宽。

可以用 Deep Research 替代雇一个初级分析师吗？

一次性简报，常常可以。需要持续覆盖的领域，不行——你需要一个慢慢积累领域知识的人，不是每周从零跑一次。

AI 工具教程

ChatGPT Deep Research：经得起挑刺的工作流

面向会被人翻引用、抠数字的简报，跑 ChatGPT Deep Research：题目收窄、调整方案、终稿前核每一条引用。附最新额度、设置与可直接套用的 prompt（2026 年 6 月）。

发布于: 2026/05/24 更新于: 2026/06/06 作者: AI Productivity Guide Team 🌐 查看英文版本

一句话总结

Deep Research 是 ChatGPT 的慢车道：你给一个问题，它花大约 5-30 分钟读几十到几百个来源，返回一份多小节、几乎每条关键断言都带引用的报告。2026 年 2 月升级后，它跑在一个基于 GPT-5.2 的研究模型上，开跑前会先让你确认一份可编辑的调研方案，运行中可以实时干预、也可以限定只搜某些站点。它的产出看着够可信，于是大家就跳过核实——而核实恰恰是 Deep Research 存在的意义。把问题收窄到一句话、在 prompt 里写清来源规则，然后在发稿前点开 5-8 条引用逐一核对。

这篇讲什么

这篇适合那种读者真的会去核引用、核数字、核逻辑的简报，而普通 ChatGPT 调研已经太浅、撑不住场面：投资备忘录、竞品分析、政策简报、尽调写作、买之前的技术评估。如果你的读者愿意接受”ChatGPT 这么说”，你不需要 Deep Research，你需要一段话。如果不接受，Deep Research 是合适的档位——但前提是你会好好定题、好好核实。

2026 年有哪些变化

Deep Research 在 2025 年初上线时跑在基于 o3 的模型上，超额后回落到更便宜的 o4-mini。2026 年 2 月的更新把主引擎换成了基于 GPT-5.2 的研究模型，并加入了几个对正经活儿真正有用的控制项：

可编辑的调研方案。 开跑前 Deep Research 会先问几个澄清性问题、给出一份方案。你可以改这份方案，让报告对准你真正需要的东西。
实时干预。 你能看到它正在跑的查询，可以暂停、中途塞进补充指令或新来源，不必从头重来。
限定站点与时间范围。 把搜索限制在可信域名或某个时间窗内，它就不会再去引用随便一个 Substack。
MCP 与应用连接。 通过 MCP 接入你自己的数据源，做”内部 + 联网”的混合简报。
更好的输出。 全屏报告带目录；可导出 PDF、DOCX 或 Markdown（导出时引用会略有损耗，以应用内版本为准）。

额度，以及你需要哪个档

Deep Research 的额度和普通对话是分开计的。下面这些额度到 2026 年 6 月一直稳定；标准额度用完后，运行会自动回落到一个更便宜的轻量模型，而不是直接卡住你。

档位	价格（美元/月）	Deep Research 次数/月	备注
Free	$0	5（仅轻量版）	够试用；美国 Free 自 2026 年 2 月起带广告
Go	$8	有限	入门付费档
Plus	$20	25，之后回落到轻量版	偶尔写简报的甜区
Pro	$100 / $200	250	$200 档另带完整约 100 万 token 的应用内上下文

价格和额度为 2026 年 6 月数据，变动频繁，下单前请以 OpenAI 套餐页为准。如果你每周都重度调研，Plus 很快会用完——25 次标准额度大约相当于每个工作日一次。如果你天天泡在 Deep Research 里，$100 的 Pro 档那 250 次是实际起步线。

开始前准备

把问题收窄到一句话。“对一支[规模]的买家，比 X 和 Y 在 Z 上的拥有成本”，比”讲一讲 X”强得多。题太宽，模型聚不焦 30 个来源。
运行前先定好什么算可接受来源：同行评议、点名的行业分析师、厂商文档，还是独立基准。写下来——你会把它粘进 prompt，也会填进站点限定的筛选里。
在日历上单独留出核实的时间，不只是等待。 核实这一遍的耗时，和跑的耗时差不多。
凡是要发稿的，用标准额度，别用轻量回落版。 如果你快到月度上限，就把 Deep Research 留给真正需要它的那份简报。

具体步骤

像给一个仔细的分析师下任务那样写定题 prompt，别像给搜索引擎：

对比 Snowflake 和 Databricks 的拥有成本——对象是
一支 200 人的数据团队、每月跑 5TB 批 ETL。
来源要覆盖厂商文档、近 18 个月发表的第三方基准、
至少两个独立客户案例。仅来自厂商的断言要标出来。

先看它给出的调研方案。 这是你能做的回报最高的一次修改。如果方案过度偏向厂商页面、或漏了某个地区，就在这里改掉，别让它白跑 20 分钟去搜错的范围。
来源重要的话就限定它。 加上可信域名和时间窗，模型就没法用过时或低质量的页面凑数。
启动后去做点别的有用的事，大约 20 分钟。别坐着盯——“是不是卡了？“的本能没用。如果在实时进度里看到它跑偏，当场干预。
回来后先看结构，别先读正文。该有的小节都在吗？引用是逐条挂在断言后面，还是只堆在结尾？
先读引用列表，再读正文。 如果来源集中在某一家厂商的站点上，综合一定偏向那家厂商的叙事。
随机挑 5-8 条引用打开核：页面存在吗？真说了简报里转述的那句话吗？
找出最可能出错的 2-3 条断言（具体数字、正面对比、近期日期），用原始来源核，而不是用被引用的二手综述。

一份能压住 Deep Research 的 prompt

Deep Research 简报。
约束：
- 没有来源的断言，标"无来源——模型推断"。
- 不要把厂商市场材料和独立基准混在一起，
  当成两类证据分别处理。
- 任何数字（价格、市场规模、增速）要引用一手来源，
  不是某篇引用了它的二手文章。
- 来源之间有分歧时，把分歧露出来，不要平均掉。
- 最后加一节"最弱证据"，列出支撑最差的 3 条断言。

最有用的是结尾那条”最弱证据”——它强迫模型自查，列出来的恰恰是你最该亲手去核的。

完成后检查

厂商对比相关的引用 100% 点开——这是虚构和日期漂移最严重的地方。
每个量化断言都用原始来源核。Deep Research 对二手综述太信任，而且导出时引用链接可能损坏。
在快速变化的领域里，看到 24 个月以上的引用就警觉——通常说明搜索没找到当前数据。时间范围筛选能挡掉大部分这类问题。
问自己：“一个领域专家一定会写、而这份简报漏掉的是什么？“答不上来，简报就还没准备好发。

怎么复用这套流程

存一份 deep-research-template.md，固定你的定题 prompt 结构和”最弱证据”结尾。
对会重复出现的简报类型（季度竞品扫描、厂商评估），把成功的一次跑成结构模板——复用小节标题，不复用内容。
给每个领域维护一个可信来源白名单（你认可的分析师、出版方、厂商文档）。把它粘进 prompt，也加载到站点限定的筛选里，模型就会偏向这些。

容易踩的坑

把输出当终稿。 它是一份强初稿和一份引用地图，仅此而已。
跳过方案审查。 改它给出的方案是修正范围最便宜的办法，跳过就白费一次额度。
因为正文听起来很权威就跳过核实。 Deep Research 的”自信度 / 准确度”比是最高的——这正是它最容易翻车的地方。
题定得太宽。“讲讲 AI 基础设施市场”会得到一摊东西，模型聚不焦 30 个来源。
厂商来源和独立来源不区分。 半篇简报最后都在复读厂商自己的叙事。
普通调研够用时却烧一次额度。 等待是真实成本，10 分钟联网就能答的问题别用 20 分钟去跑。
不预留核实时间。 跑 20 分钟、只核 5 分钟，比跑 5 分钟普通调研、认真核还差。

FAQ

和普通 ChatGPT 调研有什么区别？: 普通调研是一发一发打的，你在常规对话里逐轮引导。Deep Research 是有额度的批处理，读几十到几百个来源、写一份带引用的报告。当”浅”是你真正的问题时，才上慢车道。
Deep Research 一个月能跑几次？: 2026 年 6 月数据：Free 每月 5 次轻量版，Plus、Team、Enterprise 每月 25 次（之后回落到轻量版），Pro 每月 250 次。额度变动频繁，请以 OpenAI 套餐页为准。
现在用的是什么模型？: 自 2026 年 2 月起，标准额度跑在基于 GPT-5.2 的研究模型上；超额后回落到更轻、更便宜的模型。正因为推理够深，一次才要跑几分钟，而不是几秒。
引用能信吗？: URL 存在的概率比”它真说了那句话”高。点进去核实来源是否真说了被转述的内容——转述漂移是主要失败模式，链接还可能在 PDF/DOCX 导出时断掉。
如果跑超过 30 分钟还没完？: 大多数在 5-30 分钟内结束。如果明显远超还卡着，用实时干预把范围收窄，或取消重定题——通常是题太宽。
可以用 Deep Research 替代雇一个初级分析师吗？: 一次性简报，常常可以。需要持续覆盖的领域，不行——你需要一个慢慢积累领域知识的人，不是每周从零跑一次。

一句话总结

这篇讲什么

2026 年有哪些变化

额度，以及你需要哪个档

开始前准备

具体步骤

一份能压住 Deep Research 的 prompt

完成后检查

怎么复用这套流程

容易踩的坑

FAQ

相关阅读

相关文章

ChatGPT Canvas 工作流：改长文档不用整篇重写

ChatGPT 键盘快捷键：2026 年值得记的那一份清单

ChatGPT 整理会议纪要：从转录到行动项（2026）

手机上的 ChatGPT：真正适合手机的几种用法

ChatGPT 定时任务：把重复 AI 工作排进时间表（2026 指南）

ChatGPT 做翻译——比贴上去就让它翻好得多