这篇主要解决什么问题
Deep Research 看着很厉害——研究计划、10-15 分钟跑、产出一份精致报告。但精致掩盖了它的失败模式:基于弱来源的自信综合。这篇抽出真价值(来源识别、结构化对比),并告诉你什么该扔(报告的散文本身)。
这篇适合谁看
需要对一个话题做多源综述的人——战略 / 产品负责人、市场分析师、做文献第一遍扫的科研人、调研供应商空间的运营、做初步尽调的律师。
什么时候适合用
问题范围明确、有至少 30 分钟核对产出。Deep Research 不是 5 分钟快查;当成”初级分析师的初稿”看,不是成品 memo。它的优势场景是答案为”10 个来源加权”,而不是”一条权威事实”。
什么时候不建议用
快速事实核查(用普通 Gemini 搜索或 Perplexity 基础);Deep Research 找不到优质来源的高度专业领域(前沿 ML 论文、冷门监管文件、行业内部定价);需要实时数据的任务(实时报价、突发新闻、当前天气)。
开始前准备
- 选一个有可验证答案空间的问题。“Top 3 X 在 Y、Z 上对比” 比 “讲讲 X” 强。
- 老实分配时间预算:跑 10-15 分钟、验证 30-45 分钟、改写 30 分钟。不到这个量就是在洗稿。
- 开跑前先定来源门槛:仅 peer-reviewed、仅近 12 个月、仅指名 vendor。没门槛就接受综合给你什么。
具体步骤
- 问题写具体并带约束。占位符只放在代码块里,例如
关于 <主题> 的前 3 种方法,按 <criteria> 对比 <选项 A> 和 <选项 B>。模糊表述只换来模糊报告。 - 点 Deep Research 等着——可能 5-15 分钟。别打断;卡过 25 分钟才重启。
- 报告到了先读”来源”,不是综合。点开每个引用 URL 验证三件事:页面存在、页面真讲了被引用的内容、对这个话题这家来源足够权威。
- 没有强来源的结论一律删,笔记里红色划掉。不要把弱结论带进成品。
- 把报告结构当起点,不当成品。用你的口吻只用验证过的结论重写。Gemini 的散文是一次性的。
- 来源单独存到一份 Doc 或 Sheet。综合是一次性的;来源单可以在以后同问题更新时复用。
第一次实操怎么跑
- 选一个你完全熟的话题。只有这样才能抓出细微错误。
- 用你正常的措辞跑一遍 Deep Research。保存输出。
- 按上面第 1 步的结构化措辞再跑一次。对比来源重合度。
- 标出只在第二次(更约束)出现的来源——那就是结构化 prompt 的价值。
完成后检查
- 每条承重结论是否过了来源核对?争取 80%+ 通过率;低于这个,这只是初稿不是 brief。
- 来源是否落在你指定的时间窗口里?Deep Research 在尝试扩覆盖时会向更旧的来源漂。
- 综合是否掩盖了来源之间的关键分歧?看到”专家一致认为”通常是抹平的信号。
怎么复用这套流程
- 把验证通过率最高的 prompt + 来源门槛组合存成模板。
- 重复话题(季度竞品扫描)用同一 prompt 配新鲜度窗口重跑,对比来源差异。
- 失败日志:Deep Research 反复幻觉来源的话题,说明这个领域要么付费墙重要么索引不够。
- 大约每两个月刷新一次——Deep Research 的来源偏好和流畅度都会随底模动。
建议的操作流程
产品上线竞品分析:带约束写问题 → Deep Research → 等 10 分钟 → 验证 12 个来源、留 8 删 4 → 只用验证过的来源重写一份 2 页综合 → 来源 Doc 留给下季度更新用。
容易踩的坑
- 把 Deep Research 输出当最终结果。一定要验来源。
- 问得太泛——“讲讲 AI”拿到没用的总览。
- 不点开就相信引用。Deep Research 偶尔编造看起来真实的 URL,或者把真 URL 挂在错结论上。
- 在文献付费的话题上跑——拿到从新闻稿综合的概览,不是真研究。
- 让精致散文说服你分析也扎实。漂亮散文是 LLM 研究输出里最常见的欺骗。
进阶技巧
- 技术话题加:“优先 peer-reviewed 或官方文档来源”。模型对来源质量提示有显著响应。
- 商业话题加:“优先过去 12 个月的来源”,避开过期行业报告。
- 同一问题换两种表述各跑一次——对比来源列表看覆盖盲区。交集就是高置信集合。
- 配合 Gemini 普通对话:把综合粘进去问”这份报告回避了哪些批评者会指出的东西?“——能挖出盲点。
FAQ
- Deep Research 跟普通 Gemini 区别?: 它跑多次搜索、规划角度、跨源综合。慢、彻底,但仍受来源质量限制。
- 能信综合吗?: 只能像信来源那样信它。一定要核对。
- 为什么它会引用博客和论坛?: 当话题在权威来源里覆盖不够时,模型会往来源质量栈下面够。收紧 prompt。
- 免费 vs Advanced?: 免费档跑得短、有上限。Advanced 跑更久、用更好的底模。真要用的工作,本文默认 Advanced。
- 能读我 Drive 吗?: Workspace 集成能把 Drive 文件接进研究计划。要按工作区显式启用。