Gemini Deep Research 工作流

Deep Research 把 Gemini 变成多步研究 Agent。什么时候能信、什么时候要核对。

这篇主要解决什么问题

Deep Research 看着很厉害——研究计划、10-15 分钟跑、产出一份精致报告。但精致掩盖了它的失败模式:基于弱来源的自信综合。这篇抽出真价值(来源识别、结构化对比),并告诉你什么该扔(报告的散文本身)。

这篇适合谁看

需要对一个话题做多源综述的人——战略 / 产品负责人、市场分析师、做文献第一遍扫的科研人、调研供应商空间的运营、做初步尽调的律师。

什么时候适合用

问题范围明确、有至少 30 分钟核对产出。Deep Research 不是 5 分钟快查;当成”初级分析师的初稿”看,不是成品 memo。它的优势场景是答案为”10 个来源加权”,而不是”一条权威事实”。

什么时候不建议用

快速事实核查(用普通 Gemini 搜索或 Perplexity 基础);Deep Research 找不到优质来源的高度专业领域(前沿 ML 论文、冷门监管文件、行业内部定价);需要实时数据的任务(实时报价、突发新闻、当前天气)。

开始前准备

  • 选一个有可验证答案空间的问题。“Top 3 X 在 Y、Z 上对比” 比 “讲讲 X” 强。
  • 老实分配时间预算:跑 10-15 分钟、验证 30-45 分钟、改写 30 分钟。不到这个量就是在洗稿。
  • 开跑前先定来源门槛:仅 peer-reviewed、仅近 12 个月、仅指名 vendor。没门槛就接受综合给你什么。

具体步骤

  1. 问题写具体并带约束。占位符只放在代码块里,例如 关于 <主题> 的前 3 种方法,按 <criteria> 对比 <选项 A> 和 <选项 B>。模糊表述只换来模糊报告。
  2. 点 Deep Research 等着——可能 5-15 分钟。别打断;卡过 25 分钟才重启。
  3. 报告到了先读”来源”,不是综合。点开每个引用 URL 验证三件事:页面存在、页面真讲了被引用的内容、对这个话题这家来源足够权威。
  4. 没有强来源的结论一律删,笔记里红色划掉。不要把弱结论带进成品。
  5. 把报告结构当起点,不当成品。用你的口吻只用验证过的结论重写。Gemini 的散文是一次性的。
  6. 来源单独存到一份 Doc 或 Sheet。综合是一次性的;来源单可以在以后同问题更新时复用。

第一次实操怎么跑

  1. 选一个你完全熟的话题。只有这样才能抓出细微错误。
  2. 用你正常的措辞跑一遍 Deep Research。保存输出。
  3. 按上面第 1 步的结构化措辞再跑一次。对比来源重合度。
  4. 标出只在第二次(更约束)出现的来源——那就是结构化 prompt 的价值。

完成后检查

  • 每条承重结论是否过了来源核对?争取 80%+ 通过率;低于这个,这只是初稿不是 brief。
  • 来源是否落在你指定的时间窗口里?Deep Research 在尝试扩覆盖时会向更旧的来源漂。
  • 综合是否掩盖了来源之间的关键分歧?看到”专家一致认为”通常是抹平的信号。

怎么复用这套流程

  • 把验证通过率最高的 prompt + 来源门槛组合存成模板。
  • 重复话题(季度竞品扫描)用同一 prompt 配新鲜度窗口重跑,对比来源差异。
  • 失败日志:Deep Research 反复幻觉来源的话题,说明这个领域要么付费墙重要么索引不够。
  • 大约每两个月刷新一次——Deep Research 的来源偏好和流畅度都会随底模动。

建议的操作流程

产品上线竞品分析:带约束写问题 → Deep Research → 等 10 分钟 → 验证 12 个来源、留 8 删 4 → 只用验证过的来源重写一份 2 页综合 → 来源 Doc 留给下季度更新用。

容易踩的坑

  • 把 Deep Research 输出当最终结果。一定要验来源。
  • 问得太泛——“讲讲 AI”拿到没用的总览。
  • 不点开就相信引用。Deep Research 偶尔编造看起来真实的 URL,或者把真 URL 挂在错结论上。
  • 在文献付费的话题上跑——拿到从新闻稿综合的概览,不是真研究。
  • 让精致散文说服你分析也扎实。漂亮散文是 LLM 研究输出里最常见的欺骗。

进阶技巧

  • 技术话题加:“优先 peer-reviewed 或官方文档来源”。模型对来源质量提示有显著响应。
  • 商业话题加:“优先过去 12 个月的来源”,避开过期行业报告。
  • 同一问题换两种表述各跑一次——对比来源列表看覆盖盲区。交集就是高置信集合。
  • 配合 Gemini 普通对话:把综合粘进去问”这份报告回避了哪些批评者会指出的东西?“——能挖出盲点。

FAQ

  • Deep Research 跟普通 Gemini 区别?: 它跑多次搜索、规划角度、跨源综合。慢、彻底,但仍受来源质量限制。
  • 能信综合吗?: 只能像信来源那样信它。一定要核对。
  • 为什么它会引用博客和论坛?: 当话题在权威来源里覆盖不够时,模型会往来源质量栈下面够。收紧 prompt。
  • 免费 vs Advanced?: 免费档跑得短、有上限。Advanced 跑更久、用更好的底模。真要用的工作,本文默认 Advanced。
  • 能读我 Drive 吗?: Workspace 集成能把 Drive 文件接进研究计划。要按工作区显式启用。

相关阅读

标签: #Gemini #教程 #研究 #工作流