这篇讲什么
“让 ChatGPT 帮我研究一下 X”得到的东西看着光鲜,一半是编的——假引用、来源混在一起、数字自信地错。真正能用的调研流程,是用 ChatGPT 干它擅长的三件事(生陌生领域的大纲、列可能的来源、综合你已经读过的材料),人来盯它不擅长的那件事(判断来源质量)。这篇适合分析师、研究者、写简报的人——产出会被人盯着挑刺的那种。
这篇适合谁看
调研后产出会被一个能挑你毛病的人读:教授评分的论文、MD 会撕的并购备忘录、CEO 会引用的市场进入简报。如果读者根本不会核来源,你不需要工作流,你只需要写一段话。
什么时候适合用
- 3-5 个选项对比,要做一份结构化的取舍表。
- 见 vendor 之前先扒一下陌生行业或技术的背景。
- 写 1-3 页的短简报,每条断言都要有出处。
- 从 50 个搜索结果里筛出真正该读的 10 篇。
开始前准备
- 先定产物形状。“2 页简报,8 条带引用的断言,1 个推荐”比”研究一下 X”强得多。
- 想清楚读者是谁、他已经懂什么。大纲深度从这里推。
- 同时开一个笔记文件存来源 URL 和原文引语。证据不能只活在对话里。
- 显式打开联网搜索——别指望 ChatGPT 自己判断是否需要时效数据。
具体步骤
-
按读者深度要主题大纲:
列出 \{主题\} 的 5 个子领域,让一个资深 PM 在见 vendor 前必须搞懂。 每个写一句为什么重要。 -
每节让它联网找 3-5 个潜在来源,带发布日期:
对子领域 2,列 5 个近 18 个月发表的来源。 含标题、作者、出版方、日期、一句话摘要。 -
自己打开排前面的来源。读。再把关键段落贴回对话——这一步是杜绝假引用的关键。
-
让它只基于你贴的文字做综合:
只基于我上面贴的段落(不要用你的训练数据), 写 4 条 bullet 描述主要共识,2 条描述主要分歧。 -
最后写稿时引用的是你贴的 URL,不是模型自己生成的 citation。模型可以转述你的证据,不能信任它来生产证据。
一份能压住幻觉的 prompt
你在帮我做一份关于 {主题} 的调研简报。
约束:
- 不知道就说"不知道——需要搜索"。
- 不要编引用。找不到来源就说找不到。
- 每条断言要么可追溯到我提供的来源 URL,
要么标注"模型观点,未引用来源"。
实操下来这能显著降低虚构率,不能归零,但提升明显。
完成后检查
- 每个引用 URL 都点开。页面存在吗?真说了模型转述的那句话吗?
- 数字对照原始来源核,不要对照二手综述。
- 问一句:“反方观点是什么?“答不上来,说明简报是单面的。
- 检查发布日期。ChatGPT 的”近期”有时候意思是 2023。
怎么复用这套流程
- 做一份
research-template.md,存你常用的大纲 prompt 和反幻觉前言。 - 成功的调研对话用描述性命名归档——既是下次的模板,也是审计轨迹。
- 经常调研的领域(某个市场、监管机构、技术)在 Project 里建一份术语表,确保术语一致。
建议的操作流程
大纲 → 分节联网找源 → 人读关键源 → 贴关键段落 → 基于所贴段落做综合 → 引用你核过的 URL → 最后用对抗性问题再过一遍。
容易踩的坑
- 跳过来源核实。引用看着真,错的概率比想象的高。
- 不读原文就让它生成 citation——模型很擅长编貌似真实的参考文献。
- 主题太宽,大纲都列不清。“AI in healthcare”得先收窄到”AI 在 primary care 的医嘱转写”。
- 不区分模型训练数据 vs 联网结果,混在一起用。最后简报常常已经过时。
- 直接信它生成的表格(“5 家 vendor 的价格对比”),不逐行核。一般对一半,错的那几行会很自信。
- 忘了同行评议论文优先级高于 Medium 帖子 / LinkedIn carousel,即使后者说得更自信。
FAQ
- 调研用 Perplexity 还是 ChatGPT?: Perplexity 是为来源型调研专门做的,citation 质量更稳。ChatGPT 在大纲和综合上更顺。两个一起用。
- Deep Research 模式呢?: 在多源简报上确实值得。把它的输出当一稿,不当终稿。
- 怎么避免被它的假论文坑?: 让它出 DOI 或 arxiv ID。每个都点开。给不出可用链接的,就当编的。
- 能不能不自己读来源?: 能,前提是你接受被印出来骂。模型在转述,转述会漂移。