这篇讲什么
大多数”帮我分析一下”出来的东西是把输入复述得更顺,再加一个听着自信的结论——结论几乎总错,因为模型跳过了最脏的中间一步:把输入先组织成结构再下推论。Claude 的长 context 和愿意听细致指令的特性让它是当下大众模型里最强的分析手——前提是你带它走一遍”先分类再推论”的流程。这篇适合分析师、PM、咨询、创始人——任何要写一份会被人质疑的推荐意见的人。
这篇适合谁看
- 把 10+ 个输入综合成推荐的分析师和咨询。
- 大量用研、客服 ticket、需求待办里找规律的 PM。
- 拿着混合证据做 hire/fire/build/buy 决策的创始人。
- 读多份来源、写结构化结论的研究者。
什么时候适合用
- 手头有输入(文档、转录、问卷、表格导出),要出结论。
- 输入多到没法全扫、杂到没法塞表格、ddl 在明天。
- 你能说清要做什么决定,但还说不清证据怎么排。
- 利害真实但不至于赌公司命。后者还是要拉真人。
什么时候不适合
- 一份小输入,10 分钟能读完——直接读。
- 数字密集型分析更适合 Python / pandas。Claude 能做但不如代码干净。
- 漏一个细节就出大事的(合同审、医疗)——让 Claude 列候选,人来核。
开始前准备
- 一句话定决策。“要不要 hire X”——不要”帮我想想 X”。
- 把输入归到一处。Markdown 文件、PDF、粘转录。总量控制在 200K token 以内——Claude 长 context 强,但超过这个数质量下滑。
- 写出初步假设,哪怕粗糙。模型能帮你压力测试它;你不出假设它帮不上。
- 想清输出形状:1 页 memo、决策矩阵、带推荐的取舍清单。
具体步骤
-
把所有输入以文件(Claude.ai Projects)或文本贴入。每个标清:“文档 1:客户访谈转录,2026-05-15。文档 2:PRD 草稿 v3。”
-
强制做一次分类,不允许直接推论:
下结论之前,把上面输入分到 3-5 个能帮我们决定 \{问题\} 的类别。每类列出哪些输入归入、为什么。 -
检视分类。感觉牵强或漏明显切法就推回去:“文档 4 你放在 A 类,但它更像 B 类。”
-
让它分类得出结论,不要一个大综合:
每类写 2-3 句这些输入合起来在说什么, 再写一句不确定在哪。 -
综合成带显式 caveat 的推荐:
基于分类分析,给我: - 一句话推荐 - 支持它的 3 条最强证据 - 2 条最强反对意见 - 我需要再知道什么才会改变推荐 -
压力测试:把推荐贴回去问”要让这条推荐错,什么必须为真?“——强迫模型走出附和模式。
能逼出诚实分析的 prompt 模板
你在帮我决定:{一句话决策}。
约束:
- 推论前先分类。
- 每条断言标注"由文档 X 支持"或"模型推断"。
- 输入之间的分歧要显式列出。
- 收尾说我们需要再知道什么才能有信心。
完成后检查
- 类别是不是接近 MECE(互斥且穷尽——大致即可)?类别重叠产出一堆糊的结论。
- 每个结论能不能追到具体输入?没有出处的就是模型推断,要标。
- 推荐可执行吗,还是模糊到谁都不得罪?“建议进一步研究”不算推荐。
- 反对意见在综合里活下来了,还是消失了?应该显式存在。
怎么复用这套流程
- 周期性决策类型(招聘、选 vendor、需求优先级)建一个 Project 带分类 prompt 当起手。同一框架,换输入。
- 维护一份
decisions.md记录过往分析和结果。半年后能看到哪种分类方式扛住了、哪种没有。 - 压力测试 prompt 单独存——杠杆最高的那条。
建议的操作流程
带标签装入输入 → 分到 3-5 类 → 分类得结论 → 综合 + 显式反对意见 → 压力测试(“要错的话什么必须为真”)→ 用 Claude 的稿当脚手架写你的 memo,不当终稿。
容易踩的坑
- 跳过分类。推荐结构性薄弱,因为模型没有锚点。
- 不做结构就要推荐。出来的是输入的”自信平均值”。
- 把 Claude 的初稿当 memo 终稿。初稿是脚手架,综合部分需要你判断。
- 输入不打标签全塞。模型把无标签输入当同等重要,自然权重丢了。
- 不做压力测试。模型默认附和;显式反向提问才能拿到诚实分歧。
- 结构化(表格)和非结构化(转录)混在一次分析里。拆开,分别分析,最后综合时再合。
FAQ
- 分析为什么选 Claude 不选 ChatGPT?: Claude 更长 context + 更愿意听细指令,多文档综合上比 ChatGPT 强一档。ChatGPT 也很能打;Gemini 长 context 也有竞争力。
- 实际输入上限?: Claude context 很大,但混合材料超过 ~150K token 后质量下滑。更大就先各自总结,再分析总结。
- 要不要用 Claude Artifacts 出 memo?: 终稿那一步用 Artifacts 很顺。分析步骤还是用聊天。
- Claude Projects vs 单对话?: 周期性分析类型用 Project;一次性决策用单对话。
- 能信任 Claude 处理敏感数据吗?: Anthropic 企业版的数据控制很强。默认消费版会存对话,上传前确认。
- 为啥我的推荐感觉模棱两可?: 大概率没做压力测试。加上”要错的话什么必须为真”那条 prompt。