Claude 长文档工作流

长 context 是 Claude 的强项——100+ 页文档不用拆。

这篇讲什么

一套可复用的工作流,用 Claude 处理 100-500 页长文档,不拆分、不误转述、不编出根本不存在的章节。痛点:很多人扔一份 200 页 PDF 上去问”5 条总结”,拿到一篇看着像样、漏掉最重要那节的输出,然后拿着这份总结做决策。Claude 的长 context 在这类文档上能跑赢所有替代——但要靠结构化提问。这篇把结构给你。

本文涉及的工具 / 概念:

  • Claude: Anthropic 的对话式 AI,多数 plan 支持 200k token 上下文。
  • 结构大纲 pass: 任何内容解读前先要文档结构;让答案落地的关键一步。
  • 逐节深入: 一次问一节并要页码引用,而不是对全文一个大问题。

这篇适合谁看

研究、分析、法律、学生,以及任何以读长 PDF 为生的人。如果你被 LLM “总结”漏掉最关键那段坑过,这篇尤其值。

什么时候适合用

读报告、合同、论文、笔录、技术规范、监管申报或任何超过 50 页的东西。多文档比对且每份本身就长时也很有用。

开始前准备

  • 确认文档有真正的文本层(PDF reader 里能选中文字)。重扫描靠 OCR,会带噪声。
  • 旁边另开一份独立副本核查。第一遍什么都别信。
  • 决定输出目标——执行摘要、分节表、引语清单、合规缺口分析。不同目标要不同 prompt。
  • 估算时长。长文档工作 30-60 分钟;提前留出,不要挤。

具体步骤

  1. 上传文档。改成好记的名字(“acme-vendor-msa-2026.pdf”),方便后续消息里 Claude 按名引用。
  2. 先要结构大纲:列出本文每个一级和二级章节及对应页码区间。先不要总结内容。 强制先盘点再解读。
  3. 逐节深入并要页码:在第 4 节(第 23-41 页)列出每条编号义务,给原文措辞和页码。 重要章节都跑一遍。
  4. 风险敏感内容问它”没有”什么:这份 MSA 通常会有的章节里,本文没有哪些?要具体。 抓住你以为有的缺失条款。
  5. 至少手工验证 3 条引语 + 2 个数字。错了就先反推 Claude 再继续——首次幻觉之后准确率会下降。
  6. 最后要执行摘要,必须在分节细节都核过之后:现在写一页执行摘要,每条主张注明章节和页码。

第一次实操怎么跑

  1. 选一份 50-100 页你读过的文档。熟悉度是幻觉检测器。
  2. 按顺序跑步骤 2-6。计时。
  3. 对 Claude 给的每条主张标:引对了 / 引错章节 / 编的。
  4. 用错最多的那个点把 prompt 写紧,重跑。把更紧的 prompt 存成这种文档的默认。

完成后检查

  • 每条主张都有页或节标注。重要文档没例外。
  • 至少手工验证过 3 条引用。挑最关键的几条。
  • Claude 能说出”没有”什么(sanity check 防幻觉覆盖)。
  • 执行摘要的每条主张能追到具体章节,而不是”本文讨论了”这种泛话。
  • 数字主张手算一行合计。LLM 对数学最自信最容易错。

怎么复用这套流程

  • 把结构化的 prompt 序列存成模板(“长 PDF 入档 v3”)。
  • 反复出现的文档类型(合同、论文、申报)按类型加专门问题。
  • 维护一份”常忘问的”清单——希望当初问了的。每次 session 补一条。
  • 每季度用已知好文档复测流程;Claude 行为在演进。

建议的操作流程

上传 → 大纲 pass → 分节深入并要页码引用 → 负空间检查(“少了什么”)→ 手工验证 3-5 条引语 → 带 citation 的执行摘要。200 页文档整圈 30-60 分钟,结束时摘要你撑得住。

FAQ

  • Claude 的”长”是多长?: 多数 plan 200k token(粗略相当于 500-800 页常规散文)。再多就按章节智能拆分,不要按页数。
  • 长 context 中段会掉吗?: 会——中段召回明显下降(Claude 长上下文不稳定)。逐节深入能缓解。
  • 一节一节问还是一次性?: 求准确就一节一节。一次性只在你已经熟悉文档、只是要回顾时用。
  • 扫描 PDF 怎么办?: 重扫质量降。OCR 抽查;让它”以纯文本输出可疑那页”。
  • 能一次比较两份长文档吗?: 能,但 drift 更大。给每份明确角色(“文件 1 = 旧合同,文件 2 = 新红线稿”)。
  • 怎么留长文档给以后用?: 放进 Project(见 Claude 文件)。

容易踩的坑

  • “200 页 5 条总结”——拿到自信、似是而非、部分错的总结。
  • 不要 citation——每条主张都同样可信也同样可疑。
  • 不复核数字——LLM 最自信的地方往往最容易错。
  • 把 20 万 token 一次喂进去就提一个问题,以为它能精确覆盖文档中段——长输入里中段召回会悄悄掉,必须把问题钉到具体小节(Claude 长上下文不稳定)。
  • 把 Claude 的”找不到”当定论——有时是它漏了;用章节锚点换种说法。
  • 在执行摘要这步就停,不回去对分节细节验证 citation。

相关阅读

标签: #Claude #教程