这篇讲什么
Claude 的 200K 上下文是长 PDF / 报告深度分析的对的工具——本文给出怎么用好的工作流。
本文涉及的工具 / 概念:
- Claude: Anthropic 的对话式 AI 助手,类似 ChatGPT,支持文件、长文档和工具集成。
这篇适合谁看
分析师、研究、法务 / 政策人员——一次处理 1-2 份长文档。
什么时候适合用
来源是一份大文档(50-500 页)需要细读、不只是格局扫描时。
具体步骤
-
建 Project。打开 claude.ai,sidebar →
+ New project,名字写产出,例2026 Q1 政策白皮书审读。点项目 →Custom instructions,粘下面这段:你的角色:资深 <领域> 文档分析师(法务 / 政策 / 行业报告 / 学术)。 阅读目标:<例 "为决策者扫出本白皮书的核心主张、最弱论证和与现有政策冲突点,1500 字 brief"> 读者:<例 "我和我老板,决策者,每人 10 分钟读时间"> 绝对规则: - 每个事实声明都必须给页码或节号引用,格式 [p.42] 或 [§3.2] - 不许使用文档之外的信息(如果需要查外部,先停下来告诉我) - 不许 hallucinate 数字、引语、页码 - 用中文输出 -
上传长文档。项目页右上
+ Add content→ 上传 PDF / DOCX / MD。Claude 当前免费档 ~100K tokens、Pro/Team 200K tokens(≈ 400-500 页 PDF)。超过:- 砍掉对目标无用的附录、参考文献、版权页
- 或用
pdftk/qpdf拆成两份分别上传到两个 Project
# 例:把 500 页 PDF 拆成 1-250 / 251-500 qpdf --pages document.pdf 1-250 -- document.pdf doc_part1.pdf qpdf --pages document.pdf 251-z -- document.pdf doc_part2.pdf -
阅读地图——目录 + 各节长度。开新聊天:
基于已上传的文档,输出一份阅读地图: 1. 目录:所有一级 / 二级标题(标出页码范围) 2. 长度分布:每个一级章节大约多少页,占全文百分比 3. 重点候选:基于阅读目标,哪 3-5 节最值得深读?为什么 4. 跳过候选:哪些节明显跟目标无关、可以略过? 不要总结内容;这一步只画地图。 -
关键节深度提取——对步骤 3 标的重点候选,逐节问:
深度处理"<节标题>" [§<节号>,p.<起>-<止>]: 1. 用 5 句话概括本节的核心主张,每句末标 [p.<页码>] 2. 列出本节的关键数据 / 引语 / 时间节点,逐条带页码引用 3. 列出本节里和文档其他节冲突或表述不一的主张(说哪节冲突) 4. 列出本节的隐含假设(作者没明说但前提依赖的) 5. 列出本节里最弱的 1-2 条论证(证据薄、循环论证、推论跳跃) 引用必须真实在 PDF 里能找到;如果某条找不到原文,明确写 "未在文档中找到"。 -
跨节冲突扫描:
不限于单节,扫描整份文档: 找出所有自相矛盾的地方,每条用以下格式输出: - 主张 A:<具体陈述> [§<节>,p.<页>] - 主张 B:<具体陈述,与 A 冲突> [§<节>,p.<页>] - 冲突类型:数字冲突 / 立场冲突 / 时间冲突 / 定义冲突 - 严重程度:高 / 中 / 低 不要从文档之外的常识判断矛盾——只看文档内部。 找不到就说 "未发现明显内部矛盾",不要硬造。 -
最弱论证审计:
通读全文,列出本文档里最弱的 5 个论证。每条按以下结构: 主张:<引用作者原文,带页码> 弱点类型:证据薄弱 / 来源单一 / 循环论证 / 推论跳跃 / 偷换概念 / 选择性数据 具体分析:<1-2 句解释为什么这是个弱论证> 如果你是审稿人,会怎么质疑作者:<1 个具体问题> 按"对结论影响"排序——首位是即便其他都对,这条若假就推翻主结论的。 -
批评者问题清单:
假设你是这份文档的 <审稿人 / 反对派智库 / 媒体调查记者>,列 10 个最尖锐的问题: - 每个问题必须指向文档里的具体页码 - 问题要无法用"再读一遍文档"回答(必须需要外部信息或重新分析) - 避免泛泛的"是否全面""是否客观",要 specific把这 10 个问题贴回 Project 里建一条置顶聊天
批评者问题待答,留给你下一阶段(出 brief 前)人工解决。 -
人工深读关键页。Claude 已经把”有争议 / 支撑差 / 内部矛盾”几节浮现出来——你只需要打开 PDF 跳到这些页码:
- 步骤 5 的所有 “高” 严重冲突节
- 步骤 6 的前 3 个最弱论证所在页
- 步骤 4 中”未在文档中找到”出现的页(Claude 可能搞错了引用,你要核实)
把人工读出的修正再喂回 Claude 让它更新 brief。最终产出存到:
claude_longdoc_2026_05_21_<topic>/ ├── 00_instructions.md ├── 01_reading_map.md ├── 02_per_section_extracts.md ├── 03_cross_section_conflicts.md ├── 04_weakest_arguments.md ├── 05_critic_questions.md └── 06_final_brief.md
建议的操作流程
Project 起手 → 上传 → 目录 + 长度图 → 分节摘要 + 冲突标 → 跨节冲突 → 最弱论证 → 批评问题 → 人工深读。
容易踩的坑
- 用普通对话——上下文上限烧你
- 只问”总结”——埋掉冲突
- 冲突地图不读原文就当终
FAQ
- 为啥不用 ChatGPT?: Claude 200K 上下文更适合单份长文档;ChatGPT 在多源工作流上更强。
- 哪个版本?: Claude Pro 够多数长文档活。Team 解锁 Projects 与共享对话。