用 AI 总结 PDF:长报告 / 学术论文 / 合同三类工作流

PDF 类型不同,AI 总结的 Prompt 与工具选择也不同。三类常见情形——长报告、学术论文、合同——各给一套模板、工具表,加上防引用幻觉的可信度检查。

任务场景

下午 4 点收件箱里突然来了一份 187 页的 McKinsey 报告,老板的备注:“明早 strategy review 前给点想法?“或者,一篇同事推的 38 页论文”你真的应该读一下”。或者,一份 24 页的 SaaS 合同周五要签字,唯一一个能问的法务今天 PTO。“让 AI 总结一下 PDF”听起来是一件事——其实是三件完全不同的事:Prompt 不同、工具不同、可信度模型也不同。

什么时候适合让 AI 来做

AI 在压缩这件事上是真的强:50 页压成 800 字还能保留主要论证。它也擅长结构化阅读——把一篇 paper 的方法节、合同的赔偿条款、报告的数据附录精准挑出来。AI 不擅长的:编引用。当你要求”附页码引用”时,模型在长上下文压力下会编出看起来很合理的页码。更糟的是,它会把一句根本不在原文里的话改写后挂在”第 27 页”。把页码当成”待验证指针”,不要当成”结论”。修复方式是结构化的:每份总结都应该能对照原文核验,而你的工作流要让这一步成本低。

常见失败模式:模型总结的其实是摘要executive summary,你以为它读了全文。100 页报告 8 秒就出结果,基本就是只读了前 5 页和目录。

需要先给 AI 的信息

  • PDF 本体——不是截图。文件上传,让 OCR 干净。
  • 页数和文档类型——187 页报告 vs 12 页 memo 对 Prompt 影响很大
  • 真正的阅读目标——决定是否引用、是否买、是否复现、是否签
  • 你最想被回答的 2-3 个问题(让模型围绕你的问题总结,不要围绕原文目录)
  • 你的领域语境——“我是 Series B SaaS 创始人,从采购角度看”和”我是公司法务,从风险角度看”,产出会很不同
  • 一条可信度约束——“每个 claim 必须给页码 / 章节号;找不到就写 ‘no citation’,不要瞎猜”
  • 你真正要的输出格式——bullet brief、slide notes、200 字 stand-up 总结、还是 2 页 memo
  • 下游输出的读者——老板、团队、还是未来的自己

三种工作流,三套 Prompt

1. 长报告(商业 / 政策 / 行业研究)

读这份 {N 页} 报告。我的目标:{这份总结要支持的决策}。
我的背景:{角色 + 这个话题我已经知道什么}。

返回:
1)一句话核心结论(用报告自己的话)。
2)每个主要章节一个 bullet(≤3 句)。标注哪些章节影响我的决策、哪些只是背景。
3)3 个最关键的数据点,每个给页码。报告没给原始来源的,标"无来源"。
4)2 个我应该反驳的观点——引用 8-15 词原文 + 页码。
5)一个怀疑论者会问作者的 3 个问题。能从文档里答的,一句话答;不能答的标"需 follow up"。
6)我明天开会要带进会议室的那一句话。

可信度约束:找不到页码就写 "uncited",不要瞎猜。
附文档:{upload}

2. 学术论文

你是 {field} 的资深审稿人。我在决定要不要{引用 / 复现 / 在此基础上做}这篇 paper。

返回:
1)研究问题(1 句)。
2)方法的 3 个独特特征(数据、模型、实验设计),每个为什么重要。
3)主要结果 + effect size + 我应该信多大程度(样本、复现、混淆风险)。
4)实验设计 2 个可能缺陷。
5)与领域内 3 篇最相关工作的关系。
6)如果我在这个领域,值得 follow up 的 2 个具体实验。
7)发给同事一句 Slack 的 headline finding。

可信度约束:不许编 prior work 引用。文中找不到支持的 claim 直接说。
附文档:{upload}

3. 合同 / 法律文档

你是熟悉 {美 / 欧 / 中} 商业合同的律师助理。我是签这份合同的 {采购方 / 供应商 / 合作方}。

返回:
1)双方义务,分点列,附章节引用。
2)我应该最警惕的 5 个条款(赔偿、退出、IP 归属、自动续约、管辖法、责任上限)。每个:引用 10-25 词原文 + 章节号。
3)3 个建议协商收紧的条款——具体改法(如"赔偿上限从无限改为 12 个月费用")。
4)3 句话发给对方提出修改建议。
5)律师 30 秒扫描会标出的那一个最大风险。

重要:这不是法律意见,最终请律师确认。
附文档:{upload}

短版本——单问题查找

读这份 PDF。只回答这个问题:{一个具体问题}。
给:答案 + 页码 + 12-25 词原文支持。
如果 PDF 根本没回答这个,写 "not found"——不要推断。
附文档:{upload}

工具对比简表

PDF 类型优先工具原因
100+ 页长报告Claude(长上下文)一次能读完不切片
含公式的学术 paperChatGPT + Code Interpreter能跑公式 / 复现小实验
合同 / 法律Claude(保留措辞)长引用保真不爱改写
中 / 日 / 韩 PDFKimi / 通义 / GeminiCJK OCR 和术语更稳
扫描版(图片)PDFGemini 或先 OCR 再 Claude原生视觉 OCR 避免垃圾进垃圾出
多 PDF 交叉阅读NotebookLM一个项目里索引 50+ 源做 cross-citation

输出示例

一个好的报告总结 headline:“McKinsey 这份 deck 论证 SMB SaaS 在 2028 年前会整合成 4 个垂直赢家,但支撑数据只到 2024——趋势外推是这条 claim 的承重论证,且无来源标注。” 这一句比 800 字 bullet 都管用。

一个好的合同风险旗:“第 9.4 条(赔偿,p.11):‘Customer shall indemnify Vendor against any claims arising from Customer’s use of the Service, without limitation.’ ‘without limitation’ 是让赔偿没有上限的关键——建议改为 ‘capped at 12 months of fees paid’。”

一个好的论文总结:“主张:prompt chaining 在 benchmark 上提升准确率 14pp。可信度:中。Benchmark 是作者自己的(n=200),无第三方复现。混淆:chain length 和总 token budget 共变,分不清是结构作用还是单纯多算了。“

怎么改输出

  • 总结太泛 —— “重写,只保留影响我’是否{签 / 引 / 买}‘的内容。背景复述全删。”
  • 引用看起来可疑 —— “每个 claim 给 12-25 词原文。文档里找不到原文就标 ‘uncited’,不许 paraphrase。”
  • 100 页之后没读 —— “确认:你是不是读完了全部 {N} 页?给我 3 个来自文档后三分之一的具体发现。没读到 X 页之后就直说。”
  • 法律语气过度对冲 —— “砍掉所有 ‘may”might”could potentially’。有风险的条款直接说有风险,没问题的条款直接说没问题。每条都对冲等于没有意见。”
  • 学术 critique 太浅 —— “用敌意 peer reviewer 的标准。指出你会跑哪个实验来打破这篇 paper 的主张。“

容易踩的坑

  • 信”秒出的总结”——100 页 6 秒出来的总结就是摘要,不是全文;用一个后段问题反向验证。
  • 让 AI 改写法律原文——改写会丢掉关键词(“without limitation""sole discretion""perpetual”),合同条款一律逐字引。
  • 一个 Prompt 用到底——同一个 Prompt 把合同审成 exec summary,真正的风险就漏了。
  • Prompt 里没领域语境——同一篇 paper 让”NLP 资深审稿人”读和让”好奇通才”读,产出完全不同;明确指定。
  • 扫描 PDF 跳过 OCR——纯图 PDF 没 OCR 时模型在读文件名和元数据,总结就是幻觉。
  • 高 stakes 文档没逐页核验——合同 / 政策类,总结只是”该读哪几页”的引导,不能代替读。
  • 忘了文档年代——2019 年的行业报告带 2019 的假设;总结要标 data freshness,不要当成当下信息。
  • 多文档不打来源 tag——一次总结 5 个 PDF 但不标”哪条 claim 来自哪个源”,就没法核验。

FAQ

  • 是不是 PDF 都先转成 markdown 再喂? —— 凌乱的 PDF(扫描版、多栏、表格多)转一下有帮助。干净的现代 PDF 不用,现代模型原生处理。例外:嵌套深的财报表格,转 markdown 几乎总是有用。
  • 实际页数上限? —— Claude 一次稳定吃 200+ 页;ChatGPT 和 Gemini 切成 50-80 页一段加 final combine 更靠谱。NotebookLM 能跨 50+ 文档处理上千页,但单文档深度会让步。
  • 怎么检查模型没瞎编? —— 挑一个带页码的具体 claim,打开 PDF 翻到那页,核验那 12-25 词原文是否存在。不存在就让模型重新做、要求更严的引用保真。两次都对不上就换工具。
  • 合同条款分析能直接发给对方吗? —— 条款分析是 research;发给对方的邮件草稿是起点。具体提多大让步必须经过律师确认再发。
  • 模型能识别文档里”缺什么”吗? —— 能,但要你主动问。“和典型 {SaaS / NDA / 雇佣} 合同相比,这份缺了哪些标准章节?“——这样问效果很好。模型当 checklist 比当自由 critic 更有用。

相关阅读

标签: #AI 写作 #Prompt #内容创作