这篇讲什么
大多数”帮我总结这份 PDF”的 prompt 拿回来的都是糊成一片的概述,恰好把你真正想要的那部分丢了。问题不在模型,在于一次喂太满。下面这套分层提问方法,先逼它产出结构,再做压缩,质量提升明显。适合研究、分析、学生群体,常常要面对 20-200 页有真文字层的 PDF(不是扫描件),希望用 5 分钟挑出关键的 10 句话。
这篇适合谁看
每天要扫好几份 PDF 的人:一天读三篇论文的研究生、要在 10 分钟内判断”全读 / 略读 / 跳过”的并购分析师、开会前快速消化白皮书的政策研究者。如果你的 PDF 是图片扫描件,先 OCR——ChatGPT 要么静默拒绝,要么开始编页码。
什么时候适合用
- 20-200 页、有文字层的 PDF——短到能一次塞进去,长到值得做结构。
- 后续需要回引”第几页第几节”的文档。
- 三选一时间窗(全读 / 略读 / 跳过)只有 10 分钟。
- 两份相关 PDF 对比(监管文件、同主题白皮书)。
不适合:数学密集的论文(LLM 转述公式很危险)、字面措辞极关键的法律合同、漏掉一条就要赔钱的场景。
开始前准备
- 确认 PDF 有文字层:随便选中一句复制看看,复制不出来就先 OCR。
- 想清楚真正要什么:高管摘要、章节地图、还是找某个具体说法——三种 prompt 不一样。
- 同时打开一个笔记文件。模型的总结是耗材,你抠出来带页码的引语才是产出。
- 敏感文档(NDA、内部财务)用 Team 或 Enterprise 工作区,对话不会进训练集。
具体步骤
-
上传 PDF,先要结构大纲:
给出这份 PDF 的结构大纲:章节、小节标题、页码范围。 先不要解读。 -
看大纲。带封面 / 目录的 PDF 经常把页码偏移,要先告诉它”PDF 第 1 页 = 正文第 X 页”。
-
一章一章问,不要让它一次出大总结:
总结第 3 章(第 24-41 页),5 条 bullet。 每条必须带页码。 每条附一句原文直接引语,用引号标出。 -
章节都拿完之后,再让它基于已生成的章节摘要写一页执行摘要。这种分层方法在我跑过的所有 PDF 上都稳赢一次性总结。
-
最后追一句:“执行摘要里你删掉了哪些重要论点或数字?认真读的人会注意到。“这一步能逼出来它本来想藏的东西。
好用的 prompt 模板
你在为一个只有 5 分钟时间的 {读者} 总结一份 {文档类型}。
输出:
- 3 句 TL;DR
- 5 个核心论点 + 页码
- 3 个值得记住的数字 + 页码
- 2 个读者应该向作者追问的问题
发送前把占位符替换成实际的文档类型和读者。
完成后检查
- 打开 PDF,随机挑两个引用页码核对。错一处就把整份总结当不可信处理。
- 数字一定要核——LLM 编数字比编名词频繁。最终简报里的百分比、金额,你必须亲眼在原文看过。
- 问一句:“这份文档里有没有作者自相矛盾的地方?“真文档基本都有;找不出来说明它读得太浅。
怎么复用这套流程
- 把”先大纲、再分章”这套 prompt 存成模板。换 PDF 时主要改文档类型和读者。
- 按领域维护小型术语表(法律术语、医学缩写、内部代号),喂给系统上下文,准确度立刻提升。
- 周期性文档(季报、周报)可以把上期总结留在对话里当 diff 锚点。
建议的操作流程
上传 → 大纲 → 校验页码偏移 → 带页码的分章摘要 → 一页执行摘要 → “你跳过了什么”追问 → 人工核对引用数字。
容易踩的坑
- “把这份 200 页 PDF 用 3 条总结”——拿回的是 3 条没有锚点的废话。
- 跳过大纲直接要执行摘要——模型把文档的真实结构丢了。
- 看到页码就信——页码是 PDF 摘要里被幻觉得最多的字段。
- 上传扫描件不做 OCR——ChatGPT 会基于文件名和可见 metadata 编内容。
- 把 200 页文本贴进对话框而不是当文件上传——丢掉了 PDF 解析器,还浪费 token。
- 一个对话里塞 5 份不同 PDF——上下文串味,最后总结混在一起。
FAQ
- 为什么它引”第 47 页”,但根本没有 47 页?: 模型经常把封面和目录页一起算了。一开始就告诉它”PDF 第 1 页 = 正文第 X 页”。
- 页数上限多少?: Plus 实际能跑到约 300 页;超过 150 页质量明显下滑,即使它接受上传。建议拆成卷。
- 是不是 Claude 或 NotebookLM 更合适?: NotebookLM 在引用密集型任务更强;Claude 长 context 更稳;迭代式分章问答 ChatGPT 体验最好。
- 付费 PDF 能传吗?: 技术上可以,但要看授权。很多出版商禁止把正文喂给第三方模型。