PDF 多长 AI 就吃不消？

取决于工具，没有单一数字。Claude.ai 拒收超过 32 MB 或 100 页的 PDF，但接受的部分会在 1M tokens 窗口内读完；Gemini 接受最多 900 页；ChatGPT Plus 接受大文件，但对文本密集的 PDF 会建索引、按约 11 万 tokens 一段检索。一旦文档比你这个工具单次实际读取的窗口还密，就换成分块总结（模板 #16）。

能信模型对合同的总结吗？

一审可以。绝不能是唯一一审。要签的东西必须在原文上做法律审查，不是在总结上。

长 PDF 最好的模型是？

截至 2026 年 6 月，Claude Opus 4.7 / Sonnet 4.6 和 Gemini 3.1 Pro 都是 1M tokens 上下文，且直接读文档，因此在原文引用上最稳；Gemini 单文件接受的页数最多（900 页）。ChatGPT Plus 在较短、推理重的总结和 Q&A 迭代上最强。见[Claude 长文档研究](/zh/articles/claude-long-document-research/)，或走 1M 上下文路线的[Gemini PDF 总结工作流](/zh/articles/gemini-pdf-summarization-workflow/)。

能处理扫描 PDF 吗？

只在 OCR 过后能。纯图 PDF 需要先 OCR，模型不能像素级可靠地读原文引用。

表：可以，如果是文字编码。图：模型只能描述它看到的；数字必须从图背后的数据表验证。

非英文 PDF 应该用英文 Prompt 吗？

用 PDF 语言提问以保引文保真度。需要时末尾再加一轮翻译。

AI 提示词库

PDF 总结 Prompt：17 个针对报告、论文、合同的模板

17 个可直接复制的 PDF 总结 Prompt——按深度匹配需求：60 秒一瞥、高管 1 页、按节细读、批判审计、合同评审、多 PDF 对比。含 2026 年 6 月各模型最新限制。

发布于: 2026/05/17 更新于: 2026/06/14 作者: AI Productivity Guide Team 🌐 查看英文版本

PDF 总结翻车，通常就因为那句”总结一下”。好总结按需求匹配深度：60 秒一瞥、高管 1 页、按节细读、批判审计。这 17 个模板针对每种深度和每种 PDF 类型，而且都带一个把”能用的总结”和”听起来像样的总结”区分开的习惯：强制页码引用的验证钩。

一句话总结： 先告诉模型 PDF 类型和你的读者角色，选一个深度档，再要求每个主张都带页码。能直接上传到对话的文件里，Claude.ai 接受 32 MB / 100 页以内的 PDF，Gemini 最多 900 页，ChatGPT Plus 最大 512 MB（文本上限约 200 万 tokens）。超出这些就先分块（模板 #16）。任何你打算引用的数字都要手动抽查。

这套 Prompt 主要解决什么问题

“总结这份 PDF”得到 Wikipedia 风格的摘要——对高管太模糊、对研究者太浅。这些 Prompt 强制深度、受众和输出形状，让总结真能用，不是只产出。

这篇适合谁

每周筛 20 篇论文的研究者；earnings call 前读行业报告的分析师；做合同一审的法务相邻岗位；从竞品 deck 和 pitchbook 提 takeaway 的创始人；准备研讨会讨论的学生；任何为 PDF 付时间、希望 PDF 用决策回报的人。

什么时候不建议用

短文档（≤3 页）——直接读。需要原文引用的 PDF——总结会丢精确措辞，法务 / 学术工作需要的。来源不可信的 PDF——AI 总结一份误导性来源会产出自信的误导性总结。

Prompt 结构公式

一个 PDF 总结 Prompt 应包含 6 个要素：

PDF 类型：研究论文 / 行业报告 / 合同 / pitch deck / 财报。
读者角色：谁读总结（高管、研究者、律师、你）。
深度档：60 秒一瞥 / 1 页高管 / 按节细读 / 批判审计。
提取目标：主张、方法、风险、义务、行动项。
验证钩：“每个主张引用页 / 节”或”列出你用的引文”。
诚实规则：模型标出推断 vs PDF 明示。

这套 Prompt 适合用在哪

行业报告（Gartner、McKinsey、行业展望）
学术论文（摘要 / 方法 / 结果 / 局限）
合同（我方义务、对方义务、终止、责任）
财报（10-K、10-Q、earnings transcript）
Pitch deck（主张审计、ask、traction）
长内部备忘和战略文档
多 PDF 对比（信哪份）

17 个可直接复制的 Prompt 模板

1. 60 秒一瞥

读附件 PDF。输出：1 句这是什么、3 句核心发现、1 句我应注意的局限。其他不要。总共 ≤100 字。

2. 高管 1 页

为不会读全文的高管总结：5 个 bullet（每 ≤20 字）、1 行关键风险、1 个我应问作者的问题。结尾 1 句"用这份做什么"建议。

3. 按节总结

按节输出总结。每节：1 行标题 + 2–3 bullet + 页码。跳过纯格式节（目录、引用）。任何长度只值 1 bullet 的节标"薄"。

4. 批判阅读

以怀疑评审员身份读 PDF。输出：3 个最强主张及证据、3 个最弱主张及缺什么、3 个我会问作者的问题。每个弱主张：什么具体数据或引用能补强。

5. 两份 PDF 对比

我有 2 份 PDF。对比：论点、方法、证据质量、结论。结尾："只信一份的话，信哪份、为什么"。再列 1 个能帮我决定的问题。

6. 从报告提行动项

这是行业 / 战略报告。提取：对 [我的角色] 的 5 条可行动 takeaway。每个：行动、为什么重要、何时行动（现在 / 下季度 / 仅监控）、1 个行动风险。

7. 合同 / 条款总结

这是合同。输出：(a) 我方义务、(b) 对方义务、(c) 终止条款、(d) 责任上限和赔偿、(e) 任何非常规 / red-flag 条款。不给法律意见——只是结构化总结附页码。标出任何非标语言供法务审查。

8. 黑话转人话

识别 PDF 中最常用的 10 个技术术语。每个用人话 1 句话定义。然后只用这些人话定义重新总结摘要。输出：术语表 + 人话摘要。

9. 学术论文深读

这是学术论文。输出：(a) 1 句研究问题、(b) 3 句方法、(c) 关键发现编号 bullet 附效应量、(d) 局限 bullet（拆作者承认 vs 我推断）、(e) 这篇论文使能的 3 个后续研究。

10. 财报（10-K / 10-Q）总结

这是公开公司财报。输出：(a) 同比上行 / 下行、(b) 表现最好的 3 个 segment、最差的 3 个、(c) 与去年不同的 3 个风险因素、(d) 1 段 MD&A 中的前瞻评论。带页码。

11. Pitch deck 审计

这是 pitch deck。输出：(a) ask（金额、用途）、(b) 3 个最强主张、(c) 3 个最弱 / 未验证主张、(d) traction 指标及度量期间（标出缺期间的）、(e) 团队和主张的 mismatch（如有）。

12. 方法核查

下面是论文或报告。只审计方法：样本量与选择、对照组、统计方法、混杂因素是否承认或漏。每个弱点：1 句描述、严重度（高 / 中 / 低）、什么引用能修。

13. 报告主张 vs 引用核对

下面是报告。挑 5 个最重要的主张。每个：主张、引用来源（或"无引用"）、来源是否支撑主张的诚实评估（是 / 部分 / 否，附理由）。找到 2 个无来源主张就停。

14. 提取数据表

这份 PDF 含表和图。输出：(a) 每个表的标题和页码、(b) 最常引用的 3 个数据点及来源表、(c) 正文引用但没出现在表里的数字（可能是计算或无源）。

15. 决策导向总结

我有一个决定要做：[我的决定]。只针对该决定总结这份 PDF。输出：(a) 支撑决定的事实、(b) 反对的事实、(c) 能扭转判断的缺失事实、(d) 诚实 1 句话建议。

16. 长 PDF 分块总结

PDF 100+ 页。两 pass 总结：pass 1——按节 bullet（模板 #3）。pass 2——把节 bullet 合成 1 页高管摘要，引用回节号。输出两 pass。

17. 读完测我

200 字总结。然后输出 5 个 PDF 中能找到答案的问题——3 个事实型、2 个推断型。我答后给我打分并指出每题对应的页。用来测试我的理解，不只是总结覆盖。

容易踩的坑

“总结一下”没约束。 输出泛、无深度。
不抽查就信总结。 尤其数值主张——对要引用的 PDF，手动验证 2–3 个。
跳过局限 / 弱点。 偏颇来源的总结也偏颇。
不是高管却要”高管摘要”。 你要细节；“高管”=1 页就结束。
PDF 长过上下文还硬塞。 长 PDF 要分块总结（模板 #16），不是截断单 pass。
无页码引用。 没引用的总结无法验证。
合同当报告处理。 合同总结要结构化法务式（模板 #7），不是 bullet。

下一步怎么继续提升

永远在前面告诉模型 PDF 类型（论文 / 报告 / 合同 / deck）。同个 Prompt 在有无类型间质量差天大。
每个主张都强制页码引用（模板 #3、#7、#10）。既强制 grounding 又便于抽查。
长 PDF 先分块再合成（模板 #16）。单 pass 处理 100+ 页会漏后半。
研究论文跑模板 #9 紧接 #12。无方法核的发现是装饰品。
要采取行动的 deck 和报告，决定前跑模板 #13。多数捏造藏在无引用主张里。
总结 + Q&A 配ChatGPT PDF 总结工作流迭代深度，无需重传文件。
分拣 20+ PDF 时配一瞥 + 决策导向（模板 #1 + #15）——只留能推决定的。

哪种 PDF 用哪个工具（截至 2026 年 6 月）

瓶颈很少是 Prompt，而是整份 PDF 在模型开始截断之前能不能装得下。决定这一点的是上传上限和上下文窗口，而各工具差别很大。

工具	对话内 PDF 上限	上下文窗口	最适合
Claude.ai（Opus 4.7 / Sonnet 4.6）	每文件 32 MB / 100 页	1M tokens	合同、论文、需要引文保真的细活
Gemini（Google AI Pro，$19.99）	每份 PDF 最多 900 页	1M tokens	极长的单份报告、多模态（图表、扫描件）
ChatGPT Plus（$20）	512 MB / 每条消息 10 个文件	应用内约 320 页（完整 1M 仅 $200 Pro）	较短、推理重的总结和 Q&A 迭代
Google NotebookLM	每个来源 50 万词 / 200 MB，最多 300 个来源（Plus）	在来源上检索	多 PDF 资料库和有出处的引用

说明：ChatGPT Plus 接受大文件，但对文本密集的 PDF 上限约 200 万 tokens，并会先建索引、按约 11 万 tokens 一段检索，而不是一次读完每一页——所以一定要要求页码引用（模板 #3、#10）来抓出它跳过的内容。Claude 和 Gemini 在 1M tokens 窗口内直接读文档，这就是它们在原文引用上更稳的原因。永远先按文档大小选工具，再用匹配读者的深度模板。

FAQ

PDF 多长 AI 就吃不消？ 取决于工具，没有单一数字。Claude.ai 拒收超过 32 MB 或 100 页的 PDF，但接受的部分会在 1M tokens 窗口内读完；Gemini 接受最多 900 页；ChatGPT Plus 接受大文件，但对文本密集的 PDF 会建索引、按约 11 万 tokens 一段检索。一旦文档比你这个工具单次实际读取的窗口还密，就换成分块总结（模板 #16）。
能信模型对合同的总结吗？ 一审可以。绝不能是唯一一审。要签的东西必须在原文上做法律审查，不是在总结上。
长 PDF 最好的模型是？ 截至 2026 年 6 月，Claude Opus 4.7 / Sonnet 4.6 和 Gemini 3.1 Pro 都是 1M tokens 上下文，且直接读文档，因此在原文引用上最稳；Gemini 单文件接受的页数最多（900 页）。ChatGPT Plus 在较短、推理重的总结和 Q&A 迭代上最强。见Claude 长文档研究，或走 1M 上下文路线的Gemini PDF 总结工作流。
能处理扫描 PDF 吗？ 只在 OCR 过后能。纯图 PDF 需要先 OCR，模型不能像素级可靠地读原文引用。
表和图呢？ 表：可以，如果是文字编码。图：模型只能描述它看到的；数字必须从图背后的数据表验证。
非英文 PDF 应该用英文 Prompt 吗？ 用 PDF 语言提问以保引文保真度。需要时末尾再加一轮翻译。