为什么它引"第 47 页"，但根本没有 47 页？

模型把封面和目录页一起算进去了。一开始就告诉它"PDF 第 1 页 = 正文第 X 页"。

真正的页数上限是多少？

硬上限是每个文件 200 万 token（约 150 万字），不是按页算。实践中 Plus 上超过约 150 页质量明显下滑，因为模型在检索碎片、不是线性通读。超长文档拆成卷。

为什么它漏了我明知道在第 180 页的事实？

超过约 11 万-13 万 token，ChatGPT 就按关键词检索片段、不再通读全文，你没问到的内容它就漏。明确按页码范围去问那一节。

是不是 Claude 或 NotebookLM 更合适？

引用密集型任务 NotebookLM 更强、单个来源能读约 50 万字；Claude 在 100 页内读图表和版式更干净；迭代式分章问答 ChatGPT 体验最好。详见上面的对比表。

付费 PDF 能传吗？

技术上可以，但要看授权。很多出版商禁止把全文喂给第三方模型。

AI 工具教程

用 ChatGPT 总结 PDF（2026 实操）

先要章节大纲、再分章带页码、最后拼执行摘要，质量比一句“帮我总结”高很多。附 2026 上传限制，以及什么时候该用 Claude 或 NotebookLM。

发布于: 2026/05/17 更新于: 2026/06/06 作者: AI Productivity Guide Team 🌐 查看英文版本

一句话总结

一句”帮我总结这份 200 页 PDF”拿回来的总是糊成一片，因为 ChatGPT 并不会把整份文件一次读进去——超过约 11 万 token 之后它会转成检索（RAG），只把和你关键词匹配的片段拽进来。正确做法是分层提问：先要结构大纲，再一章一章带页码总结，最后用这些分章摘要拼出执行摘要。每个页码、每个数字都要回原文核对。下面给出具体 prompt、2026 的上传限制，以及和 Claude、NotebookLM 的对比。

这篇讲什么

大多数”帮我总结这份 PDF”的 prompt，拿回来的都是糊成一片的概述，恰好把你真正想要的那部分丢了。问题不在模型不够强，而在于一次喂太满。下面这套分层提问法先逼它产出结构、再做压缩，5 分钟就能挑出带可信页码的关键 10 句话。适合研究、分析、学生群体，常要面对 20-200 页有真文字层的 PDF（不是扫描件）。

为什么一次性总结总是翻车

ChatGPT 处理长 PDF 的方式和大家想的不一样。截至 2026 年 6 月，单个上传文件最大可达 512 MB、抽取文本上限 200 万 token，但模型的实时上下文窗口要小得多——一次大约只有 11 万到 13 万 token 的内容真正进上下文（ChatGPT Plus 应用内约 320 页；完整的 100 万 token 应用内上下文只有 200 美元的 Pro 档才有）。文档超过实时窗口时，OpenAI 后端会把抽取出的文本存进一个私有向量索引，ChatGPT 再通过 myfiles_browser 工具，只检索和你提问匹配的片段。

这就是盲目”帮我整篇总结”会失败的原因：模型看到的是碎片，不是整份文档。这也是为什么”大海捞针”式问题——把第 10 页的一个事实和第 180 页的另一个事实连起来——最容易被它悄悄漏掉。下面这套流程是顺着检索来做，而不是硬扛：显式的大纲逼它扫一遍结构，分章提问让每段总结都落在同一个连贯片段里。

这篇适合谁看

每天要扫好几份 PDF 的人：一天读三篇论文的研究生、要快速过 150 页募集说明书的并购分析师、开会前消化白皮书的政策研究者。如果你的 PDF 是图片扫描件，先 OCR——否则 ChatGPT 要么静默拒绝，要么照着文件名和可见 metadata 编内容。

什么时候适合用

20-200 页、有文字层的 PDF：短到能塞进去，长到值得做结构。
后续需要回引”第几页第几节”的文档。
三选一时间窗（全读 / 略读 / 跳过）只有 10 分钟。
两份相关 PDF 对比（两份监管文件、同主题的两份白皮书）。

不适合：数学密集的论文（LLM 转述公式很危险）、字面措辞极关键的法律合同、漏一条就要赔钱的场景。

开始前准备

确认 PDF 有文字层：随便选中一句复制看看，复制不出来就先 OCR。
想清楚真正要什么：高管简报、章节地图、还是找某个具体说法——三种 prompt 不一样。
同时打开一个笔记文件。模型的总结是耗材，你抠出来带页码的引语才是产出。
敏感文档（NDA、内部财务）用 Team 或 Enterprise 工作区，对话默认不进训练集。（个人 Free 或 Plus 账号想要同样效果，去 Data Controls 里关掉”Improve the model for everyone”。）

具体步骤

上传 PDF，先要结构大纲：

给出这份 PDF 的结构大纲：章节、小节标题、页码范围。
先不要解读。

看大纲。带封面和目录的 PDF 经常把页码偏移，要先告诉它”PDF 第 1 页 = 正文第 X 页”。

一章一章问，不要让它一次出大总结：

总结第 3 章（第 24-41 页），5 条 bullet。
每条必须带页码。
每条附一句原文直接引语，用引号标出。

章节都拿完之后，再让它基于已生成的章节摘要写一页执行摘要。这种分层方法稳赢一次性总结，因为每一步都待在同一个检索片段里，而不是逼模型横跨整个索引。
最后追一句：“执行摘要里你删掉了哪些重要论点或数字？认真读的人会注意到。“这一步能逼出来检索时被它漏掉的内容。

好用的 prompt 模板

你在为一个只有 5 分钟时间的 [读者] 总结一份 [文档类型]。
输出：
- 3 句 TL;DR
- 5 个核心论点 + 页码
- 3 个值得记住的数字 + 页码
- 2 个读者应该向作者追问的问题

发送前把方括号占位符替换成实际的文档类型和读者。

完成后检查

打开 PDF，随机挑两个引用页码核对。错一处就把整份总结当不可信处理——一处偏移通常意味着所有页码都偏了同样的量。
数字一定要核。LLM 编数字比编名词频繁；最终简报里的百分比、金额，你必须亲眼在原文看过。
问一句：“这份文档里有没有作者自相矛盾的地方？“真文档基本都有；找不出来说明检索读得太浅。

ChatGPT、Claude、NotebookLM 处理 PDF 对比

三家主力工具处理长文档的方式不一样。按文档长度和你对引用的信任度来选（数据截至 2026 年 6 月核对）。

工具	单文件 PDF 上限	怎么读	最擅长
ChatGPT Plus（$20/月）	512 MB，200 万 token	约 11 万-13 万 token 内走完整上下文，之后转 RAG 检索	迭代式分章问答；一个对话里混多种文件类型
Claude Pro（$20/月）	32 MB，100 页	100 页以内读文本 + 图表等视觉元素；Sonnet 4.6 / Opus 4.7 上下文 100 万 token	100 页以内、版式和图表重要的文档
NotebookLM（免费 / Pro $19.99）	每个来源 200 MB 或约 50 万字	多来源接地检索，跑 Gemini 3.1 Pro	引用密集的研究；免费 50 个来源，Pro 300 个

大致判断：PDF 在 100 页以内、且图表重要，Claude 读版式最好；要跨多来源给出指回原文段落的内联引用，NotebookLM 赢；要来回追问章节、或同一对话里既有 PDF 又有表格图片，ChatGPT 最顺。

2026 上传限制速查

截至 2026 年 6 月，ChatGPT 的文件限制：

单文件最大：512 MB；OpenAI 建议控制在 25 MB 以内以稳定处理。
文本上限：每个文件抽取文本 200 万 token，超出部分被截断。
免费版：每天约 3 次文件上传。
Plus / Go：每 3 小时滚动窗口约 80 个文件，单条消息最多 10 个文件。
存储：每个用户上传文件上限 25 GB。

如果碰到”You’ve reached our limit of file uploads”，等过这个 3 小时窗口，或者拆开文档只传需要的那一节。

怎么复用这套流程

把”先大纲、再分章”这套 prompt 存成模板。换 PDF 时主要改文档类型和读者。
按领域维护小型术语表（法律术语、医学缩写、内部代号），总结前先喂进去，术语准确度立刻提升。
周期性文档（季报、周报）可以把上期总结留在对话里当 diff 锚点。

建议的操作流程

上传 → 大纲 → 校验页码偏移 → 带页码的分章摘要 → 一页执行摘要 →“你跳过了什么”追问 → 人工核对要引用的每个数字。

容易踩的坑

“把这份 200 页 PDF 用 3 条总结”——拿回的是 3 条没锚点的废话，因为检索压根没扫整份文件。
跳过大纲直接要执行摘要——模型把文档的真实结构丢了。
看到页码就信——页码是 PDF 摘要里被幻觉得最多的字段。
上传扫描件不做 OCR——ChatGPT 会照着文件名和可见 metadata 编内容。
把 200 页文本贴进对话框而不是当文件上传——丢掉了 PDF 解析器，还浪费 token。
一个对话里塞 5 份不同 PDF——上下文串味，最后总结混在一起。

FAQ

为什么它引”第 47 页”，但根本没有 47 页？: 模型把封面和目录页一起算进去了。一开始就告诉它”PDF 第 1 页 = 正文第 X 页”。
真正的页数上限是多少？: 硬上限是每个文件 200 万 token（约 150 万字），不是按页算。实践中 Plus 上超过约 150 页质量明显下滑，因为模型在检索碎片、不是线性通读。超长文档拆成卷。
为什么它漏了我明知道在第 180 页的事实？: 超过约 11 万-13 万 token，ChatGPT 就按关键词检索片段、不再通读全文，你没问到的内容它就漏。明确按页码范围去问那一节。
是不是 Claude 或 NotebookLM 更合适？: 引用密集型任务 NotebookLM 更强、单个来源能读约 50 万字；Claude 在 100 页内读图表和版式更干净；迭代式分章问答 ChatGPT 体验最好。详见上面的对比表。
付费 PDF 能传吗？: 技术上可以，但要看授权。很多出版商禁止把全文喂给第三方模型。

一句话总结

这篇讲什么

为什么一次性总结总是翻车

这篇适合谁看

什么时候适合用

开始前准备

具体步骤

好用的 prompt 模板

完成后检查

ChatGPT、Claude、NotebookLM 处理 PDF 对比

2026 上传限制速查

怎么复用这套流程

建议的操作流程

容易踩的坑

FAQ

相关阅读

相关文章

ChatGPT Canvas 工作流：改长文档不用整篇重写

ChatGPT Deep Research：经得起挑刺的工作流

ChatGPT 键盘快捷键：2026 年值得记的那一份清单

ChatGPT 整理会议纪要：从转录到行动项（2026）

手机上的 ChatGPT：真正适合手机的几种用法

ChatGPT 定时任务：把重复 AI 工作排进时间表（2026 指南）