单文件的真实页数 / 大小上限是多少（2026 年 6 月）？

— Claude.ai 网页端拒收超过 100 页或 32MB 的 PDF；Claude Files API 能到 500MB。Gemini 单文件上限 1,000 页 / 50MB，且每页按图片读。ChatGPT 单文件上限 200 万 token / 512MB，但只做纯文本提取。超过这些上限的，把 PDF 切开做一次 final combine，或者作为 NotebookLM 里最多 50 份（免费）/ 300 份（Plus/Pro）来源之一丢进去。

是不是 PDF 都先转成 markdown 再喂？

— 凌乱的 PDF（扫描版、多栏、表格多）转一下有帮助。干净的现代 PDF 不用，现在的模型原生处理。例外：嵌套深的财报表格，转 markdown 几乎总是有用。

怎么检查模型没瞎编？

— 挑一个带页码的具体 claim，打开 PDF 翻到那页，核验那 12-25 词原文是否存在。不存在就让模型重新做、要求更严的引用保真。两次都对不上就换工具。

为什么 ChatGPT 漏掉了我报告里的图表？

— 在 Free、Plus、Pro 上 ChatGPT 只做纯文本提取——抽出文字层，忽略图表图片和扫描页（视觉提取仅 Enterprise 有）。图表多或扫描版的 PDF 用 Gemini 3.1 Pro，它把每页都当图片读。

合同条款分析能直接发给对方吗？

— 条款分析是 research；发给对方的邮件草稿是起点。具体提多大让步必须经过律师确认再发。本文不构成法律意见。

模型能识别文档里"缺什么"吗？

— 能，但要你主动问。可以这样问："和典型 `[SaaS / NDA / 雇佣]` 合同相比，这份缺了哪些标准章节？"模型当 checklist 比当自由 critic 更有用。

AI 场景化应用

用 AI 总结 PDF：长报告 / 学术论文 / 合同三类工作流

PDF 类型不同，AI 总结的 Prompt 和工具选择也不同。长报告、学术论文、合同三类情形各给一套模板、各家工具最新页数 / 大小上限（2026 年 6 月），再加上防引用幻觉的可信度检查。

发布于: 2026/05/16 更新于: 2026/06/04 作者: AI Productivity Guide Team 🌐 查看英文版本

一句话总结（2026 年 6 月）： “总结这份 PDF”其实是三件事——报告、论文、合同，各有各的 Prompt、各有各的可信度模型。能不能做先看工具上限：Claude.ai 网页端单个 PDF 上限 100 页 / 32MB；Gemini 上限 1,000 页 / 50MB，且每页都按图片读（扫描件首选）；ChatGPT 单文件上限 200 万 token，但 Free/Plus/Pro 只做纯文本提取。NotebookLM 用来交叉读多份资料（免费 50 份、Plus/Pro 300 份）。高 stakes 文档上唯一能救你的一条规则：每个页码引用都当成”待核验的指针”，永远别当成”结论”。

任务场景

下午 4 点收件箱里突然来了一份 187 页的 McKinsey 报告，老板的备注：“明早 strategy review 前给点想法？“或者，一篇同事推的 38 页论文”你真的应该读一下”。或者，一份 24 页的 SaaS 合同周五要签字，唯一一个能问的法务今天 PTO。“让 AI 总结一下 PDF”听起来是一件事——其实是三件完全不同的事：Prompt 不同、工具不同、可信度模型也不同。

什么时候适合让 AI 来做

AI 在压缩这件事上是真的强：50 页压成 800 字还能保留主要论证。它也擅长结构化阅读——把一篇 paper 的方法节、合同的赔偿条款、报告的数据附录精准挑出来。AI 不擅长的：编引用。当你要求”附页码引用”时，模型在长上下文压力下会编出看起来很合理的页码。更糟的是，它会把一句根本不在原文里的话改写后挂在”第 27 页”。把页码当成”待验证指针”，不要当成”结论”。修复方式是结构化的：每份总结都应该能对照原文核验，而你的工作流要让这一步成本低。

常见失败模式：模型总结的其实是摘要或executive summary，你以为它读了全文。100 页报告 8 秒就出结果，基本就是只读了前 5 页和目录。

需要先给 AI 的信息

PDF 本体——不是截图。文件上传，让 OCR 干净。
页数和文档类型——187 页报告 vs 12 页 memo 对 Prompt 影响很大
你真正的阅读目标——决定是否引用、是否买、是否复现、是否签
你最想被回答的 2-3 个问题（让模型围绕你的问题总结，不要围绕原文目录）
你的领域语境——“我是 Series B SaaS 创始人，从采购角度看”和”我是公司法务，从风险角度看”，产出会很不同
一条可信度约束——“每个 claim 必须给页码 / 章节号；找不到就写 ‘no citation’，不要瞎猜”
你真正要的输出格式——bullet brief、slide notes、200 字 stand-up 总结、还是 2 页 memo
你下游输出的读者——老板、团队、还是未来的自己

三种工作流，三套 Prompt

1. 长报告（商业 / 政策 / 行业研究）

读这份 {N 页} 报告。我的目标：{这份总结要支持的决策}。
我的背景：{角色 + 这个话题我已经知道什么}。

返回：
1）一句话核心结论（用报告自己的话）。
2）每个主要章节一个 bullet（≤3 句）。标注哪些章节影响我的决策、哪些只是背景。
3）3 个最关键的数据点，每个给页码。报告没给原始来源的，标"无来源"。
4）2 个我应该反驳的观点——引用 8-15 词原文 + 页码。
5）一个怀疑论者会问作者的 3 个问题。能从文档里答的，一句话答；不能答的标"需 follow up"。
6）我明天开会要带进会议室的那一句话。

可信度约束：找不到页码就写 "uncited"，不要瞎猜。
附文档：{upload}

2. 学术论文

你是 {field} 的资深审稿人。我在决定要不要{引用 / 复现 / 在此基础上做}这篇 paper。

返回：
1）研究问题（1 句）。
2）方法的 3 个独特特征（数据、模型、实验设计），每个为什么重要。
3）主要结果 + effect size + 我应该信多大程度（样本、复现、混淆风险）。
4）实验设计 2 个可能缺陷。
5）与领域内 3 篇最相关工作的关系。
6）如果我在这个领域，值得 follow up 的 2 个具体实验。
7）发给同事一句 Slack 的 headline finding。

可信度约束：不许编 prior work 引用。文中找不到支持的 claim 直接说。
附文档：{upload}

3. 合同 / 法律文档

你是熟悉 {美 / 欧 / 中} 商业合同的律师助理。我是签这份合同的 {采购方 / 供应商 / 合作方}。

返回：
1）双方义务，分点列，附章节引用。
2）我应该最警惕的 5 个条款（赔偿、退出、IP 归属、自动续约、管辖法、责任上限）。每个：引用 10-25 词原文 + 章节号。
3）3 个建议协商收紧的条款——具体改法（如"赔偿上限从无限改为 12 个月费用"）。
4）3 句话发给对方提出修改建议。
5）律师 30 秒扫描会标出的那一个最大风险。

重要：这不是法律意见，最终请律师确认。
附文档：{upload}

短版本——单问题查找

读这份 PDF。只回答这个问题：{一个具体问题}。
给：答案 + 页码 + 12-25 词原文支持。
如果 PDF 根本没回答这个，写 "not found"——不要推断。
附文档：{upload}

工具对比简表（上限数据截至 2026 年 6 月）

先按文档的硬上限选工具，再看质量。下面的页数 / 大小上限是消费版网页 / App 的上限，比模型原始上下文窗口更紧——它才是真正卡住你上传的那个数。

PDF 类型	优先工具	硬上限（网页 / App）	原因
100 页以内长报告	Claude（Sonnet 4.6 / Opus 4.7）	100 页、单文件 32MB	1M token 上下文吃得下整篇，保留承重论证强
100–1,000 页长报告	Gemini 3.1 Pro	1,000 页、单文件 50MB	每页原生读；单文件页数上限最高
含公式的学术 paper	ChatGPT（GPT-5.5）	200 万 token、单文件 512MB	Python 工具能跑公式 / 复现小实验
合同 / 法律	Claude（Opus 4.7）	100 页、单文件 32MB	长引用保真最好，最不容易偷偷改写条款
中 / 日 / 韩 PDF	Kimi / 通义 / Gemini 3.1 Pro	各工具不同	CJK OCR 和术语更稳
扫描版 / 纯图片 PDF	Gemini 3.1 Pro	1,000 页、单文件 50MB	原生视觉把每页当图片读，省掉单独 OCR
多份资料交叉阅读	NotebookLM	50 份（免费）、300 份（Plus/Pro）	整个项目索引，做有依据的 cross-citation

两个最容易踩的限制：ChatGPT 在 Free/Plus/Pro 上只做纯文本提取（视觉提取仅 Enterprise 有），图表和扫描页会丢，这类发给 Gemini。还有 Claude.ai 网页端的 100 页上限远低于它 1M token 的模型上下文，所以一份 250 页的报告得走 Gemini、Claude Files API，或者切片再合并。

输出示例

一个好的报告总结 headline：“McKinsey 这份 deck 论证 SMB SaaS 在 2028 年前会整合成 4 个垂直赢家，但支撑数据只到 2024——趋势外推是这条 claim 的承重论证，且无来源标注。” 这一句比 800 字 bullet 都管用。

一个好的合同风险旗：“第 9.4 条（赔偿，p.11）：‘Customer shall indemnify Vendor against any claims arising from Customer’s use of the Service, without limitation.’ ‘without limitation’ 是让赔偿没有上限的关键——建议改为 ‘capped at 12 months of fees paid’。”

一个好的论文总结：“主张：prompt chaining 在 benchmark 上提升准确率 14pp。可信度：中。Benchmark 是作者自己的（n=200），无第三方复现。混淆：chain length 和总 token budget 共变，分不清是结构作用还是单纯多算了。“

怎么改输出

总结太泛 —— “重写，只保留影响我’是否 [签 / 引 / 买]’的内容。背景复述全删。”
引用看起来可疑 —— “每个 claim 给 12-25 词原文。文档里找不到原文就标 ‘uncited’，不许 paraphrase。”
100 页之后没读 —— “确认：你是不是读完了全部 [N] 页？给我 3 个来自文档后三分之一的具体发现。没读到 [X] 页之后就直说。”
法律语气过度对冲 —— “砍掉所有 ‘may”might”could potentially’。有风险的条款直接说有风险，没问题的条款直接说没问题。每条都对冲等于没有意见。”
学术 critique 太浅 —— “用敌意 peer reviewer 的标准。指出你会跑哪个实验来打破这篇 paper 的主张。“

容易踩的坑

信”秒出的总结”——100 页 6 秒出来的总结就是摘要，不是全文；用一个后段问题反向验证。
让 AI 改写法律原文——改写会丢掉关键词（“without limitation""sole discretion""perpetual”），合同条款一律逐字引。
一个 Prompt 用到底——同一个 Prompt 把合同审成 exec summary，真正的风险就漏了。
Prompt 里没领域语境——同一篇 paper 让”NLP 资深审稿人”读和让”好奇通才”读，产出完全不同；明确指定。
扫描 PDF 跳过 OCR——纯图 PDF 没 OCR 时模型在读文件名和元数据，总结就是幻觉。
高 stakes 文档没逐页核验——合同 / 政策类，总结只是”该读哪几页”的引导，不能代替读。
忘了文档年代——2019 年的行业报告带 2019 的假设；总结要标 data freshness，不要当成当下信息。
多文档不打来源 tag——一次总结 5 个 PDF 但不标”哪条 claim 来自哪个源”，就没法核验。

FAQ

单文件的真实页数 / 大小上限是多少（2026 年 6 月）？ —— Claude.ai 网页端拒收超过 100 页或 32MB 的 PDF；Claude Files API 能到 500MB。Gemini 单文件上限 1,000 页 / 50MB，且每页按图片读。ChatGPT 单文件上限 200 万 token / 512MB，但只做纯文本提取。超过这些上限的，把 PDF 切开做一次 final combine，或者作为 NotebookLM 里最多 50 份（免费）/ 300 份（Plus/Pro）来源之一丢进去。
是不是 PDF 都先转成 markdown 再喂？ —— 凌乱的 PDF（扫描版、多栏、表格多）转一下有帮助。干净的现代 PDF 不用，现在的模型原生处理。例外：嵌套深的财报表格，转 markdown 几乎总是有用。
怎么检查模型没瞎编？ —— 挑一个带页码的具体 claim，打开 PDF 翻到那页，核验那 12-25 词原文是否存在。不存在就让模型重新做、要求更严的引用保真。两次都对不上就换工具。
为什么 ChatGPT 漏掉了我报告里的图表？ —— 在 Free、Plus、Pro 上 ChatGPT 只做纯文本提取——抽出文字层，忽略图表图片和扫描页（视觉提取仅 Enterprise 有）。图表多或扫描版的 PDF 用 Gemini 3.1 Pro，它把每页都当图片读。
合同条款分析能直接发给对方吗？ —— 条款分析是 research；发给对方的邮件草稿是起点。具体提多大让步必须经过律师确认再发。本文不构成法律意见。
模型能识别文档里”缺什么”吗？ —— 能，但要你主动问。可以这样问：“和典型 [SaaS / NDA / 雇佣] 合同相比，这份缺了哪些标准章节？“模型当 checklist 比当自由 critic 更有用。

任务场景

什么时候适合让 AI 来做

需要先给 AI 的信息

三种工作流，三套 Prompt

1. 长报告（商业 / 政策 / 行业研究）

2. 学术论文

3. 合同 / 法律文档

短版本——单问题查找

工具对比简表（上限数据截至 2026 年 6 月）

输出示例

怎么改输出

容易踩的坑

FAQ

相关阅读

相关文章

AI 周计划优先级反思：5 分钟搞定

用 AI 清洗 Excel 脏数据：大小写、空格、错字、去重

AI 一次出 30 个内容选题：十分钟突破写作选题瓶颈

用 AI 抽取会议行动项：从转录拿到「负责人 / 任务 / 截止日期」清单

用 AI 起草拍板式会议议程：30 分钟出一个决策

用 AI 总结长篇政策文档