单文件最大多大？

截至 2026 年 6 月，Claude.ai 网页端单文件 30MB、单次对话 20 个文件。开发者用 Files API 可达单文件 500MB。超限就拆文件，或先抽出相关章节。

PDF 最多多少页？

网页端受模型上下文限制，没有硬性页数上限。走 API 则每次请求 600 页（200k token 模型为 100 页），整个请求体不超过 32MB。每页约 1500–3000 token。

上传的文件会被拿去训练吗？

Anthropic 默认不拿消费者对话或上传内容训练模型。具体以你的 plan 及 Team/Enterprise 数据设置为准。

能处理带公式的 Excel 吗？

读值，开启代码执行后还能对 XLSX 做计算。但它不会像表格软件那样审查公式逻辑——要审公式就导出 CSV 并显式说明。

OCR 差的扫描 PDF 怎么办？

密扫质量会降。因为每页还会被渲染成图像，Claude 往往能救回 OCR 弄错的文字，但仍要核：让它把可疑那页以纯文本输出，再肉眼抽查。

怎么干净对比两份合同？

一次都传上，并给每份角色："文件 1 = 当前合同，文件 2 = 改稿；列出每条改动条款，并各自引用原文和页码。" 用上面那条两份合同 prompt。

AI 工具教程

Claude 文件上传工作流：让检索真正生效（2026）

Claude 的文件处理强过多数大模型，前提是你上传得对。精确上限、可落地的喂料 prompt 序列，以及合同、论文、财报的引用核查法。

发布于: 2026/05/17 更新于: 2026/06/09 作者: AI Productivity Guide Team 🌐 查看英文版本

一句话总结

把文件丢上去问”总结”，Claude 给你的是任何模型都能产出的、听着稳妥的安全网泛话。有用回答和危险回答的差别，只在 Claude 有没有真把答案钉在源文件上。这套流程就四步：改文件名、先盘点后解读、一节一节深入、每条结论都要页码或章节出处。截至 2026 年 6 月，Claude.ai 网页端单文件 30MB、单次对话最多 20 个文件；Opus 4.7 和 Sonnet 4.6 都是 100 万 token 上下文（约 3000 页）。下面是 prompt 序列，以及多数人会跳过的那一步核查。

这篇适合谁看

把 PDF、合同、论文、文字稿、代码、表格上传到 Claude，并指望答案能直接拿去用的人——法律、财务、研究、并购尽调、新闻。只要一个错数字或一条被编造的条款会带来真实代价，这套流程就是为你写的。

什么时候该用、什么时候别用

该用的场景：长文件（50+ 页）、多文件比对、需要按段落引用、要反复使用的文件，或任何编造答案代价高昂的情形。在有据可查的文档问答上，Claude 确实比 ChatGPT 更强——但前提是你上传得对。

别用的情况：含敏感 PII 或不可披露信息的文件、超出上传上限的文件、搜一下就有答案的简单问题，以及没有文本层的二进制格式（裸图、加密 PDF——带密码的 PDF Claude 会直接拒收）。

截至 2026 年 6 月的 Claude 文件上限

真正约束你工作流的就是这几个数。网页端和开发者 API 的上限不一样，这是最容易把人绊倒的地方。

渠道	单文件上限	一次可传	页数 / 上下文上限
Claude.ai 网页端（Free/Pro/Max）	30 MB	单次对话 20 个	受模型上下文限制（Opus 4.7 / Sonnet 4.6 为 100 万 token）
Claude Projects	30 MB	项目知识库内基本无限	按需检索相关片段；全量无法一次塞进上下文
Anthropic API（内联 PDF）	单次请求 32 MB	—	600 页（200k 上下文模型为 100 页）
Files API（开发者）	500 MB	每工作区 100 GB	用 `file_id` 引用，保持请求体精简

网页端支持的文档格式：PDF、DOCX、CSV、TXT、HTML、ODT、RTF、EPUB、JSON、XLSX（XLSX 需开启代码执行）。图片：JPEG、PNG、GIF、WebP，最大 8000×8000 像素。来源：Anthropic 的 Upload files to Claude 帮助页和 PDF support API 文档。

有个细节能解释大部分”Claude 看错了我的图表”的抱怨：每一页 PDF 都会同时按”抽取文本 + 渲染图像”两种方式处理，每页大约 1500–3000 token。密集小字或图形繁多的页面，可能还没到页数上限就已经把上下文窗口塞满。如果某份文件感觉像被草草扫过，那大概率就是被扫过了——拆开它。

开始前准备

文件改成清晰的名字：contract-vendor-a-2026.pdf，不要 Final_v3 (1).pdf。Claude 在答案里会引用文件名，可读性很值。
砍掉非必要页。600 页报告带 580 页附录，比你真正需要的那 20 页钉得更差。
提前定好引用格式——页码、章节标题，或两者都要——并在第一条 prompt 就写清楚，Claude 才会一致执行。
旁边另开一份独立副本核查结论。第一遍什么都别信。

完整流程，逐步走

上传前先改名。 给文件一个 Claude 能干净引用的名字。
一组文件一条消息一起传。 多文件场景把所有文件一起附上，Claude 才会把它们当一组，你也能立刻问对比类问题。
先盘点，暂不解读。 上传后第一句：分别描述每个文件是什么、有哪些章节、大致大小。先不要总结或解读内容。 这逼它先做结构性扫描，再谈解读。
先要目录，再逐节深入。 长 PDF 先拿目录，然后一节一节问。跨整篇文档的大范围问题会在中段悄悄掉链子——即便是 100 万 token，“中间内容被忽略”也是有据可查的现象。
每条结论都要出处。 话术：引用相关段落，并给出页码或章节标题。 转述但无来源的答案直接拒收。
逼表格和数字结构化。 让它输出 CSV 或 Markdown，而不是散文——更好验证。重要数字手算一行核对。
常用文件升级到 Project。 一份文件要反复用，就放进 Project，省得每次重传。见 Claude Projects 和 Claude Projects 进阶工作流。

真能把 Claude 钉在源上的 prompt

存成一套可复用的模板，和上面的步骤一一对应。

盘点（每次第一条先跑）：

回答任何问题前：先描述每个已上传文件——标题、类型、页数或行数、
章节标题。先不要总结或解读内容。

带强制引用的逐节深入：

只基于 [文件名] 的第 4 节：列出每一条定量结论。每条都要引用原文
段落，并给出页码或章节标题。源里没有的数字就直说，不要推断。

审计级抽取（可脚本化）：

以 JSON 数组输出结论。每项必须含：claim、file、page、quote、
confidence（low | med | high）。只纳入你能从源文件逐字引出的结论。

两份合同对比改稿：

文件 1 = 当前合同。文件 2 = 改稿。列出每一条改动条款。每条都引用
旧文（带页码）和新文（带页码）。整条被删的条款要单独标出。

信它之前先核它

这一步把”真活儿”和”看着没问题”分开。重要文档上，千万别跳。

每条数字或引语都带页码或章节出处。没有例外。
至少手工核对 3 条原文引用。挑最反直觉的几条——幻觉就藏在那里。
确认文件里”没有”什么。问 这份文件里没有哪些章节？，作为对抗编造结构的 sanity check。
多文件场景下，每条答案都注明来自哪份文件。Claude 把来源搅在一起时，就用显式文件名锚点反推。

一个快速校准练习：挑一份你已经读过的 30–50 页文档，在新对话里跑盘点和引用 prompt，然后数一下 Claude 给的页码里真正含有那条结论的占比。低于 90% 就把引用要求写得更严、重跑，再拿去用到新文件上。

容易踩的坑

没看清文件结构就要”总结”。拿到”听着对的废话”。
一次混传 10 个不相关文件。Claude 答题会把来源搅在一起。
相信无来源结论。一定要回去要原文段落 + 页码。
以为 OCR 完美。重扫描 PDF 会出现乱码段落——让 Claude 把可疑那页以纯文本输出，肉眼核。
整篇文档一次问一个大范围问题。中段召回会悄悄下降。
Project 里旧版越堆越多。过期文件会和当前版混在一起污染答案；及时清理。

常见问题

单文件最大多大？ 截至 2026 年 6 月，Claude.ai 网页端单文件 30MB、单次对话 20 个文件。开发者用 Files API 可达单文件 500MB。超限就拆文件，或先抽出相关章节。
PDF 最多多少页？ 网页端受模型上下文限制，没有硬性页数上限。走 API 则每次请求 600 页（200k token 模型为 100 页），整个请求体不超过 32MB。每页约 1500–3000 token。
上传的文件会被拿去训练吗？ Anthropic 默认不拿消费者对话或上传内容训练模型。具体以你的 plan 及 Team/Enterprise 数据设置为准。
能处理带公式的 Excel 吗？ 读值，开启代码执行后还能对 XLSX 做计算。但它不会像表格软件那样审查公式逻辑——要审公式就导出 CSV 并显式说明。
OCR 差的扫描 PDF 怎么办？ 密扫质量会降。因为每页还会被渲染成图像，Claude 往往能救回 OCR 弄错的文字，但仍要核：让它把可疑那页以纯文本输出，再肉眼抽查。
怎么干净对比两份合同？ 一次都传上，并给每份角色：“文件 1 = 当前合同，文件 2 = 改稿；列出每条改动条款，并各自引用原文和页码。” 用上面那条两份合同 prompt。

怎么复用这套流程

把 prompt 集合存成命名模板（“标准合同审阅""论文抽取”）。反复使用的文件类型建一个 Project，自定义指令写 永远引用页码；没来源就拒答。维护一份过往幻觉清单——失败模式会复现，命名之后下次更容易识别。每季度用新文件复测一次，确认模型更新后 Claude 的行为没有漂移。

一句话总结

这篇适合谁看

什么时候该用、什么时候别用

截至 2026 年 6 月的 Claude 文件上限

开始前准备

完整流程，逐步走

真能把 Claude 钉在源上的 prompt

信它之前先核它

容易踩的坑

常见问题

怎么复用这套流程

相关阅读

相关文章

Claude Computer Use 实操：2026 桌面自动化设置指南

Claude 手机语音流：路上把半篇文档说完

Claude Skills 实操：一个 Skill 到底怎么被触发（2026）

Claude 团队知识库实操：能撑半年的共享 Project

Claude vs Codex 做 PM 任务（2026 年 6 月）：哪个更省时间

Claude 分析工作流：先分类，再下结论