Gemini 上下文比预期短：按计划档定位 + 修复路径

Q: 有没有免费拿到完整 1M 窗口的办法？

有。在 [aistudio.google.com](https://aistudio.google.com) 里用 Gemini 3.1 Pro。这个 UI 免费，并开放完整 1M 窗口，还带实时 token 计数器。2026 年 3 月 23 日起的 AI Studio 新用户可能需要先设置 prepaid billing plan。

宣传 1M token，但发一份 100 页 PDF 就报超限。修复方法取决于你的 Gemini 计划档和使用的入口。

发布于: 2026/05/21 更新于: 2026/06/21 作者: AI Productivity Guide Team 🌐 查看英文版本

Google 宣传 Gemini 3.1 Pro 有 1M token 的 context window，但你在 gemini.google.com 上传一份 100 页 PDF，可能会收到 Files and prompt exceed Gemini's context window. For better results, try uploading smaller files。这不是虚假宣传：消费端 Gemini app 里的 1M 窗口是付费档才解锁的，免费账号拿到的窗口要小得多。

截至 2026 年 6 月，Google 已经在 Gemini Apps 帮助中心公开了各档位的具体数字：免费档 = 32K token，Google AI Plus = 128K token，Google AI Pro 和 AI Ultra = 完整的 1M token（约 1,500 页文字或 30,000 行代码）。最快的修复办法是先搞清楚自己在哪个档，再把任务放到窗口够用的入口上。

最快修复： 如果你是免费档，把长文档任务放到 aistudio.google.com（完整窗口、无需订阅），或者升级到 Google AI Pro（$19.99/月）在 app 内拿到 1M 窗口。

先定位你属于哪一类

把你的现象对到下面的原因，再跳到对应步骤：

如果符合这个	最可能的原因	跳到
顶部模型选择器显示 Flash 或非 Pro 模型	模型小 / 窗口小	Step 1
账号页面显示 “Free”、没订阅	32K 免费档上限	Step 2
账号显示 “Google AI Plus”	128K 上限（不是完整 1M）	Step 2
PDF 是扫描件（文字无法选中）	按图像计 token，每页约 1-2K	Step 4
对话已经有大量轮次或上传过多个文件	历史吃掉了窗口	Step 7
只有公司 / Workspace 账号有问题	IT 设置的限额	Step 8
你经常需要长上下文	入口选错，改用 API / AI Studio	Step 6

常见原因

按出现频率：

1. 你不在 Pro/Ultra 计划档（最常见）

截至 2026 年 6 月，这是最关键的因素。Google 现在公开了 Gemini app 各档位的窗口：

Gemini app 档位	Context window	大致相当于
免费档	32K token	约 50 页文字
Google AI Plus	128K token	约 190 页
Google AI Pro	1M token	约 1,500 页
Google AI Ultra	1M token	约 1,500 页

营销里看到的那个完整 1M 数字，其实是 Pro/Ultra 档的数字。免费档大约只有它的 1/30。Web UI 不会告诉你窗口很小，它只是直接拒绝文件。

如何判断：打开 gemini.google.com/app，看头像下方的计划档标识，或访问 one.google.com/about/google-ai-plans。

2. 选错模型（窗口更小或被压缩）

如果顶部模型选择器选的是 Flash / 快速模型，而不是 Gemini 3.1 Pro，那么即便是付费档，你拿到的有效窗口也会更小、长文档处理也更弱。

如何判断：顶部模型选择器显示的不是 Pro / Thinking 模型。

3. 附件按”解析后的内容”算 token，不是按显示大小

文件大小上限和 token 成本是两回事。一份 PDF 在硬盘上可能很小，但解析后 token 很贵。

显示大小：5 MB
实际占用 context：解析后的文字 + 图像/OCR token，有时可达 200K+

100 页 PDF 的大致 token 成本：纯文字 30K-60K token；图文混排 80K-200K token。这两种都会立刻撑爆 32K 的免费窗口。

如何判断：文件明明远低于 100 MB 的单文件大小上限，上传却仍报 Files and prompt exceed Gemini's context window。

4. PDF 含扫描页 / 大量图片

扫描 PDF 没有文字层，Gemini 把每一页当作图像处理，每页约 1-2K token（图像编码）。100 页扫描件就是 100-200K token，会撑爆免费档（32K）和 Plus（128K）。

如何判断：PDF 里的文字无法选中或搜索（其实是一张张”文字的图片”）。

5. 对话历史已经吃满窗口

Gemini app 把当前对话里每一轮历史都算进窗口。如果你已经在这个对话里塞过几个 PDF，新文件就只能争抢剩下的空间。

如何判断：当前对话已经有大量轮次或之前上传过多个文件。

6. Workspace 受管账号有更严限制

公司 Workspace 出于数据外流防范，可能把 context 或文件上限设得更低。

如何判断：同一份文件在私人账号能上传、工作账号上传失败。向 IT 确认。

最短修复路径

按”能解锁多大窗口”从低成本到高成本排序。

Step 1：选择 Gemini 3.1 Pro

gemini.google.com → 顶部模型选择器 → Gemini 3.1 Pro (Thinking)

只有 Pro 模型在付费档下才真正能用到 1M 窗口。Flash / 快速模型是用窗口和深度换速度。

Step 2：升级计划档以解锁窗口

one.google.com/about/google-ai-plans → 选择计划

截至 2026 年 6 月：

Google AI Plus（2026 年 6 月 8 日起 $4.99/月）：把 app 窗口提到 128K token（约 190 页）。够处理一份中等长度的报告，但不够一份 100 页 PDF。
Google AI Pro（$19.99/月，原名 “Gemini Advanced” / “Google One AI Premium”）：解锁完整 1M token 窗口（约 1,500 页），并附带 Gemini 3.1 Pro。
Google AI Ultra（$99.99/月）：同样的 1M 窗口，更高的用量额度和额外功能。

如果你的目标只是处理一份大文档，Pro 是能拿到完整窗口的最低档。Plus 的 128K 仍然会拒掉一份 100 页 PDF。

Step 3：拆分大文档（任何档位都适用）

把 100 页 PDF 拆成窗口装得下的批次：

# 用 pdftk（拆成两份各 50 页）
pdftk input.pdf cat 1-50 output batch1.pdf
pdftk input.pdf cat 51-100 output batch2.pdf

# 或用 macOS Preview / Adobe Acrobat / ilovepdf.com

工作流：

上传 batch1.pdf，提问：“总结这部分，输出一份 1K 字的 brief”
复制这份 brief
新开对话：上传 batch2.pdf 加上这份 brief，让 Gemini 合并
重复直到处理完所有批次

如果是 32K 的免费窗口，每批改小一点（10-20 页）。

Step 4：扫描 PDF 先 OCR 再上传

# 用 ocrmypdf（开源）
ocrmypdf input.pdf output_ocr.pdf

# 或用 Adobe Acrobat → Scan & OCR → Recognize Text

OCR 后文字层会被当作纯文本读取，一份 100 页的扫描件能从约 200K 图像 token 降到约 30-60K 文字 token。

Step 5：把 PDF 转成纯文本 / markdown

# pdftotext
pdftotext input.pdf output.txt

# 然后上传这个 .txt

纯文本 token 开销最低。约 1 MB 纯文本大致是 250K token，能轻松塞进 1M 的 Pro/Ultra 窗口，但仍会撑爆免费档和 Plus，所以必要时配合 Step 3 一起用。

Step 6：用 Google AI Studio 或 Gemini API（完整窗口，免费）

这是长期做长上下文工作的最佳方案，而且 UI 完全免费：

打开 aistudio.google.com，选 Gemini 3.1 Pro
直接上传 100 页 PDF，token 计数器会显示你相对 1M 窗口的占用
无需订阅（注意：2026 年 3 月 23 日起，AI Studio 新用户首次使用前可能会被要求先设置 prepaid billing plan）

要做自动化就调 API。截至 2026 年 6 月，Gemini 3.1 Pro 价格为输入 $2/1M token、输出 $12/1M token：

from google import genai

client = genai.Client(api_key="YOUR_KEY")

# 用 Files API 上传大文件
file = client.files.upload(path="huge_doc.pdf")

response = client.models.generate_content(
    model="gemini-3.1-pro",
    contents=[file, "总结要点"],
)
print(response.text)

无论你在哪个消费档，API 和 AI Studio 都给完整的 1M 窗口。

Step 7：新开对话释放历史

如果当前对话已经被旧轮次和文件塞满：

新开一个对话
把之前的关键内容总结成不超过 5K token 的 brief
在新对话里复用这份 brief 加新文件

Step 8：Workspace 联系 IT 提高限额

如果只有工作账号失败，那是 IT 在管：Admin Console → Apps → Google Workspace → Gemini app，他们可以在那里查看本组织的文件大小与 context 设置。

如何确认已修复

上传顺利完成，不再出现 Files and prompt exceed Gemini's context window 提示。
问一个”大海捞针”式的问题，答案藏在靠后的页（例如”第 92 页得出了什么结论？”）。能给出准确、具体的回答，说明整份文档都进了窗口，而不只是开头那一块。
在 AI Studio 里，token 计数器显示你的输入远低于 1,048,576 token。

常见问答

Gemini 说有 1M token，为什么拒掉我的 100 页 PDF？ 1M 窗口只对 Google AI Pro 和 Ultra 生效。免费档是 32K token（约 50 页），Google AI Plus 是 128K（约 190 页），所以 100 页 PDF 两者都装不下。截至 2026 年 6 月，这些分档数字已在 Gemini Apps 帮助中心公开。

有没有免费拿到完整 1M 窗口的办法？ 有。在 aistudio.google.com 里用 Gemini 3.1 Pro。这个 UI 免费，并开放完整 1M 窗口，还带实时 token 计数器。2026 年 3 月 23 日起的 AI Studio 新用户可能需要先设置 prepaid billing plan。

Gemini app 里文件上限到底是多少？ 每个 prompt 最多 10 个文件，单个 100 MB（视频 2 GB）。大小上限和 token 上限是两码事：文件可能不到 100 MB，却仍然撑爆你的 token 窗口。

Google AI Plus 能给我长上下文窗口吗？ 不能。Plus 是 128K token（约 190 页），不是完整的 1M。要处理 100 页或更大的 PDF，需要 Google AI Pro（$19.99/月）或 Ultra。

我的 PDF 在硬盘上很小却仍被拒，为什么？ token 成本取决于解析后的内容，而不是文件大小。扫描或图文混排的 PDF 按图像计，每页约 1-2K token。先 OCR（Step 4）或转成纯文本（Step 5）来降成本。

预防建议

经常做的长上下文工作应放到 aistudio.google.com，而不是 gemini.google.com。它免费，且用的是完整 1M 窗口。
扫描 PDF 先 OCR，token 数大约能省 70%。
纯文本任务转成 .txt 上传，别直接传 PDF。
如果你需要在 app 内拿到 1M 窗口，Google AI Pro（$19.99/月）是解锁它的最低档。Google AI Plus 的 128K 不足以处理 100 页文档。
重度长文档项目（论文、财报、代码库）走 Gemini API，拿完整窗口并支持自动化。