Gemini 文件上传失败 / 返回内容不对

Q: Gemini 把扫描的合同总结得完全不对，是它在瞎编吗？

不是，它读的是页面图片，OCR 失败了。上传前用 `ocrmypdf` 加一层文本，或在 prompt 前面加 `This PDF is image-only, transcribe each page first`。

上传成功但 Gemini 读不到，或总结离谱？逐一排查大小上限、格式、Drive 权限和扫描件 PDF。

发布于: 2026/05/17 更新于: 2026/06/21 作者: AI Productivity Guide Team 🌐 查看英文版本

把文件上传给 Gemini，常见三种失败：上传按钮一直转圈、上传”成功”但 Gemini 说看不到文件、或者读到了但总结完全跑题。每种症状对应不同根因：单文件超限、格式不支持、Drive 权限没开、或扫描件 PDF 没有文本层。Gemini 先过一遍格式白名单，再做内容预处理，所以任何一层失败都可能显示绿色对勾，但文件实际无法读取。

最快修复： 确认文件小于 100 MB 且格式受支持（PDF、DOCX、TXT、PNG 等），然后重新附加。如果 PDF 能读但总结一团乱，几乎一定是扫描件（纯图片）PDF——先跑 OCR。下面是完整的排查顺序：格式 -> 大小 -> Drive 权限 -> 内容质量。

先定位你属于哪一类

症状	最可能原因	跳转
报 `unsupported format` / 按钮直接拒绝	格式不在白名单	Step 1
进度卡在 100% 但不附加	文件超过大小上限	Step 2
附加成功但总结离谱	扫描件 PDF，没有文本层	Step 3
报”文件受密码保护”	PDF 加密	Step 4
提示”连接 Google Workspace” / 读不到 Drive 文件	Drive 权限没开	Step 5
只有某一个文件上传失败	文件名含特殊字符	Step 6
Web 能上传但超长文档被截断	超过页数 / token 上限	Step 7

常见原因

按出现频率，截至 2026 年 6 月：

1. 单文件超过大小上限（最常见）

在 Gemini 应用（gemini.google.com）里，单文件上限在所有消费档位都是一样的。升级到 Google AI Pro 或 Ultra 不会抬高单文件文档上限——它抬高的是上下文窗口（1M tokens）以及可分析的视频/音频总时长。

限制	Free / Google AI Pro / Ultra（Gemini 应用）	Gemini API（AI Studio）
单文件（文档、图片、代码）	100 MB	2 GB
单文件（视频）	2 GB	2 GB
每次 prompt 文件数	最多 10 个	取决于上下文窗口
项目存储	无	20 GB，文件 48 小时后自动删除
Workspace 账号	由 IT 设置（通常更低）	由 IT 设置

视频时长上限：Free 5 分钟，Pro/Ultra 延长到 1 小时。音频：Free 10 分钟，Pro/Ultra 延长到 3 小时。

如何判断：上传进度到 100% 但不出现”已附加”缩略图，或报 file too large。

2. 不支持的格式

Gemini 应用支持：

PDF、DOCX、TXT、MD、RTF，以及 Google Docs/Sheets
XLSX、XLS、CSV、TSV
PNG、JPEG、WEBP、HEIC
MP4、MOV、AVI（视频）
MP3、WAV、M4A（音频）
主流代码文件（py、js、ts、go、rs、java 等），以及单个代码文件夹或 GitHub 仓库，最多 5,000 个文件 / 100 MB

不支持（会被拒绝或静默失败）：

DMG / EXE 可执行文件
老格式 DOC（Word 95-2003）——需先转 DOCX
KEY / PAGES / NUMBERS（Apple 原生格式）——先导出为 PDF
多数情况下的 EPUB——先转 PDF

关于 ZIP：Gemini 应用其实接受 ZIP 压缩包（内含最多 10 个文件 / 100 MB），但 ZIP 不能包含视频或音频，而且解压后单文件上传仍然更稳。

如何判断：上传按钮直接拒绝，或报 unsupported format。

3. 文件来自 Drive 但 Drive 权限没开

“Add from Drive” 现在光有 OAuth 授权已经不够。截至 2026 年，它需要**开启 Gemini Apps Activity（Keep Activity）**并把 Google Workspace 连接到 Gemini Apps。任一项没开，Drive 选择器要么打不开，要么文件返回 unable to access。

如何判断：

点击 Drive 文件后报 unable to access
出现”Connect Google Workspace”或”Turn on Gemini Apps Activity”的提示

4. 扫描件 PDF（无文本层）

PDF 看起来是文档，其实是扫描页的图片。Gemini 把每页当图像处理并尝试 OCR：

短文档（小于 10 页）：临时 OCR 通常能跑
长文档（超过约 30 页）：OCR 退化，总结离谱

如何判断：用任意阅读器打开 PDF，试着选中复制文字。选不中就是扫描件。

5. PDF 加密 / 受密码保护

加密 PDF 即使你电脑能打开，上传后 Gemini 也无法解析。

如何判断：原文打开时需要输入密码。

6. 文件名含特殊字符

文件名含 emoji、控制字符或极长 unicode，可能在上传或处理阶段失败。

如何判断：换成纯英文（ASCII）文件名重试，能成功就是这条。

7. 超过页数 / token 上限（超大 PDF）

即便没超 100 MB，单个 PDF 也有 1,000 页上限，每页约消耗 258 tokens。一份 1,000 页的 PDF 本身就约 258K tokens，超大文档会撑爆上下文窗口被静默截断——总结只覆盖了前面一部分。

如何判断：长文档的开头总结准确，但后半部分被完全忽略。

8. Workspace 受管账号 IT 设置严

受管工作账号通常把上传大小和允许的文件类型压得比公开档位更低。

最短修复路径

Step 1：检查格式和大小

# 大小
ls -lh your_file.pdf
# 超过 100 MB 在 Gemini 应用任何档位都会失败

# 格式 / 真实类型（扩展名可能是假的）
file your_file.pdf
# 应该返回 "PDF document"

不支持的格式先转换：

Apple Pages / Numbers -> File -> Export To -> PDF
Word .doc -> Save As -> .docx
ZIP -> 解压后单文件上传
EPUB -> 用 Calibre 转 PDF

在 Web 应用里上传：在输入框点 Add files，本地文件选 Upload，代码/笔记本选 More Uploads，Drive 文件选 Add from Drive。

Step 2：压缩到上限以内

# 用 Ghostscript 压缩 PDF
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook \
   -dNOPAUSE -dQUIET -dBATCH -sOutputFile=compressed.pdf input.pdf

# 图片密集的 PDF（ImageMagick）
convert input.pdf -compress jpeg -quality 50 compressed.pdf

PDF 通常能压到原大小的 30-50%。如果还是超过 100 MB，或超过 1,000 页，就拆成多份分别上传，或改用 AI Studio（Step 7）。

Step 3：扫描件 PDF 跑 OCR

# ocrmypdf（开源，最稳）
brew install ocrmypdf
ocrmypdf scanned.pdf searchable.pdf

# 或在线：adobe.com/acrobat/online/ocr-pdf.html

OCR 后 Gemini 能读取真实文字，总结质量大幅提升。如果本地没法 OCR，也可以提示模型——在 prompt 开头写：This PDF is image-only. Transcribe the text on each page, then answer. 单这一句往往就能把扫描件从”我读不了”拉到可用。

Step 4：解密 PDF

# 用已知密码解密
qpdf --password=YOUR_PASS --decrypt input.pdf output.pdf

# 或在 Adobe Acrobat -> File -> Properties -> Security -> No Security

Step 5：开启 Drive 权限

1. Settings -> Gemini Apps Activity -> 打开
2. 在 Drive 选择器里出现 "Connect Google Workspace" 时点同意
3. 还是不行：myaccount.google.com -> 安全 ->
   你与第三方应用的连接 -> 找到 Gemini -> 重新授权
4. OAuth 弹窗里勾选全部权限，别跳过 Drive

临时替代方案：把 Drive 文件下载到本地，用 Add files -> Upload 上传；本地上传不需要开 Activity。

Step 6：简化文件名

mv "我的报告 v3 - 最终版!!.pdf" "report_final.pdf"

只用 ASCII + 下划线，避免空格、emoji、特殊字符。

Step 7：改用 AI Studio 或 API

如果 Web 应用反复失败，或超长文档被截断，改用 aistudio.google.com：新建 prompt 并附加文件。API 路径单文件可达 2 GB（Web 应用是 100 MB），文件免费存储 48 小时，项目存储 20 GB。注意单个 PDF 仍受 1,000 页 / 50 MB inline 上限约束。

Step 8：Workspace 账号联系 IT

受管账号上：

IT -> Admin Console -> Apps -> Google Workspace -> Gemini app
调高最大文件大小并启用所需文件类型
确认策略允许开启 Gemini Apps Activity

如何确认已修复

重新上传后，问一个答案藏在文件深处的验证问题，例如：第 4 节的标题原文是什么，并引用它的第一句话。 如果 Gemini 引出真实文字，说明文件已完整读取。如果只是模糊转述、回避具体内容，通常意味着它仍只看到元数据或部分 OCR。

常见问题

为什么明明上传成功了，Gemini 却说”我读不到文件”？ 格式白名单和内容读取是两个独立阶段。绿色对勾只说明文件上传到位了。如果读取器抽不出文字——扫描件 PDF、加密文件、或没权限的 Drive 文件——你就会得到一个”上传成功但读不了”的文件。按顺序排查：格式、大小、Drive 权限、内容质量。

Google AI Pro 能让我上传更大的文件吗？ 不能。在 Gemini 应用里，Free、Pro、Ultra 的单文件文档上限都是 100 MB。Pro/Ultra 抬高的是上下文窗口（1M tokens），并把视频延长到 1 小时、音频延长到 3 小时，但不抬高单文件文档大小。文件超过 100 MB 就用 AI Studio（单文件 2 GB）。

PDF 上传了但总结只覆盖前面一部分，为什么？ 文档超过 1,000 页上限，或大到撑爆上下文窗口被截断了。把它拆开、分段总结，或在 AI Studio 用 1M-token 模型处理。

Gemini 把扫描的合同总结得完全不对，是它在瞎编吗？ 不是，它读的是页面图片，OCR 失败了。上传前用 ocrmypdf 加一层文本，或在 prompt 前面加 This PDF is image-only, transcribe each page first。

我已经登录了，为什么 “Add from Drive” 还是不行？ 截至 2026 年，它需要开启 Gemini Apps Activity 并连接 Google Workspace，光登录不够。在 Settings 里开启 Activity、接受 Workspace 连接提示，或干脆把文件下载下来本地上传。

预防建议

关键文档存为 PDF / DOCX / TXT，避免 Pages / EPUB 等专有格式
扫描件统一先用 ocrmypdf 跑 OCR 再上传
文件名只用 ASCII + 下划线，禁用空格 / emoji
依赖 Drive 上传前，先开启 Gemini Apps Activity
大文件 / 长上下文用 aistudio.google.com——单文件上限宽 20 倍（2 GB vs 100 MB）