把 PDF 上传给 Gemini,要么上传按钮转圈不结束、要么上传成功但 Gemini 说”我看不到文件”、要么读到了但总结完全跑题——这三种失败模式各对应不同根因:大小超限、格式不支持、Drive 权限、扫描件无文本层。Gemini 的文件处理有”格式白名单 + 内容预处理”两层逻辑,任何一层失败都会让上传看起来”成功”但实际无效。
要保证上传后 Gemini 真的读到内容,按”格式 → 大小 → 内容质量”顺序检查。
常见原因
按出现频率:
1. 单文件超过上限(最常见)
Gemini 各档位上传上限:
| 档位 | 单文件上限 | 总附件 |
|---|---|---|
| Free Web | 100 MB | 10 个文件 |
| AI Premium Web | 2 GB | 10 个文件 |
| API | 2 GB | 取决于 context window |
| Workspace | 由 IT 设置 | 由 IT 设置 |
如何判断:上传进度卡在 100% 但不出现”已附加”标记,或报”file too large”。
2. 不支持的格式
支持的格式:
- ✅ PDF、DOCX、TXT、MD、RTF
- ✅ XLSX、CSV
- ✅ PNG、JPEG、WEBP、HEIC
- ✅ MP4、MOV、AVI(视频)
- ✅ MP3、WAV、M4A(音频)
- ✅ 主流代码文件(py、js、ts、go、rs、java 等)
不支持:
- ❌ ZIP / RAR / 7z 压缩包
- ❌ DMG / EXE 可执行
- ❌ 老格式 DOC(Word 95-2003,需先转 DOCX)
- ❌ KEY / PAGES / NUMBERS(Apple 原生格式)
- ❌ EPUB(部分情况)
如何判断:上传按钮直接拒绝 / 报”unsupported format”。
3. 文件来自 Drive 但 Gemini 没拿到权限
通过 “Add from Drive” 上传时,Gemini 需要 Drive 范围授权。如果 OAuth 流被中断 / 范围被拒,会拿不到文件。
如何判断:
- Drive 文件列表显示但点击后报”unable to access”
- gemini.google.com 顶部有黄条”Grant Drive access”
4. 扫描件 PDF(无文本层)
PDF 看起来是文档但其实是扫描图片——Gemini 把每页当图像处理:
- 短文档(< 10 页):能跑 OCR
- 长文档(> 30 页):OCR 失败,总结离谱
如何判断:在 Adobe Reader 里能不能选中复制 PDF 里的文字。不能 = 扫描件。
5. PDF 加密 / 受密码保护
加密 PDF Gemini 无法解析。即使你电脑能打开,上传后也读不到。
如何判断:原文打开时需要输入密码。
6. 文件名包含特殊字符
文件名含 emoji / 控制字符 / 极长 unicode 可能让 API 失败。
如何判断:换简单英文文件名重试,能成功就是这条。
7. Workspace 受管账号 IT 设置严
工作账号上传限制可能比公开档位严格。
最短修复路径
Step 1:检查文件大小 + 格式
# 大小
ls -lh your_file.pdf
# > 100 MB 在免费档会失败
# 格式
file your_file.pdf
# 应该返回 "PDF document"
不支持的格式先转换:
- Apple Pages / Numbers → 文件 → 导出为 PDF
- Word .doc → 另存为 .docx
- ZIP → 解压后单文件上传
- EPUB → 用 Calibre 转 PDF
Step 2:压缩到上限以内
# 压缩 PDF(GhostScript 法)
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook \
-dNOPAUSE -dQUIET -dBATCH -sOutputFile=compressed.pdf input.pdf
# 压缩图片 PDF
convert input.pdf -compress jpeg -quality 50 compressed.pdf
PDF 通常能压到原大小 30-50%。如果还是 > 100 MB,拆成多份分别上传。
Step 3:扫描件 OCR
# ocrmypdf(开源最稳)
brew install ocrmypdf
ocrmypdf scanned.pdf searchable.pdf
# 或在线服务
# adobe.com/acrobat/online/ocr-pdf.html
OCR 后 Gemini 能读取文字内容,总结质量大幅提升。
Step 4:解密 PDF
# 用密码解密
qpdf --password=YOUR_PASS --decrypt input.pdf output.pdf
# 或在 Adobe Acrobat → 文件 → 属性 → 安全性 → 无安全性
Step 5:Drive 权限重新授权
1. gemini.google.com 顶部黄条"Grant Drive access" → 点击
2. 或 myaccount.google.com → 安全 → 第三方访问 → 找 Gemini → 重新授权
3. OAuth 弹窗里**勾选所有权限**,不要跳过 Drive 范围
Step 6:文件名简化
mv "我的报告 📊 v3 - 最终版!!.pdf" "report_final.pdf"
只用 ASCII + 下划线,避免空格 / 特殊字符。
Step 7:用 API / AI Studio(最稳)
如果 Web UI 反复失败:
访问 aistudio.google.com
新建 prompt → 上传文件
比 gemini.google.com 限制更宽(2 GB 单文件)
Step 8:Workspace 联系 IT
工作账号有限制:
- 让 IT 在 Admin Console → Gemini app for Workspace
- 调高 “Maximum file size” 设置
- 启用所需的文件类型
预防建议
- 关键文档存为 PDF / DOCX / TXT,避免 Pages / EPUB 等非主流格式
- 扫描件统一先用 ocrmypdf 跑 OCR 再上传
- 文件名只用 ASCII + 下划线,禁用空格 / emoji
- Drive 文件上传前先确认 Gemini 有 Drive 权限
- 长上下文 / 大文件用 aistudio.google.com,限制比 Web UI 宽 20 倍