Gemini 文件上传失败 / 返回内容不对

上传成功但 Gemini"读不到",或总结离谱——大小、类型、Drive 权限三件事。

把 PDF 上传给 Gemini,要么上传按钮转圈不结束、要么上传成功但 Gemini 说”我看不到文件”、要么读到了但总结完全跑题——这三种失败模式各对应不同根因:大小超限、格式不支持、Drive 权限、扫描件无文本层。Gemini 的文件处理有”格式白名单 + 内容预处理”两层逻辑,任何一层失败都会让上传看起来”成功”但实际无效。

要保证上传后 Gemini 真的读到内容,按”格式 → 大小 → 内容质量”顺序检查。

常见原因

按出现频率:

1. 单文件超过上限(最常见)

Gemini 各档位上传上限:

档位单文件上限总附件
Free Web100 MB10 个文件
AI Premium Web2 GB10 个文件
API2 GB取决于 context window
Workspace由 IT 设置由 IT 设置

如何判断:上传进度卡在 100% 但不出现”已附加”标记,或报”file too large”。

2. 不支持的格式

支持的格式:

  • ✅ PDF、DOCX、TXT、MD、RTF
  • ✅ XLSX、CSV
  • ✅ PNG、JPEG、WEBP、HEIC
  • ✅ MP4、MOV、AVI(视频)
  • ✅ MP3、WAV、M4A(音频)
  • ✅ 主流代码文件(py、js、ts、go、rs、java 等)

不支持:

  • ❌ ZIP / RAR / 7z 压缩包
  • ❌ DMG / EXE 可执行
  • ❌ 老格式 DOC(Word 95-2003,需先转 DOCX)
  • ❌ KEY / PAGES / NUMBERS(Apple 原生格式)
  • ❌ EPUB(部分情况)

如何判断:上传按钮直接拒绝 / 报”unsupported format”。

3. 文件来自 Drive 但 Gemini 没拿到权限

通过 “Add from Drive” 上传时,Gemini 需要 Drive 范围授权。如果 OAuth 流被中断 / 范围被拒,会拿不到文件。

如何判断

  • Drive 文件列表显示但点击后报”unable to access”
  • gemini.google.com 顶部有黄条”Grant Drive access”

4. 扫描件 PDF(无文本层)

PDF 看起来是文档但其实是扫描图片——Gemini 把每页当图像处理:

  • 短文档(< 10 页):能跑 OCR
  • 长文档(> 30 页):OCR 失败,总结离谱

如何判断:在 Adobe Reader 里能不能选中复制 PDF 里的文字。不能 = 扫描件。

5. PDF 加密 / 受密码保护

加密 PDF Gemini 无法解析。即使你电脑能打开,上传后也读不到。

如何判断:原文打开时需要输入密码。

6. 文件名包含特殊字符

文件名含 emoji / 控制字符 / 极长 unicode 可能让 API 失败。

如何判断:换简单英文文件名重试,能成功就是这条。

7. Workspace 受管账号 IT 设置严

工作账号上传限制可能比公开档位严格。

最短修复路径

Step 1:检查文件大小 + 格式

# 大小
ls -lh your_file.pdf
# > 100 MB 在免费档会失败

# 格式
file your_file.pdf
# 应该返回 "PDF document"

不支持的格式先转换:

  • Apple Pages / Numbers → 文件 → 导出为 PDF
  • Word .doc → 另存为 .docx
  • ZIP → 解压后单文件上传
  • EPUB → 用 Calibre 转 PDF

Step 2:压缩到上限以内

# 压缩 PDF(GhostScript 法)
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook \
   -dNOPAUSE -dQUIET -dBATCH -sOutputFile=compressed.pdf input.pdf

# 压缩图片 PDF
convert input.pdf -compress jpeg -quality 50 compressed.pdf

PDF 通常能压到原大小 30-50%。如果还是 > 100 MB,拆成多份分别上传。

Step 3:扫描件 OCR

# ocrmypdf(开源最稳)
brew install ocrmypdf
ocrmypdf scanned.pdf searchable.pdf

# 或在线服务
# adobe.com/acrobat/online/ocr-pdf.html

OCR 后 Gemini 能读取文字内容,总结质量大幅提升。

Step 4:解密 PDF

# 用密码解密
qpdf --password=YOUR_PASS --decrypt input.pdf output.pdf

# 或在 Adobe Acrobat → 文件 → 属性 → 安全性 → 无安全性

Step 5:Drive 权限重新授权

1. gemini.google.com 顶部黄条"Grant Drive access" → 点击
2. 或 myaccount.google.com → 安全 → 第三方访问 → 找 Gemini → 重新授权
3. OAuth 弹窗里**勾选所有权限**,不要跳过 Drive 范围

Step 6:文件名简化

mv "我的报告 📊 v3 - 最终版!!.pdf" "report_final.pdf"

只用 ASCII + 下划线,避免空格 / 特殊字符。

Step 7:用 API / AI Studio(最稳)

如果 Web UI 反复失败:

访问 aistudio.google.com
新建 prompt → 上传文件
比 gemini.google.com 限制更宽(2 GB 单文件)

Step 8:Workspace 联系 IT

工作账号有限制:

  1. 让 IT 在 Admin Console → Gemini app for Workspace
  2. 调高 “Maximum file size” 设置
  3. 启用所需的文件类型

预防建议

  • 关键文档存为 PDF / DOCX / TXT,避免 Pages / EPUB 等非主流格式
  • 扫描件统一先用 ocrmypdf 跑 OCR 再上传
  • 文件名只用 ASCII + 下划线,禁用空格 / emoji
  • Drive 文件上传前先确认 Gemini 有 Drive 权限
  • 长上下文 / 大文件用 aistudio.google.com,限制比 Web UI 宽 20 倍

相关阅读

标签: #Gemini #排查 #排查