这篇主要解决什么问题
Gemini 处理 Google 托管的 PDF 异常强(解析干净、有页码、表格抽取),处理外部文件异常不稳(偶尔悄悄漏节、页码漂、扫描页失败)。这套流程能从两种都拿到可靠摘要,并告诉你什么时候该放弃换手工读。
这篇适合谁看
每周读 10+ 份 PDF 的人:股票研究分析师、科研人员、过供应商方案的运营、啃教材章节的学生、做第一遍尽调的律师、读背景报告的记者。
什么时候适合用
报告、论文、合同、财报、董事会 deck——任何 20 页以上、结构重要、需要浮出具体结论的。10 页以下别用(开销大于节省);图占主体的 PDF 也别用——意思在图里。
什么时候不建议用
不能上传到 Google 的敏感 PDF(客户机密、监管材料);OCR 是瓶颈的重扫描 PDF——Gemini OCR 还行但不到生产级抽取;公式或表格内容多的 PDF(Gemini 丢格式比保留多);遣词关键、转述就是风险的法律合同。
开始前准备
- PDF 先传 Drive。Drive 托管的解析比聊天附件的好。
- 扫描 PDF 先看首页 OCR 质量。首页就乱码后面也一样——这就停。
- 提前定输出格式:结构化摘要、决策矩阵、claims-methods-limitations 拆解。格式约束 prompt。
- 多 PDF 综合先把所有文件挪到同一个 Drive 目录。
具体步骤
- PDF 传 Drive。在 Gemini 用
@文件名引用。先确认 Gemini 看到再问分析。 - 第一条 prompt:“这份 PDF 里有什么?列章节标题、每节大致页数、有没有表格 / 图、出现超过 3 次的具名实体。” 先要结构再要内容。
- 仔细读结构性回答。长 PDF 上 Gemini 会悄悄漏节。你知道某节存在就明问:“你没提第 X 节——里面是什么?”
- 按节深入:“总结第 3 节 5 条 bullet。包含任何百分比的页码,并把原句引出来。” 页码+引文是可验证摘要的不可省项。
- 每条数字都问:“这个数字在第几页?把那句原文引出来。” 转述的数字会漂;引用的可核。
- 表格让它输出 Markdown。Markdown 表能干净粘到 Docs 和 Sheets,结构让验证快。
- 最后的综合存回 Drive 做成 Doc 顶部贴原 PDF 链接。一周内未来的你还要回头核。
第一次实操怎么跑
- 选一份你完全熟某一节的 PDF。知道地面真相才能抓出细微错误。
- 跑”先结构”prompt 和那一节深入。
- 标每个错误:漏 nuance、数字错、页码错、缺背景。记类型和频率。
- 用明确”页码+引文”措辞重跑。统计错误减少多少。这是你 prompt 效果的基线。
完成后检查
- Gemini 列全章节,还是悄悄漏一节?50+ 页 PDF 上漏节是最常见失败。
- 页码在 1-2 页误差内吗?Gemini 常小偏;承重结论一定要核。
- 数字结论是否带引用原句?没引文的数字不可靠。
- 名字、日期、百分比是否可疑地”整”?“大约 50%“且没来源通常是抹平。
- 表格行列保全吗?Gemini 长表偶尔漏行。
怎么复用这套流程
- prompt 序列存到 Drive Doc 的
PDF 总结模板片段。同类 PDF 复用。 - 重复 PDF 类型(季报、董事会 deck、供应商方案)做类型专用 prompt,提前点出你永远关心的节。
- 失败日志:哪些 PDF Gemini 解析得差。模式化(扫描、重表、公式)下次知道何时切手工。
- 每两个月刷新。PDF 解析随模型更新提升,旧 workaround 可能不再需要。
建议的操作流程
一份 100 页政府报告:传 Drive → 在 Gemini 用 @ 引 → 结构 prompt → 确认没漏节 → 深入你关心的 2-3 节带页码 → 数字用 markdown 表 → 综合存成一页 Doc 关联原文。总用时 30 分钟对比 3+ 小时手工读,浮出结论的准确度相当。
容易踩的坑
- “总结整份 PDF”——拿到没结构没页码的含糊转述。永远先用结构 prompt。
- 不验证页码就相信——长文档 Gemini 偶有 1-2 页偏。
- 上传扫描 PDF 当干净文本。先 OCR 或接受摘要只是近似。
- 跳过结构步直接问分析。结构 prompt 是防漏节最便宜的保险。
- 让摘要替代阅读。承重结论一定要在 Gemini 浮出后自己读那节。
- 多 PDF 综合时文件散在 Drive 各处。找不齐就没法交叉引用。
进阶技巧
- 论文:分别要
claims, methods, limitations三节——比自由总结清晰,也契合学术粗扫模式。 - 合同:“列出每个定义术语和它第一次出现的位置。” 合同里杠杆最高的 prompt。
- 财报:让 Gemini 输出”每行一个期间”的 CSV,粘到 Sheets 做下游分析。
- 董事会 deck:分开要
决策请求和背景幻灯。决策通常被埋。 - 多 PDF 调研:要按 PDF 一列、按结论一行的对比表。Markdown 表格式。
FAQ
- 为什么 Gemini 偶尔拒一份 PDF?: 重格式、扫描、DRM 加密的 PDF 解析容易失败。试着先转 Doc 或用工具提取文本。
- 最大能处理多大?: 看 plan。Pro 能处理 100+ 页。超过上下文窗口就按节拆分别处理。
- 页码为什么偏?: Gemini 偶尔把封面和目录算入页码,跟印刷页不一致。在真实页上验证不要只信引用的数字。
- 能处理非英文 PDF 吗?: 主流语言可以。中文和其他语言质量过得去但不等于英文;要更激进抽查。