Gemini 文档总结太泛？这样写 prompt 才有干货

Gemini 总结漏掉关键数字、跳过风险章节？告诉它抽什么、按什么结构输出就能解决。附实测 prompt、模型选择修法和核实步骤，2026 年 6 月更新。

发布于: 2026/05/17 更新于: 2026/06/21 作者: AI Productivity Guide Team 🌐 查看英文版本

把一份 80 页的 10-K 财报上传给 Gemini，输入 summarize，返回来 5 段话——关键数字没提、风险因素全跳过、读起来像新闻通稿。这是所有 LLM 在长文档上的默认行为：你不说自己关心哪一段，模型就只抓最显眼的章节标题铺一遍，剩下的略读带过。

最快的修法： 别再发单词 prompt。明确告诉 Gemini 抽什么（决策、风险、数字）以及以什么结构输出（表格或固定标题），同时确认你用的是 Pro 模型而不是 Fast。光这一步就能解决大部分”总结太泛”的问题。本文后面再讲这招还不够用的长文档场景。

先判断你属于哪一类

症状	最可能的原因	跳到
输出是一段空泛概述，没有任何具体内容	prompt 只说了 “summarize”	Step 1 和 Step 6
开头结尾都覆盖了，中间章节缺失	超长文档的长上下文召回下降	Step 3
满是表格的文档，总结却没一个数字	PDF 解析时表格被压扁	Step 4
推理很浅、措辞很泛	跑在 `Fast`（Gemini 3 Flash）上	Step 5
总结里的数字看起来不对	数字幻觉	Step 7
你需要可信、可溯源的引用	工具选错了	改用 NotebookLM

常见原因

1. Prompt 只说”总结”（最常见）

Summarize this document 没告诉模型你要决策、风险、数字还是策略，于是它默认给一个全方位的空泛版本。

如何判断： 你的 prompt 是不是只有一个动词。

2. 超大文档中段的长上下文召回下降

截至 2026 年 6 月，Gemini app 里的 Pro 跑的是 Gemini 3.1 Pro，上下文窗口 100 万 token（约 1500 页文字），所以一般 PDF 现在能整篇放进去。但”放得进上下文”不等于”全部被记住”。当文档逼近窗口上限时，模型对开头和结尾召回最强、对中段最弱——这就是公认的 “lost in the middle”（中段丢失）效应，附录和文档中部的关键数据仍然会被一笔带过。

如何判断： 文档中段的内容在总结里完全没出现，但开头和结尾覆盖得很好。

3. 表格 / 图表 / 代码段在解析时丢失

PDF 解析时复杂表格容易被压扁或丢失，Gemini 根本看不到原始结构，总结里也就没有具体数字。

如何判断： 原文有关键表格（财务数据、对比表），但总结里一个数字都没引用。

4. 没指定输出结构

不要求结构 → 自由发挥的散文 → 关键信息难定位，模型还能悄悄略掉它没抓到的内容。

5. 文档本身就是低信息密度

营销 / SEO 文章原本就空泛，总结自然也空泛。

6. 你用的是 `Fast`（Gemini 3 Flash），不是 `Pro`

Fast 为速度调优，在长文档推理上明显比 Pro 浅。

最短修复路径

Step 1：先要大纲，再钻细节

别想一步到位。第一轮：

Read this document. Give me ONLY a section-by-section outline (no summary yet):
- Section title
- Section length (pages)
- Key claim / topic (one sentence)

看完大纲，筛出真正关心的 5-10 个章节，第二轮：

Now give me a detailed summary of these sections only:
{section names}

For each:
- Key facts (with numbers)
- Decisions / recommendations
- Risks mentioned
- Direct quotes for critical claims

这样会逼模型对覆盖范围”立军令状”，而不是把全文低分辨率地复述一遍。

Step 2：给它结构化输出模板

别让 Gemini 写散文，给它填空的槽位：

Summarize this 10-K filing using this exact structure:

## Business Overview
- Main revenue segments + % of total
- Geographic mix

## Financial Highlights
| Metric | This year | Last year | YoY change |
|---|---|---|---|
| Revenue | | | |
| Operating margin | | | |
| Free cash flow | | | |
| Headcount | | | |

## Risk Factors (top 5)
1. ... (with page reference)

## Strategic Initiatives
- ...

## Management Tone Indicators
- Words used more / less than last year's filing

明确格式 + 表格槽位 + 数字要求——模型就没法悄悄留空。

Step 3：超长文档拆段

100 万 token 窗口意味着大多数 PDF 能整篇放下；但如果一份几百页的文档出现了中段丢失（原因 2），就把它拆开：

拆成：pages 1-30, 31-60, 61-80
每段单独上传，按 Step 2 的模板要总结
最后：把三段总结粘回去，让 Gemini 合并它们并提炼跨段总主题

分小段能让每一页都落在模型的高召回区。截至 2026 年 6 月，Gemini app 单次 prompt 最多上传 10 个文件、单个文件（非视频）最大 100MB，所以多文件上传完全可行。

Step 4：表格先单独抽

如果关键信息在表格里，先把表格抽出来，再让它做语义总结：

Extract every table from this document.
For each:
- Table title
- Headers (row + column)
- All cell values as markdown
- Page number

先把数字落成干净的 markdown，再在上面跑语义总结，这样数字才不会在解析中丢失。

Step 5：用 `Pro`（Gemini 3.1 Pro），不是 `Fast`

在 Gemini app 里，对话顶部的模型选择器截至 2026 年 6 月有三个选项：Fast（Gemini 3 Flash）、Thinking、Pro（Gemini 3.1 Pro）。做文档分析就选 Pro。

顶部模型选择器 -> Pro

如果你是 Google AI Pro 或 Ultra 用户，Pro 下还有一个 Thinking level 开关（Standard / Extended）；遇到密集财报、想让模型每次回答都推理更深时，选 Extended。Pro 在长文档总结上明显比 Fast 更深。

Step 6：决策 / 风险 / 数字三件套

一个通用抽取 prompt，适合约 90% 的商业文档：

Extract from this document:

DECISIONS: What did the author decide or recommend?
RISKS: What risks are mentioned? Use original phrasing.
NUMBERS: All quantitative claims (dates, percentages, dollar amounts) with surrounding context.
GAPS: What questions does the document raise but not answer?

大多数人会漏掉 GAPS 这一行，而恰恰是它能逼出空泛总结藏起来的东西。

Step 7：核实关键数字

LLM 在长文档总结里偶尔会幻觉数字（不算常见，但凡是你要据此做决定的内容都值得核对）：

挑出最关键的 5 个数字。
在原文 PDF 里用 Ctrl+F（或 Cmd+F）逐个搜。
对不上的，让 Gemini 重抽：The figure you reported for X is wrong. Find the actual value on page Y and quote the surrounding sentence.

备选：用 NotebookLM 拿可溯源的引用

如果你真正要的是一份能信、能引用的总结，那 Gemini app 就是选错了工具。NotebookLM（notebooklm.google）专为有据可查的分析而生：它只在你给的文档范围内作答，并给出可点回原文具体段落的行内引用，每条结论都能核实。每个来源最多 50 万字，单个 notebook 能放多少来源则随套餐而定（免费版上限较低，付费版可放几百个）。现在 notebook 在 Gemini 和 NotebookLM 之间是共享的，所以项目可以在两者间来回切。需要可溯源时用 NotebookLM；想在文档周围用网页搜索和更多工具时用 Gemini app。

怎么确认问题已解决

满足下面全部几条，总结就足够拿来做决策了：

引用了具体数字（营收、利润率、日期），而不只是形容词。
覆盖了文档中段章节，而不只是开头和结尾。
你在 Step 7 抽查的数字和原文一致。
它回答的是你真正问的问题（你要的 DECISIONS / RISKS / NUMBERS），而不是一份泛泛概述。

预防建议

永远先要大纲再筛章节深挖，绝不一次性 summarize。
用结构化输出模板（表格 + bullet）避免散文式漂移。
中段会丢失的超长文档，拆成 30-40 页一段。
表格先单独抽，再做语义总结，避免数字丢失。
文档分析始终用 Pro（Gemini 3.1 Pro），不要用 Fast。
关键数字自己核实，需要引用时改用 NotebookLM。

先判断你属于哪一类

常见原因

1. Prompt 只说”总结”（最常见）

2. 超大文档中段的长上下文召回下降

3. 表格 / 图表 / 代码段在解析时丢失

4. 没指定输出结构

5. 文档本身就是低信息密度

6. 你用的是 Fast（Gemini 3 Flash），不是 Pro

最短修复路径

Step 1：先要大纲，再钻细节

Step 2：给它结构化输出模板

Step 3：超长文档拆段

Step 4：表格先单独抽

Step 5：用 Pro（Gemini 3.1 Pro），不是 Fast

Step 6：决策 / 风险 / 数字三件套

Step 7：核实关键数字

备选：用 NotebookLM 拿可溯源的引用

怎么确认问题已解决

预防建议

相关阅读

相关文章

Gemini Code Assist IDE 插件和网页版模型不同步

Gemini Connected Apps(Workspace、Maps、YouTube)不触发

Gemini Gems 保存失败或消失:修复方法

Gmail 里 Help Me Write 写出的 Gemini 草稿语气怪、内容空泛

Gemini 图像生成把正常 prompt 当违规拦下

Gemini 1M 上下文还是把长文档截断

6. 你用的是 `Fast`（Gemini 3 Flash），不是 `Pro`

Step 5：用 `Pro`（Gemini 3.1 Pro），不是 `Fast`