ChatGPT 文件分析感觉太浅：原因 + 对症修复

要分析，得到的全是泛泛的 bullet——修法在 prompt，不在换模型。

发布于: 2026/05/17 更新于: 2026/06/15 作者: AI Productivity Guide Team 🌐 查看英文版本

最快修法：别让 ChatGPT “分析”或”总结”这个文件。给它一个具体的抽取任务并强制引证：List the 5 largest cost items. For each: exact figure, page number, and a verbatim one-line quote. If you can't quote it, say so. 光这一条改动，通常一轮就能解决大部分”太浅”的抱怨，根本不用去碰模型选择器。

“分析太浅”几乎都不是模型能力的问题。文件里的细节确实在 context 里（或者部分在），但 ChatGPT 默认走”安全且全面的概括”路径，因为这条路对绝大多数”帮我看看这个文件”的请求是最讨好的。要拿到 evidence、数字、原文引用，必须显式要求结构、约束输出格式、强制引证。

先建立一个认知：超过几页的文件，ChatGPT 并不会把整份读进去。它把文档切块（chunk）、做向量嵌入，然后每个问题只检索最相关的 top-k 个 chunk（也就是 RAG，检索增强生成）。上传成功不等于整份文件都摆在模型面前。这正是下面原因 2 的根源，也是为什么”读完这份 200 页报告，把所有重点告诉我”稳定地给你浅答案。

常见原因

按命中率从高到低。

1. Prompt 用了”分析 / 总结 / 看一下”这种模糊动词

最常见。“帮我分析一下这份报告”对模型来说等于”给我一份概括”——它没收到深度信号，就回 5-7 条泛 bullet。换成 list every expense item > $1M with page numbers，结果完全不一样。

如何判断：把你的 prompt 读一遍——能不能套到别的文件上？能就是太模糊。

2. 检索只拉了顶层 chunk，深层细节没进 context

大文件（PDF 超过约 30 页、文档超过约 5MB）每次只拉 top-k 个 chunk。Top-k 默认偏向标题、摘要、目录这种”高密度”段落，正文细节常常落选，根本没进模型的 context。

如何判断：让它 quote page 47, paragraph 2 verbatim。引不出 / 引的是别的页 = 检索没到那里。

3. 输出格式没约束，模型默认走”安全 bullet 列表”

不指定输出结构，模型就用最不容易被反驳的格式：5-7 条 bullet，每条 1-2 句。给一个表格或章节模板，它就被迫填具体内容。

如何判断：你最近两次问同样问题，输出结构是不是都是泛 bullet？是就是没约束格式。

4. 否定 prompt（“不要泛泛""不要套话”）几乎无效

模型对”要 Y”的遵守度远高于”不要 X”。“不要写得太浅”远不如”每条论断必须带一句原文引用 + 页码”。

如何判断：数一数你的 prompt 里”不要 / 避免 / 不允许”和”要 / 必须 / 输出”哪类更多？否定多就重写成肯定。

5. 模型在不确定时默认走”短而安全”

文档抽取质量差（扫描件 OCR、表格被压扁、纯图片页）让模型对很多内容没把握，它就用模糊语言绕过去。看起来是浅，其实是”我没读到”。

如何判断：回答里大量”可能 / 一般 / 通常 / 在大多数情况下”——它是在用通识填空，不是在读你的文件。

6. 选 reasoning 模型也救不了模糊 prompt

GPT-5.5 Thinking 和 GPT-5.5 Pro 综合得更好，但模糊 prompt 加更多推理，只是给你一份”更漂亮的浅内容”。深度来自 prompt 结构，不是模型档位。

如何判断：同一个 prompt 用 GPT-5.5 Instant 和 GPT-5.5 Thinking 跑，输出结构差不多——瓶颈是 prompt，不是模型。

动手前先确认

确认问题出现在 Project、Custom GPT 还是普通对话里——三者检索行为不同。（普通对话的附件和 Project/GPT 的 Knowledge 文件都是被检索的，不是整份载入。）
复现前把当前对话复制一份，避免历史污染下次诊断。
确认你的订阅。截至 2026 年 6 月，ChatGPT Plus（$20/月）大约提供 320 页的应用内 context；完整的 1M token context 只在 $200/月的 Pro 档。Free、Go、Plus、Team、Enterprise 在上下文窗口和可用模型上都有差异。

需要收集的信息

文件类型、大小（MB）、页数 / 行数；是否扫描件 PDF；是否含非 ASCII 文本、公式、表格。
上传方式：拖入对话框、加为 Project 文件、还是作为 Custom GPT Knowledge。
完整 prompt 文案 + ChatGPT 回复；把你认为”浅”的那两三句标出来。
选择器里的当前模型（GPT-5.5 Instant / GPT-5.5 Thinking / GPT-5.5 Pro）。
一个具体例子：第 X 页有数据 Y，但回答没提。

你属于哪一类

你看到的症状	最可能的原因	跳到
泛 bullet，没数字、没页码	模糊动词（原因 1）	Step 1
引得出前言/目录，正文数据漏掉	检索没拉到（原因 2）	Step 5
输出永远一个样	没给格式（原因 3）	Step 3
满篇”可能 / 通常”，数字还错	抽取质量差（原因 5）	Step 6
换模型毫无变化	是 prompt 不是模型（原因 6）	Step 1

最短修复路径

按收益从高到低，前 2 步通常修掉约 70% 的问题。

Step 1：把动词换成”列出 / 抽取 / 对比 / 引用”

把”分析这份报告”改成具体动作：

List the 5 largest cost items in this Q3 report. For each, give:
- The exact figure (with currency)
- The page number where it appears
- A one-line quote from the surrounding paragraph

Do not generalize. If you cannot find 5, return fewer.

差异巨大。“List / extract”触发模型走检索 + 引证路径；“analyze”触发的是概括 + 抹平路径。

Step 2：要求每条 evidence 配引用 + 页码

通用模板：

For every claim you make:
- Quote the supporting sentence verbatim, in quotes.
- Cite the page number or section heading.
- If you cannot quote it, say "no direct support in document"
  instead of inferring.

这一条强制模型从”概括模式”切到”引证模式”。它会变慢，但浅度问题立刻消失。

Step 3：给输出结构模板

不要让它自由发挥。给一个表格或 Markdown 骨架：

Output as a table with these columns:
Risk | Likelihood (low/med/high) | Quote from document | Page

Then below the table, list:
- 2 assumptions the document makes that you would challenge
- 1 missing analysis the document should have done

空着的单元格逼模型填具体内容，浅就藏不住了。

Step 4：追问”你跳过了什么”

第一轮回答出来后接一句：

What did you skip? List every section, table, and figure you did not
look at, and why. If you skipped anything because it didn't match a
keyword, list those keywords.

模型通常会承认遗漏，然后你就能让它专门去补那几块。

Step 5：分章节问 + 自己聚合

大文档不要一次问全文。先：

List every section heading in this document with its page range.

然后逐章追问，最后你自己写汇总。“一次拿到完整深度分析”是反模式——每个轮次能给的深度有上限，因为每轮只检索少量 chunk。把一份 200 页的 PDF 拆成几个小文件分别上传，也能提高每份文件真正进到 context 的比例。

Step 6：抽取层差就先转 Markdown 再上传

如果是扫描 PDF / 复杂排版，先在本地转 Markdown 再上传：

pip install marker-pdf
marker_single report.pdf --output_dir ./out --max_pages 200

把转出来的 Markdown 上传。因为文本现在干净、结构化了，检索质量会飞跃，深度问题往往跟着一起消失。（表格同理：把 xlsx 导出成 csv。）

怎么确认已经修好

开新对话上传同一个文件，跑改写后的 prompt——确认输出稳定带有具体引用 + 页码。
把回答里的某条 quote 在原 PDF 里用 Ctrl+F 找。找不到就是模型编的（这算检索/抽取失败，不是修好）。
让同事跑一遍同一 prompt——确认深度来自 prompt 结构，不是你的会话状态。

如果还是没修好

把文件切到最小：只保留有数据的那几页，再问同一题。如果深度回来了，那就是检索问题。
换格式排除抽取层的锅：PDF 转 Markdown、xlsx 转 csv。
换模型：GPT-5.5 Instant 换 GPT-5.5 Thinking。reasoning 模型对结构化 prompt 综合更深，但前提是 Step 1-3 已经到位。
准备好原文件、确切的 prompt、模型回复，去 help.openai.com 提工单。

常见问题

文件明明上传成功了，为什么 ChatGPT 还是给我一份很浅的概括？ 上传成功不等于模型读了整份。超过几页它每个问题只检索最相关的几个 chunk，文档大部分根本没进 context。问窄的、强制引证的问题，别问”把所有内容总结一下”。

换成 GPT-5.5 Thinking 或 Pro 能解决分析太浅吗？ 单独换没用。prompt 还是模糊的话，reasoning 模型只是给你一份写得更好的浅答案。先把 prompt 修好（Step 1-3），再用 reasoning 模型加真正的深度。

ChatGPT 到底能深度分析多大的文件？ 没有单一的页数门槛，因为深度受限于每轮的检索量，不只是总大小。截至 2026 年 6 月，务实做法是把超大 PDF 拆开、分章节问。Plus 大约给 320 页的应用内 context；完整 1M token 窗口只在 Pro 档。

为什么它引用一个不存在的页码，或者干脆引不出？ 要么检索压根没到那一页（文件太大，top-k 漏了——见 Step 5），要么文本抽取得很烂（扫描件或纯图片 PDF——见 Step 6）。让它原文引用某一指定页来验证；引不出就说明内容根本不在 context 里。

在 Project 里和在 Custom GPT 里有区别吗？ 检索机制一样（切块、嵌入、检索），但文件上限不同。截至 2026 年 6 月，Free 在一个 Project 里大约能放 5 个文件、Plus 约 25 个；Custom GPT 最多接受 20 个 Knowledge 文件。文件越多，越多内容在抢同一批被检索的 chunk，所以文件少而干净通常分析得更深。

预防建议

自己整一个”深度分析模板”：列出 / 抽取 / 对比 / 引用 / 反驳——固定 5 段。
每个 prompt 末尾固定加一行 “Quote with page numbers; no inference without a quote.”。
否定指令一律重写成肯定指令。
反复分析的同类文件做成 Custom GPT，把深度要求写进它的 Instructions。
拿到浅答案不要直接重问，先追问”你跳过了什么”。