ChatGPT 名义上接受很多格式,但深度处理只覆盖一个子集:文本 PDF / DOCX / TXT / MD / CSV / XLSX / JSON / PPTX;图像 PNG / JPG / WEBP / GIF;代码常见后缀。这之外的(Pages、Keynote、HEIC、压缩包、可执行文件、奇怪编解码视频)要么直接拒收,要么 UI 显示上传成功但分析流水线根本不接。可靠路径不是和它较劲,是把文件转成它擅长的类型再传。
常见原因
按命中率从高到低:
1. 格式不在支持列表里
最常见的”拒收”原因。Apple 系列(.pages、.key、.numbers)、HEIC 照片、RAW 图片格式(.raw、.cr2、.nef)、3D 模型(.obj、.stl)都不在白名单。
如何判断:上传时弹”此文件类型不受支持”或”无法处理此文件” = 白名单外。看官方支持列表(Help Center)确认。
2. 名义支持但分析流水线不覆盖
ZIP / RAR / 7z 能传,但 ChatGPT 不会解压。EXE / DMG / APP 能传但不会被分析。SVG 上传成功但 vision 不一定能正确渲染。
如何判断:上传无报错但提问时它说”我无法分析此文件” / “我只能看到文件名” = 流水线不接。
3. 文件扩展名错了,字节签名不匹配
把 report.txt 改名成 report.pdf 不会让它变成 PDF。ChatGPT 部分场景按字节签名(魔数)判类型,部分按扩展名——不一致就走错路径。
如何判断:macOS / Linux 跑 file report.pdf,输出真实类型。“ASCII text” 但扩展名是 .pdf 就是这种。
4. 容器里包了不支持的编解码
.mp4 上传,但里面是 HEVC / AV1 / VP9 编码,分析流水线只支持 H.264。.docx 里嵌入旧版 OLE 对象解析失败。
如何判断:用 ffprobe video.mp4 看 codec;用别的工具能打开但 ChatGPT 不行 = 编解码问题。
5. 文件过大触发不同限流
不同类型上限不同(PDF 通常 ≤ 50MB,图像 ≤ 20MB,CSV / XLSX 各有限制)。超过上限有时报 “unsupported”,实际是”过大”。
如何判断:把同类型小文件传一份能不能上 = 大小问题;不能上 = 真不支持。
6. 后端处理器变更,昨天能用今天不行
“支持”是动态的。OpenAI 偶尔切换后端 PDF 解析器、图像处理库,导致一些边缘格式(如带嵌入字体的 PDF)昨天能用今天报错。
如何判断:同一文件历史成功过、最近一周开始失败 = 后端变更。等几天或转格式。
动手前先确认
- 确认问题是在 Projects、Custom GPT 还是普通对话里出现;三者支持的文件类型 / 上限不同。
- 复现前把当前对话复制一份,避免清掉历史影响下次诊断。
- 确认账号订阅:Free / Plus / Team / Enterprise 在单文件大小上限和支持类型上有差异。
需要收集的信息
- 文件真实类型(用
file <name>命令查看,不要信扩展名)。 - 文件大小(MB)、来自哪里(手机相册 / 截图 / 下载 / 同事发送)。
- 完整报错文案截图,或上传成功但提问无果的回复截图。
- 上传方式:拖入对话框、Project 文件区、Custom GPT Knowledge。
- 当前模型 + 订阅级别。
最短修复路径
按收益从高到低,前 2 步通常修 70% 问题。
Step 1:先识别真实类型,再决定转什么
不要信扩展名。先跑:
# macOS / Linux
file mystery_file
# 例:mystery_file: PDF document, version 1.7
# Windows PowerShell
Get-Item mystery_file | Format-List
知道真实类型后查”目标格式”对照表(下一步)。
Step 2:转成”高保真支持类型”
按内容类别对照转:
| 你有 | 转成 | 用什么工具 |
|---|---|---|
| Pages / Keynote / Numbers | Apple iWork → Export → PDF | |
| HEIC | JPG / PNG | macOS Preview / iPhone 设置改默认 / heif-convert |
| RAW 图 | JPG | Lightroom / darktable / 手机自带相册导出 |
| EPUB | PDF / TXT | Calibre ebook-convert |
| 音频 mp3 / m4a / wav | 转录文本 | Whisper / MacWhisper(本地)→ 上传 .txt |
| 视频 mp4 | 抽帧 + 转录文本 | ffmpeg 抽关键帧;Whisper 转录 |
| ZIP / RAR | 解压后上传单文件 | unzip / unrar / Finder |
| .doc(旧 Word) | .docx | Word “另存为” |
| 扫描 PDF | OCR 后的 PDF | ocrmypdf input.pdf output.pdf |
转完后用真实扩展名(不要再骗)。
Step 3:HEIC / RAW 图片特例
iPhone 默认拍照是 HEIC,多数情况 ChatGPT 不接:
iPhone → 设置 → 相机 → 格式 → 选 "Most Compatible"(兼容)→ 以后拍的都是 JPG
或者发送时通过 macOS Preview 打开 → 导出为 JPG,再上传。
Step 4:音视频必须先本地转录
ChatGPT 不会自动转录长音频。本地跑:
# 安装 whisper
pip install openai-whisper
# 转录
whisper meeting.m4a --model medium --language Chinese --output_format txt
# 输出 meeting.txt,上传这个
短音频也建议先转——结果比让 ChatGPT 听 + 总结稳。
Step 5:压缩包先解压
ChatGPT 不会解压 ZIP / RAR / 7z。本地解开,挑你真正要分析的几个文件再传:
unzip -l archive.zip # 看里面有什么
unzip archive.zip -d ./out # 解压
20-100 个文件别全传,挑核心 3-5 个。
Step 6:实在不行就贴文本
任何”奇怪格式”的最后兜底:在原 app 里打开 → 全选 → 复制内容 → 在 ChatGPT 里贴成文本。失去样式但保留信息,对纯分析任务足够。
怎么确认已经修好
- 转换后开新对话上传,问一个具体内容相关问题(不是”你看到什么”),看回答是否引用了文件实际内容。
- 让它从转换后的文件里”原文引一段”,能引出且与原始文件一致 = 转换无损。
- 让同事用相同流程转一份再传,确认转换路径稳定。
如果还是没修好
- 把文件切到最小:1 页 PDF / 1 张图 / 100 行 CSV,看最小用例能不能跑通。
- 换工具重做转换:
marker-pdf替代 Acrobat、magick替代 Preview——不同工具产物不同。 - 换模型:4o → o3 / GPT-5;vision / 抽取在不同模型上表现略有差异。
- 准备好原文件 + 转换后文件 + 报错截图,去 help.openai.com 提工单。
预防建议
- 统一上传格式:文本类 PDF / DOCX / TXT / MD;表格 CSV / XLSX;图像 PNG / JPG;代码原后缀。
- iPhone 永久关掉 HEIC:设置 → 相机 → 格式 → 兼容(Most Compatible)。
- 任何编辑过的 Office 文档上传前重新另存为,更新内部格式。
- 大压缩包先在本地解压挑文件,不要把整个项目压成 ZIP 传。
- 音视频内容一律本地 Whisper 转录后上传 .txt,比让 ChatGPT 听稳。
相关阅读
- ChatGPT 文件上传失败
- ChatGPT 生成的文件下载失败
- ChatGPT 上传的 PDF 分析不正确
- ChatGPT 项目功能
- ChatGPT 文件分析
- ChatGPT Projects 进阶工作流
标签: #ChatGPT #ChatGPT 文件 #排查 #排查 #文件类型