如果你的网站已经上线 1–4 周,但在 Google 搜索 site:yourdomain.com 仍然显示 0 条结果,请按下面这个清单逐个排查。这十个原因覆盖了绝大多数案例。
1. robots.txt 屏蔽了所有爬虫
打开 https://yourdomain.com/robots.txt,确认没有:
User-agent: *
Disallow: /
这是最常见、最致命的错误。
2. 页面有 noindex meta 标签
在文章页右键 → 查看源代码,搜索:
<meta name="robots" content="noindex">
如果存在,任何页面都不会被收录。常见于:
- Astro / Next 等框架的默认开发态配置忘了改
- 主题 / 模板默认带 noindex
- WordPress 设置里的”阻止搜索引擎索引此站点”未关闭
3. canonical 指错地方
如果文章 A 的 canonical 指向文章 B,Google 会只收录 B 而不收录 A。
中英文双语站尤其要注意:两个语言版本的 canonical 应该各自指向自己,再用 hreflang 互相关联。
4. 网站完全依赖 JavaScript 渲染
如果不打开 JS 就完全看不到内容,对 Google 来说就是”空白页”。
解决方法:用 SSG(静态生成)或 SSR(服务端渲染)。Astro 默认 SSG,天然 SEO 友好。
5. sitemap 没提交
去 Search Console → Sitemaps,确认 sitemap-index.xml 已经”成功”。如果显示”已提交”但页面数为 0,请看 Sitemap 已提交但未收录;从 0 开始把 Search Console 接好可以参考 Search Console 提交 sitemap。
6. 新域名沙盒效应
如果你的域名是刚买的,Google 通常需要几周确认你不是垃圾站。耐心。沙盒期最常见的两种中间态是 已抓取 - 当前未编入索引 与 已发现 - 当前未编入索引,各自有对应的排查路径。
7. 内容重复 / 大量”瘦内容”
新站如果首页只有几句话,文章只有 100–200 字,Google 会推迟收录甚至不收录。建议:
- 首页内容超过 300 字
- 文章正文超过 800 字
- 不要复制 / 翻译别人的内容上线
8. 网站结构内链稀疏
让爬虫”走得动”很重要。每页至少链接到 3 个其他页面(栏目、相关、面包屑)。
9. 域名 DNS 或 HTTPS 有问题
- 没启 HTTPS:现在仍然会被严重压制。
- DNS 解析问题:偶尔无法访问会让爬虫”放弃”。
10. 处罚 / 安全问题
到 Search Console → 安全和手动操作。如果有警告,按提示处理后申请复审。
一份排查动作清单
- 打开
site:yourdomain.com看是否有任何收录。 - 打开任意一篇文章源代码,搜索
noindex。 - 打开 robots.txt。
- 在 Search Console 查看”网址检查”工具。
- 提交 sitemap 并等 7–14 天。
总结
不被收录不是”运气”,而是网站本身可能有具体问题。这十条按顺序排查,绝大多数情况一两天内就会找到原因。如果最终查到的是内容质量或数百上千页站点的低价值问题,请看 Search Console 低价值 URL 与 1000+ 篇文章后的内容站运营 中的修复路径。
决策前的检查清单
- 如果错误是在某次改动后立刻出现,先回滚或隔离那次改动,不要同时试一堆无关修复。
- 如果只在生产环境出现,对比环境变量、build 产物、缓存、权限和平台设置。
- 如果只影响某个账号或浏览器,优先查权限、cookie、插件、额度和地区可用性。
- 如果有两个修复方向,先选最容易验证、最容易撤销的那个。
什么时候可以先停下来
当你无法复现、日志和 UI 互相矛盾、涉及账单或账号安全、或者每个修复都需要你没有的生产权限时,就该停止盲试并升级处理。向平台支持或同事求助前,把完整错误、时间点、项目 ID、复现步骤、截图和最近改动整理好。清楚的升级说明,通常比再猜一小时更快解决问题。
诊断流程
- 先复现一次问题,并写下准确路径。复现不了时,先收集证据,不要急着改设置。
- 判断影响范围:一个用户还是所有用户,一个浏览器还是全部浏览器,只在本地还是只在线上,新内容还是旧内容也受影响。
- 优先查最近一次改动。大多数排查不是寻找神秘根因,而是找出哪次改动制造了不一致。
- 把系统切成两半测:输入 vs 输出、本地 vs 线上、账号 vs 项目、源文件 vs 生成文件、prompt vs 模型。确认哪一半还在失败。
- 先做最小且可撤销的修复。不要同时改 DNS、权限、账单、部署和代码。
- 用原复现路径和一个相邻路径验证,再记录最终是哪一步修好的。
最小复现模板
问题:
- [完整错误或异常表现]
发生位置:
- URL / 工具 / 项目:
- 账号:
- 环境:local / preview / production
- 浏览器 / 设备:
复现步骤:
1.
2.
3.
预期结果:
-
实际结果:
-
最近改动:
- 代码:
- 配置:
- DNS / 权限 / 账单:
- Prompt / 模型 / 上传文件:
证据:
- 截图:
- Console error:
- 服务端或平台日志:
这些”假修复”别做
- 只清缓存,却不确认底层文件、权限、路由或设置是否正确。
- 明明是环境变量、凭证、额度或平台配置问题,却反复重装依赖。
- 一次改好几个无关设置,最后不知道到底是哪一步起作用。
- 从另一个框架或平台复制修复方法,却不确认路由、build 输出或鉴权模型是否相同。
- 没看 status page 和近期反馈,就把平台临时故障当成自己的 bug。