网站上线后为什么 Google 搜不到?十个最常见的原因

你的网站发布一周还是搜不到?逐个排查这十种最常见的原因:robots、noindex、重复内容、canonical 错误、JS 阻挡、新域名沙盒、内容质量低等。

如果你的网站已经上线 1–4 周,但在 Google 搜索 site:yourdomain.com 仍然显示 0 条结果,请按下面这个清单逐个排查。这十个原因覆盖了绝大多数案例。

1. robots.txt 屏蔽了所有爬虫

打开 https://yourdomain.com/robots.txt,确认没有:

User-agent: *
Disallow: /

这是最常见、最致命的错误。

2. 页面有 noindex meta 标签

在文章页右键 → 查看源代码,搜索:

<meta name="robots" content="noindex">

如果存在,任何页面都不会被收录。常见于:

  • Astro / Next 等框架的默认开发态配置忘了改
  • 主题 / 模板默认带 noindex
  • WordPress 设置里的”阻止搜索引擎索引此站点”未关闭

3. canonical 指错地方

如果文章 A 的 canonical 指向文章 B,Google 会只收录 B 而不收录 A

中英文双语站尤其要注意:两个语言版本的 canonical 应该各自指向自己,再用 hreflang 互相关联。

4. 网站完全依赖 JavaScript 渲染

如果不打开 JS 就完全看不到内容,对 Google 来说就是”空白页”。

解决方法:用 SSG(静态生成)或 SSR(服务端渲染)。Astro 默认 SSG,天然 SEO 友好。

5. sitemap 没提交

去 Search Console → Sitemaps,确认 sitemap-index.xml 已经”成功”。如果显示”已提交”但页面数为 0,请看 Sitemap 已提交但未收录;从 0 开始把 Search Console 接好可以参考 Search Console 提交 sitemap

6. 新域名沙盒效应

如果你的域名是刚买的,Google 通常需要几周确认你不是垃圾站。耐心。沙盒期最常见的两种中间态是 已抓取 - 当前未编入索引已发现 - 当前未编入索引,各自有对应的排查路径。

7. 内容重复 / 大量”瘦内容”

新站如果首页只有几句话,文章只有 100–200 字,Google 会推迟收录甚至不收录。建议:

  • 首页内容超过 300 字
  • 文章正文超过 800 字
  • 不要复制 / 翻译别人的内容上线

8. 网站结构内链稀疏

让爬虫”走得动”很重要。每页至少链接到 3 个其他页面(栏目、相关、面包屑)。

9. 域名 DNS 或 HTTPS 有问题

  • 没启 HTTPS:现在仍然会被严重压制。
  • DNS 解析问题:偶尔无法访问会让爬虫”放弃”。

10. 处罚 / 安全问题

到 Search Console → 安全和手动操作。如果有警告,按提示处理后申请复审。

一份排查动作清单

  1. 打开 site:yourdomain.com 看是否有任何收录。
  2. 打开任意一篇文章源代码,搜索 noindex
  3. 打开 robots.txt。
  4. 在 Search Console 查看”网址检查”工具。
  5. 提交 sitemap 并等 7–14 天。

总结

不被收录不是”运气”,而是网站本身可能有具体问题。这十条按顺序排查,绝大多数情况一两天内就会找到原因。如果最终查到的是内容质量或数百上千页站点的低价值问题,请看 Search Console 低价值 URL1000+ 篇文章后的内容站运营 中的修复路径。

决策前的检查清单

  • 如果错误是在某次改动后立刻出现,先回滚或隔离那次改动,不要同时试一堆无关修复。
  • 如果只在生产环境出现,对比环境变量、build 产物、缓存、权限和平台设置。
  • 如果只影响某个账号或浏览器,优先查权限、cookie、插件、额度和地区可用性。
  • 如果有两个修复方向,先选最容易验证、最容易撤销的那个。

什么时候可以先停下来

当你无法复现、日志和 UI 互相矛盾、涉及账单或账号安全、或者每个修复都需要你没有的生产权限时,就该停止盲试并升级处理。向平台支持或同事求助前,把完整错误、时间点、项目 ID、复现步骤、截图和最近改动整理好。清楚的升级说明,通常比再猜一小时更快解决问题。

诊断流程

  1. 先复现一次问题,并写下准确路径。复现不了时,先收集证据,不要急着改设置。
  2. 判断影响范围:一个用户还是所有用户,一个浏览器还是全部浏览器,只在本地还是只在线上,新内容还是旧内容也受影响。
  3. 优先查最近一次改动。大多数排查不是寻找神秘根因,而是找出哪次改动制造了不一致。
  4. 把系统切成两半测:输入 vs 输出、本地 vs 线上、账号 vs 项目、源文件 vs 生成文件、prompt vs 模型。确认哪一半还在失败。
  5. 先做最小且可撤销的修复。不要同时改 DNS、权限、账单、部署和代码。
  6. 用原复现路径和一个相邻路径验证,再记录最终是哪一步修好的。

最小复现模板

问题:
- [完整错误或异常表现]

发生位置:
- URL / 工具 / 项目:
- 账号:
- 环境:local / preview / production
- 浏览器 / 设备:

复现步骤:
1.
2.
3.

预期结果:
- 

实际结果:
- 

最近改动:
- 代码:
- 配置:
- DNS / 权限 / 账单:
- Prompt / 模型 / 上传文件:

证据:
- 截图:
- Console error:
- 服务端或平台日志:

这些”假修复”别做

  • 只清缓存,却不确认底层文件、权限、路由或设置是否正确。
  • 明明是环境变量、凭证、额度或平台配置问题,却反复重装依赖。
  • 一次改好几个无关设置,最后不知道到底是哪一步起作用。
  • 从另一个框架或平台复制修复方法,却不确认路由、build 输出或鉴权模型是否相同。
  • 没看 status page 和近期反馈,就把平台临时故障当成自己的 bug。

相关阅读

标签: #SEO #Google #收录 #排查