Discovered Not Indexed:新独立站的多周策略指南

Google 把新独立站 URL 挂在 Discovered 桶里的原因,以及真正能在数周到数月里把它们移出去的策略:站点权威、内链、内容深度和现实时间表。

在 Search Console 看到「Discovered — currently not indexed」,本能反应是「肯定哪里坏了」。其实没坏。这个状态字面意思就是:Google 通过 sitemap 或链接知道了 URL 的存在,但还没去爬。下面讲为什么、以及真正能让 URL 走出这个桶的做法。(只想要遇到这条错时的快速排查步骤?看 快速修复 Search Console 报错。)

问题背景

Search Console 有两个「未收录」桶绝对不能搞混。「Crawled — not indexed」= Google 读过了但拒收。「Discovered — not indexed」= Google 还没读。前者是质量判决,后者是优先级决定,由 crawl budget 和你站点的重要程度驱动。修复方式完全不同。

判断标准

  • sitemap 里超过一周的 URL,Search Console 显示「Discovered — currently not indexed」。
  • 这些 URL 真实有效,和其他被收录的 URL 在同一个站。
  • 受影响的页面通常更新或层级更深(离首页点击数更多)。
  • 最近批量发了 50+ 文章,只有少数被收录。

快速结论

这不是技术问题,别浪费时间改 robots/sitemap/canonical。把它当 crawl budget + 权威信号来处理。给受影响 URL 加内链,砍掉吃 crawl budget 的薄 / 重复页,接受新站长尾可能要 4-12 周才能被爬完。

实操步骤

  1. 先确认 URL 确实在这个桶里。打开 Pages 报告,点这一行,复制 3 个样本 URL。逐个 inspect,实时测试应该全部通过。
  2. 查内链。在代码库或用爬虫,数指向每个受影响 URL 的内链。少于 2-3 条是 Google 收到的「这页不重要」的信号。
  3. 审全站的薄 / 低价值 URL。如果你的站会大量生成几乎空白的页面(分页归档、只有 1-2 篇文章的标签页、近重复模板),它们在吃 crawl budget——本该流向真内容的份额被它们占了。删或 noindex。
  4. 提升可发现性:从首页或高流量文章内链到受影响 URL。让 Google 爬到深层 URL 最有效的方式,就是让它经常访问的 URL 指过去。
  5. 挑 5-10 个最重要的受影响 URL,用 URL Inspection -> Request indexing。这能为单个 URL 插队。不要对几百个 URL 都点。
  6. 等 30-60 天。新站和大批量新内容真的需要时间消化。60 天后桶还没明显缩小,问题在站点权威——重点放外链和内容深度。

容易踩的坑

  • 和「Crawled — not indexed」搞混。原因和处理完全不同。先把桶的标签看清楚。
  • 天天重新提交 sitemap。sitemap 提交不影响爬取优先级——内链和外链才影响。
  • 对几十个 URL 狂点 Request indexing。Google 会限流,长尾还是不动。
  • 加结构化数据指望能改优先级。结构化数据影响展示样式,不影响爬取调度。
  • 才上线 30 天就慌。新域名大部分内容在「Discovered」桶里停 1-2 个月是常态,Google 在判断这个站值不值得完整爬。

这篇适合谁

刚发了一批文章、看到只有部分被收录的独立内容站;改版或搬家后产生新 URL 的博客。

这篇不适合谁

如果是上周还 200、今天 404 的 URL 显示在这里,桶在误导你——其实是重定向 / 404 问题。用 URL Inspection 实时测试确认。

FAQ

  • 一个「Discovered」状态的 URL 多久会被爬?: 老站:几天到一周。新站:2-8 周。新站的长尾:有时 3 个月以上。内链和外链能加速。
  • 「Discovered — not indexed」比「Crawled — not indexed」更糟吗?: 不同问题。Discovered = 优先级问题。Crawled = 质量问题。Discovered 一般更容易修,因为内容可能本身没问题——只是要让 Google 觉得值得爬。
  • 加大发文频率有用吗?: 有时反而坏事。如果产量翻 10 倍但质量没翻 10 倍,crawl budget 被摊薄。稳定节奏 + 高质量 + 内链 比数量管用。
  • IndexNow 之类的工具能强制 Google 爬吗?: IndexNow 给 Bing 和 Yandex 用,Google 不接。对 Google 来说,有效杠杆是 sitemap + 内链 + 对少数关键 URL 用 URL Inspection 申请。

相关阅读

标签: #独立开发 #SEO #Google #Search Console #收录 #排查