修复 Search Console 报错:Discovered Currently Not Indexed(快速排查)

2026 最新:Search Console 这条状态到底什么意思,遇到时先查哪三件事、如何确认修好了。如果你要的是新站长期建权威的策略,看相关页。

本页是出错时的「快速排查」。如果你要的是新站「数周到数月」的权威建设策略(站点权威 / 内链 / 抓取预算),看 Discovered not indexed:新独立站策略指南

“Discovered – currently not indexed” 是什么意思:Google 通过 sitemap 或某个外链知道这个 URL 存在,但还没派爬虫去抓。和 “Crawled – currently not indexed” 完全不一样——后者是爬过了但拒收,前者是连爬都没爬。

修这个的关键不是逼 Google 收录,是让它觉得”这站值得我分预算去爬”。

常见原因

1. 站点权威低 → 抓取预算少

抓取预算 = Googlebot 每天/周愿意花在你域名上的请求总数。新站、低外链站、低流量站这个数字非常低(可能 < 100/天),有大量 URL 时 Googlebot 优先抓”看起来重要的”,剩下的扔进 Discovered 队列。

如何判断:Search Console → 设置 → 抓取统计信息(Crawl Stats)→ 看”每天抓取的总请求次数”。健康活跃站每天几百到几千;新站常常 10-50。

2. 抓取预算被其他 URL 吃掉

如果你站上有大量 thin / 重复 / 参数 URL(分面导航、tag 页、search 结果页、UTM 链),Googlebot 优先爬它们,正经文章排队。

如何判断:Crawl Stats 里看”按文件类型”和”按响应”,如果大量爬取在 /tag//search?/products?color= 这种 URL 上,说明预算被浪费。

3. URL 被发现时的”信号弱”

Google 是从 sitemap / 内链 / 外链发现新 URL 的。光出现在 sitemap 是最弱的发现信号。如果一个 URL 只在 sitemap 里出现 1 次、站内没任何内链、也没外部信号——Google 把它扔进队列最后。

如何判断:随便挑 3 个 Discovered URL,搜你代码里 rg "/that-url/" src/ 看出现几次。如果只有 sitemap 提到,那就是信号弱。

4. 历史显示这页内容是薄 / 重复

Google 已经爬过相似的页面、判断为低质,会主动避免爬这类新 URL。常见于:

  • 模板站每个城市/产品/语言 × N 的组合页
  • 大量 AI 生成无人工编辑的列表页
  • 标签 / 分类页内容高度重叠

最短修复路径

Step 1:先确认到底是不是”质量阻塞”

挑一个 Discovered URL,在 Search Console 用 “URL 检查 → 请求编入索引” 强制爬一次。等 1-3 天:

  • 结果:进入索引 → 不是质量问题,是预算/优先级问题。走 Step 2-3
  • 结果:变成 “Crawled - currently not indexed” → 内容问题,去看 Crawled not indexed 怎么办
  • 结果:还是 Discovered → 站点级权威信号太弱,走 Step 4

Step 2:把抓取预算从垃圾 URL 里腾出来

在 robots.txt 屏蔽 thin URL:

User-agent: *
Disallow: /search
Disallow: /tag/
Disallow: /*?utm_
Disallow: /*?ref=
Disallow: /*?sort=
Disallow: /*?filter=

Sitemap: https://yourdomain.com/sitemap.xml

或对那些必须保留可访问但不该被收录的页面加 noindex

<meta name="robots" content="noindex,follow" />

follow 让 Google 仍然顺着内链发现深层页,但不收录当前页。

Step 3:增加 Discovered URL 的内链信号

# 找你想要被收录但站内只有 sitemap 引用的页面
rg -L 'href="/my-discovered-url"' src/   # -L 反向:没匹配的文件

如果 /articles/ 索引页、首页”最新”区、相关文章模块都没链它,加上:

<!-- 在文章末尾自动列 5 篇相关 -->
{related.map(p => (
  <li><a href={`/articles/${p.slug}/`}>{p.data.title}</a></li>
))}

目标:每个想收录的 URL 至少有 5 处站内内链。

Step 4:拉高整站权威信号

短期可执行:

  • 拿到 3-5 条真实外链(Reddit / HN / 朋友博客 / awesome-list)
  • 把站点提交到 IndieHackers / Product Hunt / 行业目录
  • 让最强的 5 篇文章在社交上推一次,带来真实流量

中期:

  • 持续每周发 2-3 篇好内容(≥ 800 字、有独特视角)
  • 内部建 hub / pillar 页,把相关文章聚合
  • 删/合并最薄的 20-30% 页面

Step 5:等 2-8 周看 Discovered 数量是否下降

修完后:

  • 不要每天看 Search Console(数据延迟 2-3 天)
  • 每 2 周看一次”页面”报告里 Discovered 数量趋势
  • 期望:8 周后 Discovered 占比下降 30-50%

如果 8 周后没动静 → 重新走 Step 1 的诊断

预防建议

  • 不发空页 / 占位页 / 模板页
  • 薄分页(标签、search、filter)默认 noindex
  • 新文章上线时自动加到首页 + 索引页 + 相关文章模块
  • robots.txt 默认屏蔽 UTM / tracking 参数,省抓取预算
  • 整站 sitemap 只含真正想被收录的 URL,别把 noindex 页面也塞进去

相关阅读

标签: #SEO #Google #Search Console #收录