"URL is unknown to Google" 是什么意思

Search Console 说 URL 未知——它存在,但 Google 没见过。

URL Inspection 输出 “URL is unknown to Google” 看起来吓人,但它的意思比想象的简单:这个 URL 存在于你站,但 Google 完全没遇到过它。不是拒绝、不是 noindex、不是 robots.txt 屏蔽——它根本没进过 Google 的发现管道。

这是新文章上线后最常见的状态,大多数情况下不需要慌,3-14 天会自然变成 “Crawled”。但有几种永远不会变的情况要主动修。

常见原因

1. 没有任何内链指向它

Google 发现 URL 的三个主要管道:sitemap、站内内链、外部链接。0 内链 + 不在 sitemap → 永远是 unknown。

如何判断

# 全站搜内链
rg 'href="/my-new-url/?"' src/
# 0 行 = 没内链

2. 不在 sitemap.xml 里

发布脚本忘了把新 URL 加到 sitemap,或 sitemap 是手动维护的、人忘记编辑。

如何判断

curl -s https://yourdomain.com/sitemap.xml | grep -c "/my-new-url"
# 期望 ≥ 1

3. sitemap 本身没提交过

Search Console 里 sitemap 一栏空白,或显示”无法获取”。Google 根本不知道你有 sitemap。

如何判断:Search Console → 索引 → Sitemaps,看是否有提交记录、状态是不是”成功”、“已发现 URL 数”是否对得上你站文章数。

4. 新站,Google 还没爬过整站

域名才上线几天,Google 的全站爬取还没完成。即使 URL 在 sitemap 里,可能也要等一周才被列入 Known。

5. URL 被 robots.txt 屏蔽

如果 Disallow: /article/,Google 看到 sitemap 里有这个 URL 也不会抓——并且 URL Inspection 会显示 “Excluded by robots.txt”,而不是 unknown。

如果你看到的是 unknown 不是 excluded,robots.txt 不是原因

6. URL 含特殊字符或编码错误

/文章/某某 这种 Unicode 路径如果 sitemap 里没正确 URL-encode,Google 可能爬不到。

如何判断:sitemap 里的 URL 应该是 /%E6%96%87%E7%AB%A0/... 形式,不是直接中文。

最短修复路径

Step 1:先在 Search Console 用 URL Inspection 主动告知

打开 Search Console → 顶部搜索框输入完整 URL → 等结果 → 点 “Request indexing”。

这是最快的”嘿 Google,这里有个 URL”信号。10 分钟内 URL 会从 unknown 变成 “URL is on Google” 或 “Crawled - currently not indexed”。

每日配额约 10 个 URL,留给重要的页面。

Step 2:把 URL 加进 sitemap.xml

如果你用 Astro / Next / Hugo 的自动 sitemap,新页面会自动入。手动维护的话:

<url>
  <loc>https://yourdomain.com/articles/my-new-url/</loc>
  <lastmod>2026-05-21</lastmod>
  <changefreq>monthly</changefreq>
  <priority>0.8</priority>
</url>

部署后到 Search Console → Sitemaps 重新提交(或等下一次自动 ping)。

Step 3:从首页 / 索引页 / 相关文章三处加内链

# 验证添加成功
rg 'href="/articles/my-new-url/?"' src/
# 期望 ≥ 3 处

至少:

  • 首页”最新文章”区列出
  • /articles/ 索引页列出
  • 另外 2-3 篇相关文章末尾的”相关阅读”加链接

Step 4:sitemap 没提交过就提交

Search Console → 索引 → Sitemaps → 输入 sitemap.xml → 提交。

提交后状态应该在 1-2 分钟内变”成功”,“已发现 URL 数”会显示。若是”无法获取”,先用 curl -I https://yourdomain.com/sitemap.xml 看 HTTP 状态,应该 200。

Step 5:等 3-14 天

新站 + 没外链的情况,10-14 天是常态。期间:

  • 每周回看一次 URL Inspection,状态会从 unknown → URL on Google
  • 不要每天 Request indexing 同一个 URL,没用还消耗配额

容易误判的情况

  • “unknown” 等于”拒绝”:完全不是。Google 还没见过它,无所谓拒绝。
  • 以为提交后立刻收录:从 unknown 到 indexed 通常 3-14 天,老站 1-3 天,新站可能 2-4 周。
  • 以为 sitemap 重新提交能加速:提交一次就够,重复提交是 no-op。
  • 每天 Request indexing 浪费配额:每个 URL 一次足够,剩下的留给其他页。

预防建议

  • 新文章发布脚本自动做三件事:写文件、加进 sitemap、加进首页 / 索引页内链
  • 用 build 阶段脚本验证:每篇文章至少在 3 个其他文件里被引用
  • sitemap 永远自动生成,不要手动维护
  • 重要 URL 上线后 24h 内手动 Request indexing 一次

相关阅读

标签: #SEO #Google #Search Console #收录