新分类页不被收录:4 个原因 + 对症修复

刚把内容拆成分类,新分类页就死活不收——分类页不是文章列表那么简单。

你做完站内分类,把 200 篇文章按 10 个分类拆开,每个分类生成一个 /category/xxx/ 页面。结果几周后这些分类页全部卡在 “Crawled — currently not indexed”,文章本身倒收录了。

原因不是技术问题,是分类页对 Google 来说只是”导航”而非”内容”。只有当分类页有独立的编辑层(导语 + 精选 + 点评)时才会被当作真正的内容页收录。

症状

  • 分类页在 sitemap 里但卡 “Crawled — currently not indexed”
  • 分类页只有标题加文章卡列表
  • 其他部分(文章正文)正常收录
  • site:yourdomain.com/category/xxx/ 找不到,但 site:yourdomain.com/articles/the-article/ 能找到

快速结论

在 Google 眼里,光秃秃的分类页是导航页。只有当它有列表以外的独立编辑内容时才会被收录。

常见原因

1. 分类页只是自动生成的文章卡列表

最常见。模板长这样:

<h1>{categoryName}</h1>
<ul>
  {posts.map(p => <li>
    <h2>{p.title}</h2>
    <p>{p.description}</p>
    <a href={p.url}>阅读全文</a>
  </li>)}
</ul>

Google 看:除了 <h1> 一个分类名 + 一堆已经在别处收录的文章摘要——这页有什么独有的、值得收录的内容?答:没有。

2. 分类页内容与首页或其他分类雷同

如果你 10 个分类页都是同样的”标题 + 文章列表”模板,且很多文章在多个分类下(tag 重叠),分类页之间相似度 70%+,Google 标 Duplicate 或不收录。

3. 分页奇怪(如 /category/x/page/2 只放一篇)

分类页大量分页且每页内容稀疏:/category/x/ 8 篇,/category/x/page/2 只剩 2 篇,/category/x/page/3 1 篇——Google 全弃。

4. 指向分类页的内链很弱

分类页只在主导航出现一次,文章正文里没人链回去——内链信号弱。

5. 分类页 noindex 默认开(CMS 配置)

某些 CMS(WordPress 某些主题、Ghost、Hugo)默认给 archive / category 页加 noindex。你不知道。

如何判断

curl -sL https://yourdomain.com/category/xxx/ | grep -i noindex

6. 分类太多太薄

50 个分类每个只有 1-3 篇文章——薄到 Google 看不下去。

最短修复路径

Step 1:给每个分类页写 150-300 字的编辑导语

模板加:

<h1>{categoryName}</h1>

<div class="category-intro">
  <p>{categoryIntro}</p>  <!-- 来自 categories.json,每个分类一段 -->
</div>

<h2>本分类必读</h2>
<ul>
  {featuredPosts.map(p => <li>
    <h3><a href={p.url}>{p.title}</a></h3>
    <p class="curator-note">{p.curatorNote}</p>  <!-- 你的编辑点评 -->
  </li>)}
</ul>

<h2>全部 {categoryName} 文章 ({posts.length})</h2>
<ul>
  {posts.map(p => <li><a href={p.url}>{p.title}</a></li>)}
</ul>

categoryIntro 写:

  • 这个分类讲什么
  • 谁会需要这些内容
  • 读完能拿到什么
  • 包含主关键词

例子:

"AI 编程"分类收录了我们 2026 年关于 Claude Code、Cursor、Codex 实际用法的所有文章,重点不是工具评测而是 "上下文管理、context 限制、回滚策略" 等大家 day 1 踩坑的真问题。如果你刚开始用 AI 写代码,从下面 3 篇必读开始。

150-300 字,独有信息密度。

Step 2:精选 3-5 篇必读 + 加点评

每篇必读加一段你的编辑点评:

"AI Coding Context Management"
点评:所有用 Claude Code 的人最早撞到的问题是 context 限制。这篇给出"什么时候 /clear、什么时候 /compact、什么时候新 session"的判断框架。其他评测文章都没提这个。

短点评比 stock 描述好 10 倍。

Step 3:内链信号集中到分类页

  • 主导航顶部链分类
  • 每篇文章面包屑:首页 > [分类名] > 文章标题,分类名是链接
  • 相关文章模块下方加:“看更多 [分类名] 文章”链接
<nav class="breadcrumb">
  <a href="/">首页</a> ›
  <a href={`/category/${categorySlug}/`}>{categoryName}</a> ›
  <span>{articleTitle}</span>
</nav>

Step 4:分页策略

  • 第 1 页 self-canonical<link rel="canonical" href="/category/x/" />
  • 第 2+ 页 self-canonical(不要 canonical 指第 1 页,那会让深页全部不收)
  • 或更激进:深分页(page 3 之后)<meta name="robots" content="noindex,follow" />
  • 或最激进:根本不分页,分类页 lazy load 所有文章

Step 5:合并 / 删除薄分类

// 找薄分类
const thinCategories = categories.filter(c => c.posts.length < 5);
console.log(thinCategories.map(c => c.slug));

少于 5 篇的分类:

  • 合并到相邻分类
  • 或 noindex
  • 或干脆删了分类,文章保留

Step 6:URL Inspection 重交

修完后到 Search Console → URL 检查 → 输入分类页 URL → Request indexing。

每个分类页都做一次。4-8 周后回看是否进入索引。

哪些情况可能不是你操作错了

新站即使好的分类页 4-8 周才被收录是常态——Google 在等使用信号(流量、点击)。耐心是真修复。

容易误判的情况

  • 加更多标签 / 更多卡片:没用,如果没有原创编辑层
  • 以为分类页不收录 = 文章不会被搜到:文章本身能直接被搜,分类页是 hub,不是必经
  • 以为 sitemap 加 priority 1.0 有用:Google 忽略 priority
  • 以为 canonical 把分页指到第 1 页能解决:反而让深页全失收

预防建议

  • 建分类时先写好导语再上线列表,不要”先发列表,文案以后补”
  • 把每个分类页当 hub 文章来对待:要有独立编辑工作,不是过滤器
  • 分类规划阶段:每个分类至少能覆盖 10 篇以上内容才设
  • CI 加分类页字数检查:< 100 字的分类页 build fail(强制写导语)
  • 每个分类页 self-canonical,分页也 self-canonical

FAQ

Q:薄分类页要 noindex 吗? A:是——在补好真实导语之前都 noindex。等内容到位再去掉。

Q:Google 会收录每个分页吗? A:不会,深分页常被跳过。第 1 页通常会收,第 2-3 页有时会,第 4 页之后大多不会。

Q:分类页能排目标关键词吗? A:能,但需要把它当 pillar 文章做。仅文章列表的分类页 99% 不会排任何 query。

相关阅读

标签: #SEO #Google #Search Console #收录 #排查 #分类页