你做完站内分类,把 200 篇文章按 10 个分类拆开,每个分类生成一个 /category/xxx/ 页面。结果几周后这些分类页全部卡在 “Crawled — currently not indexed”,文章本身倒收录了。
原因不是技术问题,是分类页对 Google 来说只是”导航”而非”内容”。只有当分类页有独立的编辑层(导语 + 精选 + 点评)时才会被当作真正的内容页收录。
症状
- 分类页在 sitemap 里但卡 “Crawled — currently not indexed”
- 分类页只有标题加文章卡列表
- 其他部分(文章正文)正常收录
site:yourdomain.com/category/xxx/找不到,但site:yourdomain.com/articles/the-article/能找到
快速结论
在 Google 眼里,光秃秃的分类页是导航页。只有当它有列表以外的独立编辑内容时才会被收录。
常见原因
1. 分类页只是自动生成的文章卡列表
最常见。模板长这样:
<h1>{categoryName}</h1>
<ul>
{posts.map(p => <li>
<h2>{p.title}</h2>
<p>{p.description}</p>
<a href={p.url}>阅读全文</a>
</li>)}
</ul>
Google 看:除了 <h1> 一个分类名 + 一堆已经在别处收录的文章摘要——这页有什么独有的、值得收录的内容?答:没有。
2. 分类页内容与首页或其他分类雷同
如果你 10 个分类页都是同样的”标题 + 文章列表”模板,且很多文章在多个分类下(tag 重叠),分类页之间相似度 70%+,Google 标 Duplicate 或不收录。
3. 分页奇怪(如 /category/x/page/2 只放一篇)
分类页大量分页且每页内容稀疏:/category/x/ 8 篇,/category/x/page/2 只剩 2 篇,/category/x/page/3 1 篇——Google 全弃。
4. 指向分类页的内链很弱
分类页只在主导航出现一次,文章正文里没人链回去——内链信号弱。
5. 分类页 noindex 默认开(CMS 配置)
某些 CMS(WordPress 某些主题、Ghost、Hugo)默认给 archive / category 页加 noindex。你不知道。
如何判断:
curl -sL https://yourdomain.com/category/xxx/ | grep -i noindex
6. 分类太多太薄
50 个分类每个只有 1-3 篇文章——薄到 Google 看不下去。
最短修复路径
Step 1:给每个分类页写 150-300 字的编辑导语
模板加:
<h1>{categoryName}</h1>
<div class="category-intro">
<p>{categoryIntro}</p> <!-- 来自 categories.json,每个分类一段 -->
</div>
<h2>本分类必读</h2>
<ul>
{featuredPosts.map(p => <li>
<h3><a href={p.url}>{p.title}</a></h3>
<p class="curator-note">{p.curatorNote}</p> <!-- 你的编辑点评 -->
</li>)}
</ul>
<h2>全部 {categoryName} 文章 ({posts.length})</h2>
<ul>
{posts.map(p => <li><a href={p.url}>{p.title}</a></li>)}
</ul>
categoryIntro 写:
- 这个分类讲什么
- 谁会需要这些内容
- 读完能拿到什么
- 包含主关键词
例子:
"AI 编程"分类收录了我们 2026 年关于 Claude Code、Cursor、Codex 实际用法的所有文章,重点不是工具评测而是 "上下文管理、context 限制、回滚策略" 等大家 day 1 踩坑的真问题。如果你刚开始用 AI 写代码,从下面 3 篇必读开始。
150-300 字,独有信息密度。
Step 2:精选 3-5 篇必读 + 加点评
每篇必读加一段你的编辑点评:
"AI Coding Context Management"
点评:所有用 Claude Code 的人最早撞到的问题是 context 限制。这篇给出"什么时候 /clear、什么时候 /compact、什么时候新 session"的判断框架。其他评测文章都没提这个。
短点评比 stock 描述好 10 倍。
Step 3:内链信号集中到分类页
- 主导航顶部链分类
- 每篇文章面包屑:
首页 > [分类名] > 文章标题,分类名是链接 - 相关文章模块下方加:“看更多 [分类名] 文章”链接
<nav class="breadcrumb">
<a href="/">首页</a> ›
<a href={`/category/${categorySlug}/`}>{categoryName}</a> ›
<span>{articleTitle}</span>
</nav>
Step 4:分页策略
- 第 1 页 self-canonical:
<link rel="canonical" href="/category/x/" /> - 第 2+ 页 self-canonical(不要 canonical 指第 1 页,那会让深页全部不收)
- 或更激进:深分页(page 3 之后)
<meta name="robots" content="noindex,follow" /> - 或最激进:根本不分页,分类页 lazy load 所有文章
Step 5:合并 / 删除薄分类
// 找薄分类
const thinCategories = categories.filter(c => c.posts.length < 5);
console.log(thinCategories.map(c => c.slug));
少于 5 篇的分类:
- 合并到相邻分类
- 或 noindex
- 或干脆删了分类,文章保留
Step 6:URL Inspection 重交
修完后到 Search Console → URL 检查 → 输入分类页 URL → Request indexing。
每个分类页都做一次。4-8 周后回看是否进入索引。
哪些情况可能不是你操作错了
新站即使好的分类页 4-8 周才被收录是常态——Google 在等使用信号(流量、点击)。耐心是真修复。
容易误判的情况
- 加更多标签 / 更多卡片:没用,如果没有原创编辑层
- 以为分类页不收录 = 文章不会被搜到:文章本身能直接被搜,分类页是 hub,不是必经
- 以为 sitemap 加 priority 1.0 有用:Google 忽略 priority
- 以为 canonical 把分页指到第 1 页能解决:反而让深页全失收
预防建议
- 建分类时先写好导语再上线列表,不要”先发列表,文案以后补”
- 把每个分类页当 hub 文章来对待:要有独立编辑工作,不是过滤器
- 分类规划阶段:每个分类至少能覆盖 10 篇以上内容才设
- CI 加分类页字数检查:< 100 字的分类页 build fail(强制写导语)
- 每个分类页 self-canonical,分页也 self-canonical
FAQ
Q:薄分类页要 noindex 吗? A:是——在补好真实导语之前都 noindex。等内容到位再去掉。
Q:Google 会收录每个分页吗? A:不会,深分页常被跳过。第 1 页通常会收,第 2-3 页有时会,第 4 页之后大多不会。
Q:分类页能排目标关键词吗? A:能,但需要把它当 pillar 文章做。仅文章列表的分类页 99% 不会排任何 query。