Hreflang 没有 return tag,Google 整组忽略
Search Console 报你 hreflang 簇 "No return tags"。A 指向 B,但 B 没指回 A。Google 整组标注作废。
URL unknown、Crawled / Discovered not indexed、Sitemap 提交不收录、孤儿页、分类页 / 标签页未收、新站延迟。
Google 不收录的原因复杂,但 80% 的案例落在几个具体状态码里:URL is unknown、Crawled - currently not indexed、Discovered - currently not indexed、Duplicate。 这里每个状态都有专门一篇文章——告诉你 Search Console 的字段是什么意思、什么情况是正常等待、什么情况要修结构,以及最短修复路径。 同时区分"提交 sitemap ≠ 一定收录"、"URL Inspection ≠ 强制 Google 收录"、"索引慢不一定是技术错误"这三个最被误解的点。
Search Console 报你 hreflang 簇 "No return tags"。A 指向 B,但 B 没指回 A。Google 整组标注作废。
SPA 在用户看来一切正常,但 Search Console 显示页面被索引时 `<body>` 是空的。Googlebot 渲染的坑在哪、怎么修。
Search Console 通知说切到 mobile-first 索引。两周后曝光掉 15-40%。桌面版有的内容,移动版没有——就这么蒸发了。
老 SEO 建议说第 2 页之后加 `noindex,follow`。但 Google 长期对待 `noindex,follow` 等于 `noindex,nofollow`——深层文章因此变成孤儿。
Search Console 报上千条带 `?utm_*`、`?sort=`、`?ref=` 的重复 URL,每个参数组合都被当独立页面索引了。
你为了"省 crawl budget"在 robots.txt 里 disallow 了 `/assets/` 或 `/_next/static/`。Googlebot 再也没法正常渲染——排名和 rich result 双跌。
你的 sitemap.xml 单文件塞了 7.3 万条 URL。Search Console 报 "Couldn't fetch" 或者只处理前 5 万条。怎么正确切分 sitemap。
原本排名好的页面从 Google 消失。可能是算法更新,可能是 manual action——怎么判断?
Crawl Stats 显示 Googlebot 每天抓数百 URL,但 Performance 曝光持平——抓取 ≠ 流量。
改版后 Search Console 显示已收录页数下降——什么是真损害、什么只是正常重新评估?
新域名上线 4–8 周。sitemap 已提交、URL Inspection 显示 "Discovered"——但没任何进展。
"Indexed" 一夜掉了 50–200 个 URL。没改东西、没报错——发生了什么?
Google 不会显式罚薄页面——它只是默默降级:更少抓取、更低排名、最后掉收录。
Search Console 的 Removals 是约 6 个月的临时屏蔽,不是永久删除或"强制重收"按钮。被很多人误用。
Search Console 出现 Alternate page with proper canonical tag 一堆 URL,多数人以为被拒收录,其实是 Google 按你的 canonical 配合不收录这条变体。本文讲清楚和真正问题怎么区分。
canonical 写错会让真页进不了索引、或排名 URL 是参数版甚至别人的站,且浏览一切正常只有 Google 知道。本文给三类真实出错写法 + Search Console 验证步骤。
SERP 里的描述不是你写的——通常是太泛、缺关键词、或全站重复。
你设了 canonical,Google 却选了另一个 URL。
hreflang 警告到底什么意思、为什么会出现配对不闭环、return tag 和语言码错的最短修复路径。要看 Search Console International Targeting 报告里的错误,看相关页。
新域名提交 sitemap 一个月、Search Console 已发现 100 已编入只 3 ——这是 Google 对零历史信号的保守期,通常 8-16 周。本文讲这段时间能控制什么、不能控制什么。
Crawled - currently not indexed 多半是内容深度不够,Google 嫌的不是字数少,而是除主关键词外没独有信息。本文讲深度等于信息密度的含义和加密度方法。
Search Console 标了页面不适配移动端——viewport、tap target、内容截断。
Indexed 状态,0 曝光——通常是内容深度、意图匹配、主题权威三类问题。
Search Console 未编入索引底下有 10+ 种具体状态,每种修法完全不同。本文是 7 种高频状态的对照表,每种给出判定方法、修复步骤和通常的见效时间。
Search Console Soft 404 不是内容质量问题,而是工程问题:服务端该返回 404 却给了 200。本文从空 tag 页、空搜索结果、SPA 路由三个常见来源给出修复路径。
JSON-LD 警告——缺必填字段 / 类型不对 / 日期格式错。
Google 用 H1 / 站名替了你的 title——长度、塞词、相关性、缺 H1 都会触发。
noindex 阻止收录,robots.txt 阻止抓取——两者完全不同。这篇用一张对比表说清楚什么时候用哪个,以及最常见的混用坑。