部署 preview URL 被搜索引擎收录 —— 排查与修复
Vercel 或 Netlify 的 preview URL 出现在 Google 索引里,甚至盖过你的正式域名,几乎都是 preview host 上漏了 noindex 头或 robots 屏蔽。
带有该标签的文章
Vercel 或 Netlify 的 preview URL 出现在 Google 索引里,甚至盖过你的正式域名,几乎都是 preview host 上漏了 noindex 头或 robots 屏蔽。
SPA 首次渲染之后才改 `document.title`,Googlebot 索引的却是原始占位符。SERP 每条都显示 "Loading..." 或站点首页标题。
Google 在 2023 年下线了 HowTo 富结果,但你的模板仍在每个页面注入 HowTo JSON-LD。Rich Results Test 通过,富结果却再也不出现 —— 这段标记现在已经是负担。
JSON-LD 报 1,247 条评论、4.8 星,页面上只有 32 条。Google 判定为内容不一致,SERP 里的星级片段直接消失。
Search Console 在几百个 Article 页面上提示 "Missing field author.name"。byline 字符串明明在那,但 JSON-LD 形状不对 —— 富结果悄悄消失。
sitemap 里每个 URL 的 `lastmod` 都是今天。Googlebot 抓取率不升反降,因为 Google 已经把这个字段当作不可靠信号忽略掉了。
`<title>` 和 `<h1>` 说的不是一件事,Google 哪个都不用 —— 把 SERP 标题改写成正文里裁剪出来的一段。
_redirects 文件三千多行,构建多花八秒,爬虫追多跳链路,没人记得哪些规则还需要。讲清楚怎么审计、合并和裁剪。
每篇文章底部的'相关文章'都是三条几乎一样的稿子。读者跳出,内链权重稀释。讲清楚怎么检测、打分、去重。
Search Console 报你 hreflang 簇 "No return tags"。A 指向 B,但 B 没指回 A。Google 整组标注作废。
SPA 在用户看来一切正常,但 Search Console 显示页面被索引时 `<body>` 是空的。Googlebot 渲染的坑在哪、怎么修。
Search Console 通知说切到 mobile-first 索引。两周后曝光掉 15-40%。桌面版有的内容,移动版没有——就这么蒸发了。
老 SEO 建议说第 2 页之后加 `noindex,follow`。但 Google 长期对待 `noindex,follow` 等于 `noindex,nofollow`——深层文章因此变成孤儿。
Search Console 报上千条带 `?utm_*`、`?sort=`、`?ref=` 的重复 URL,每个参数组合都被当独立页面索引了。
你为了"省 crawl budget"在 robots.txt 里 disallow 了 `/assets/` 或 `/_next/static/`。Googlebot 再也没法正常渲染——排名和 rich result 双跌。
你的 sitemap.xml 单文件塞了 7.3 万条 URL。Search Console 报 "Couldn't fetch" 或者只处理前 5 万条。怎么正确切分 sitemap。
用 AI 找出过时文章、定向起草刷新内容,把衰退中的页面拉回前三。
用 AI 画出站内链路图,挑出本周最值得补的 20 条桥接链接。
用 AI 在 90 分钟内规划国际化 SEO:hreflang、本地化信号、货币显示。
用 AI 找出互抢同一关键词的文章对,再决定每一对该合并还是分化。
3 小时的实战竞品分析:现在谁在排前面、空隙在哪里、独立开发者能不能打赢——不用付费 SEO 工具。
一份 4 小时的季度复盘模板,把流量漂移、话题腐化、排名下滑在变严重之前抓出来——附具体的问题清单、查询语句和决策规则。
收录页数动了又说不清原因?把 Search Console 按目录切片,15 分钟把模糊问题变成可调查的具体路径。
多数情况下站内搜索结果页不该被索引。本文讲清楚原因,以及让它们进索引反而能拿到流量的两个例外。
三个控制项做三件不同的事。选错了,要么页面漏进索引、要么浪费抓取预算、要么把页面藏得连 Google 都掉不掉。
WHOIS 隐私把你的姓名、地址、邮箱从公开查询里藏起来。流传很久的传言说 Google 会把隐藏注册人当作可疑信号。真相到底是什么。
三篇都打「how to use claude API」——Google 哪个都不排。GSC 里找 cannibalization、定一篇当 pillar、其他重定 sub-intent 或合并。
首屏 20 条可见,下面 100 条 JS 加载——Google 看不见。
页面更新后 Google 一直没重抓——服务器没返回 Last-Modified / ETag。
page/2 的 canonical 指向 page/1 还是 self?Google 现在的真实建议。
Etsy SEO 标签 Prompt——生成符合 Etsy 搜索意图的 13 个 tag、平衡宽词与长尾、覆盖礼物 / 节日买家,又不堆词。
可见的"发布 / 更新"日期与 JSON-LD 的 `datePublished` / `dateModified` 不一致——这不只是外观 bug。
Rich Results Test 过但 Search Console 报 breadcrumb 不一致,或 SERP 面包屑看起来不对——如何让 JSON-LD 与可见 UI 对齐。
你把 canonical 改到了新 URL。几周后 Google 仍排名旧 URL。canonical 是提示不是命令——真正能换 canonical 的是这些信号。
刚把内容拆成分类,新分类页就死活不收——分类页不是文章列表那么简单。
原本排名好的页面从 Google 消失。可能是算法更新,可能是 manual action——怎么判断?
Search Console "HTML Improvements" 或第三方爬虫显示几百页 meta description 相同——为什么没你想的那么严重,但仍要管。
Rich Results Test 报 FAQPage 错。Search Console 移除 FAQ rich snippet。常见原因与修法。
Search Console 显示首页天天被爬,但 /articles/* 几乎不被抓——为什么?
Crawl Stats 显示 Googlebot 每天抓数百 URL,但 Performance 曝光持平——抓取 ≠ 流量。
设了 en 与 zh 的 hreflang,但 Search Console 报缺 x-default——x-default 到底是干什么的、什么时候需要。
改版后 Search Console 显示已收录页数下降——什么是真损害、什么只是正常重新评估?
站点有几千页但只有少量被收录——为什么会这样,真正能推进的是什么?
`<meta name="robots">` 与 `X-Robots-Tag` HTTP header 冲突时行为不可预测——怎么选、怎么保持一致。
新域名上线 4–8 周。sitemap 已提交、URL Inspection 显示 "Discovered"——但没任何进展。
几周前加了 `<meta name="robots" content="noindex">` 但页面仍在 Google——最常见的几种原因。
模板默认或迁移失误把 `<meta name="robots" content="noindex">` 留在了应该公开的页面。怎么发现并回滚。
URL 在 sitemap 里,但站内没有任何页面链向它——Google 视它为不重要,要么延迟抓取,要么直接跳过。
Search Console 显示已收录,但 Performance 报告里 28 天 0 曝光——这其实意味着什么?
你点了 10 次 Request Indexing,URL 还是没收——URL Inspection 不是大家想的那个东西。
sitemap.xml 列出了带 `<meta name="robots" content="noindex">` 的 URL。Google 报警但结果不一致——为什么、怎么修。
"Indexed" 一夜掉了 50–200 个 URL。没改东西、没报错——发生了什么?
2026 最新:sitemap.xml 已提交、URL 都在里面,但 Search Console Pages 报告完全没有——常见原因。
模板重构或框架升级把全站 JSON-LD 打挂——如何发现并修。
Google 已经把所有标签归档页都收了,但文章页仍卡在 Discovered 或 Crawled — currently not indexed。
Google 不会显式罚薄页面——它只是默默降级:更少抓取、更低排名、最后掉收录。
分享 URL 到 X/Twitter 没图,即使 og:image 已设——Twitter 卡片有它自己的规则。
Search Console 的 Removals 是约 6 个月的临时屏蔽,不是永久删除或"强制重收"按钮。被很多人误用。
你给嵌入视频加了 VideoObject JSON-LD,但 SERP 没视频 rich result、视频 tab 也没列——为什么。
站级 WebSite JSON-LD 声明的 name / URL / SearchAction 与实际不符——为什么让 Google 混乱,如何对齐。
收录慢容易让人慌。新站、新分区、改版后的真实基线是什么样的。
AI 对照四大拒审桶预审:内容稀薄、About / Contact / Privacy 弱、爬虫导航坏、政策边缘内容。输出阻塞 / 风险 / 可选分流,避免白白等 30 天冷却。
可复用 AI 审计工作流——抓 Astro 内容站的坏 slug、缺翻译、死内链、draft 泄漏、配置漂移。
30 分钟月度流程:lychee / linkinator 确定性扫 URL,AI 按根因(404 / 重定向链 / 拼写 / 死外链)聚类并出按 cluster 修复方案——比等 Search Console 提示快好几周。
Category 页是被低估的 SEO 面——这套 AI 工作流抓重复 intro、内链弱、缺描述、分页坏。
用 AI 识别 pillar、cluster 话题、内容缺口。
用 AI 审计 hreflang——slug 不匹配、缺对、错代码。
10 条一批喂 AI 出 145 字符 meta,30% 抽查挡住幻觉,一个 PR 上线——之前 meta 单薄的页面被重新索引后 CTR 通常提 10-20%。
每周 30 分钟 AI 工作流分流 Search Console:索引覆盖、CWV、移动可用性、人工操作。
别用通用 80 点 SEO 清单。用 AI 在 20 分钟内为你的栈(Astro / Next / Hugo / WordPress)生成定制版。
3 趟 AI 工作流——给每页打薄内容分、浮出最差的、给一份"扩 / 合 / noindex / 删"的方案。
可复用的 Claude Code Prompt + 工作流,给你的内容站跑真实 SEO 审计。
用 Codex 抽查 sitemap 正确性、新鲜度、覆盖度。
Astro 的分类与标签页怎么搭,才能可扩展、能排名、还能避开薄页陷阱——基于 Content Collections 的实战做法。
Astro 站点 SEO 的最低必备:每一页必须有的标签是什么、为什么有、以及在 500 篇规模下还成立的写法。
在 Astro 里怎么生成、校验、提交 sitemap.xml——包括 hreflang 配对、排除规则、以及 Google 实际怎么用它。
第一个内容站做纯英文、纯中文还是双语?这篇给出 URL 结构、hreflang 写法和 sitemap 配置,按真实情况选。
内容站的分类与 URL 设计指南:栏目 schema、hub 页模板、sitemap 配置,让结构从 50 篇撑到 1000 篇都不用改。
2026 年 Firebase Hosting 上线前的 10 项检查清单——涵盖域名、SSL、缓存、跳转、sitemap、Search Console、回滚演练。
Vercel 因 Next.js 出名,但做 Astro 内容站也很好。用这套 vercel.json 配置、图片设置和流量公式判断该不该选。
动笔前先验证题材需求——用 autocomplete + SERP 抓取脚本、需求信号评分表和免费 Keyword Planner 流程。
新内容站的广度 vs 深度按阶段决策——附 hub 评分表、内容计划模板、Search Console 检查命令。
2026 年实用的选题框架:怎么选一个真有搜索量、意图清晰、又轻到能让独立站半年到一年内排上去的主题。
把分类、slug、内链都做成数据,让长尾内容站从 1 篇撑到 500 篇都不用大改架构。含内容表模板和 slug 强校验。
2026 年 Vercel 内容站上线前的 10 项检查——Astro / Next.js 设置、自定义域名、环境变量、sitemap、canonical、分析、回滚。
用 Search Console 国家信号、hreflang layout 模板、30 篇复盘门,决定是否上第二语言。
14 个 Prompt 抢回前 80 字——搜索意图直给、反常识、问题放大、数据钩、节奏破局,按读者温度选一种。
17 个可直接复制的博客大纲 Prompt——SEO 教程、对比文章、Pillar Page、Cluster 内容——大纲做好了,正文就好写。
14 个 Prompt 写出能拿点击的 meta description:搜索意图直给、列表、对比、“不用 X”角度、CTR 改写,以及 Google 偷偷改写后的诊断与修复。
12 个 SEO 审计 Prompt:metadata、内链、hreflang、薄内容、canonical、结构化数据、关键词重叠、Core Web Vitals——每条带可量化阈值和修复动作。
15 个 Prompt 写出能排名也能赢点击的 SEO 标题——≤60 字符、有意图、带年份、带括号角度、列表钩子。
Search Console 出现 Alternate page with proper canonical tag 一堆 URL,多数人以为被拒收录,其实是 Google 按你的 canonical 配合不收录这条变体。本文讲清楚和真正问题怎么区分。
改了主域名,但 canonical 还指老的——通常是配置 + 缓存。
canonical 写错会让真页进不了索引、或排名 URL 是参数版甚至别人的站,且浏览一切正常只有 Google 知道。本文给三类真实出错写法 + Search Console 验证步骤。
双语 / 多 locale 页 canonical 指错方向。常见原因:模板写死一个 canonical;translationKey 逻辑误作 canonical;默认 canonical fall back 到默认语言 URL。先做:每篇:canonical 等于自己 URL。
SERP 里的描述不是你写的——通常是太泛、缺关键词、或全站重复。
2026 最新:Search Console 这条状态到底什么意思,遇到时先查哪三件事、如何确认修好了。如果你要的是新站长期建权威的策略,看相关页。
你设了 canonical,Google 却选了另一个 URL。
Google 在搜索结果里把你的 title 换成了更短 / 不同的。常见原因:title >60 字符;title 堆词 / 品牌;不匹配搜索意图。先做:在 Search Console 找受影响页(Pages → 按曝光过滤)。
专门解读 Google Search Console 「International Targeting」报告里出现的 hreflang 错误:return tag 缺失、语言码无效,每一种该怎么处理。
hreflang 警告到底什么意思、为什么会出现配对不闭环、return tag 和语言码错的最短修复路径。要看 Search Console International Targeting 报告里的错误,看相关页。
新域名提交 sitemap 一个月、Search Console 已发现 100 已编入只 3 ——这是 Google 对零历史信号的保守期,通常 8-16 周。本文讲这段时间能控制什么、不能控制什么。
页面有 50 个内链,Search Console 链接报告显示 0——多半是 Googlebot 看不到:链接在 hydration 后才渲染、藏在折叠面板里或被 robots 拦。本文给三类原因和修复。
Crawled - currently not indexed 多半是内容深度不够,Google 嫌的不是字数少,而是除主关键词外没独有信息。本文讲深度等于信息密度的含义和加密度方法。
搜索结果显示 Google 生成的 snippet 而非你的 meta。常见原因:meta 太短(70 以下)或太长(160 以上);meta 与 title 雷同;per-query 意图 snippet 更好服务。先做:用 Search Console 看哪些 query 命中页。
Search Console 标了页面不适配移动端——viewport、tap target、内容截断。
在 Twitter / LinkedIn / Slack 分享页面,预览图不出。
分享到 LinkedIn / X / Slack 没图——meta 标签 / 尺寸 / 缓存。
Indexed 状态,0 曝光——通常是内容深度、意图匹配、主题权威三类问题。
曾收录、有排名、带流量的页突然 URL is not on Google,且不是 noindex 也没 404——这是 Google 主动 deindex 了。本文给一套区分技术回归、质量降权、合并归并的排查路径。
改了 robots.txt 但 Google 还在爬同一批 URL。常见原因:CDN 缓存 robots.txt 几小时;静态和动态两份 robots.txt 同时存在,静态优先;Google 还没重新拉。先做:确认 robots.txt 只有一个来源。
Search Console 未编入索引底下有 10+ 种具体状态,每种修法完全不同。本文是 7 种高频状态的对照表,每种给出判定方法、修复步骤和通常的见效时间。
/sitemap.xml 或 /sitemap-index.xml 返回 404——通常是集成没启用或 `site` 没配。
在 Search Console 提交了 sitemap,几周过去仍然 0 收录或只收录了几条?sitemap 提交≠收录。本文按概率排出 6 种最常见原因,给出对应的修复路径。
Search Console Soft 404 不是内容质量问题,而是工程问题:服务端该返回 404 却给了 200。本文从空 tag 页、空搜索结果、SPA 路由三个常见来源给出修复路径。
Rich Results Test 显示你的 JSON-LD 有警告 / 字段无效。
JSON-LD 警告——缺必填字段 / 类型不对 / 日期格式错。
Google 用 H1 / 站名替了你的 title——长度、塞词、相关性、缺 H1 都会触发。
Search Console 说 URL 未知——它存在,但 Google 没见过。
站点过几百篇之后,内容重复会直接把收录拖死。用脚本化流程在 Google 发现之前先把重复页揪出来。
让 AI 写的文章读起来"低质"的具体信号,以及怎么用 10 分钟编辑把它们处理掉——从 2026 年发布者的视角。
一篇讲清楚 canonical 标签——它做什么、什么时候有用、以及四个会悄悄毁掉收录的常见错误。
数量买覆盖,质量买排名。用 Search Console 数据驱动的决策流程和质量下限脚本,每月做出该投哪边的判断。
Google 爬了你的页面但决定不收录。原因几乎总是内容质量、重复、或权威——不是技术问题。真实的修复清单。
Google 把新独立站 URL 挂在 Discovered 桶里的原因,以及真正能在数周到数月里把它们移出去的策略:站点权威、内链、内容深度和现实时间表。
换域名一定会短期掉排名。用这套 301 重定向 playbook、Search Console 搬家步骤和验证命令,做对了几周恢复。
2026 年用 AI 挖内容缺口的可重复流程:把自己的 sitemap、Search Console 数据和主题 pillar 结构喂给 AI,让它告诉你"该写但还没写"的文章在哪。
发了新内容 Google 不理你,按顺序排查的清单。顺序很重要——从上往下走。
面向中英(或任意双语)站的 `hreflang` 实操指南——`<head>` 里要放什么、大多数生成器哪里出错、以及怎么验证生效。
1000+ 篇的站靠脚本,不靠意志力。用这套内容索引生成器、重复扫描和退役货架流程稳住。
一份新内容站的 30 天实操清单:收录、结构、前 20 篇文章,以及哪些事现在不必管。
Next.js 本身不破坏 SEO 但有几个坑。上线前用这套 metadata API、sitemap.ts、view-source 检查清单过一遍。
正确放出 sitemap 和 robots.txt 对 SEO 是底线。本文给 2026 年 App Router 的标准写法。
Pages 报告显示「已收录 vs 未收录」和原因。大部分听起来吓人的类别其实没事。怎么分类处理。
用内容 schema、内链审计脚本和 pillar 页模板把 pillar/cluster 关系编码进数据,让 Google 真的看懂主题权威。
独立站的 robots.txt 实操指南——能跑的两行默认、悄悄毁掉收录的几条规则、以及 robots.txt 和 noindex 的区别。
根 vs www 看似审美——两边都发同一内容就出事。用这套 DNS 表、跳转配置和 curl 验证一次锁定。
每季度跑一次的轻量内容审计:URL 清单、Search Console join、死页扫描、重复检测、坏链检查、决策记录。
2026 年用 AI 一个月做几十篇文章而不被 helpful content 算法处罚、也不丢掉网站的语气,应该用什么流程。
URL Inspection 会显示「User-declared canonical」和「Google-selected canonical」。两者不一致时,原因和处理。
用 Codex 或其它代码可读的 AI Agent 做技术 SEO 审查,附可粘贴的 prompt、dist/ 检查命令和结构化数据校验。
用真实 8 周 git 数据定可持续发布节奏:批量写作流程 + backlog 跟踪脚本 + 季度复盘。
一份判断分类(hub)页要不要被收录的实操指南——什么时候它真的值钱、什么时候在内卷、空分类页怎么改成真正的着陆页。
WordPress 时代的老问题,2026 年的清晰答案——什么时候标签归档对 SEO 有用、什么时候在拖后腿,以及具体的 noindex 写法。
不绕弯的 JSON-LD 结构化数据入门——每个内容站都该上的三种 schema,以及暂时可以忽略的那些。
`blog.yoursite.com` 还是 `yoursite.com/blog`?用 Vercel / Next / Cloudflare rewrite 配置让 SEO 集中在一个域名。
2026 年新站提交 Google 的最短四步流程:验证、sitemap、对一条 URL 申请收录、首页内链。附每一步真实需要等多久。
5 分钟提交 sitemap 的完整流程,加上 3 种「Success 假象」怎么识别和修复。
一份清晰的对照——Google 实际惩罚的是哪些和广告相关的东西,以及让「变现」变成「SEO 问题」的具体阈值。
URL Inspection 告诉你 Google 看到什么、何时爬过、为什么收没收录。附 API 调用脚本,批量复用。
一篇大白话讲清楚 sitemap.xml——它做什么、不做什么,以及大多数生成器塞进去但 Google 从来不读的四个字段。
只刷新值得刷的——Search Console 查 8-20 位文章的查询、刷新模板、re-index 流程一次给齐。
2026 年版的 `<title>` 和 `<meta name="description">` 写法——长度限制、意图匹配、Google 哪些会被改写。
Search Console 显示 'Crawled — currently not indexed'?Google 看了但选择不收。这篇按可能性顺序排查 5 个原因:内容质量、内部链接、新域名沙盒、相似度、规范化。
noindex 阻止收录,robots.txt 阻止抓取——两者完全不同。这篇用一张对比表说清楚什么时候用哪个,以及最常见的混用坑。
完整版提交指南,覆盖 Search Console、sitemap、robots.txt 配置、人工请求收录和内链策略。只想看 2026 年的最短四步流程,看相关页。
你的网站发布一周还是搜不到?逐个排查这十种最常见的原因:robots、noindex、重复内容、canonical 错误、JS 阻挡、新域名沙盒、内容质量低等。