在本节中,我将引用第 IV 节中列出的解决方案 – 例如,对 301 重定向的引用将引用 (IV-2)。 (1)“www”与非www 对于全站重复内容,这可能是最大的罪魁祸首。无论您的内部路径是否错误,或者将链接和社交提及吸引到错误的 URL,您都会将 URL 的“www”版本和非 www(根域)版本编入索引: www 与非 www 示例 大多数情况下,301 重定向 (IV-2) 是您的最佳选择。
这是一个常见问题
对于此类情况,Google 非常乐意 传真列表 遵守重定向。 您可能还想在 Google 网站管理员工具中设置您的首选地址。在“网站配置”>“设置”下,您应该会看到一个名为“首选域”的部分: GWT 首选域名屏幕 GWT 有一个怪癖,要设置首选域,您可能必须为网站的“www”和非 www 版本创建 GWT 配置文件。
虽然这很烦人
但不会造成任何伤害。如果您遇到 虽然许多设备都有门来保护以太网端口 严重的规范化问题,我建议您这样做。如果没有,那么您可以放心,让 Google 确定首选域。 (2)临时服务器 虽然这个问题比 (1) 少见得多,但这个问题通常也是由子域名引起的。在典型的场景中,您正在为重新发布设计一个新网站,您的开发团队为新网站设置了一个子域名,他们不小心将其对爬虫开放。
URL,如下所示
暂存 URL 示例 最好的办法是防止 克罗地亚商业指南 此问题发生,方法是使用 Robots.txt (IV-3) 阻止暂存网站。但是,如果您发现暂存网站已被编入索引,则可能需要对这些页面进行 301 重定向 (IV-2) 或 Meta Noindex (IV-4)。
尾部斜杠
这是人们经常会遇到的一个问题,尽管它不再像以前那样是一个 SEO 问题。从技术上讲,在最初的 HTTP 协议中,带有尾部斜杠的 URL 和不带有尾部斜杠的 URL 是不同的 URL。以下是一个简单的示例: 尾部斜杠示例 如今,几乎所有浏览器都会在后台自动添加尾部斜杠,并以相同的方式解析两个版本。