重复内容不会直接影响网站的质量,因为 Google 认为重复内容并不影响质量体验。Google 团队的 Mueller 曾在采访中说到:“网站上的一些重复内容没什么大不了的”。
但是,它会对 SEO 产生一些麻烦,因为当 Google 遇到搜索内容在网站中多个页面出现时,它很难判断哪个页面最具有权威性。
老船长的解释是:谷歌不会直接因为网站存在重复内容而对其进行惩罚,但重复内容可能会对网站的搜索引擎排名产生负面影响。
💡在这里会讲述重复内容的定义,所带来的影响以及三种应对方案:
一、什么是重复内容?
重复内容是指相同或者高度重复的内容出现在网站多个页面里,这种问题可能会发生在我们自己的网站内部,或与外部的其他网站有重复内容。
-
网站内部的重复页面(如多个URL指向相同内容)。 -
抄袭或复制其他网站的内容。 -
自动生成的内容或低质量的变体内。
如图,即使有轻微变动的相似内容,也算作重复内容。
二、什么不是重复内容?
同一篇文章,如果用不同的语言表达,那么不会被视为重复内容。虽然 Google 提供翻译插件,但是不同的语言服务与不同需求的用户,Google 的算法不会将此标记为重复内容。
三、重复内容如何影响 Google 搜索排名?
Google 搜索中心的 Splitt states 说道:
“有些人认为它会影响网站的质量,但事实并非如此。不过,这确实给网站所有者带来了一些挑战,因为更难跟踪重复页面的优化策略 。“
虽然重复内容不会影响 Google 判断网站的质量,但是重复内容会在爬虫进行抓取时给 Google 搜索带来三个主要问题:
- 相似内容之间存在潜在的竞争
这让 Google 很难根据搜索结果进行排名,即影响搜索排名。 - 如果相似内容过多时,抓取规模太大
可能会需要更长的时间才能抓取到这个页面。
四、针对重复内容的三种解决方案
- 标签规范化
-
规范标签指的是 HTML 或 HTTP 标头,使用 “canonical” 标明重复内容的首选 URL ,确保只有主版本被索引,如图示范:
-
注意:Google 只是将标签视为参考建议,还是有可能选择其他的 URL , 但这却是在一定程度上引导了 Google 的搜索排名。
2. 整合相似内容
如果发现我们的有许多非常相似的页面,可以尝试将这些页面合并起 来,做成超级类目页面:
-
这能够改善用户体验,用户更容易找到信息。
-
能够简化 Google Search Console 中的报告。 -
因为整合删除了一些重复的内容,所以该页面的排名要比多个页面的排名要好一些。
3. 优化内链和重定向
-
查看并更新内部链接,指向规范后的首选 URL 。
-
检查外链,可以做301永久重定向,301重定向是解决网站上重复内容问题的最简单方法,当然,直接删除会更迅速。
Wordpress会默认把标签页和低质量分类页添加Noindex标签,这是造成网站大量重复内容的根源。
如果必须要做标签页的话,建议添加Noindex标签,他们可以存在,但是不被搜索引擎抓取。
五、SEO 的注意事项
GSC (Google Search Console)可能会标记各种带有重复内容的页面:
- “Duplicate without user-selected canonical”
未设置用户指定规范链接的重复内容,即这些页面没有设置<link rel="canonical">。
-
“Alternate page with proper canonical tag”
带有正确规范标签的替代页面,即这些页面通过规范标签正确指向了主页面,这是正常状态。
- “Duplicate Google chose different canonical than user”
重复内容,Google 选择的规范版本与用户指定的不同,即我们已经设置了“canonical”标签,但是Google 认为这不是“最佳页面”(如内容不完整、加载速度慢等),而选择另一个页面作为主版本。
这些标记说明 Google 认为重复页面并不影响页面质量,仍然对这些页面进行索引和抓取,但是这些状态与 SEO 相关,会对 Google 搜索排名造成影响。

