网站内有重复的内容会影响网站排名吗

发布于：2019-05-17

重复内容对搜寻引擎优化SEO的影响很多时候被误解，对排名的影响低估了。有些人说 “重复内容” 会引致被搜寻引擎惩罚 Search Engine Penalty。最近人说：想在网页内利用 CSS 设定不同的桌面和手机排版布局，有需要将同一段内容重复，会否因重复内容而被搜寻引擎惩罚？搜寻引擎是不会简单对有重复内容的网页惩罚。所谓惩罚是指搜寻引擎公司将该页面从索引数据库中抽走。网站的内重复内容更多情况是影响搜寻排名的质量评分令，排名下降。

重复内容是互联网上常态

首先互联网的世界就是充责着很多很多的重复内容。有些针对重复内容研究说 20% – 30% 左右。例如：

当某网页引用其他网站的内容时，不免会重复对方网页上的一些内容。

又例如：当 Donald John Trump赢出成为美国总统，很多媒体都可能是直接抄袭引用官方的生平简介。

网店很多时候亦会出现重复内容，例如：相同的产品描述出现在该产品页和产品分类下的该产品页。只要URL网址不同搜寻引擎就可能看成不同的页面。这种情况下的重复对SEO排名是非常不利的，要使用rel=“canonical”来处理。

更普遍的例子是同一网站支援加密连线HTTPS和非加密连线HTTP,由于HTTP和HTTPS被搜寻引擎看作不同网址，所以亦可看作重复内容。这种情况下的重复对SEO排名亦是非常不利。

何为搜寻引擎惩罚？

搜寻引擎是不会简单对有重复的内容的网页惩罚处理，原因是普通用户难以消除重复的内容。搜寻引擎旨在惩罚那些存心操纵SEO排名的人，而不是那些无心犯错误的普通用户。所谓惩罚是指搜寻引擎公司将该页面从索引数据库 Indexing Database 中抽走，导致搜寻用户不可能从任何搜寻查询中找到该网页。再进一步 (在极端的情况下) ，当整个网站被惩罚时搜寻引擎公司会将该网站的全部网页从索引数据库中抽走，导致搜寻用户不可能从任何搜寻查询中找到该网站的任何网页。搜寻引擎发现网页或网站涉及不当的人为操控搜寻结果排名，而将网页原应有的排名为下调，亦一般被视作搜寻引擎惩罚。

不惩罚不等于搜寻引擎喜欢

搜寻引擎不喜欢重复的网页内容。理由是：搜寻引擎认为Query Deserves Diversity(QDD)，应份给予搜寻用户多样性的搜寻引擎结果页SERP结果。搜寻引擎认为：对搜寻用户提出的查询列出的相同答案 (只是网址不同，内容大致是相同) 是浪费搜寻排名结果页面。对重复的网页内容搜寻引擎认为列出一个就足够了。所以搜寻引擎只会从相同答案中抽取最好 (best similar answer) 的一个网址放入搜寻排名结果页面，其他相同答案被筛走。而这个筛走结果常常被误解为搜寻引擎惩罚。

一般只有当网站内容大量是一字一句抄袭其他网站而对用户毫无价值并且目标是操控 SEO排名时，搜寻引擎才会引入惩罚。

重复内容会损害网站质量评分

网站的内重复的内容更多情况是影响搜寻排名的质量评分。一般相信搜寻引擎亦会对搜寻排名结果就质量进行过滤，这是以前Panda搜寻算法更生做的工作，自Panda 4.2已经整合在搜寻引擎的算法内。可视作为搜寻引擎认为：Query Deserves Quality 的一种类型。所以如果将相同一段内容在同一网页上重复很多次，质量评分和用户体验都自然下降，自然不利搜寻排名。

网站内重复的内容另一种伤害是：如果是本身网站内的网页内容重复，你希望就目标关键字是用网页A排名，而搜寻引擎可能觉得重复内容网页B更适合，并使用网页B在SERP结果。这就是cannibalization关键字竞食问题。结果导致关键字搜寻排名下降。

重复的内容不利搜寻引擎索引

但先前有人说又说不一样。理由是相同段落一个版本是给桌上计算机，一个是给手机。而当搜寻引擎的索引机械人Googlebots检索你的网站时，现在身份是扮作桌上计算机。但由于手机浏览量已经超过桌上计算机，不久将来索引机械人会是扮作手机，这就是所谓Mobile First Indexing。由于索引机械人身份只有一个，所以根本不会看到相同内容。

当搜寻引擎发现两个网页大多是重覆的内容时、搜寻引擎可能会选择放弃索引被视为重复的内容的网页。例如：一个客户网站是销售洗衣器，产品分为电解水、超声波、旋涡等。基本的产品内容是相同的。搜寻引擎会选择放弃其中两个。解决方法是在中继描述 Meta Description 中加入属性资料，使内容不被视为重覆的内容。当然，在网店中洗衣器属性是否应设置为产品项目又是另一回事。

如何检查网站内重复的内容？

网站太多重复的内容不利搜寻排名。理由是：搜寻引擎会觉得网站质量不好。有些工具例如：siteliner可以帮助检查重复内容。

其他网站抄袭内容

重复的内容最大的伤害是其他网站抄袭你的内容，而导致搜寻引擎因为QDD 筛走你的原创内容而不是抄袭者的内容。了解搜寻引擎从一篮子相同内容，但不同网址中以什么条件筛选最好网页，可能有助你跳过冗长DMCA上诉程序将抄袭者击败。其中一个条件当然是网站权威性。原创性不是搜寻引擎的主要考虑，所以发布日期更先者不一定被筛选出来。理由搜寻引擎认为后发布者可能对内容有所改进而值得被筛选出来。这是Query Deserves Freshness的概念。加入结构描述schema可能有点帮助但亦非绝对。

多语言版本做成的重复内容

对于一些服务全球的网站，网站有多语言版本，例如：英文、中文正体、中文简体等等。甚至乎中文正体亦可能由于某些原因有不同的版本。例如：一个酒店集团管理的酒店网络遍布中国、台湾、香港、马来西亚，网站内容可能会针对不同地区就内容上稍作调整。比如香港和台湾版本内容基本一样，但为了更佳的用户体验，之间只是词汇稍作本地化改动。但搜寻引擎可能会认为台湾和香港是重复的内容。

一种做法是通过hreflang标记通知搜寻引擎不同语言版本的语言代码和网址。好处是：搜寻引擎不会认为不同语言版本是重复内容搜寻引擎当成功判断搜寻用户的来源地后，能将适合的语言版本列出在搜寻排名结果页面中。

在上面的例子中，页面告诉搜寻引擎还有有英文版本(hreflang=”en”)、中文正体 (hreflang=”zh-Hant”)、中文简体 (hreflang=”zh-Hans”) 和韩文 (hreflang=”ko”) 版本。

评论展示

参与评论

Rank:

ProductId:

姓名:
内容: