如果您网站内容与其他网站有重复,您得小心。内容重复严重影响您关键词在搜索引擎中的排名。
造成内容重复(Duplicate Content)有三种情况,
- 自己重复自己
- 自己重复别人
- 别人重复自己
对于第一种,自己重复自己又分多种情况,譬如多域名指向同空间同网页等等,这类被定义成作弊,不管有意无意,当严令禁止。
自己重复别人,说白了就是引用或抄袭他人网站内容。与第三种别人重复自己正好相反。
对搜索引擎而言,重复的内容是负担。现在网络中有约20%网页内容部分或完全重复。这造成了搜索引擎检索数据库无效增大而不提高搜索用户的任何体验。
Google搜索引擎对此尤为敏感,表现为大量的补充材料。
内容重复的关键是谁复制谁。对于任何复制”副本”,其搜索引擎关键词排名百害无益。然而,对于被复制的”原本”确是另一个极端,百利无害。任何被搜索引擎辨认出”原本内容”的网页,其关键词排序盘踞高位。
“原本”与”副本”的差异在于收录时间的早晚。两者(甚至多者)的相似程度取决于多种技术分析,譬如随机抽取特征词分析、随机定位句子分析。
我们举一实例来说明问题。
启洋科技曾写过一篇名为”网站改版十个理由九个错”,因为是原创,启洋排序第一,而引用和抄袭网站之网页都在后,而且被贴上”补充材料”之烙记。
有此,我们得出结论:杜绝任何形式的自我复制(镜像),引用他人内容时慎之又慎,引用越多,网站越糟。
开始您原创内容吧,如果内容质量足够好。别人会引用,那么您站点在不知不觉中增加”印象分”,您的关键词排名会有质的突破。
以Google为代表的搜索引擎对重复内容的处理对内容原创和做新闻的网站是莫大的福音!对信手拈来的随意抄袭网站可谓沉重打击。抄袭越多网站价值越小。抄袭者长时间抄袭来的大量网页被一一标上”补充材料”,怎么办?当网站中”重复网页”数量达到一定比例(譬如80%),网站将面临随时被封杀。
搜索引擎如此认为,也是这么做的。这不是很好地符合了我们人的是非辨别标准吗?