重复内容(duplicate content)是什么?

重复内容(duplicate content)是什么?
重复内容是指网站内部或不同域名间大量出现的相同或类似的页面。
不是所有的重复内容的出现都是恶意的,也有可能由于程序无意间产生。
恶意重复内容是至网站制作者为了提高排名,欺骗搜索引擎,不顾用户体验,恶意为同一页面做出多个类似页面的行为。恶意重复内容也可能出现在Doorway Pages门页)的入口处。

不属于恶意重复内容(duplicate content)的有:
1.网页的其它版本,比如移动版本,论坛的wap版本等。
2.正常网页与打印版本。
3.因为论坛、博客、网上商店、SMS等程序自行产生的多id或近似页面。
4.博客Tag标签,博客Tag标签是一种很便利的网站内部组织形式,不属于恶意重复内容。

重复内容(duplicate content)的危害:
不管是否恶意,重复内容都会造成一定的问题,比如:造成搜索引擎困扰;使网站部分信息不出现在主索引而出现在补充材料内;用户体验糟糕。
恶意重复内容如果采集,更会造成原作者的不满,有可能面临纠纷。

重复内容(duplicate content)的处理办法:
1.做好UURL canonicalizationURL规范化),让同样的内容只有一条网址。该步骤可以使用Google管理员工具、301重定向、.htaccess、以及rel=”canonical”属性进行规范。
2.robots.txt中做好适当网址的过滤。
3.Internal Links内部链接)中注意同一内容只使用同一网址Anchor Text链接锚文本),不要混乱。
4.了解及优化程序与模板,减少程序及模板带来的重复内容。
5.文章编写及发布时适当注意,发布言之有物的文章,而不是空白或有相似内容的文章,避免或较少产生重复内容。
6.勿参与联合供稿。

正规SEM建站,远离重复内容(duplicate content):
对于重复内容的惩罚,不同于链接农场Link Farm)、门页等作弊方式,在大多数情况下不会被秒杀,直接K掉。但是即便不被K,你就可以安心使用了吗?显然不是这样的。
重复内容被发现恶意欺诈后,会导致搜索引擎对相关站点的降权,也有小几率从搜索引擎中消失。
在我的观点中,一直都认为看不见的比看得见的更重要,更可怕,比如看不见的网站权重、网页实时PR、信任指数等。而重复内容对于正规SEM建站来说,恰如一副慢性毒药,会在天长日久不知不觉中侵蚀你的网站,让你的网站在落于成千上万的同类网站之后不能脱颖而出,甚至渐行渐远。
所以,如果你想实现你的SEM目标的话,请远离重复内容。

作者:杨灿灿@SEM界 SEM第一版 2010-1-26
SEM-ALL,中国SEM学习运营第一品牌
本文SEM-ALL版权所有,未经批准转载必究。

SEM相关文章

yuer said,

二月 1, 2010 @ 9:32 下午

一直不明白谷歌管理员工具中重复内容的意义何在或者说它的弊端,今天看了灿灿写的,顿时明白了。真的很感谢

yuer said,

二月 1, 2010 @ 9:41 下午

什么是重复元说明的页面?

杨灿灿 said,

二月 3, 2010 @ 11:22 下午

有收获就好,共同探讨,共同进步。

杨灿灿 said,

二月 3, 2010 @ 11:30 下午

是说rel=”canonical”属性吗?这条你可以Google一下,参照下官方说明。有机会我会写,不过春节前可能要换网站空间,不怎么写文章了。
rel=”canonical”主要用于规范网站程序造成的相同或近似内容,比如同一个帖子URL中最后id不同,可以在需要收录的主页面之外,在其它相似页面head标签中添加这条属性,渐渐会删除其余的重复内容,只保留需要收录的那个页面,不过该属性百度似乎不支持。

RSS feed for comments on this post


留下评论