搜索引擎对原创文章的识别及应对策略
站长们时常会问起搜索引擎对原创文章的识别能力问题,也有很多站长抱怨,我辛辛苦苦写的原创文章,被别人一转载,搜索引擎上就找不到我自己的文章了,转载的反而成了原创,而原创的反而成了盗版。
搜索引擎是否具有识别原创文章的能力?如果有的话,又是基于什么原理呢?
原创文章被搜索引擎的识别目前主要还是基于文章被搜苏引擎的索引时间(收录时间)以及文章的链接两个因素。越早被搜索引擎收录的越有可能被搜索引擎认为是原创,这个看起来合理,事实上也不一定,因为最早发表在网上的也不一定是发表者原创,只能说是最早发表。因此本文讲的原创都只能是最早发表的含义,而不考虑最早发表的本来就不是原创的情况。
另外,如果文章中包含了出处,转载者同时也保留了出处,那么这些文章的链接将会呈现出星形状态,所有转载的文章都将出处指向了真正的出处,搜索引擎就可以根据这个链接判断文章的出处。
上面的分析也只能是理论上的分析,搜索引擎的排名规则也并不是只有是否为原创一条规则,它还会考虑网站影响力,相关性等等因素,然而如果说搜索引擎将非原创的文章呈现在结果里,而将原创文章不显示出来,对原创者来说就显得极为不公平。
泥人经过试验观察,发现google的原创文章的识别能力要远强于百度。以两个例子来说明。
泥人几乎是同时在自己的网站泥胚文章写作(www.nipei.com)和admin5发表了一篇文章《关键字云雾在SEO中的应用》,两篇文章都被百度和google收录,后来两篇文章被一些网站引用,有的网站保留了文章的原始出处,而有的网站在转载时去掉了链接,一周内在百度和google里搜索“关键字云雾”,都找不到在本站的原始出处的文章,再过了几天,google将本站的原始出处的文章排到了首位,而在百度里,仍然找不到本站的文章。这个例子说明,时间基本相同的情况下,google仍然能根据文章的链接判定文章的原始出处,而百度做得就差了些。
另一个例子是泥人的另外一篇文章被别人盗用在百度空间里,盗用者没有注明出处,盗用时间大概是原创文章发表后10天,结果可想而知,差不多两周后,原创文章从百度的搜索结果里消失了,取而代之的是那篇盗用文章。然而google依然将本站的原始文章排在首位。这个例子说明,google能根据发表日期来判定原创文章,而百度却依然不能。
针对于以上观察结果,泥人认为站长可以采取以下对策。
1、在原创文章末尾注明转载需要保留的文字、链接以及声明,一方面是提醒转载者要尊重他人的知识产权,转载时要保留出处,另外一方面,也是为转载者提供方便,因为,有时转载者不是不想加出处,只是怕麻烦。
2、如果自己的事小站,PR不够高,建议将自己的原创文章发表在自己的小站上,过一周左右,再去向一些大站投稿,以保持文章被搜索引擎收录的一个时间差,便于搜索引擎判定文章原始出处。
3、如果你的原创文章被盗用的文章给PK下去了,不妨在盗用者文章的评论里加上文章的原始出处,提醒转载者,也方便搜索引擎来判断原始出处。
4、有可能的话,还是在文章的正文中加入一个自己网站的链接。
最后,对于国内知识产权保护的现状,文章被盗用的现象还很严重,如果说文章被盗用还没有造成严重影响的话,建议站长还是保持一颗平常心,以平常心待之,毕竟比人愿意转载你的文章,说明是对你的文章的认可。不抛弃,不放弃,坚持做傻子。