重復收錄對網站seo優化的弊端想必大家都是知道的。重復收錄,就是搜索引擎重復收錄相同內容的頁面。大量的重復內容當然是沒有意義的,不管是對搜索引擎還是用戶,相當於互聯網垃圾。
一般來說重復收錄的情況分為同站重復收錄和非同站重復收錄兩種。後者是其他站抄襲自己的站,或者鏡像網站,對自己本身的網站影響不大。而前者重復收錄的是同一個站內的頁面,嚴重的話可能導致被k。
導致網站被重復收錄的原因有很多,在這裡筆者主要講一下剛剛碰到的一個情況。使用WP(word press)搭建的博客評論中的“?replytocom”。
上圖就是當時該頁面被百度重復收錄時的截圖(截圖的時候本博已經被百度拔毛),可以看到連接中都帶有“?replytoco.”。其實就是“?replytocom”,這表示百度蜘蛛抓取了該頁面評論中的鏈接,導致了重復收錄。不過谷歌並未如此重復收錄?replytocom,並不是谷歌robot無法抓取。只是谷歌檢測頁面的能力相對比較強,發現相同頁面不會收錄。而百度蜘蛛則相對的弱一些,如果不及時處理的話,當出現大量相同內容,可能會導致網站被百度降權。
解決的方法就是在robots.txt中寫下規則禁止蜘蛛收錄。在robots.txt中添加以下代碼即可:
Disallow:/*?replytocom=
因為筆者使用的wp搭建的博客,至於其他系統的網站是否也會出現這種問題就不清楚了。但是出現重復收錄相當於制造了垃圾信息,對互聯網環境和wp網站的seo優化總是不好的。使用wp的同學,為了網站seo優化要謹防“?replytocom”導致的重復收錄啊!
除非特殊注明,本博客文章均為於申原創,版權歸於申blog所有。
本文地址:http://www.yushenblog.com/seo/120.html 轉載請務必注明出處,謝謝。