通過分析發現,網站的鏈接並沒有出現工具指出的404頁面鏈接,然後通過進一步排查,發現是RSS頁面的輸出問題。在後台我設置了輸出RSS時僅顯示摘要,而不是全文,因此程序在自動截斷的時候將網址截成了不完整的部分。而百度是識別文本鏈接的,因此就出現的404頁面。
404頁面本身是不會影響網站權重的,但是出現這種因為系統截斷而出現的404錯誤就是有害的:
1、降低了百度蜘蛛的爬行效率,致使百度蜘蛛爬行過程中爬行一些不存在的404頁面
2、降低了百度蜘蛛爬行新網頁的機會,當百度蜘蛛發現404頁面的時候並不會直接丟棄,而是不定期地重復爬行以確認頁面是否不存在,從而將百度蜘蛛爬行的機會浪費在了404頁面
3、降低了網站在搜索引擎當中的信任度,如果一個網站經常大量的、經常的出現404錯誤,無疑會降低在搜索引擎當中的信任度從而影響權重
如何解決這一問題:
1、修改程序,去掉所有鏈接後再進行截斷輸出
2、直接全文輸出
這個問題很多網站都會出現,希望本文能夠引起廣大站長的重視!本文首發於章亮的博客:http://www.zhangliangblog.com/seo/alert_output_desc.html,轉載請注明版權