HTTP 404 錯誤意味著鏈接指向的網頁不存在,即原始網頁的URL失效,這種情況在所難免,一個優秀的404頁面對於網站的重要性不言而喻,尤其網站大幅度改版時,大量鏈接失效,通過404頁面可以引導流量,提高用戶體驗,然而作為虛擬主機用戶,網站改版時不能合理地使用404頁面,反而會造成大量重復頁面,降低自身網站的權重。
何故?筆者借前段時間所改版,談談自己的疏忽。由於該網站原來的結構不是太合理,筆者對此前的網站進行了大幅度改版,對網站所有的欄目進行了重新架構,因而原來搜索引擎所收錄的幾千條記錄的鏈接全部失效,為引導流量,我通過虛擬主機商提供的控制面板設置了一個404頁面,頁面中進行了錯誤提示並提供了網站首頁鏈接、重要欄目鏈接和全站搜索框,然而不久我就發現了問題,google收錄裡面出現了大量的重復頁面如:
查看服務器日志才發現蜘蛛爬取老頁面地址時,記錄如下:
2011-02-15 06:13:15 W3SVC9943750 222.191.251.114 GET /Literature/Xinwen/946_2.html - 80 - 123.125.71.83 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0 2450
所有的返回狀態碼都是200 0 0,而不是404狀態,200狀態碼即告訴蜘蛛此頁面仍存在,可抓取,而大量的抓取同一頁面造成大量的頁面重復,搜索引擎對該網站的信任指數Trust Rank大幅降低,因而網站被降權,因此我果斷地將404頁面去除,至此頁面收錄基本正常。
一個正確設置的404頁面,不僅應當正確地顯示,同時,應該能夠正確返回“404”錯誤代碼,而不是200或302狀態碼。由於大部分虛擬主機設置的404頁面都是返回200狀態,且用戶是無法更改服務器返回狀態的,因而作為虛擬主機用戶,在網站改版時造成大量的失效頁面時,寧願不設置404頁面,也不能設置錯誤的404頁面。此外,使用Meta Refresh來處理404錯誤頁面,將404頁面自動跳轉到首頁或者網站其他頁面的做法也很不可取,極有可能產生200或者302狀態碼,如自動跳轉至首頁極有可能導致首頁降權甚至消失。
如果你不知道你的網站返回的是404狀態碼,還是200、302或者其他狀態碼,可查看網站日志或者Server Header工具進行檢查。
本文首發中國站長網,轉載請注明來自:維普論文網(http://www.viplunwen.com)
感謝 維普論文 的投稿