我們經常說“404錯誤”,你知道他指的是什麼意思麼?404其實是Http報頭所包含的一個“狀態碼”,表明該Http請求失敗。那麼除此之外,還有哪些常用的狀態碼呢?這些狀態碼和SEO又有什麼關系呢?
每次當用戶代理(可以理解為就是IE和Firefox)向Web站點請求一個URL地址,服務器都會給予回復,回復內容包括兩部分:HTTP報頭,和被請求的內容。但僅從浏覽器上我們通常只能看到內容而看不到報頭信息。所以,我們需要通過一些浏覽器插件來觀察他們。就我個人而言,IE我用WebDeveloper;FireFox我用Fiddler。有興趣的朋友可以在網上自行下載,兩個都是相當流行的。
對SEO而言,我們需要了解的狀態代碼有:
重定向:301和302
被刪除:404
服務器錯誤:500
我們依次講解,首先將302。302在asp.net中有一個很常見的原型:Response.Redirect(),請看代碼:
protected void Button1_Click(object sender, EventArgs e)
{
Response.Redirect("~/target.aspx");
//Server.Transfer("~/target.aspx");
}
source.aspx頁面上一個Button,Click事件中代碼為Response.Redirect(~/target.aspx),點擊source.aspx頁面Button,查看該頁面對應的狀態碼,結果就是302。(如下圖,我使用的是Web Development,不知道為什麼enable log之後,就無法再轉到target頁面了?各位同學知道原因的請指點一二)
但可以查看詳細信息,可以發現302的影響,response指明了要轉向的url。
客戶端/服務器之間往返的過程其實是這樣的:
1. 點擊Button,產生回發,回發的目標頁面仍然是source.aspx,所以請求仍由source.aspx頁面進行處理,這樣才能進入source.aspx頁面的Click事件;
2. Click事件中,Response.Redirect(~/target.aspx)所作的事情實際上就是:
2.1 將回復中Http報頭的狀態碼改成302;
2.1 指明302指向的頁面就是target.aspx;
3. 浏覽器(用戶代理)收到回復的報頭信息後,
3.1 將URL地址欄的地址改成target.aspx;
3.2 向target.aspx發出請求
和Response.Redirect()同樣著名的是Server.Transfer()。但使用Server.Transfer,你會發現,頁面對應的狀態碼是200,且地址欄的url並不會發生改變,仍然是source.aspx!這是因為Server.Transfer是完全在服務器端進行跳轉的。所以一種很流行但我覺得不那麼正確的說法就是:應當使用Server.Transfer()而不是Response.Redirect()來提高性能。因為在得到Server.Transfer()性能提升的同時,你應該權衡:性能的提高,和由此產生的代價。很難直接給出一個答案,這需要依靠具體的情景來做判斷。但我傾向於盡量不使用Server.Transfer(),因為:1. 性能提升不大,節約的其實就是報頭信息的往返;2. 清晰的URL無論對於終端用戶,還是開發調試,都有很重要的作用。
好了,理解了302,301也就好辦了。302意味著重定向是暫時的,而301則是永久的重定向。
就SEO而言,為了延續鏈接價值和排除重復內容 ,我們在以下幾種情況下都可能會用到301:
1. 域名更換;
2. 多個域名間映射;如www.freeflying.com和www.freeflying.cn,兩個域名其實指向的是同一個網站,這就會造成大量的重復內容,對網站的排名不利。
3. 清除默認索引頁的重復問題:比如我們輸入www.freeflying.com/article/時,如果在IIS裡進行了設定,將指向www.freeflying.com/article/Default.aspx
4. 其他的“不同域名相同內容”的重復問題,典型的就是URL重寫後,www.freeflying.com/article/321.html和www.freeflying.com/article.aspx?id=321指向的其實都是同一個網頁內容。
對於404,最直觀的理解就是頁面不存在。如果網站是純靜態的,這很好理解;但當網站做成動態之後,如www.freeflying.com/article/321.html(映射為www.freeflying.com/article.aspx?id=321),雖然id=321的文章已經被刪除了,或者根本不存在,但article.aspx這個頁面始終是存在的,所以HTTP報頭的狀態碼不會是404,而是200,表示請求成功。
我們假設一個網站有id=321/342/6739……的文章都被刪除了,但蜘蛛並不知道,它仍然會進行抓取,結果它發現,這些不同的URL對應的居然全是同一個頁面。它就會將其當做重復頁面進行處理。
500意味著程序內部出現異常,比如3/0,代碼如下:
protected void Button1_Click(object sender, EventArgs e)
{
int i, j;
i = 8;
j = 0;
this.Label1.Text = (i / j).ToString();
}
如果搜索引擎接到一個500的狀態碼時,搜索引擎會理解程序只是出現了暫時性的錯誤,它會在之後繼續抓取,查看問題是否已經解決,這並不會給網站帶來太大的問題——只要你能夠盡快恢復。但是,Asp.net自帶的個custom error的web.config配置,會讓我們在不經意間“失誤”。理由和上面講到的404變200類似,當轉向自定義的error.aspx之後,蜘蛛得到的是成功鏈接error.aspx的200代碼,所以蜘蛛會以為報錯的originpage.aspx正常的顯示內容就是error.aspx的內容。不同url參數的originpage.aspx會被蜘蛛認為是不同的url,所以蜘蛛會認為這些所有的url都重復了——後果是很嚴重的。
好了,認識到問題的嚴重性之後,我們來看解決問題的辦法,太簡單了,呵呵
protected void Page_Load(object sender, EventArgs e)
{
//如果你希望搜索引擎知道這個url將不再使用
Response.StatusCode = 404;
//如果你希望告訴搜索引擎這個url只是出現了暫時的故障
Response.StatusCode = 500;
//如果你想永久重定向該頁面
Response.StatusCode = 301;
Response.RedirectLocation = @“\website1\target.aspx”;
}
原文地址:http://www.cnblogs.com/freeflying/archive/2010/02/24/1672308.html