細心的同學會發現,在本教程裡,我們介紹概念的順序是按該概念的重要性來的。
目標關鍵詞、長尾關鍵詞、鏈接錨文本的概念是最重要的,而且是同學們最不容易懂的,我們在本概念篇的最後會回到這幾個概念上來。
其他的概念,是為著某一個具體的SEO操作而來。比如:
Google分析,用來分析和統計網站訪問情況;
robots.txt,用來屏蔽死鏈接等。
今天,咱們要來講一個新的為SEO操作目的而來的經典概念。
HTTP狀態碼:這是服務器和客戶端之間交流信息的語言。
比如:
當客戶端向服務器請求一個死鏈接時,服務器會返回“404”的信息。
“404”就是一個HTTP狀態碼,這個代碼告訴客戶端:“你請求的鏈接,我這邊沒有”。。
再舉個例子,“200”這個HTTP狀態碼代表的是,“你的請求,已經成功發送”。
如果客戶端向服務器發送一個鏈接,服務器返回“200”。那麼就說明,服務器正常返回了客戶端需要的信息。
HTTP狀態碼有什麼用?和SEO有什麼關系?。
因為網站日志往往會記錄下HTTP狀態碼,所以通過查看網站日志裡的HTTP狀態碼,我們可以清楚地看到網站服務器與客戶端之間的信息交換情況。
這個客戶端可以是用戶浏覽器,也可以是搜索引擎或其他爬取工具(如RSS)。
對於SEO來講,HTTP狀態碼的最大意義就是,通過它們可以查看搜索引擎在你網站的爬取情況。
比如:
baiduspider爬取的痕跡記錄是“404”,就說明,百度蜘蛛剛才訪問了一個死鏈接。
Googlebot爬取記錄是“200”,就說明,Google機器人剛才正常抓取了一個頁面。
一般在網站日志中,最常見的HTTP狀態碼就是200和404。
其他常見的HTTP狀態碼以及其代表的含義有:
成功2×× 成功處理了請求的狀態碼。
200 服務器已成功處理了請求並提供了請求的網頁。
204 服務器成功處理了請求,但沒有返回任何內容。
重定向3×× 每次請求中使用重定向不要超過 5 次。
301 請求的網頁已永久移動到新位置。當URLs發生變化時,使用301代碼。 搜索引擎索引中保存新的URL。
302 請求的網頁臨時移動到新位置。搜索引擎索引中保存原來的URL。
304 如果網頁自請求者上次請求後沒有更新,則用304代碼告訴搜索引擎機器 人,可節省帶寬和開銷。
客戶端錯誤4×× 表示請求可能出錯,妨礙了服務器的處理。
400 服務器不理解請求的語法。
403 服務器拒絕請求。
404 服務器找不到請求的網頁。服務器上不存在的網頁經常會返回此代碼。
410 請求的資源永久刪除後,服務器返回此響應。該代碼與 404(未找到)代碼相似,但在資源以前存在而現在不存在的情況下,有時用來替代404 代碼。如果資源已永久刪除,應當使用 301 指定資源的新位置。
服務器錯誤5×× 表示服務器在處理請求時發生內部錯誤。這些錯誤可能是服務器本身的錯誤,而不是請求出錯。
500 服務器遇到錯誤,無法完成請求。
503 服務器目前無法使用(由於超載或停機維護)。通常,這只是暫時狀態。
其他疑問:
1、怎麼看網站日志?
通過Ftp (FTP 是File Transfer Protocol(文件傳輸協議)的英文簡稱,而中文簡稱為“文傳協議”。用於Internet上的控制文件的雙向傳輸。同時,它也是一個應用程序(Application)。用戶可以通過它把自己的PC機與世界各地所有運行FTP協議的服務器相連,訪問服務器上的大量程序和信息), 在根目錄下可以看到一個包含log的文件夾,這就是網站日志。下載、解壓,裡面的txt文件內容就是日志記錄。
但也有一些服務器或虛擬主機沒有提供log文件,請與主機商聯系,或自己開通服務器的記錄日志功能。
2、網站日志中怎麼看搜索引擎機器人?
搜索引擎機器人:百度的“代號”是baiduspider、Google是Googlebot、Yahoo是Slurp。
在日志中搜索baiduspider,看到的那行信息就是百度蜘蛛與服務器的溝通信息。
3、看到了200 0 0 代表什麼?!
可以先簡單記住,看到200就代表搜索引擎已經成功抓取了網頁信息。
4、為什麼“200”很多,但我的網站還沒被收錄,或收錄很少?
如果和搜索引擎蜘蛛在一起的“200”很多,那收錄是沒問題的,但得等一次的更新期。除非被特殊處理,下次會展示很多出來。
5、怎麼除了200之外的其他狀態碼很多?
請按以上的代碼表對一下,然後分析為什麼會出現這個情況。當然,如果只是個別則沒事。
6、需要經常看嗎?
只要你收錄正常了,服務器沒什麼大問題,那一般沒必要經常看。
7、推薦在線的HTTP狀態碼檢測工具:http://www.seobox.org/getheader.htm
搜索引擎用來爬取網頁內容的工具我們稱之為搜索引擎機器人。
搜索引擎機器人每次來到要抓取的網站,都會先訪問這個網站根目錄下的一個文件(robots.txt),如果不存在該文件,則搜索引擎機器人默認這個網站允許其全部抓取。