對於SEO優化人員來說,IIS網站日志就是我們網站優化的指南針,就是我們優化的晴雨表,能夠通過分析IIS日志能夠有效的修正我們網站優化的方向,從而加快SEO優化的進程,說明IIS日志對於SEO優化人員來說是至關重要的,那麼IIS網站日志我們應該如何分析呢?
首先要了解IIS日志中代碼的意思,舉例說明一下(下面是截取某客戶網站的一段日志):
2012-08-10 05:41:24 W3SVC1265125946 118.194.167.166 GET /irs_xadmin/FCKeditor/editor/skins/default/toolbar/image.gif - 80 61.135.204.168 Mozilla/4.0+(compatible;+MSIE+8.0;+Windows+NT+5.1;+Trident/4.0;+.NET+CLR+2.0.50727) 200 0 0
下面做一下解釋說明:
2012-08-10 05:41:24 用戶訪問的日期和時間
W3SVC1265125946 該網站在服務器上所對應的絕對目錄地址
118.194.167.166 該網站服務器的IP
GET /irs_xadmin/FCKeditor/editor/skins/default/toolbar/image.gif 用戶訪問網站的文件地址
- 80 該網站服務器的端口
61.135.204.168 訪問用戶的IP地址
Mozilla/4.0+(compatible;+MSIE+8.0;+Windows+NT+5.1;+Trident/4.0;+.NET+CLR+2.0.50727) 訪問用戶的一些詳細信息說明
200 0 0 用戶訪問網站所返回的狀態碼
那麼,了解這些以後如何針對IIS日志進行分析,找到針對性的SEO優化方案呢?這裡就需要利用網站日志分析工具來解決了,可參考光年SEO日志分析系統V2和Web_Log_Explorer3.31,這兩款免費工具,通過網站日志分析工具,我們大致可以分析出一下幾個方面的問題:
1. 概要分析:分析出各搜索引擎的訪問次數,總停留時間,總抓取量,占比數
2. 目錄抓取:分析出各搜索引擎抓取網站目錄的情況,包括網站各目錄的爬取量
3. 頁面抓取:可以分析出搜索引擎對那個頁面抓取的最多、最頻繁
4. 關鍵字分析:可以分析出百度、谷歌等搜索引擎透過哪些關鍵字抓取網站和帶來流量的
5. 狀態碼分析:分為用戶狀態碼和蜘蛛狀態碼,這裡主要應該還是看404狀態碼,是不是有些頁面已經刪除,但還在網站中存在鏈接,蜘蛛是否過多的抓取這些鏈接
針對上述分析的方向,我們可以做相應的優化:
1) 編寫新的robot.txt,把一些系統目錄加上禁止爬取
2) 對網站URL進一步靜態化,最好能把tag頁和分頁也弄成靜態地址
3) 對沒有收錄的文章,以該文章的url向相關網頁做鏈接
4) 優化文章標題和內容,增加關鍵字曝光率