什麼是網站日志?
保存於網站空間內的一種文本文件,用來記錄網站運行狀態的各種數據,通常是在網站運行的過程中,由服務器程序實時更新記錄。
常見的網站日志程序片段:
網站日志分類:
網站日志與網站的服務器程序密不可分,不同的服務器程序在生成網站日志時方法相差相大。
互聯網上常見的服務器程序有:
Apache 49%,
IIS 20% ,
Lighttpd 4%
本文檔側重於IIS與Apache服務器的日志說明。
日志分析與流量軟件分析的差別:
從SEO的角度來說,兩者的相同點:
日志分析和流量軟件分析都能分析出網站各種流量、受訪頁情況、關鍵字數據等
不同點:
日志分析往往不能分析當前的流量數據;
常見的流量分析軟件不能分析出搜索引擎爬蟲數據;
常見的流量分析軟件不會分析錯誤鏈接等數據;
網站日志研究對於SEO的作用:
1、了解搜索引擎抓取網頁的問題:
分析搜索引擎爬蟲訪問情況,我們可以分析出搜索引擎收錄網頁的一些線索:
搜索引擎最近訪問網站的頻率是否正常?
搜索引擎比較喜歡訪問哪部分網頁?
搜索引擎很少訪問哪部分的網頁?
搜索引擎是否訪問了一些我們禁止訪問的內容?
2、了解網站內容及鏈接是否正常:
通過分析服務器返回的狀態代碼,可分析以下問題:
是否有死鏈接?
是否有頁面元素被誤刪,比如圖片、css腳本等等?
服務器是否曾出現暫時故障?
是否有臨時重定向?
是否有權限控制導致搜索引擎無法抓取數據?
網站日志研究對於網站安全的作用:
1、了解網站被盜鏈的情況
如果有第三方網站調用我們網站的圖片、視頻或者網頁文件,將會浪費我們的服務器資源,通過對日志的研究,可以很快發現這種問題。
2、可初步分析網站是否被黑客植入程序
如果黑客利用網站程序的一些BUG,通過植入代碼的進行進行攻擊破解的話,通過日志分析就有可能找到這種痕跡。
3、可初步分析是否有程序在大量抓取數據
搜索引擎或者第三方網站如果使用采集程序,大量反復采集我方網站數據,既會對服務器性能造成嚴重影響,而且會讓我們的資料流轉到其它網站上。
通過分析日志數據,可以讓我們發現這種采集現象。
關於網站日志分析的總結:
一般地,網站流量主要采用流量統計軟件來統計,而網站的故障分析、搜索引擎爬蟲規律研究則通過日志軟件來分析;
如果我們能夠持續對網站日志進行分析,就可以幫助我們在網站出現問題的短時間內了解到問題出在什麼地方,並盡快找到解決方案。