優化流量和改善頁面不是網站分析師的直接工作,但一個優秀的網站分析師得有能力為產品和運營部門提供分析和建議,並在公司中形成數據氛圍,保證各個部門向著同一個目標前進。畢竟,網站分析是一個發現問題、分析問題和解決問題的過程。
而流量對一家互聯網公司的重要性不言而喻,所以我們做流量分析、內容分析和轉化分析等工作,因為我們關心流量的背後能為網站帶來多少收入。
那麼,網站流量數據分析流程是怎樣的?常用的網站分析工具有哪些?網站流量質量如何分析?本篇文章就圍繞這幾個問題進行詳細解答。
在進行流量數據分析前,我們得知道流量數據如何獲取?常見的網站流量有哪些類型?如何區分真假流量?
1.1流量數據的獲取
流量數據獲取主要分3類:網站日志文件、打點、JS頁面標記。它們的區別如下:
現在大多數公司都是用JS頁面標記來獲取數據。JS頁面標記是指在頁面端嵌入JS標記代碼,JS代碼會將一些需要統計的信息以URL參數的形式附帶在請求地址的後面。而JS頁面標記輸出的是執行過JS代碼的日志請求記錄。
日志輸出的IP地址、訪問時間戳、訪問地址路徑、訪問來源、User Agent用於我們准確分析流量。
1.2流量數據的分類
知道流量數據如何獲取後,那麼常見的流量類型有哪些呢?通常,我們將網站的流量分為三大類,分別是直接流量、推介流量和搜索引擎流量,如圖:
搜索流量:是指訪問者通過點擊搜索結果訪問網站產生的流量;
推介流量:是指訪問者通過點擊其他網站的鏈接訪問網站產生的流量;
直接流量:是指訪問者直接輸入域名訪問網站產生的流量;
1.3直接流量的分類及分析
假如發生referer信息的丟失,推介流量便會被系統算做直接流量;當訪問者首先通過搜索引擎或標記鏈接訪問網站後,再次直接訪問時,這部分也會被記錄為之前的訪問來源,算做直接流量。由於直接流量的復雜性,我們在分析前得弄清直接流量的分類組成和對應的分析法。
1.3.1直接流量的分類
直接流量通常包含以下三大類的流量,如圖:
浏覽器地址欄:訪問者在浏覽器地址欄中直接輸入網址產生的流量;
浏覽器收藏夾:訪問者點擊書簽中收藏的網站URL產生的流量;
丟失來源信息:各種沒有或丟失來源信息的流量,包括 Flash 廣告、工具、彈窗廣告等;
1.3.2直接流量的分析方法
由於浏覽器地址欄、浏覽器收藏夾、丟失來源信息這三個產生流量的原因和特點不同,分析方法也不同。下面針對這三類直接流量來分別探索其不同分析方法。
1、浏覽器地址欄—流量分析法
針對浏覽器地址欄產生的流量,一般從Landing Page、頁面訪問路徑進行分析。
1)Landing Page:由於大部分是網站的首頁,如果Landing Page不是網站首頁的那部分流量,大部分都不是浏覽器地址欄產生的流量。
2)頁面訪問路徑:當發現網站的直接流量變高,或者質量變差等異常現象,一般以網站首頁為起點,通過路徑分析發現問題。
2、浏覽器收藏夾—流量分析法
網站中的任何一個頁面都可能被訪問者收藏,並再次訪問。分析方法如下:
對收藏行為和來自浏覽器收藏夾的流量進行標記,然後在報告中過濾出這部分的流量;
進行新老訪客分析。一般使用收藏夾訪問網站的用戶大都屬於回訪用戶,如果大部分新增流量都是新訪用戶時,這部分流量一般有問題。
3、丟失來源信息—流量分析法
丟失來源信息的分析方法一般有3類:
URL增加標記;
站內搜索關鍵詞分析(先將直接流量分類,然後關注直接流量使用站內搜索的情況,以及關鍵詞的變化);
使用跳出率指標來分析,因為純正的直接流量是網站忠誠度最高的那類訪客。
1.4如何區分真假流量
知道流量數據的分析流程及方法後,那麼對於現在常見的虛假網站流量該如何區分呢?怎麼辨別虛假流量去保證廣告效果呢?虛假流量通常是通過程序或者人為產生的。
1.4.1真假流量的特征
1)虛假流量的特征:
目的性:虛假流量的產生一定和某個目的有關;
規律性:特定的目的會使虛假流量一定帶有規律性。
2)真實流量的特征:
自然性:真實流量在各個維度的表現都是自然的;
多樣性:網民的喜好不同,行為也一定是多樣的。
1.4.2如何區分真假流量
知道真實和虛假流量的特征後,那麼如何辨別呢?通常,辨別虛假流量是通過判斷流量產生的時間/地理位置/網絡屬性/跳出率,訪客進入頁面的路徑/點擊分布圖/重合度/忠誠度去分析的。
1)流量產生的時間
真實的流量一般分布在全天的各個時間段,即使有訪問高峰,在流量曲線圖中一般也為平滑曲線。而虛假流量卻是人為控制的,在曲線圖中的表現是流量暴增。
2)流量的地理來源
通常訪客是來自各個不同的地理位置,而虛假流量很難使用多個IP來產生流量,所以如果流量集中來自一個地區就比較可疑了。
3、流量的網絡屬性
真實流量下,訪客網絡的接入方式應該是千差萬別的,而虛假流量的接入一般比較單一。所以,如果訪客接入方式只提供1-2種服務提供商的名稱就比較可疑了。
4)流量的跳出率
真實流量下,訪客可能在任何時間跳出,如果跳出率比較集中在某一個時間段,則要重點分析那個時間段的流量地理來源以及流量的網絡屬性了。
5)進入入徑&點擊分布圖
通常,由於廣告活動會有一個登錄頁面,所以流量入口只有一個。真實訪客進來後會點擊不同的鏈接,可能在任何一個頁面離開,而虛假流量的訪問路徑與離開頁面一般都相同。
6)訪客忠誠度分析
通常來說,一定數量的訪客訪問網站後是會對網站進行回訪的,即使數量很少。所以,真實流量會有訪客再次回訪的行為產生,而虛假流量一般是不會有回訪的,對於那些沒有回訪的流量一般是異常的。
7)訪客重合度分析
對於不同的流量渠道,可以使用訪客重合度分析法判斷是否為虛假流量。一般,當某個渠道在短時間內有較高訪客重合度時候,就需要進一步檢查流量的質量了。
目前,市面上常用的運營數據分析工具有友盟、talking data 、百度統計、諧雲等,下面主要說下這幾個主流工具的使用特點,它們的對比如下:
知道了哪部分才是網站的真實流量,那麼對於這部分真實流量的質量該如何評估呢? 我們去評估網站流量的質量是因為只有保證有質量的流量,才能為企業帶來價值。
網站的質量分析一般是按照質和量兩個維度來衡量的,如下圖所示:
量:X軸,指網站獲得的訪問量;
質:Y軸,指可以促進網站目標的事件次數,例如商品浏覽、注冊、購買等行為。
將流量按照它們在這兩個維度上的表現展示在坐標軸上,不同的流量就會有不同的位置相對應,如果把流量的成本用圓圈的大小表示,則可把流量表示在四個象限的位置描述成四種不同的流量:
第一象限的流量:質高量高。這是網站的核心流量,對於這部分流量保持即可。建議降低獲取流量的成本;
第二象限的流量:質高量低。這部分流量是網站的忠誠用戶,它們有很高的質,但數量較少。建議提高這部分流量的數量;
第三象限的流量:量還可以但質較低,並且獲取流量的成本也比較高;
第四象限的流量:量高質低。這部分流量要提高質。建議使用細分的方法。
總結:這樣整個網站流量數據分析的流程就很清晰了,先分清流量數據的種類,再按照需求去獲取流量數據,再去分析這些流量數據的真假以及質量好壞。有了這些後再去甄別該選用什麼樣的數據分析工具,根據他們的優劣以及自身的需要去選擇,從而保證網站流量的質量為企業帶來價值。