首先要了解搜索引擎的基礎原理,這才能知道在什麼情況下什麼數據指標是有關的;
之後需要對多種技術的入門級知識,因為各類數據的獲取方式都不同,有些需要采集、有些需從日志提取
、有些從數據倉庫導出、有些從API獲取等等,需要學習的方向不盡相同;
單單的數據只是數字,還需要分析數據才能讓它產生價值。臨時性的分析一般用到Excel,監控類的分析
則需要自己做個能輸出圖表的報表系統。
這些至少要花個半年功夫才能學會,但並不算難,沒有什麼可畏懼的。就如學習1+1時都會覺得9*9是難的
,但學會後再往回看,那就沒什麼了。
一個基礎的假想案例分析
假設個較接近於實際應用的例子:
一個游戲類論壇,A板塊為網盤游戲下載,很多頁面上有到X網盤的導出鏈接;B板塊為BT下載,頁面上有
一個站內的種子下載鏈接,無站外導出鏈接。
開始分析:
統計頁面的抓取數量與即時收錄數量,並計算之後,發現A板塊的頁面質量明顯低於B。(頁面質量 = 收
錄數量 / 抓取數量)
那麼此時猜測,是否是A板塊帖子頁面上,X網盤的導出鏈接導致了它的頁面質量低?
為了驗證猜測,再將A板塊的帖子頁面分為兩組,其中aa組有X網盤的導出鏈接、bb組沒有X網盤的導出鏈
接。分別計算其頁面質量。如果aa組帖子的頁面質量明顯低於bb組,那麼可以得出初步結論:
“X網盤的導出鏈接,使得自身帖子頁面質量降低,影響到收錄量,並最終導致SEO流量受損。所以需將該
類導出鏈接做特殊處理,比如由自己站內URL,301跳轉到X網盤等。”
當然這個結論未必是正確的。比如,aa組帖子具備的特征,除了具有X網盤的導出鏈接外,也可能具備的
特征如轉載帖子比較多(游戲資源貼許多會是轉載),可能是後者真正導致了其頁面質量的低下。
盡管更嚴謹的數據分析(比如再將轉載帖子與非轉載帖子分組)更可能得出准確的結論,但這般嚴謹下去
就沒個頭了,SEO畢竟不是火箭科學,在某步的數據獲取很有難度時,借助經驗來猜測下可能更劃得來。
所以可以先實施項目,然後再監控整個A板塊相對B板塊的頁面質量是否有拉近,從而以最終效果來證實之
前的猜測正確與否。
盡管這個例子完全為假設,我並不確定實際情況中,帖子到網盤的導出鏈接是否會影響到頁面質量。但類
似的例子平日能遇到很多,且此類分析的時候所需的數據收集起來方便,因此這是日常SEO數據分析最容
易碰到的一類情況。
一個進階的實際案例分析
(數字與實際數值不等,但大致比例相同)
內頁的流量在某一時間段大幅度下降,需分析其下降原因。
一個常用且管用的思路是,取25%的熱詞,看它們帶來的流量、與另外75%詞分別的變化。如果得出的數據
是熱詞的流量下降多,即多半為熱詞的排名有下降;如果下降程度相當,則為整體的影響。
首先,計算得出25%的熱門關鍵詞,它們的流量下滑幅度為35%;而75%的非熱詞,它們的流量下滑幅度為
30%。但雖然數據差了5%,但差距還不是特別明顯,需要進一步分析才能確定。
因為關鍵詞往往是可以被進一步分詞的,如“SEO文章”可進一步分為兩個檢索詞——“SEO”、“文章”
,而且檢索詞才是搜索引擎真正在處理的。所以進一步的分析就去分析25%的熱門檢索詞流量的變化。
最終得出的數據是,包含25%熱門檢索詞的關鍵詞流量下降了40%,不包含熱門檢索詞的詞流量僅下降10%。