無論搜索引擎如何變化,相關性這個決定搜索質量的因素,只會變得越來越重要。無論是網站內容的相關性還是網站鏈接的相關性,這些都是我們做白帽SEO的基礎和重點。
內容相關性
什麼是內容相關性
每一個網站都會有自己的一個主題,即使大型的綜合網站,也會圍繞幾個詞展開其內容的撰寫與發布。在輔以相關性高外鏈的支持下,久而久之,在這個領域,這個網站就成了權威,擁有了高權重。比如,楊氏SEO博客是以SEO,網站優化和搜索引擎為主題的博客。那麼理應在搜索引擎的數據中,這三個詞占據著主導地位。
這就是內容的相關性,我們可以通過谷歌網站管理員工具看到:
通過網站管理員工具-優化-內容關鍵詞,我們可以清楚的看到,搜索引擎對於網站整體內容的把握,同博主自己對於網站的定位是相同的。說明,這是一個同預期關鍵詞相關程度高的網站。
而一個不好的例子是:
我們分析這個網站,在內容頁標題中,一般以 “XXXX 價格/報價” 為標題。但是我們看整站關鍵詞的相關度,“價格”這個詞的重要程度僅僅排在第十位,甚至不如“京東”和“亞馬遜”(分詞原因)。這樣,在白帽SEO的自然優化中,如果用戶以 “XXXX 價格”為關鍵詞進行查詢,那麼這個網站的內容頁很難排在前列,或者說在這個長尾關鍵詞上,他們的努力需要大過競爭對手很多,才可以獲取排名和流量。
內容相關性的算法
搜索引擎已知的200種排名因素中和若干種算法中,關於內容和檢索詞相關程度的算法有不少,之前介紹過的TF-IDF算法就是其一,此外還有:
1.特征權重計算:TF-IDF算法
2.相似性計算:Consine算法
3.概率檢索中的BM25或BM25F模型
……等等。當然,以上三種是比較有特點而且確實被商業搜索引擎運用在實際檢索過程中的,此外還有很多沒有公開的算法和模型。我們SEO不是做IR研究的,所以算法和模型對我們來說,實際的意義不大。但作為SEO,基本了解這些算法和模型,將會對網站內容方面的優化產生巨大的作用。
鏈接相關性
什麼是鏈接相關性
鏈接相關性同內容相關性的基本理念一樣,即獲得同行業權威站點的投票,效力要遠遠大於非同行業的網站。
這也是我們為什麼在說,最好的外鏈是你搜索本站目標關鍵詞後,排在前10位的網站導出的外鏈,效果最好。
所以經常看到一些同行在SEO論壇發一些其他行業的外鏈,我不能說沒有效果,但其效率實在太低。別人發一條,可能大於你發10條甚至幾十條。當然如果是群發,則不在討論范圍之內。
現在市面上有很多基於關鍵詞相關性的外鏈挖據工具,這樣的工具也要慎重選擇。一般這樣的工具挖掘的是已經被廣大SEO熟知,甚至是數據庫中的網址。有規律且不是很大量的發布,可以產生一定的效果,但如果是大量群發,則很可能觸發判罰條件。
谷歌前些日子在更新企鵝算法後,對一些網站站長群發了警告郵件,其中絕大部分的郵件內容是關於“非自然外鏈”。這也說明了,搜索引擎對於非相關性外鏈的群發,判罰是非常精准和嚴厲的。
此外,網站內部的鏈接,也分相關和不相關。如果是大量相關性強的內鏈,則會對網站內部的權重流通,產生非常有益的效果。如果是相關性不強的內鏈,則很可能喪失投票的效果。
鏈接相關性的算法
在鏈接相關性的算法中,我也挑選了幾個比較著名且很有可能被商業搜索引擎應用的模型和算法,有興趣的朋友可以自己搜索相關文獻進行研究:
1.谷歌專利:PR算法
2.鏈接權威度:HITS算法
3.計算對象集合:SALSA算法
4.專家頁面子集:Hilltop算法
其中後兩種算法是對前兩種算法的補充和完善。其特征都是找到相關度高的權威頁面,然後賦權給其他頁面。基於此,我們可以得出一個結論,即在接受外鏈權重方面,首先要考慮的是外鏈的相關性,其次才是該外鏈導出網站本身的權重。