下面是一篇來自seoMoz的關於搜索引擎如何評定鏈接價值的文章。
今天約見一個新客戶,這個客戶好奇地問我,搜索引擎是怎樣給某個網頁排名的,你推薦的這些SEO改動為什麼會對排名的變動有影響,你在哪兒學的SEO,你能不能給列一下你做一些比較好的SEO案例?當你進的項目進行到一定深度時,就會開始進行鏈接建設(外鏈建設)了。客戶想知道為什麼鏈接建設那麼重要?你就拉出那張“影響網站排名的因素”給他看,指出外鏈在影響網站搜索引擎排名所占的比重後,他們就會明白了,不過他們又有了另一個問題:
在網頁搜索引擎排名上,Google是怎樣決定某個鏈接帶給這個網頁多少排名分值呢?
為了回答這個問題,就順便寫了這篇博客。下面,你會發現很多最重要的影響搜索引擎判斷一個鏈接價值的因素和分析。
開始前,有一個很重要的概念需要說說:
頁面 vs 網站級別鏈接圖
可能你注意到了,搜索引擎已經越來越依賴對整個網站的評估多於對某個網頁的評估。這就是有時你會看到某些新網頁或者只有很少鏈接的網頁排名卻很高,僅僅因為它們是在一個重要的、被信任的和外鏈極好的網站(域名)上。在有關影響搜索引擎排名的因素調查中,我們稱之為“網站的權威性”,而且這個因素被Google算法(按照投票集合的觀點)認為是最重要的。網站(域名)權威性可能基於網站鏈接圖來計算的,而不是基於網頁的鏈接圖,下面的列表裡,一些標准可能只影響上面其中之一,一些則兩個都影響。
1. 內部鏈接和外部鏈接
當搜索引擎為了開始判斷某個網頁是否流傳廣泛(易IT注:流傳廣泛性,popularity)、重要性和相關性,並通過評價鏈接到這個網頁的鏈接打分時,它們發現一種經典的基於引用的規則,就是指其他人說你好頂過你自賣自誇說千句好要重要,也更可信。因此,內部鏈接雖然也會帶來某些分值和權重,但外部鏈接帶來的要多的多。
但這並不意味著有好的內部鏈接架構就不重要了,或者說對內部鏈接做的一切(有好的錨文本-Google叫定位文本,去掉不需要的鏈接等等)不重要了,只是說一個網站或某個網頁的在排名上的表現高度依賴別的網站怎樣引用和評價它們。
2。定位文本(錨文本,Anchor Text)
對SEO們來說,很明顯,總的來說定位文本在搜索引擎排名公式中是最重要的因素之一,所以不要驚奇在鏈接的眾多屬性中,搜索引擎特別關照這個定位文本的屬性。
我們的實驗(和以往很多經驗)顯示,“完全匹配(exact match)”的定位文本比那些只是被包含著目標關鍵字的定位文本要來的有益的多。個人觀點,搜索引擎不會遠離這個標准,尤其對於那些通用(不含品牌的)的關鍵短語來說,這也是造成很多對SERPs(搜索結果頁面)過於優化和修飾的原因。
3. PageRank(頁面排名)
無論這個頁面排名叫什麼,微軟叫StaticRank,(Bing的Page Score可能也是其中之一,易IT注),Yahoo叫WebRank,Google叫PageRank,這些都是基於一種遞歸的、基於馬爾可夫鏈的鏈接分析算法,是所有搜索引擎排名系統的一部分。PageRank等排名系統使用的是一種投票的算法,而且和投票網頁的影響力和多少有關。
關於Pagerank(頁面排名)有幾點很很重要的基本概念需要知道:
每個網址(URL)天生就都被分配了一些數量的Pagerank。
如果一個網頁有“n”個鏈接,每個鏈接傳遞出去的頁面排名被那個網頁的頁面排名除於“n”(一個網頁上鏈接越多,那個網頁上每個鏈接傳遞出去的Pagerank就越低)
一種通過多次的迭代算法用來計算網絡的整個鏈接圖的流向,並以此計算出某個網址的排名分數。
在Google的工具條上的Pagerank數值是指數形式的頁面排名,所以頁面排名4比頁面排名3要重要8-10倍。
頁面排名可以通過頁面層次的鏈接圖來計算,並給出某個單獨的網址PageRank,但是頁面排名也可以通過在網站(域名)級別的鏈接圖來計算,通過計算網站間的鏈接來決定網站的重要性和排名。
4. 信任排名機制
關於信任排名機制的基本概念,請參考斯坦福的論文 - 用信任排名打擊網絡垃圾。信任排名的基本觀點就是互聯網上“好的”和“值得信賴”的網頁都緊密的鏈接在一起,然後讓垃圾網頁只能在這個核心外游蕩。因此,通過迭代算法和類似於頁面排名的衡量標准讓只有來自信任網站的源(trusted seed sources)傳遞更多的排名權重。信任排名可以用來預報某個網頁的質量高低和是否是垃圾網頁。
當搜索引擎不披露有關這個衡量標准的相關數據時,有可能某種“距離可信賴信息源距離“的公式應用在頁面排名的算法中。另一個有趣的地方是還有一個叫反-信任排名的指標,這個指標用來檢測誰鏈接到那些已知的垃圾站點上,這個可能也是影響排名的一個因素。頁面排名(pagerank)和信任