外鏈加入排名算法的原因
早起的搜索引擎排名原理基本上取決於頁面的相關性和關鍵詞的匹配度,因此,出現了大量的seo低級作弊現象,比如說關鍵詞堆砌,操控關鍵詞密度等等通過操控自己頁面的title keywords 關鍵愛詞密度就能達到很好的排名。這種操縱排名太簡單了,只要做自己的頁面就可以很大地操控排名。顯然,這樣不利於搜索引擎用戶的搜索體驗。於是外鏈算法便應運而生了。
外鏈算法
據說李彥宏在1997年就提出了一份“超鏈文件檢索系統和方法”文件,並申請了專利。比pr算法出現地還要早。從現在的搜索引擎比較來說,百度的排名比起其它搜索引擎更易受到外鏈的影響。因此,百度2012年9月出了一份打擊買鏈的申明,並在2013年2月19日正式加入了一個綠蘿算法:http://zhanzhang.baidu.com/wiki/142,並打擊了大量的買鏈以及一些其它類型的外鏈作弊突出網站。由此可見,現在簡單的外鏈算法也越來越不符合搜索引擎的發展,但是既然百度花大力氣出了綠蘿算法,並隨後又內測了外鏈拒絕工具,我認為,外鏈算法的使用,還會延續很長一段時間。其它影響算法的新因素還有待觀察。
HITS算法:HITS 算法是由康奈爾大學( Cornell University ) 的Jon Kleinberg 博士於1997 年首先提出的,為IBM 公司阿爾馬登研究中心( IBM Almaden Research Center) 的名為“CLEVER”的研究項目中的一部分。主要指的是兩種情況會對排名有積極影響,一種是有質量有數量的外鏈(該主題有排名的N個頁面)頁面(說明頁面內容有很高的權威度),一種是有質量有數量的導出鏈接(該主題有排名的N個頁面)頁面(說明頁面鏈接有很高的權威度);參考資料:http://baike.baidu.com/view/6284787.htm; 據說鏈接的存在時間和點擊訪問情況也會影響HITS算法。
TrustRank算法:即信任指數算法,TrustRank算法最初來自於2004年斯坦福大學和雅虎的一項聯合研究,用來檢測垃圾網站,並且於2006年申請專利。實現方法:挑選出兩百多個種子網站,通過超鏈接,距離種子網站越近的網站信任指數越高,反之則越低。
據說挑選種子網站的方法有兩種,一是挑選pr值高的頁面或網站,一是挑選導出鏈接最多的頁面或網站。(似乎與HITS算法有異曲同工之處),得出網站或頁面的TrustRrank值後,把傳統排名算法挑選出來的多個頁面,根據信任指數的比較,重新做一次排名;或者設定一個最低的信任指數值,只有超過這個值,才被認為有足夠的質量進入排名,低於此值的,從搜索結果中過濾出去。
而隨著時間的推移,Trustrank引起的新問題開始漸漸凸顯,成為google的新麻煩:搜索結果充斥著著名和權威站點的影子,即使這些頁面內容可能是Spam。用一些權重高的站點發布同樣的內容頁,排名要明顯高得多。優秀的個人或企業站點,尤其是新建的,即使內容再好,也難有排名優勢。
如何成為TR站或頁面:1.域名注冊時間在五年或五年以上;2.網站托管在專用服務器上;3.網站加載時間快;4.網站內容是原創的;5.訪客在每個網頁的停留時間超過90秒;6.網站被多個國際IP段引用;7.網站在其所屬行業中擁有權威性。
谷歌的PR算法:PR值全稱為PageRank(網頁級別),2001年9月被授予美國專利,專利人是Google創始人之一拉裡·佩奇(Larry Page)。因此,PageRank裡的page不是指網頁,而是指佩奇,即這個等級方法是以佩奇的名字來命名的。它是Google排名運算法則(排名公式)的一部分,是Google用於用來標識網頁的等級、重要性的一種方法,是Google用來衡量一個網站的好壞的重要標准之一。在揉合了諸如Title 標識和Keywords標識等所有其它因素之後,Google通過PageRank來調整結果,使那些更具“等級/重要性”的網頁在搜索結果中令網站排名獲得提升,從而提高搜索結果的相關性和質量。
PR算法公式如下:PR(A)=(1-d)+d(PR(t1)/C(t1)+…+PR(tn)/C(tn));A代表頁面A;PR(A)則代表頁面A的P;d為阻尼指數。通常認為d=0.85;t1…tn 代表鏈接向頁面A的頁面t1到tn;C代表頁面上的外鏈接數目。C(t1)即為頁面t1上的外鏈接數目;真正用於排名的pr值我們是無法知道的,工具條 pr值並不是pr值的一個精確反映。真是的pr值是一個准確的大於0.15而且沒有上限的數字。而且真正的pr值是不間斷更新的,而工具條pr值往往是幾個月更新一次。而且,工具條PR與反向鏈接數目是呈現對數關系的。pr只是谷歌排名算法的兩百多個因素之一,重要性也在下降。pr值不僅影響排名,還影響:1.網站收錄深度和總頁面數;2.搜索引擎蜘蛛反問頻率;3.重復內容判定;4.排名初始子集的選擇。現在谷歌pr算法據說已經排除了一部分谷歌認為可疑或者無效的鏈接,比如付費鏈接,博客和論壇的垃圾鏈接等。(本人認這種說法還有待證明);優點:是一個與查詢無關的靜態算法,所有網頁的 PageRank值通過離線計算獲得;有效減少在線查詢時的計算量,極大降低了查詢響應時間。不足:人們的查詢具有主題特征,PageRank忽略了主題相關性,導致結果的相關性和主題性降低;另外,PageRank有很嚴重的對新網頁的歧視。參考資料:http://baike.baidu.com /view/20039.htm http://baike.baidu.com/view/1518.htm
Hilltop算法:Hilltop算法是由Krishna Baharat在2000年左右所研究的,於2011年申請了專利,並且把專利授權給谷歌使用,後來Krishna Baharat本人也加入了谷歌。可以簡單理解外與主題相關的pr值。搜索關鍵詞後,谷歌先按正常排名算法找到一系列相關頁面並排名,然後計算這些頁面有多少來自專家文件的與主題相關的鏈接,來自專家文件(1.預先挑選,搜索引擎根據最常見的搜索詞預先計算出一套專家文件;或者2.用戶搜索特定查詢詞後,搜索引擎按傳統算法挑出一系列初始相關頁面,這些頁面就是專家文件)的鏈接越多(至少有兩個才會影響排名),頁面的排名分值越高。對傳統排名做重新調整,得到最後的排名結果。這就是搜索引擎排名階段的最後過濾和調整步驟。參考資料:http://baike.baidu.com/view /19071.htm
幾種排名算法可以想到搜索引擎對外鏈的算法主要是有以下幾個方面:1.外鏈的數量;2.外鏈的質量;3.外鏈的相關性(相關主題有排名的頁面);4.打造權威頁面或者樞紐頁面都可以嘗試;5.靠近種子站;外鏈的數量和質量在百度推出百度對外鏈的判定方法時可以看出,數量的作用越來越小,質量高才是硬道理,外鏈的相關性才能真正的體現出推薦性鏈接,也是高質量外鏈的表現,關於打造權威頁面這個還是間接的說明了網站用戶體驗的重要性,鏈接導向的網站頁面要盡量能滿足客戶的需求或者能夠引導客戶跳轉到其他頁面。
以上信息由上海鋼結構雨棚www.hrlgjg.com進行整理發布,轉載請注明出處,謝謝!!