目的:以百度空間為樣本,研究在外部導入鏈接極端豐富的條件下,各大搜索引擎的收錄特征。
方法:從百度空間外測發布後,每天晚上(除忘掉或者太忙外)堅持在百度、雅虎、Google和MSN中文中查詢四大搜索引擎對百度空間的收錄狀況:1,外部鏈接數(Back Links);2,收錄頁面數。並記錄在案。
結果:
1、基本情況詳見俺的原始數據(Excel格式),下載免費。
2、四大搜索引擎對百度空間的收錄情況:見圖表:
圖一:四大搜索在一個多月時間內對百度空間頁面收錄數量統計圖
從圖一可以看出,Google收錄百度空間的速度是最快、速率是最高的,但在一個月後,Google可能因為數據中心(DC)切換的原因,收錄數量急劇下降,至今(2006年9月2日)未恢復。
圖二:百度空間外鏈增長情況統計圖
從圖二中可以看出,Google外鏈一直是“0”,這是因為Google周期性地更新BL數量和PageRank值引起的,另外,絕大多數的SEO都知道,Google的BL並不代表真正的外部鏈接數量。
3、三大搜索引擎頁面收錄量與自身反鏈數量的關系:見圖表
表一:
從表一可以看出:Yahoo!中文是各大引擎中,在蜘蛛爬取和收錄之間,最為標准和規范的搜索引擎,其自身頁面收錄量和反鏈數的相關系數最高,為:0.93,而MSN的低相關系數,可能與其三天收錄一次頁面的怪癖有關。
4、Google頁面收錄量與其它三大搜索引擎反鏈數量的關系:見圖表
表二:
從表二可以看出:Google收錄量與MSN查詢的反鏈數量正相關,且相關系數最高(0.72),對於SEO來說,使用MSN查詢反鏈的意義最大。
結論:
1、通過本研究和前期研究發現,世界四大中文搜索引擎對百度空間都是友好的,沒有因為競爭關系不收錄對方,也不會因為競爭關系,給對方差別待遇,如只收錄首頁、只收錄URL不給描述。
2、在前三十天,Google在收錄頁面速度方面優於其它三大中文搜索引擎(見圖一),差距極為顯著。但是滿月以後,可能是Google的數據中心切換原因,收錄頁面數急劇波動,這算是固疾沉疴了。百度由於沒有特殊對待自己,因此表現出收錄中文頁面的特點:一等二看三通的特征,與SEO業界較多持百度對大站收錄速度快的普遍看法,不符合。只要你的外部鏈接足夠豐富,Google會很快收錄你,並且多多益善。
3、雖然百度空間外鏈數量方面,YAHOO一直領先,但YAHOO中國的收錄頁面非常有節奏,原因可能是YAHOO的蜘蛛很勤勞,對整個互聯網網頁進行著廣泛而普遍的抓取,但是搬運回家的頁面數,是按節奏進行的。
4、MSN的蜘蛛據朋友舉報,最近不再象MSN新搜索外測伊始那樣勤勞了,並且,MSN中文網頁收錄呈三天一次的節奏(見原始數據),非常的搞怪。
5、Google不規則提供BL數查詢,導致Google的外鏈數量已經成為一個沒有SEO參考價值的數據,這也是Google隱藏其神秘排名算法,忽悠SEO大眾的辦法之一。
6、本次研究的重大遺憾,沒有對比中文雅虎和英文YAHOO之間的差別,沒有對比MSN中文和MSN英文之間的差別。
聲明:研究指本人個人研究,不代表科學;結論是指個人看法,不代表真理。
附查詢方法:
1、百度BL查詢
2、
3、
4、
5、雅虎的BL查詢
6、
7、
8、