最近國內搜索行業最大的事莫過於360搜索的推出,不少人在微博和博客留言裡問我對360搜索有什麼評論。作為一個以網絡為生卻無法感性體驗國內互聯網氛圍的SEO,我其實對幾個搜索引擎的厮殺、又有誰加入戰局、各自使用了什麼招數之類的事情不太關心,誰贏都沒關系,誰贏了、誰占了一定市場份額,再去琢磨一下怎麼在這個搜索引擎排名就行了,如此而已。
不過還是談幾點對360搜索的印象。
首先,目前360搜索的結果質量相當高,越是常用詞,搜索質量越高,長尾詞則質量下降。如果確如360自己所言,360搜索是他們自己的技術,那相當不容易。要知道,搜索引擎是個需要積累的、高技術含量的東西。這裡說的積累,不僅是人才(這個倒可以短時間解決),還有算法的修改評測和數據的累積。尤其是數據的累積,這個幾乎無法短時間彌補。如果360搜索在沒有歷史數據累積的情況下達到目前水平,那是相當驚人地牛X的。看看百度、Google之外的其它搜索引擎的質量就知道這有多難了,包括Bing,以微軟在人才、資金上的投入,又做了那麼多年的搜索,到現在也沒怎麼樣。
不過呢,360搜索是否真的是他們自己的技術,我有高度疑問。除了上面說的難度問題,還有一些對排名結果的觀察。根據我關注的一部分關鍵詞的排名對比和歷史記錄數據,360搜索的結果很像百度結果最後排名調整前的數據,而且是一段時間以前的。
這裡可能需要說明一下“最後排名調整”指的是什麼。搜索引擎收到查詢詞,在數據庫中按正常算法找到應該排前1000名(Google)或前760名(百度)的URL後,並不是馬上直接顯示出來,而是要在這1000個或760個結果中再最後調整一下排名,包括某些過濾算法的加入、這些URL之間鏈接關系的再計算等等。所以,我們有時候會在百度第76頁看到一些很熟悉的、曾經風光過、現在被某種形式懲罰的網站。也不一定總是第76頁,經常也出現在最後幾頁,比如seowhy的首頁現在就在第75頁。這些網站既然被降權或懲罰了,干脆找不到不是更合適嘛?為什麼放到第76頁去?原因很可能就是這是返回結果之後再最後調整的結果。
這種水平的高度相似,如果解釋為巧合,或排名算法的相似,我比較難以相信。在數據量很大的情況下,算法的任何微小差異都將導致結果的明顯差別。
而且,在360正式推出之前,好像沒人聽說過有什麼360蜘蛛。這個姑且不說了,可以解釋為匿名蜘蛛,雖然匿名爬行網站是相當不尊重站長的行為。
我當然不能肯定360結果就是,或者很大程度上是,百度最後調整前的數據。外人無法肯定,我只能說很像。
網上有人覺得360搜索是整合了百度和Google結果後再調整排名,我倒不覺得。整合其它搜索引擎數據的所謂“元搜索引擎”一直存在,如現在居然還活著的dogpile.不過360搜索能實時這麼做的可能性很低,百度、Google怎麼可能允許呢,360真這麼做的話早就被屏蔽了(換IP也一樣能屏蔽)。
那麼360怎麼會有百度的數據呢?真的建個關鍵詞庫然後去抓取百度搜索結果?怎麼想怎麼不可能啊,那太雷人了。百思不得其解,哪位知道指點我一下。又或者是我的幻覺?360真的完全是自己的技術?
至於360以後會占多少市場份額,這個和搜索技術、搜索質量似乎關系不大,要看360搜索商業模式的發展、哪個巨頭更黑、更狠。
最後補一句,在任何市場裡,有競爭都是好事。