在所有的SEO工具中,能夠被稱為利器的工具不多,但Google GSA虛擬機版本絕對算是一個。去年我介紹了《利用Google Search Appliance 服務器做SEO 》,不過這個正式版實在太昂貴而且根據美國的某條法律不銷售給中國,所以很多人都沒辦法用來做SEO應用。 而Google GSA虛擬機版本就很好的解決了這個問題。
GSA
先講講這個Google GSA虛擬機版本怎麼應用到SEO上面吧。
如我以前所說:
你可以把這個GSA看做是google 的微縮版,它有爬蟲,有索引庫,有排序算法。它的的硬件和軟件都是現在google.com這個網站正在用的東西。所以兩者之間相似程度非常的高。我在過去操作google mini的時候已經證實:至少它的抓取機制和現在的google.com幾乎是一摸一樣的。
其實何止爬蟲抓取機制,連絕大部分排序的算法都是一樣的。雖然這個GSA內置了更多給離線文檔(如 pdf\word\)排序的算法,但是在給網頁排序這塊的算法和google.com如今正在用的算法是非常接近的。因為這個GSA的本意是給某些需要搜索的企業用戶來索引他們自己的信息,是希望用google的技術能力來幫他們索引最相關的信息,不然就沒有必要非得用google的產品了。 開發過小規模搜索引擎的人都知道,對於小型搜索引擎,其他東西大家都能基本做到,GSA值錢的地方就是這個排序算法,這是大家選擇GSA的首要原因。
另外,這個方法是一個有著11年SEO經驗並且在美國google做過2年產品經理的人強烈推薦使用的方法,他自己就買了2台正式版。
不過排序算法總還是有差別的,根據我使用了2年多GSA的經驗,對於網頁的排序算法90%以上是一樣。
GSA在SEO方面至少有以下幾個應用。
第一個應用就是檢查搜索引擎爬蟲在你網站上可能遇到的問題。
因為這是一個真正的搜索引擎,而且對於google來說,GSA和google.com的爬蟲是一模一樣的,所以檢查到的問題都是真正的搜索引擎爬蟲會遇到的問題。
操作方法為:
點擊“抓取並編制索引” —> “抓取網址”,按如下格式輸入你要檢查的網址,按後點擊“保存要抓取的網址”。
設置待抓取URL
在“狀態和報告”—> “ 抓取狀態”裡,點擊“恢復抓取”。
等一段時間以後,如果一切正常,在GSA的前台就可以開始搜索到網站的內容。
在“狀態和報告”—> “抓取狀態”裡,就可以看到爬蟲遇到的一些問題。如:
檢索錯誤
點擊出錯的部分,會列出哪些URL因為什麼原因出錯。
出錯的URL
這個虛擬機版本已經內置了一些數據。每次測試前,都需要把數據清空。 在 “管理”—>“重置索引”裡, 點擊“立即重置索引”可以清空所有已經抓取的數據。
看著這些似曾相識的界面,應該能明白我以前寫那篇《google 的良苦用心:網站管理員工具》的依據了。
第二個應用就是可以探測到google大部分基本的排序規則。
以前很多人在做SEO過程中對很多排名因素都是不能確定的。 如:到底 h1 放多少個好、有沒有必要加導出鏈接等等。
有了GSA,就可以做大量的 A/B測試,就能把很多因素都測試出來。 如:測試<h2>和<strong>這兩個標簽哪個對排名的影響更大一點。
那就可以設計A和B兩個網頁,其他部分都一模一樣,只是某個特定的關鍵詞,A網頁是用<h2> 加粗的,B網頁是用<strong>加粗的。 用GSA只收錄這兩個網頁,並且只對這兩個網頁進行排名。在前台搜索這個關鍵詞,看哪個網頁排在前面,這樣就可以知道哪個因素對排名的影響大一些了。
有點需要注意一下的是,那些被測試的網頁,如果上面有鏈接而你又沒做限制的話,爬蟲會順著這些鏈接把很多網頁都收錄進來,那會對測試結果造成干擾。
A/B測試
類似的測試方法還有很多,只要你想得到都可以去測試。 這樣能把google宣稱的200多項排序規則中的一大半規則都可以測試出來。 不過要明白一點的是:即使能把所有的規則測試出來,也不一定能做好SEO,在《怎樣形成一套非常科學系統