Google周期性地公布已設計好的新服務,幫助Web站點管理員處理對站點訪問的數據過剩問題或幫助他們捕獲更多網絡堵塞。其中Google近期支持的一個服務是,通過努力使網蟲們能夠在站點發現新內容並且通過Google搜索很快得到它們。
在文章中,我將給出Google站點當前處理的具體細節,並且提供示例演示如何獲得站點圖以及如何運行。我使用http://www.allinvites.com作為示例站點,這個站點是我妻子的(我已事先征得她的同意)。正常情況下,我使用假設的站點,但是由於本文的目的,我使用到一個小而生動的站點。
具體細節
我已經提到過Google站點圖在高層的目標,但是確實還是有很多的服務和警告。首先,Google指出站點圖不會危害或幫助站點在Google的隊列。實際上,Google已經在站點圖FAQ中明確指出:“使用站點圖不會影響PageRank(搜索引擎使用的一種網頁重要性評估方式,它的值決定了網頁在搜索結果中的排名)值,這對於如何計算網頁的Ranking值毫無改變。”但是,網頁的Ranking值由於以前沒有被編入索引而現在被編入Google索引而升高。我的感受是:如果僅僅為了提升網頁的Ranking值,則不需要使用站點圖。如果最終Google正式指出站點圖可以用於此目的或者你想從站點圖獲取些別的利益,你可以嘗試采用這個方法。
Google沒有必要為你所提交的所有網頁都制作索引。例如,如果在自己的站點提交URL,而此URL在robots.txt文件中是受保護的,則Google的網蟲們將尊重在robots.txt文件中的設置而忽略提交給站點圖服務器的任務。第二,Google不保證所有提交的網頁都得到處理,但是提交的站點圖仍會被Google的網蟲們所使用以了解站點更多信息。正如Google所說的,向站點圖提交信息只會幫助你而不會危害你。
與其不顯眼的潛在下降相比,站點圖是一個很好的服務。首先,它甚至對於商業用途都是免費的。尤其對於那些身無分文的流浪者來說,這從來就不是件壞事。第二,站點圖的一個要點就是高效的幫助人們更快的獲得站點的索引。通過站點圖比通過手工提交可以更快發現和處理你的網站、新的內容和內容的變動。
最後也是最重要的,Google提供了站點圖相關的報表工具可以收集到如下的很多方面的信息:
使用Google站點圖
現在你對於Google站點圖能幫你解決那些問題有了更好的理解了,那麼,就讓我們進入到如何使用這種服務中來吧。
充分利用站點圖有3個步驟:
創建站點圖
Google的站點圖服務用到的站點圖創建是采用Google自定義的開源的使用XML語言的“站點圖協議”來給服務器提供你的站點關於設計方面的信息。Google甚至給你提供Google站點圖產生器,它可以很有趣的為你創建現成的Google站點圖。
如果要滿足下面幾項要求,則使用Google站點圖產生器是你最好的選擇:
開始時,需要有Google站點圖產生器。因為我的示例站點建立在Linux服務器上,所以下載了產生器的“tar.gz”版本。我的主機支持運行Python腳本程序並且我使用的是Python 2.2.3版本。
將下載的命名成sitemap_gen-x.x.tar.gz文件放置於服務器的某個位置。我將下載的文件放在示例位置的根目錄上。下一步,使用“gunzip”命令解壓。
Gunzip –dc sitemap_gen-x.x.tar.gz | tar xvf
文件的內容將被解壓到去掉“.tar.gz”後綴名的文件夾中。
在此文件夾中,找到example_config.xml文件 並將其拷貝到config.xml。編輯這個文件,注意下面幾個必需(有些是可選)的參數。
在“Site Overview”屏幕中,選擇“Add”按鈕。
圖B:選擇“Add”按鈕
在“Add a Sitemap”頁面允許添加一個一般的或移動站點(我在本文中沒有涉及移動站點),甚至提供位置使用站點圖的特征而不需要創建完全的站點。在我的示例中,對於大多數的網絡站點,都選擇“General Web Sitemap”然後點擊下一步“next”按鈕。
圖 C:確定需要添加的站點圖
在配置文件中,使用“store_into”指令來告訴站點圖產生器在什麼位置放置創建好的站點圖文件。在站點圖的“Add a general Web Sitemap”頁面中,輸入一個完整的URL,然後點擊“Add Web Sitemap”按鈕進行處理。
圖D:告知站點圖所創建到站點文件的位置
站點驗證
你可能很想知道Google在個人惡意使用可選方法對一個不屬於他的站點提交站點圖時是如何保護你的站點的(可選方法在下文中將會解釋)。為了防止這種欺騙行為,Google要求在顯示任何新站點的統計信息之前驗證站點。在圖E中,注意到“Verify(驗證)”鏈接到一個新添加的站點。點擊此在你站點圖帳戶上鏈接開始驗證過程。
Google的假設是:如果你能通過並且能在網絡站點的根上創建文件,你就是此站點的所有者。Google給你提供了一個長長的唯一的文件名並且詢問你是否要在網絡服務器的根文件上創建一個同名的空文件。
圖 F:Google需要創建一個驗證文件確保所提交的站點的所有權
用文本編輯器創建一個被請求的文件(對於Linux,我喜歡用Nano,而對於 Windows 我喜歡用Notepad++)。當一切就緒,點擊頁面右下角的“Verify”按鈕。如果創建的文件正確,將返回如圖G所示的頁面。
Figure G.:驗證成功
不要從網站上刪除此文件。Google將會周期性的檢查以確保這些文件依然存在。如果被刪除,Google將要求重新驗證站點的所有權。
提交站點圖的其他途徑
在文章中我僅僅講述了站點圖協議提交的方法,正如你可能希望的,Google推薦使用它們的自定義創建站點圖協議。但是,作為Google,它們也知道用戶的需求是多種多樣的,所以它也提供了一些其他的方法建立站點圖並且提交給站點圖服務器。這些方法包括: