1、提交sitemap即意味著google將會索引、收錄網頁
時常可以看到不少朋友在論壇中詢問諸如“我已提交了Sitemaps,為什麼Google還未收錄我的網頁啊?”之類的問題,似乎在其潛意識裡,只要在sitemaps中提交了相應網頁,Google便應該將其收錄。
這是很荒唐的理解,從最基本的角度,Sitemaps只是google向網站管理員提供的一個工具,盡管可以說是一個非常重要、有效的工具,但其只是對Google的索引收錄過程起一定的輔助作用,而決定Google是否會索引網站/網頁的最主要因素則在於Google對網站的信任度及網站是否具有良好的可索引架構等。
從這個意義上說,絕不能將Google Sitemaps理解成Google的“後門”——當然,這裡的“後門”則是指一般意義上的後門,而不是我們那篇文章中的意思——盡管Sitemaps能夠幫助Google及時發現新的內容,提高Google 爬行與索引的效率,但它與Google是否一定會收錄或索引之間沒有什麼必然的聯系。
比如說,如果Google對某個網站的信任指數較低,那麼,其對該網站爬行索引的廣度與深度都存在很大限制(參見Matt Cutts的 Indexing Timelines),其Spider便不會在網站內充分索引,提交Sitemaps並不能改變這個由算法決定的選擇機制,即使Google通過 Sitemaps得到了網站內新網頁的URL,其同樣不會去索引那些頁面。
2、Sitemap中的網頁,或早或晚,都會被google收錄
這種想法的謬誤之處在上文已經涉及到部分,但是,就算網頁具有良好的導航架構,就算網站獲得了比較高的Google信任指數,也不能保證Sitemaps 中的URL都會被Google收錄。
另一個重要因素在於,網站/網頁則否對Spider友善,在很多時候,不要奢望Spider具有堅韌不拔專啃硬骨頭的“革命精神”,相反地,其有著“知難而退”的壞習慣,對於Sitemaps中其難以辨識或根本無法辨識的URL,是根本沒有興趣爬行的。
這就要求網站建設者以搜索引擎Spider的視角設計網頁,盡量避免在網頁鏈接中使用對Spider不友好的元素,比如說包含在Framesets中的URL對Spider而言是極其難以閱讀的,而JavaScipt中的URL則根本就是Spider看不到的等。
3、Sitemaps中應包含網站的全部內容
許多朋友在生成Sitemaps時,總怕有所遺漏,總想在Sitemaps包涵網站內的全部文件,結果,提交的Sitemaps往往十分龐大,不僅包括網頁URL,也包括網頁中的圖片、flash等等,事實上,這對Google的索引與收錄包括對網站最終的SEO效果,均沒有太大的實際意義,而且,過大的Sitemaps文件也是對服務器帶寬的巨大浪費,增加服務器的負擔。
當然,這並不是說在Sitemaps中不應該包含圖片文件,如果希望在Google圖片搜索中獲益,希望優化Google圖片搜索,在 Sitemaps中加入圖片文件也許會有所幫助——老實說,本人並不這麼認為,不過,因未有明確證據,在此不敢斷言——不過,相比較而言,對圖片搜索來說,為圖片設置恰當的“alt” tag,使用有意義的文件名會有效得多。反觀一些朋友Sitemaps中的圖片文件URL,卻仍在使用如“1234567.gif”之類的文件名,這恐怕並不是一個好的選擇。
至於在Sitemaps中包含被robots.txt排除在外的網頁或使用“meta NOINDEX”的網頁URL,則更屬無意義之舉了。
4、使用Google sitemap能提高網站/網頁在SERP中的排名(或提高SEO效果)
Sitemaps只是在一定程度上提高網站頁面被收錄、索引的效率,從這個意義上說,對網站的整體SEO效果當然是有所助益的。
但是,Sitemaps與網站/網頁最終出現在SERP中的排名則沒有任何直接意義上的聯系,這是兩個雖有聯系但實現過程中交叉部分很少的兩個機制。——當然,如果非要強辯說,隨著網站內頁面收錄數量增加,站內的交叉鏈接權值會相應提高,而這會對最終的排名產生影響,倒也能在某種程度上說得過去,不過,影響多大就難說了。
5、新網站可通過Google sitemap走出Sandbox
所謂Sandbox,是Google基於新網站信任度不夠的體現,當然,其中時間因素是一個重要的考量。
要盡快走出Sandbox,只能通過權威性的相關鏈接與高質量的網頁內容來達成,Sitemaps對其無能為力。
6、在Sitemaps中設定某個URL高優先度可以提高其PageRank(或SERP排名)
呵呵,本來想寫夠五項誤區就罷手的,不過,錯誤理解優先度(Priority)概念的情況實在太普遍了,常常可以許多人的言談中看到類似的誤解。——同樣的情況還包括,如在Sitemaps中將所有Url都設置成高優先度,誇張的是某位朋友的Sitemaps中,所有URL的Priority 全為1。
首先需要明確的是,Sitemaps中的優先度,只是相對於同一網站內的其他網頁URL而言的,也即是說,比較A網站Priority=0.1 的URL與B網站Priority=1的URL哪個更優先沒有任何意義;其次,優先度只是告訴Google,網站建設者認為網站內哪個網頁更重要,這樣,在同一網站內存在多個待索引網頁時,Google的Robots才會根據優先度的不同,聽從網站建設者的“建議”,先去索引高優先度的網頁。——當然,在對搜索結果進行排序時,Google則有自己的主見,是不會受網站建設者所左右的。
因此,優先度的意義只體現在可以幫助網站建設者實現讓網站內的重要頁面盡可能地被Google收錄,或者,先被Google收錄,與網頁的PageRank無關,當然更與最終SERP中的排名無關