搜索引擎收錄網頁與網頁權重之間存在著本質的區別,也就是說收錄不是權重,權重不是收錄。
以前本人常常強調權重的重要性,並鼓勵網站不要流失權重。但是卻少有提及讓搜索引擎收錄更多網頁的問題,因此,在本文中,筆者會從不同的角度談該問題。其實收錄與權重有著非常大的區別,從一個簡單的說法來說即,收錄量決定著網站內容在檢索結果中出現的頻率和次數,而權重決定排名。舉一個很簡單的例子,一個IT界的門戶網每天都會有將近500篇文章誕生,隨著它們的產生,一些頁面會自動創建,如標簽頁,這樣這個網站每天有將近1000頁新網頁,而在這1000頁中,搜索引擎收錄了500頁,搜錄率只有50%。而另外一個還算不錯的網站,每天將近有50篇網頁誕生,但搜錄40篇,搜錄率80%。可是實際上,在搜索引擎檢索結果中,前面的IT門戶網的占有率大很多,但由於後一個網站質量很好,且權重較高,得到了很好的排名。
搜索引擎的收錄量有哪些因素?
搜索引擎的搜錄是有規律的,第一條就是吸引蜘蛛,這也是最難的一條。吸引蜘蛛有捷徑可循,但吸引蜘蛛之後,另外一件事是讓搜索引擎將抓取的網頁建立索引,加入它自身的數據庫中。那麼,是什麼影響這搜索引擎的收錄呢?
1.蜘蛛訪問的次數與頻率:這是絕對前提,如果蜘蛛不訪問網站,無從談起收錄了。當然,蜘蛛訪問網站會消耗掉網站的流量,且會加大服務器的負擔。因此,我們要做的應該是讓蜘蛛養成定期循環訪問網站的習慣,例如在每天晚上睡覺前訪問網站,了解網站更新了哪些內容。
2.蜘蛛訪問的深度與廣度:蜘蛛就是搜索引擎抓取網頁信息的一種機器人程序,它在抓取網頁信息時,常常具有挑選性,例如蜘蛛會根據網站信息的深度來判斷當前網頁的重要性,並判斷是不是要收錄它。同時,蜘蛛還會顯示出不耐煩情緒,當網頁內的哪些干擾信息比較多,如廣告、JS代碼等,蜘蛛會選擇暫停抓取。
3.網站或欄目甚至網頁的權重:權重會影響收錄,主要體現在高權重的網頁會讓蜘蛛停留更長的時間,並削弱它的挑選性,更會消除它的不耐煩。但是網頁的權重是經過長期積累起來,且要有合理的網站權重規劃。
4.網站信息產生的速度與質量:權威人士撰寫的網站內容,例如著名作家、谷歌內部的工程師等,他們的網站更新速度慢,但搜錄很快,且較為全面。
雖然上述是從搜索引擎的角度,強調收錄的搜索引擎主動的,而非以網站擁有者的意志為轉移。網站擁有者只能順從搜索引擎,掌握那些蜘蛛的規律,按規律辦事,或許這樣能得到搜索引擎的親睐。
如何看待收錄與權重
收錄是權重的基礎,因為沒有收錄量,再高的權重都沒有意義(當然這是不可能的)。權重能反過來刺激收錄量,這在上文已經提到過了。但在這裡,有一個概念性的誤解需要被澄清:本站所提到權重和收錄偶爾會引起讀者誤解,特別是在傳遞權重時,我們往往希望搜索引擎不收錄一些網頁,或不要將權重傳遞給某些網頁。那麼接下來,我們就來看看收錄是如何產生的,權重是如何傳遞的。
收錄,顧名思義就是讓網頁被收集記錄到搜索引擎數據庫中,在這個過程中,搜索引擎會對網頁信息進行索引,即確定該網頁和哪些關鍵字相關。在搜索引擎蜘蛛爬行時,首先會檢查網站的robots.txt文件,以確定網站管理人是否希望搜索引擎不要收錄其中的一些或全部網頁。除此之外的所有網頁都可能被收錄,只要蜘蛛能到達這個頁面(實際上由於上述的一些蜘蛛特性,很多網頁是到不了的)。因此,我們最好讓網站的每一個我們想被收錄的頁面都可以從首頁通過點擊鏈接訪問到。而且有一個特點是,距離首頁的點擊次數越少,收錄的機會越大。
權重,是搜索引擎給予一個網頁的評估值,這個權重可以反映出網頁的重要程度,權重越高,說明獲得更多搜索引擎的信任和認可,在排名時獲得更好的排名。關鍵是,權重是怎麼傳遞的。一般來說是通過鏈接,特別是帶錨文本的鏈接(超文本鏈接,鏈接文本現在也被計入傳遞權重的范圍)。但權重的傳遞不是等價平均的傳遞的,而是經過計算後傳遞的。例如某頁面A的權重為1.00,而它鏈接到10個頁面,這10個頁面將獲得總和為5~6的權重值,它們也不是完全平分這5~6分,而是各不相同。有的可以繼承2的權重值,有的可能只能繼承0.5的權重值。
需要強調的是,凡是鏈接,都會傳遞權重,而且權重值會被分散到所有鏈接身上。就像上文所述的權重值,在這5~6分中,如果有100個鏈接來分攤它,那麼每個鏈接分攤到的分數會很小,即使權重傳遞不平均,但最高也會低到0.01級。可是,我們並不願意減少鏈接數來使分攤者變少,我們可以使用rel=”nofollow”來阻止權重傳遞,也就是讓這100個鏈接有40個鏈接不傳遞權重,那麼只剩下60個鏈接來分攤這5~6分的權重,雖然每個頁面得到的權重仍然很小,但總比更小要好。
1.收錄和權重的誤區 認為rel=”nofollow”不會被收錄:實際上它只負責阻止傳遞權重,而並不阻止收錄鏈接所在頁。為了阻止通過鏈接收錄站外鏈接,我們往往將站外鏈接處理為一個站內的跳轉頁面,用robots.txt阻止這一系列的跳轉頁面,最終防止收錄站外鏈接。
2.認為只要不收錄就和權重沒關系:現在很多網站存在一個嚴重的問題,就是權重黑洞。即一些網頁內的鏈接連接到一個不收錄的頁面或沒有權重傳出的頁面。如果一個頁面的權重傳遞到一個不收錄的頁面,那麼這些權重就浪費了,權重在這裡進入終結。最好的是權重能在網站內部不斷的流動,最終回到首頁或要優化的目標頁面。
3.網頁跳轉沒有關系:使用meta refresh、header()、window.location.href都是不明智的,這些跳轉會造成權重流失。
無論如何,收錄量和權重在SEO裡面是一對非常關鍵的概念,一方面要充分把握好它們在SEO中重要地位,另一方面,應該避免它們造成的損害。
文章來源奢侈品http://s.n6188.com/,轉載請注明!
注:相關網站建設技巧閱讀請移步到建站教程頻道。
收藏本文