最近有朋友說他負責優化的站點收錄一直上不去,覺得很奇怪,因為網站數據本身的數據量還是蠻大的,但是很多頁面卻沒收錄。做SEO的都知道,這個涉及到很多方面,簡單地說就是:內優和外優。一個網站要想獲得最好的排名,最大的流量,最高的權重,就必須做好站內和站外的優化。他說外部優化這塊是沒有問題,所以可以肯定的說問題在於他網站本身。雖然內優也包含很多方面,但在這些重要因素中一個屬於先天性的,能決定網站頁面的收錄數量及重要性(即頁面權重)方面有著重大的影響的因素就是網站結構。然後我仔細看了一下他的網站結構,發現一些問題:首頁結構還算合理,但是到了內容卻很無賴,大量的<iframe></iframe>框架結構,大家都知道這個蜘蛛無法爬取,更談不上收錄了,汗啊,不懂的SEO的設計師的作品!
為什麼說網站結構在決定網站頁面的收錄數及頁面權重方面具有重要作用呢?
要了解這個問題,我們就要先學習搜索引擎蜘蛛爬取和收錄網頁的方式。
爬行和抓取是蜘蛛工作的第一步,而超鏈接就是蜘蛛爬行的路,為了抓取盡量多的頁面數據,他們會順著發現的每一個鏈接爬下去,並收集新的數據。從理論上說,蜘蛛從任何一個頁面出發,順著鏈接都可以爬行到網上的所有頁面。然而,對於蜘蛛來說網站結構及頁面鏈接結構是非常復雜的。所以我們的搜索引擎工程師也想到了這一點,給我們的蜘蛛做了兩個非常好的爬行策略:一種是深度優先,另一種是廣度優先。
我們來看一下深度優先是這樣描述的:
所謂深度優先,指的是蜘蛛沿著發現的鏈接一直向前爬行,直到前面再也沒有其他鏈接,然後返回到第一個頁面,沿著另一個鏈接再一直往前爬行。
廣度優先是指蜘蛛在一個頁面上發現多個鏈接時,不是順著一個鏈接一直向前,而是把頁面上所有第一層鏈接都爬一遍,然後再沿著第二層頁面上發現的鏈接爬向第三層頁面。
通常來說深度優先和廣度優先是混合使用的,這樣既可以爬取到盡量多的網站(廣度優先),也能爬取到更多的網站內頁(深度優先)。實際上蜘蛛沒有想象的那麼順利,一些小站還好,但往往很多站點的數據量很大,頁面很多,相當一部分數據蜘蛛會抓取不到,怎麼辦呢?這就需要一個非常符合蜘蛛爬取的網站結構。
什麼樣的網站結構最符合蜘蛛爬取呢?
我們平時說的網站結構一般從兩個方面理解:一是物理結構,一是邏輯結構(鏈接結構)。對於小型站點來說,扁平化得結構已經足矣,對數據量較大的大型站點來說比較好的就是邏輯結構與樹型物理結構完美結合,才能更好的服務於SEO。簡單的說就是將網站首頁,欄目頁,內容頁之間的鏈接結構清晰化,讓蜘蛛很容易就能發現下一個頁面的存在。這就需要我們SEO去這樣設計網站結構:
主頁鏈接向所有的欄目主頁
主頁一般不直接鏈接向內容頁,除非是你非常想推的幾個特殊的頁
所有欄目主頁都連向其他欄目主頁
欄目主頁都連回網站主頁
欄目主頁同時連向屬於自己本欄目的內容頁
欄目主頁一般不連向屬於其他欄目的內容頁
所有內容頁都連向網站主頁
所有內容頁都連向自己的上一級欄目主頁
內容頁可以連向同一個欄目的其他內容頁
內容頁一般不連向其他欄目的內容頁
內容頁在某些情況下,可以用適當的關鍵詞連向其他欄目的內容頁
如果按照上面的方法來設計好網站後,無論蜘蛛怎麼爬,你網站的頁面都會得到充分的展現機會,對於網站內部優化來說已經做好了95%。一個好的網站結構不僅有利於搜索引擎對頁面的收錄,減少大量外部優化的工作量,而且是衡量一個網站用戶體驗好壞的重要因素,清晰的網站結構可以幫助用戶快速獲取所需信息;相反,如果一個網站的結構很亂,蜘蛛將會很吃力,嚴重影響他們的爬行,他們只會放棄你的站,對用來說,他們在很有限的時間內找不到想要的信息,他們也會放棄浏覽的。本文為BLUEFATE原創作品,這個是我優化的站點亞太衛浴網www.ytwy360.com轉載請保留,謝謝啦。
感謝 BlueFate 的投稿