下面要講到一個被很多SEO們誤解的重要概念。很久以前,搜索引擎的爬蟲(機器人)大部分時間都會遞歸地抓取某個網站(通過你提交的網站首頁網址,然後通過網頁上發現的鏈接抓取這些鏈接所指向的網頁,周而復始)。但現在不是那麼回事了,就像下面的圖一樣,搜索引擎的爬蟲抓取時會有多個進入點,並且每個進入點都同樣重要,然後再從這些進入點向外擴散,進行抓取。
那我們看看有什麼方能提高網頁被搜索引擎抓取、索引和排名的方法:
樣例網站架構圖
首先通過下圖看看通常網站的架構圖:
典型的網站外鏈分布圖
然後我們看看一個典型網站外鏈分布圖:
爬蟲抓取路徑的優先級
下面要講到一個被很多SEO們誤解的重要概念。很久以前,搜索引擎的爬蟲(機器人)大部分時間都會遞歸地抓取某個網站(通過你提交的網站首頁網址,然後通過網頁上發現的鏈接抓取這些鏈接所指向的網頁,周而復始)。但現在不是那麼回事了,就像下面的圖一樣,搜索引擎的爬蟲抓取時會有多個進入點,並且每個進入點都同樣重要,然後再從這些進入點向外擴散,進行抓取。
5個提高網頁被搜索引擎抓取、索引和排名的方法
最後,我們看看有什麼方能提高網頁被搜索引擎抓取、索引和排名的方法:
使網站結構扁平化
如果你的網站能夠建立一個理想的、扁平的鏈接層次,那麼可以實現通過3次點擊就訪問100萬個頁面頁,和通過4次點擊就訪問100萬頁面的效果。
從“強力的”頁面鏈接到需要鏈接的頁面
應該知道有很多外鏈的“強力”頁面(指排名高、外鏈多的頁面,易IT注)的漣漪性效應,並且充分利用這種效應。把這種頁面看作是目錄(或分類)頁面,並通過它們鏈接到網站的其他頁面。
同樣,你以後也可以將這種頁面當作著陸頁,幫助提高你想用戶訪問頁面的流量。
減少“死胡同”和低價值頁面
那些在鏈接圖上邊緣的頁面價值很低。確認網站上沒有那些讓PageRank降低的頁面。通常這樣的頁面是PDF、圖片和其他文件。你可以用301重定向將這些文件重定向到包含(嵌入或包含下載鏈接)這些文件內容的頁面,並且頁面上有返回網站其他部分的鏈接。
創作值得鏈接的分類或導航頁面
如果你能制作這樣值得鏈接和引人注目的頁面,它們會獲得更高的PageRank和更優先的抓取率。同時這些PageRank和抓取優先級會通過頁面上的鏈接傳遞到網站的其他頁面(給搜索引擎一個網站上所有頁面都很重要的信號)。
將不重要的頁面排除在爬蟲抓取路徑之外
減少不必要的導航級別(或內容頁面),並且將爬蟲導向真正需要PageRank的網址。
原文:Diagrams for Solving Crawl Priority & Indexation Issues
譯文出處:易-IT博客