先了解下百度快照,在互聯網中每個允許搜索的網頁,在百度上都會自動生成臨時緩存頁面並存儲在百度數據庫中,稱為“百度快照”,如下圖。
百度官方解釋快照的作用,是用戶打開網站時遇到網站服務器暫時故障或網絡傳輸堵塞時,可以通過快速浏覽頁面中的文本內容。百度快照僅會臨時緩存網頁的文本內容,所以圖片、音樂等非文本信息,仍是存儲於原網頁。當原網頁進行了修改、刪除或者屏蔽後,百度會根據技術安排自動修改、刪除或者屏蔽相應的網頁快照。
其實上面提到的應該是針對普通用戶而言,而作為網站站長,我們除了這個外,還應該這樣用。
百度怎樣抓取搜索關鍵字
如果站長搜索某個關鍵詞,在搜索結果點擊百度快照,除了看到網站的頁面內容外,我們還可以看到百度怎樣抓取關鍵詞的,如截圖中粗體、黃色背景就是抓取的搜索關鍵詞。通過這樣功能,站長可以分析與你競爭的多個對手網站的關鍵詞在頁面中的分布位置及出現次數,為關鍵詞競爭度分析做好基礎。
了解了競爭網站關鍵詞的這些情況後,站長可以打開他們的網站,很容易找到這些關鍵詞,進一步去分析關鍵詞的表現樣式如字體顏色、加粗、標題樣式、斜體等表現,從而作為自己網站SEO的參考。
百度快照中頁面是否完全抓取
有很多站長在網站建設時,並沒有注意到網站頁面大小對搜索引擎抓取的影響,從而是網頁中某些區域的分布的關鍵詞,自己感覺關鍵詞分布位置,出現次數、表現樣式都很合理,但是對百度來說,如果頁面大小太大,這個區域的關鍵詞寫的再好,都是不會被百度蜘蛛抓取。(百度收錄頁面大小約在150K左右)
備注:對於搜索引擎來說頁面大小並不影響抓取和收錄,但是搜索蜘蛛會放棄爬行抓取超出頁面大小限制的外的內容。
舉例,百度快照裡頁面沒有顯現完整,首頁底部友情鏈接區域沒在快照中出現,那麼做網站的權重或PR也不會傳遞到所做的友情鏈接網站中。
如截圖所示,從百度快照中看到由於頁面大大,對超出規定頁面大小外的內容,搜索蜘蛛放棄抓取。如圖中紅色框的內容和其後面的內容都沒有被抓取。那麼像“童裝”關鍵詞,在沒有被抓取的內容部分中關鍵詞無論怎麼分布、表現也不會被抓取,在一定程度也影響了網站在這個關鍵詞上自然排名。
因此,站長可以通過這兩個方面,研究競爭對手網站關鍵詞的一些情況或是及時調整自己網站的頁面大小,使頁面可以被完全被抓取,對自己網站SEO優化也起到一定程度的幫助作用。
個人觀點,歡迎大家批評指點!謝謝