搜索引擎在收錄網頁時,對網頁進行備份,存在自己的服務器緩存裡,當用戶在搜索引擎中點擊“網頁快照”鏈接時,搜索引擎將Spider系統當時所抓取並保存的網頁內容展現出來,稱為“網頁快照”。而網頁快照的時間理應和搜索引擎收錄網頁時的時間同步,但事實上站長朋友看到的快照時間並非如此。
針對目前百度搜索引擎出現快照異常的問題,柴潇總結了以下三點:
一、快照時間更新慢;
二、快照時間不更新;
三、快照時間倒退。
這三個問題是SEO人員經常糾結的問題,今天就針對這三個問題展開分析。
一、快照時間更新慢
快照更新時間慢是一個很正常的現象。但可以簡單的歸納為兩種情況,1、網站不更新;2、快照更新需要時間。
1、網站不更新
一個網站的快照更新時間首先跟網站本身的更新時間有必然聯系。如果網站不更新,那麼搜索引擎蜘蛛爬取時沒有看到新的東西,自然會掉頭就走,索引庫裡的備份時間也不會更新。
2、快照更新需要時間
搜索引擎蜘蛛抓取了網頁後,先會將索引庫裡的時間進行更新。而用戶看到的網頁快照 時間是展示到界面的時間,搜索引擎快照的更新有一定的延遲,並不是所有的網站都會在索引庫更新後第一時間反應到快照上來。因此快照時間更新不及時,跟搜索 引擎的更新延遲是有關的。但是也跟網站本身長期建立起來的更新周期有一定的關系,如果你的網站一如既往的每日及時更新,那麼搜索引擎對你網站的抓取更新周 期也會隨之調整。
二、快照時間不更新
快照時間不更新,同樣簡單的分兩種情況:1、網站長期不更新;2、網站出現無法訪問或者屏蔽等現象。
1、網站長期無人打理,不更新,不用多說,搜索引擎即便再照顧你,也不會照顧到沒有節操的地步。你網站最後一次的更新時間會一直保留,因此造成快照時間不更新的假象。
從上圖中可以看出,該網站雖然說搜SEO這個詞排名很好,但是快照時間並沒有更新。通過查看頁面內容就會發現,該頁面作為一個固定的列表頁,裡面的內容發布於2008年,至今沒有變化,是導致排名雖然很好,但是快照並麼有更新的原因。
2、如果網站在中途出現無法訪問,或服務器關閉,或因為其他原因導致蜘蛛抓取異常等現象,會導致快照更新出現異常。
有時候會看到,網站在更新,或者網站可以正常訪問,但是快照時間依然停留在很久以前。是因為搜索引擎展示給用戶的時間,並不一定是最新更新的時間,而是會選擇一個它認為比較合適的收錄時間。
三、快照時間倒退
如果說前兩種情況大家都可以理解的話,第三種情況可能就很少有人理解了。為什麼呢?因為有些網站是2013年建的,快照顯示時間卻是2006年。這個時間差讓人哭笑不得,甚至有罵百度腦殘的沖動。這個問題在幾次站長大會上一直有人向百度工作人員提出過提問,但是一直都沒有正面回應,都是以第二個現象的答案來回答這個問題的。今天柴潇就對這個現象進行圖文解析。首先我們來看一下下面這組圖。
上圖是柴潇的個人博客,這裡顯示的時間為2006-5-12,但實質上其博客是2013年建立的。因此看到這個快照時間後,非常難以理解,想知道這個時間是從哪裡來的。經過一番研究後發現了這個秘密,請看下圖:
當時打開網站進行查看,發現首頁的內容摘要裡顯示了一個英文時間,這個時間翻譯過來恰好就是2006年5月12日。經過回憶,而在這段時間,這個網站曾有一天因為服務器到期而無法訪問。看到這些,問題迎仍而解。
原來百度快照時間除了會自己選擇一個合適的收錄時間作為快照時間來展示給用戶之外,還有可能抓取網站內容中的時間作為快照時間展示出來。
也許還有人會覺得這是一種恰合,於是為了進一步證明,柴潇再次做了實驗。請看下圖:
之前說SEO研究協會網的快照是2014年1月10日。當我把網站頁面的內容裡的時間修改為2014年7月25日後,百度快照時間開始更新。更新後的快照時間和我修改的時間吻合。
因此,從以上的實 驗中可以看出,百度快照時間的來源主要有三點:
一、及時按照收錄時間進行更新;
二、系統在索引庫裡的備份時間裡選取一個百度自認為相對適合的時間作為快照 時間進行展示;
三、當網站服務器出現無法訪問等情況時,網站快照時間容易出現異常,這事搜索引擎蜘蛛會抓取網站內容裡面的時間作為快照時間進行展示出來。
當然以上只是柴潇總結出來的部分現象,並非全部,由於篇幅較長,所以不一一列舉,今後將會在巨推學院的課程裡依次進行分享。
下面是大家僅此遇到的一些關於SEO方面的問題:
Q:網