在第一期【院長幫幫忙】欄目露面的站點是編織匯(www.bianzhihui.com),該站點通過反饋中心反饋頁面內容遲遲不被抓取,經百度工程師追查,原來是因為頁面上的無用時間信息——沒有想到是不是?同學們快來看看這個案例吧。也想讓院長幫助追查嗎?快來看看這裡!
站點求助:現象
編織匯網站內容發布後幾個禮拜都未曾收錄。案例如下:
http://www.bianzhihui.com/t/6717(教程詳細頁面舉例)
http://www.bianzhihui.com/u/12306 (用戶頁面舉例)
http://www.bianzhihui.com/h/154 (編織花樣頁面舉例)
我們已將這些url放入sitemap,並使用了百度統計的集成的JS推薦,但是未曾有改善。
站點求助:自查
根據反饋中心的回復,使用抓取異常工具診斷:未發現異常
院長出手,內部追查
工程師結論: spider抓取很及時,但因為該網站沒有設置內容產出時間,網站底部卻有個老舊時間日期,導致spider誤以為網頁內容老舊(具體策略較復雜,在此不做贅述)。建議增加頁面內容產生時間,去掉沒有必要的時間信息
*以上為舊頁面截圖,“2014年9月9日”對時間識別造成干擾。
站點總結:
1,網頁上切忌勿亂加時間,如我們網站的(始於2014年9月9日)這種時間是一個大忌
2,網頁內容盡可能加上產出時間,也就是發布時間
3,百度site的結果時間和權重並無太多關系
4,跟百度溝通的時候,一定要條例清晰,證據確鑿。自身的問題一定要先排查准確。