百度搜索引擎目前不主動抓取https網頁,導致大部分https網頁無法收錄。但是如果網站一定要使用https加密協議的話該如何做到對百度搜索引擎友好呢。其實很簡單:
1,為需要被百度搜索引擎收錄的https頁面制作http可訪問版。
2,通過user-agent判斷來訪者,將Baiduspider定向到http頁面,普通用戶通過百度搜索引擎訪問該頁面時,通過301重定向至相應的https頁面。如圖所示,上圖為百度收錄的http版本,下圖為用戶點擊後會自動跳入https版本。
3,http版本不是只為首頁制作,其它重要頁面也需要制作http版本,且互相鏈接,切不要出現這種情況:首頁http頁面上的鏈接依然鏈向https頁面,導致Baiduspider無法繼續抓取——我們曾經遇到這種情況,導致整個網點我們只能收錄一個首頁。
如下面這個做法就是錯誤的:http://www.abc.com/ 鏈向https://www.adc.com/bbs/
4,可以將部分不需要加密的內容,如資訊等使用二級域名承載。比如支付寶站點,核心加密內容放在https上,可以讓Baiduspider直接抓取的內容都放置在二級域名上。
文章來源:百度站長學院