百度收錄永遠是SEOER著討論的關鍵話題,在網站優化戰爭中,穩定的收錄直接影響了網站的流量、收入。為何網站首頁快照更新很快,可就是不收錄內頁?相信許多朋友與我一樣在尋找問題的答案。本文落拓一起探討下網站內頁百度不收錄的原因分析與對策。
原因1:百度已經索引了但還未放出來排名。百度對文章的收錄需要審核時間,蜘蛛抓取成功索引內容錄入數據庫,需要經過二次審查是否為SPAM然後才放出參與排名,放出的時間與網站權重高低有著直接的關系,百度周期更新才放出收錄是新站最為常見的現象。
對策:我們要做的就是保證定期定量的更新、觀察網站日志,只要蜘蛛正常爬行,就靜心等待著,會有驚喜的。
原因2:robots設置問題導致內頁不受引擎蜘蛛爬行索引
對策:檢查是否語法錯誤屏蔽了蜘蛛爬行,其中包括meta robots與nofollow等標簽的的設置。
原因3:文章原創度問題,頭部標簽的設置導致頁面類似重復,或者采集頁面太多,因百度數據庫中已經存在大量的相似信息而不收錄,長期地操作會導致百度降權。
對策:應該保持文章的原創度(偽原創相信朋友們都熟悉),質量比數量更重要,最好是能每天定時更新讓百度對你網站抓取也有守時的好習慣。
原因4:網站內部鏈接存在問題,比如有大量錯誤鏈接、不良的網站鏈接,蜘蛛爬行不通暢無法抓取,不良網址鏈接導致網站降權。
對策:針對首頁、頻道等各個重要頁面做錯誤鏈接檢查(可以觀察谷歌站長工具的抓取錯誤),檢查留言板、評論等網友互動功能的不良鏈接,避免與不良網站互鏈。
原因5:網站使用了黑帽手段,百度識別了欺騙手段整站降權。
對策:遠離關鍵詞堆積、群發,黑鏈等黑帽行為,網站的長期穩定少懂歪腦筋,百度一有動作就沒很難挽回了!
原因6:服務器無法訪問,速度緩慢、被掛馬等情況。百度蜘蛛索引內容時,多次識別網站有著大量錯亂代碼或者遇到服務器無法訪問,網站被列入觀察名單。
對策:做好網站代碼優化提高頁面讀取速度,選擇負責任的安全空間服務商,成熟的網站程序並定期更新補丁,定期對修改文件痕跡做好跟蹤。
除了踏踏實實地做好以上6點,落拓特別提出幾點值得去做的:1、首頁做好全站的網站地圖,讓蜘蛛順利爬行到內頁;2、內頁的相關鏈接調用一定要規則化,讓每個頁面的主題更突出;3、外部鏈接可適當地做一些內頁的蜘蛛引導。每個細節把握好讓自己放下心,相信百度不會遠離對我們內頁的收錄。
感謝 落拓 的投稿