相信很多網站都會遇到百度不收錄內容頁面的現象,而如果通過站長統計工具查看流量的來源時,你會發現大部分的流量來自網站的長尾關鍵詞,也就是網站的內容頁面,一旦百度不收錄內容頁面,對網站流量的獲取勢必影響很大。如果您的網站同樣出現百度不收錄內容頁面現象,那就和我一起認真分析一下原因吧。
百度不收錄內容頁面的原因:
1、 網站內容質量太低
網站內容質量太低是造成百度不收錄的主要原因,在8月22日百度官方公布的新算法《百度算法升級,將影響作弊站點收錄及低質站點的排序》中,百度針對低質量內容的站點進行重點打擊,尤其是采集內容的站點。所以,網站出現百度不收錄內容頁面現象,先檢查自己的網站內容是否高質量呢?
解決辦法:調整網站內容質量,如果網站內容是靠復制粘貼來的,那就增加每日原創文章的數量,或者調整網站內容頁面的布局,比如增加用戶評論功能,增加相關文章推薦,目的降低頁面相似度,從而解決百度不收錄內容頁面現象。
2、 百度spider頻繁抓取其他頁面
排除掉網站內容質量低的因素,網站的內容頁面依舊不收錄,那就查看一下網站日志,看看百度spider是否針對某一些目錄和頁面頻繁的抓取,造成抓取浪費。對搜索引擎的抓取流程有一定了解的朋友知道,百度spider對站點的每日抓取時間是有限的,一旦百度spider在有限的時間內頻繁抓取某不關頁面或者目錄,勢必造成對其他頁面抓取不足和抓取不到的現象。
解決辦法:查看網站日志,對頻繁抓取的頁面進行屏蔽,從而在有限的時間內讓百度spider抓取到更多其他內容頁面。
3、 其他因素匯總
百度不收錄內容頁面的因素是很多的,比如:服務器的因素造成的、網站改版的因素、網站大量死鏈接的因素、網站鏈接深度過深的因素等。
解決辦法:服務器的穩定性很重要,如果長時間網站出現打不開的現象,對百度對內容頁面的抓取是致命的;網站改版不要頻繁修改標題和描述信息;用工具檢測網站是否存在大量的死鏈接,將死鏈接進行清除或者屏蔽抓取;鏈接URL層次過深的可以調整鏈接結構,因為目錄過深的內容百度spider抓取是比較困難的,甚至抓取不到。
上面我總結出了針對百度不收錄內容頁面的三點原因,那麼在實際操作中,是如果運用的呢?下面我就針對自己的網站出現百度不收錄內容頁面而采取的方法從而成功解決的例子。
先來看看最近幾天的百度收錄情況表:
從圖中數據可以看出,9月2號出現百度不收錄內容頁面現象,經過調整在9月9號得到解決。
網站自上線以來,雖然是論壇形式的,但是我對論壇內容管理的很嚴格,前期大部分的內容帖子均是我個人原創或者偽原創發布,所以,可以排除掉網站內容質量很低的原因,通過對服務器的監控數據,網站的服務器在最近一段時間運行正常,其他的因素也不是很多。我們來看看百度spider是否在抓取上出現了問題。
上圖是通過網站日志分析軟件對百度spider抓取目錄9月2號-9月5號的統計,發現百度spider在頻繁的抓取/bbx目錄,這個目錄是便民百寶箱的鏈接,現在很多地方論壇都使用的有這個插件,裡面內容可謂重復度極高。
於是我對/bbx鏈接進行了nofollow控制,屏蔽百度spider對該目錄的抓取,同時在robots.txt文件中,添加Disallow:/bbx命令,從而雙重權限禁止百度spider對該目錄的抓取。終於在9月9號,百度開始恢復對內容頁面的收錄。
當網站出現百度不收錄內容頁面現象時,站長需要認真檢查自己的操作是否有造成百度不抓取的原因,結合對百度日志的分析,可以客觀的發現問題從而解決問題。如果您的網站同樣有百度不收錄內容頁面現象,自己又把握不准,可以和王繼順聯系,我很樂意幫助您解決。
本文是由北京人論壇http://www.beitao8.com/結合論壇的實際情況進行說明示例供稿,轉載請帶鏈接!