用織夢DEDECMS建站的站長會發現,DEDECMS自帶的robots.txt文件設置很簡單(開發者基於每個網站的目錄結構和優化目的不同的考慮),並不能完全滿足網站的優化要求,那怎樣才能結合自己網站的情況,做好robots.txt優化呢?以下介紹一點自己的想法,僅供參考。
適用於未偽靜態的DEDECMS網站。
User-agent: *
Disallow: /dede 管理後台目錄,需要改名,具體設置後面具體講
Disallow: /include 程序核心文件目錄
Disallow: /member 會員管理目錄,有些文件可以開放
Disallow: /plus 插件及輔助功能目錄 ,有些文件可以開放,如search.php
Disallow: /templets 默認模板存放目錄
Disallow: /data 系統緩存或其它可寫入數據存放目錄
Disallow: /uploads 上傳下載文件保存目錄,不想搜索引擎引用圖片的話,禁止
Disallow: /images 系統默認模板圖片存放目錄
Disallow: /index.php 網站默認首頁,靜態化的話,最好禁止
Disallow: /404.html
Allow: /plus/search.php 開放禁止目錄裡的具體文件
...
基本設置就是這樣,下面著重講下後台管理目錄和欄目頁的設置:
1.dede目錄,為了網站安全考慮需要改名。然而改名之後,大家不免疑惑:改了名,在robots.txt文件裡怎麼設置呢?直接禁止抓取,還是洩露了後台目錄,等於改名無效。那麼該如何解決這個問題呢?我們可以通過下面的設置解決這個問題,如後台目錄為dedecms:
Disallow: /d*ms
這樣我們就能即禁止了搜索引擎的抓取,又不會洩露了後台目錄名稱。
2.欄目頁。有些人會注意到,如果網站不做偽靜態優化的話,欄目分頁後會有兩個鏈接指向欄目首頁,如*/web/和*/web/list_1_1.html,為了網站優化,建議先將欄目分頁優化以下(具體做法大家可以在網上找),把首頁和第一頁的鏈接改為*/web/的形式,然後在robots.txt文件裡做以下設置:
Disallow: /*1.html$
以上就是DEDECMS robots.txt文件的設置,大家可以根據自己網站的情況具體設置。
注意事項:
1.按官方說明設置好目錄權限;
2.後台目錄改後的名稱開頭字母和結尾字母不要和其他目錄一樣;
3.用百度站長工具測試一下robots.txt文件設置是否有效。