網頁收錄問題
1:如何讓我的網站(獨立網站或者blog)被百度收錄?
百度會收錄符合用戶搜索體驗的網站和網頁。
為促使百度Spider更快的發現您的站點,您也可以向我們提交一下您的網站的入口網址。提交地址是:http://www.baidu.com/search/url_submit.html。您只需提交首頁即可,無需提交詳細的內容頁面。
百度的網頁
2:如何讓我的網頁不被百度收錄?
百度嚴格遵循搜索引擎Robots協議(詳細內容,參見http://www.robotstxt.org/)。
您可以寫一個Robots文件以限制您的網站全部網頁或者部分目錄下網頁不被百度收錄。具體寫法,參見:如何撰寫Robots文件。
如果您的網站是在被百度收錄之後再設置Robots文件,則Robots文件通常在兩周內生效,被文件限制的內容,將從百度搜索結果中移除。
如果您的拒絕被收錄需求非常急迫,也可以發郵件給webmaster@baidu.com請求處理。
3:為什麼我的網站內一些不設鏈接的私密性網頁,甚至是需要訪問權限的網頁,也會被百度收錄?
百度Spider對網頁的抓取,是通過網頁與網頁之間的鏈接實現的。
網頁之間的鏈接類型,除了站點內部的頁面鏈接之外,還有不同網站之間的互相鏈接。因此,某些網頁即便通過您的網站內部鏈接無法訪問到,但是,如果別人的網站上有指向這些頁面的鏈接,那麼這些頁面還是會被搜索引擎所收錄。
百度Spider的訪問權限,和普通用戶是一樣的。因此,普通用戶沒有權限訪問的內容,Spider也沒有權限訪問。之所以看上去某些訪問權限限制內容被百度收錄,原因有兩點:
A. 該內容在Spider訪問時是沒有權限限制的,但抓取之後,內容的權限發生了變化
B. 該內容有權限限制,但是由於網站安全漏洞問題,導致用戶可以通過某些特殊路徑直接訪問。而一旦這樣的路徑被公布在
如果您不希望這些私密性內容被百度收錄,一方面可以通過Robots協議加以限制;另一方面,也可以聯系webmaster@baidu.com進行解決。
4:我的網頁為什麼會從百度搜索結果中消失?
百度並不允諾所有網頁都可從百度搜索到。
如果您的網頁長時間無法從百度搜索到,或者突然從百度的搜索結果中消失,可能的原因有:
A. 您的網站所在
B. 您的網頁內容有不符合國家法律和法規規定的地方
C. 您的網頁不符合用戶的搜索體驗
D. 其他技術性問題
以下的說法是錯誤的和毫無根據的:
A. 參與了百度競價排名但未續費,會從百度搜索結果中消失
B. 參與了其他搜索引擎的廣告項目,會從百度搜索結果中消失
C. 與百度旗下網站產生了競爭,會從百度搜索結果中消失
D. 從百度獲得的流量太大,會從百度搜索結果中消失
5:什麼樣的網頁會被百度認為是沒有價值而不被百度收錄或者從現有搜索結果中消失?
百度只收錄百度認為有價值的網頁。任何網頁在搜索結果中的去留變化,都是機器算法計算和調整的結果。下述類型的網頁,百度明確不會歡迎:
A. 網頁做了很多針對搜索引擎而非用戶的處理,使得用戶從搜索結果中看到的內容與頁面實際內容完全不同,或者使得網頁在搜索結果中獲得了不恰當的排名,從而導致用戶產生受欺騙感覺。
如果您的網站中有較多這種頁面,那麼這可能會使您的整個網站的頁面收錄和排序受到影響。
B. 網頁是復制自互聯網上的高度重復性的內容。
C. 網頁中有不符合