在百度首頁輸入任意關鍵詞搜索之後,我們跳轉到搜索結果頁面,在浏覽器的網址欄我們可以看到很長的一串url地址。那麼,你真的了解這一串url的含義嗎?
s?:搜索
百度搜索結果頁使用了重定向,因此我們看到的不是search.php?這樣的url格式
wd:當前搜索的關鍵詞
即輸入的關鍵詞的urlencode字符串,編碼格式為gbk或者utf-8,默認編碼格式為utf-8。用於作為搜索原料,百度還會經過分詞、判類等操作,不是直接檢索數據庫,這個會在後面的破譯百度系列當中詳細講解。
bs:上一次搜索的關鍵詞
內容格式與當前搜索的關鍵詞一致。用於記錄用戶的搜索行為,記錄該值被用於相關關鍵詞統計、同義詞分析等操作。
rsv_spt:用戶浏覽器類型
值為1或者3(暫時只統計到這兩個值)。用於標記用戶當前使用的浏覽器,IE內核浏覽器為1,非IE內核為1,不過現在這個參數恆為3,還沒有了解到時停用了還是改作他用。
rsv_bp:判斷是第幾次搜索
值為0或者1。當用戶第一次搜索時,該參數值為0;當用戶在第一次搜索的結果頁進行第二次搜索或者更多次數搜索時,該參數值為1。用於記錄用戶的搜索行為,記錄該值被用於校驗搜索結果質量以及相關搜索詞相關數據分析。
tn:搜索來源
該值為網站標記。例如從hao123的百度輸入框搜索內容,將出現tn=sitehao123。記錄該值被用百度統計搜索來源,該來源數據可能被作為決策數據。
inputT:鍵入時間
從打開百度頁面開始到點擊搜索按鈕的時長。該參數被用於記錄用戶搜索行為。
oq:相關搜索的主詞
例如搜索seo是什麼,在底部的相關關鍵詞當中有淘寶seo是什麼意思,當點擊後oq的值就是seo是什麼。該參數主要用於相關詞統計以及用戶搜索行為記錄。
rsp=第n+1次相關搜索
統計相關搜索的次數,例如是第4次相關搜索,那麼rsp的值為3。該參數主要用於相關詞統計以及用戶搜索行為記錄。
f:搜索行為判斷
8為用戶自主搜索,3為下拉框推薦,1為相關搜索。該參數主要用於用戶搜索行為記錄以及關鍵詞統計。
pn:頁碼
值為公差為10的等差數列。用於頁碼判斷,同時也用於校驗搜索結果質量。
cl:搜索類型
值為3時是網頁搜索,其他的值所對應的類型暫時還沒有統計到。該值會影響搜索結果排序。
lm:指定時間內百度收錄情況查詢
值為1時是最近24小時;值為7時是最近7天;值為30時是最近1個月;值為360時是最近1年。
rn:搜索結果顯示條數(Record Number)
取值范圍在10~100條之間,缺省值為10。
ie:查詢輸入文字的編碼
此項設置會影響搜索參數wd的編碼類型。
si:在限定的域名中搜索
主要用於檢索某個站點的百度索引數據,例如想要只得到百度的搜索結果,那麼參數的值為baidu.com。使這個參數有效必須結合ct參數一起使用。
ct:此參數的值一般是一串數字
估計應該是搜索請求的驗證碼,目的暫時還沒有分析出來。
本文首發於優問網(http://www.excellam.com/view/22450.html),轉載請注明版權。
《破譯百度》系列將全程投遞與紅黑聯盟站長網,希望各位站長支持,如有錯誤,請批評指正!