百度是全球最優秀的中文信息檢索與傳遞技術供應商,公司號稱“全球最大的中文搜索技術提供商”。中國所有提供搜索引擎的門戶網站中,超過90%以上都由百度提供搜索引擎技術支持,現有客戶包括新浪、搜狐(chinaren)、Tom(163.net)、騰訊、263、21cn、上海熱線、廣州視窗、新華網、北方時空、西部時空、重慶熱線、吉林信息港、大慶信息港、東方熱線、湖南信息港、南陽信息港、順德信息網。
百度搜索引擎使用了高性能的“網絡蜘蛛”程序自動的在互聯網中搜索信息,可定制、高擴展性的調度算法使得搜索器能在極短的時間內收集到最大數量的互聯網信息。百度在中國各地和美國均設有,搜索范圍涵蓋了中國大陸、香港、台灣、澳門、新加坡等華語地區以及北美、歐洲的部分站點。百度搜索引擎擁有目前世界上最大的中文信息庫,總量達到6000萬頁以上,並且還在以每天幾十萬頁的速度快速增長。由於後台應用了高效的信息索引算法,大大提高了檢索時的響應速度和承受大時的穩定性,百度搜索引擎對超過6000萬網頁檢索一次的本地平均響應時間小於0.5秒。
百度公司(Baidu.com,Inc)於1999年底成立於美國硅谷,它的創建者是資深信息檢索技術專家、超鏈分析專利唯一持有人――百度總裁李彥宏,及其好友――在硅谷有多年商界成功經驗的百度執行副總裁徐勇博士。
百度搜索引擎的特點
1. 基於字詞結合的信息處理方式。巧妙解決了中文信息的理解問題,極大地提高了搜索的准確性和查全率。
2. 支持主流的中文編碼標准。包括GBK(漢字內碼擴展規范)、GB2312(簡體)、BIG5(繁體),並且能夠在不同的編碼之間轉換。
3. 智能相關度算法。采用了基於內容和基於超鏈分析相結合的方法進行相關度評價,能夠客觀分析網頁所包含的信息,從而最大限度保證了檢索結果相關性。
4. 檢索結果能標示豐富的網頁屬性(如標題、網址、時間、大小、編碼、摘要等),並突出用戶的查詢串,便於用戶判斷是否閱讀原文。
5. 百度搜索支持二次檢索(又稱漸進檢索或逼進檢索)。可在上次檢索結果中繼續檢索,逐步縮小查找范圍,直至達到最小、最准確的結果集。利於用戶更加方便地在海量信息中找到自己真正感興趣的內容。
6. 相關檢索詞智能推薦技術。在用戶第一次檢索後,會提示相關的檢索詞,幫助用戶查找更相關的結果,統計表明可以促進檢索量提升10-20%。
7. 運用多線程技術、高效的搜索算法、穩定的UNIX平台、和本地化的,保證了最快的響應速度。百度搜索引擎在中國境內提供搜索服務,可大大縮短檢索的響應時間(一個檢索的平均響應時間小於0.5秒)
8. 可以提供一周、二周、四周等多種服務方式。可以在7天之內完成網頁的更新,是目前更新時間最快、數據量最大的中文搜索引擎。
9. 檢索結果輸出支持內容類聚、網站類聚、內容類聚+網站類聚等多種方式。支持用戶選擇時間范圍,提高用戶檢索效率。
10. 智能性、可擴展的搜索技術保證最快最多的收集互聯網信息。擁有目前世界上最大的中文信息庫,為用戶提供最准確、最廣泛、最具時效性的信息提供了堅實基礎。
11. 分布式結構、精心設計的優化算法、容錯設計保證系統在大下的高可用性、高擴展性、高性能和高穩定性。
12. 高可配置性使得搜索服務能夠滿足不同用戶的需求。
13. 先進的網頁動態摘要顯示技術。
14. 獨有百度快照,
15. 支持多種高級檢索語法,使用戶查詢效率更高、結果更准。已支持“+”(AND)、“-”(NOT)、“|”(OR)、“site:”、“link:”,還將繼續增加其它高效的搜索語法。