一、什麼是需求滿足

1.1 什麼是需求滿足

　　用戶來搜索“章魚保羅”，就文本相關性而言，搜索引擎只要返回和“章魚保羅”內容相關的結果就可以了，這樣用戶是否滿意呢？
　　用戶甲：聽說章魚帝掛了，來看看最新結果，怎麼全是8月份的，往後翻頁中…
　　用戶乙：今天同事們在討論章魚哥掛了，章魚哥是啥？我又out了，來搜索一下章魚帝生平事跡是啥，怎麼全是最新的結果，沒有章魚哥的介紹啊，變換個query看看
　　用戶丙：我是鐵桿球迷，看完章魚哥，再看看足球相關的吧，魯尼，傑拉德是否又進球了，怎麼連個相關推薦都沒有，還得我親自輸入。
　　用戶丁：找個章魚哥的頭像用一下吧，一定很拉風，怎麼全是結果沒有方圖呢，這麼扁的圖怎麼用啊
　　用戶戊：換個章魚哥的壁紙，也許下次買彩票能發大財，咦，怎麼全是小尺寸的圖…
　　（以上信息通過分析2010-10-27用戶session得出。）
　　籠統的說，用戶向搜索引擎表達他的需求，搜索引擎理解用戶需求，提供各不同的需求下的資源，這整個過程可統稱為需求滿足。簡單說，就是除了基礎文字相關性之外的rank工作，都屬於需求滿足的范疇，也就是說，提供給用戶的檢索結果，不僅僅要求在字面上是和用戶輸入的文字相關的，還要滿足用戶的各種不同需求。
需求滿足在rank體系中所處的位置：

1.2 為什麼需要需求滿足

　　用戶通過query表達了自己的需求，而對於大部分query來說，尤其是具有隱含需求的query，僅僅字面匹配的查詢結果未必能夠滿足其需求。目前我們的排序系統是主要是基於文本相關性這個維度的，權值體現了query中的term與obj的相關程度，在這個體系下，相關的結果未必能夠滿足用戶需求。
　　例如前面提到的“章魚保羅”的例子，顯然，這些需求在文本相關性這個維度下很難解決，尤其涉及到突發時效性需求，泛需求等。

1.3 需求滿足包含哪些工作

　　從上面的例子中，可以看出，需求滿足需要解決時效性需求問題，多需求問題，相關推薦，size需求，素材類需求，浏覽引導等問題。除了基礎文本相關性以外的rank策略以及為了這些所做的query分析工作可認為屬於需求滿足的工作，另外還包括前端結果展現與用戶引導浏覽的工作。
　　Image需求滿足，按照不同的維度，可以劃分為如下幾個方面：
　　　　a.需求識別
　　　　b.資源建設
　　　　c.需求調權
　　　　d.結果組織與推薦
　　　　e.用戶引導交互

二、需求滿足如何做

　　需求滿足要解決的核心問題：
　　　　需求識別
　　　　資源建設
　　　　需求調權

2.1 需求的識別

2.1.1 需求的類型

　　識別query有哪些需求，以及需求的強弱，是最基礎的工作。首先要有需求的體系，能完備的描述各種需求，其次是如何識別這些需求，把每個query的需求對應到這個體系中去。
　　基於統計的需求識別
　　通過對大量的數據統計分析，可以識別出query有哪些方面的共性。可供分析的數據很多，比如用戶行為數據，點擊反饋，檢索結果等。
　　比如：搜索“章魚保羅壁紙”，通過統計用戶點擊圖片的長寬數據，發現用戶點擊的圖片，大部分是長寬比較大的圖片，而“章魚保羅頭像”則恰恰相反。
　　又比如通過分析大量用戶的檢索數據，發現相當部分的用戶在檢索“章魚保羅”之後，又檢索了足球相關的關鍵詞，那麼可以識別“章魚保羅”和足球有著很高的關聯度，在給用戶推薦相關搜索時，可以插入足球相關的推薦。

　　 專名&需求詞
　　判斷query中包含專名或者需求詞等關鍵詞，是最直接的方式。比如“章魚保羅頭像”，用戶在query中顯示的表達了頭像方面的需求，其中就包含了尺寸方面的需求，頭像是需要小尺寸的圖，如右圖所示，這時候出一張大的圖片就不符合用戶需求了。
　　 時效性需求
　　時效性需求的識別，主要是通過用戶檢索量的突發以及資源數的突發來判斷。
　　檢索量的突發，可以通過累積每個query的每天的用戶檢索頻率，用連續多天的用戶檢索頻率，計算當天檢索量和歷史比較，是否有突發，進而判斷是否有時效性需求的強弱。資源數方面的判斷，可通過類似的方式挖掘。
　　比如“章魚保羅”，在世界杯期間，該query，以及相關query的檢索量，相比世界杯之前，用戶檢索量有了爆發性的增長，並且持續保持在高檢索量的狀態，則可認為是有時效性需求的query。

2.2 需求的滿足

　　識別出query有哪些需求，下一步的工作就是提供相應的資源。

2.2.1 資源的挖掘

　　如何獲得滿足需求的資源，是需求滿足的另一個核心問題。在資源上，通過某一個或者幾個特征組合，能夠把滿足要求的資源和不滿足要求的資源區分開，找到用戶需求需要的資源，去掉不滿足要求的資源，是主要的工作。
　　內容屬性特征
　　對內容屬性維度來說，可以分為底層的物理特征，中層的物體識別和高層的語義特征。
　　對於底層的物理特征，相對比較簡單，包括尺寸，顏色，格式，清晰度飽和度等，中層特征，有人與非人的，色情圖片的，整車的識別，手機圖片的識別等；對於高層的語義特征，包括場景的識別，圖片風格的識別，情感的識別，比如是室內還是室外，是否非主流風格等，都可以作為資源篩選的特征。

　　 話題屬性維度
　　話題屬性維度，是指動物，植物，帥哥，美女，軍事，體育等等各種不同的話題，我們希望把圖片能按照這樣一個分類進行一個劃分。
　　比如，通過這個分類，我們可以知道哪些圖片是頭像類的，哪些是壁紙的，哪些是足球體育相關的。用戶在搜索“章魚保羅”時，可以推薦足球相關的資源。
　　 時效性資源的收錄

　　時效性資源，可以很容易的通過收錄時間來判斷，和非時效性資源區分開。時效性資源的來源一般包括新聞站點，各大論壇，bbs等社區類網站。

2.2.2 需求調權

　　明確了query的需求，挖掘了滿足需求的資源，那麼如何把滿足需求的資源rank到前端呢？
　　對於各種不同的需求維度，都有自己的調權的策略。比如“章魚保羅壁紙”，我們識別出有尺寸方面的需求，那麼可以把尺寸比較大的圖片，進行加權；又比如時效性的需求，可以直接在前三頁插入的時效性庫的結果，這是因為時效性需求是一個強需求維度，簡單的加權，不能保證結果調整到前三頁。
　　目前這種策略直接疊加的調權方式，優點是簡單，直接，缺點也比較多，最大的是不可控，一個維度上的調權，會對最後結果造成多大的影響，他說的話分量有多大，不知道。