近日地溝油事件引得全國各大媒體紛紛爭相報道,人人喊打(除了買油的,做地溝油生意的人),什麼是地溝油,地溝油對人體的壞處等詞一時間成為大家網絡熱搜詞,有圖為證,9月12日之前,地溝油檢索從日均700-1000一下子飙升到14日29262。可見大家對地溝油的關注度還是蠻高的。
中國的食品安全這裡不多說什麼,只能說我也非常關心食品安全,所以一激動搜了下“吃地溝油有什麼壞處”本想知道吃地溝油對身體的危害大不大的,再說通常情況下來說好處和壞處那是天壤之別的。但是當我在百度裡搜索時,驚人的結構出現了,截圖如下
第一條除了百度知道呈現了與吃地溝油有什麼壞處相近的吃地溝油有什麼危害這個標題及相關結果,但是第2、3、4個結果竟然是吃地溝油的好處,天哪,這個好處和壞處差別很大,對用戶的誤導作用很大呀,百度難道分不清好壞?
再搜下吃西瓜有什麼壞處,出來的結果是正常的。搜索食用油地溝油有什麼害處也是正常的。
由此產生幾點猜想:
第一百度對於“吃地溝油有什麼壞處”這個詞中的地溝油給予了很大的權重,而後面的“壞處”一詞是模糊匹配,沒有嚴格計算,並賦予多少權重,或者說沒有進行偏移量計算。
第二:百度對於剛發生的事件,計算沒有那麼嚴格,所以計算,匹配的不是那麼精准,這個結果有興趣的朋友可以持續觀察,我猜想過幾天這個結果應該就正常了。
第三:百度人工處理了地溝油 + 壞處的結果,去掉。所以第一條,你可以看到很多 地溝油+危害,說明地溝油 + 壞處 應該是有精准匹配的,但是從第二條就是組合了,說明人工處理過。