前幾天看到千鳥的一篇博客《標簽的語言粒度》,頗有收獲,不禁來談談自己對標簽的一些看法。
不得不承認,不管標簽(Tag)多麼時尚,關鍵詞(Keyword)多麼老土,這兩者之間的基本意義都是一致的,都是用來描述一個事物的多重屬性。以至於,如果有用戶問我標簽是什麼東西的時候,我仍然會告訴他:“就是以前常說的‘關鍵詞’,換一種時髦的叫法而已”。
當然,我這麼說只是方便普通用戶容易理解,兩者之間仍然有重要差異。
標簽,是一種分類的工具,標簽的出現是為了解決浏覽時的難題。在浏覽網站的時候,如果內容太多太雜,我們可以使用標簽來對內容進行過濾,只看自己想看的標簽。用標簽浏覽時,通常會按照發表的時間新舊順序排列。
而關鍵詞,是用來輔助搜索的工具,關鍵詞是用來描述一個東西和自己想要找的東西匹配程度的高低。用關鍵詞搜索時,搜索引擎會根據網頁和查詢關鍵詞的匹配度來提供搜索結果。排在最前的,是最准確的,而不是最新的。
所以,flickr會給每一個關鍵詞都提供一個RSS源允許用戶訂閱某個tag,而google不會給關鍵詞提供RSS,因為沒人會每天都去搜同一個詞,看看有什麼新網頁(SEO專家除外)。
標簽是web2.0的時髦特征之一。老外寫的web2.0書裡,總是喜歡拿出flickr的tag的例子來吹噓一番,說tag如何如何解決問題。好像只要用了tag,分類問題就迎刃而解了。可惜,tag的初衷雖然美好,但實際情況要復雜得多。
不論是中文還是英文,都會有大量的同義詞、近義詞、單復數等等,語義相近,但表達方式不同的情況。這種語言的隨意性,大大影響了標簽的使用效果,局限了標簽系統的適用范圍。
我整理了一下,標簽系統在下面三種情況下是比較合適的:
總之,要麼想方設法約束標簽的隨意性,要麼就是有海量的數據,可供挖掘整理,否則標簽的威力會因為標簽的隨意性而大打折扣,相同語義的不同表達方式,會讓用戶產生更多的困惑。在內容數量不多的情況下,標簽往往不如分類系統來得有效。