什麼是分詞技術?分詞技術是搜索引擎針對用戶提交查詢的關鍵串進行的查詢處理後,根據用戶的關鍵詞串用各種匹配方法進行的一種技術。分詞技術最早研究發明的是谷歌,也是最成熟的技術,中文分詞技術大家都很清楚的。雖然谷歌是分詞技術的創始者,但在中文比之英文要復雜得多,有多種語義,所以中文分詞技術這方面是百度領先。
中文分詞有三種方法:
1.字符串匹配的分詞法
2.詞義分詞法
3.統計分詞法。
在這裡就不詳細介紹了,實例為主。我們以“中文分詞技術”為例,假設它是網頁的關鍵詞,如何對它進行分詞來使我們的網頁排名更靠前,讓更多人搜索到。百度分詞:字符串匹配的分詞是“中文分詞技術”,詞義分詞是“中文分詞”、“分詞技術”,統計分詞是“中文”、“分詞”、“技術”。一個詞百度可以分這麼多個,而我們要提取對網站有用的詞語,百度也會根據詞語的匹配、詞義的匹配、詞語出現的頻率,決定根據那些詞語捕捉網頁。
在百度輸入“中文分詞技術”,排在第一頁上的都是“中文分詞技術”為標題的網頁,除了第一位網站,是“中文分詞”為標題。可能有人會覺得奇怪,其實不然在標題意思相近,文章的被關注率,網站主題,網站的外鏈及權重就決定了它的排名,當然這不是我們現在探討的。我們從搜索結果可以看到,紅色的字體大都為“中文分詞技術”,說明在網站條件相當的情況下,先顯示標題匹配的網頁。然後在往後看,用百度快照查看網頁,你會發現,“中文分詞技術”、“中文分詞”、“中文”字體為黃色,“分詞技術”、“分詞”為藍色,“技術”為綠色。百度分別給它們的權重是黃色》藍色》綠色,這樣我們就知道如何選取關鍵詞了。優先選擇“中文分詞技術”、“中文分詞”(“中文”這個詞就不用考慮了,跟我們的文章主題不符),然後再選擇“分詞技術”,雖然“分詞技術”權重稍低,但符合我們文章主題。
通過分詞技術,結合文章主題與網民的搜索習慣,我們可以為自己的網站確定關鍵詞,其實這也是seo的由來。分詞技術是搜索引擎的核心技術之一,如果你在這方面有研究的話,在提上網站排名方面,就能如魚得水了。
感謝 free狼 的投稿