這篇文章論策討論的是中文分詞技術,對seo具有指導意義。可以通過中文分詞的研究獲得百度的長尾流量。
1、百度分詞是根據內容中,第一次出現關鍵詞相關詞為標准來分的。例如”正浩生物科技有限公司“這個詞
如果你的正文中第一個出現的是”正浩“這個詞,那麼你的頁面上的關鍵詞就會被拆分成”正浩”和“生物科技有限公司“兩個詞,標題中一定要包含關鍵詞,但不一定要完全匹配,但內容中出現的關鍵詞是要跟百度分詞完全匹配的,在完全匹配中又會根據文件URL路徑的深度來進行排序,在關鍵詞都完全匹配的情況下,比如說目錄比文件有優先權,根目錄下的文件要比二級目錄下的文件有優先權,完全匹配的會排在前面,然後再是部分匹配的。
2、在關鍵詞沒有完全匹配的情況下,如果有分詞,比如說:“SEO資料庫”這個關鍵詞,有一個網頁裡第一次出現的關鍵詞是“SEO”,並且有較高的關鍵詞密度,但是這個網頁中卻沒有”資料庫“這個關鍵詞,而另一個網頁裡第一次出現的關鍵詞是“資料庫”,那麼這個網頁的關鍵詞就會被拆分成 “SEO” “資料庫” 兩個詞,雖然第二個網頁裡包含有“SEO” “資料庫” 但是第一個網頁還是會排在第二個網頁的前面,這說明關鍵詞的前面部分是最重要的。
3、關鍵詞第一部分出現的頻率是排名的關鍵,比如說 ”SEO 資料庫“,如果兩個網頁都沒有完全匹配,都是含有兩個分詞,那麼“SEO”這個分詞密度高的網頁將會排在前面。
4、如果完全匹配,但是關鍵詞第一出現是在頁面內容的最後面部分,那麼這個網頁的排名將比前面這些頁面還要低。所以關鍵詞盡早在內容中出現是非常重要的。
5、百度根據第一次出現的相關關鍵詞切詞,如果第一次出現的相關關鍵詞是關鍵詞的尾部,那麼就從後面開始切,如果是前面部分就從前面開始切,也就是根據網頁內容的順序和反序進行分詞,順序的時候就是以關鍵詞前半部分為起點,反序的時候就是以關鍵詞的後半部分為起點。例如:”正浩生物科技有限公司“ 這個關鍵詞,如果你的網頁中第一次出現的關鍵詞是”正浩生物“,那麼你這個頁面的關鍵詞會被拆分成”正浩生物”和“科技有限公司”兩個詞。
6、可以根據百度的切詞原理,自己來選擇比較好作的關鍵詞頭部(也就是調整你網頁內容中第一次出現的關鍵詞)。也就是進行人為切詞,百度會進行從前往後判斷,也會從後往前面切。
7、如果在關鍵詞沒有完全匹配的情況下,並且關鍵詞出現得不完整,比如說:正浩生物科技有限公司,網頁的內容包含的關鍵詞中如果沒有“正浩”這個詞,那麼切詞就會從“生物”開始,但是這樣的網頁都會排在比較靠後了,因為你關鍵詞的前部分都沒有包含。
8、缺詞的情況下下,如果與不缺詞的網頁進行比較的話,那還是根據切詞前部分的密度進行排序,也就是說按照切詞的順序,如果切出來的詞,前部分的密度比後部分的密度比例是關鍵,例如一個網頁中,前部分與後部分關鍵詞的比例是1:2,另外一個網頁的比例是1:4,那麼當然前面的那個網頁排名要靠前。同樣在缺詞的情況下,切出來前詞短的排名有優勢。
希望以上這些能幫助大家了解百度的關鍵字排名規則。