在關鍵詞分布策略的排名方面,除了站外的錨鏈接促進排名以外,剩余比較重要的因素就是網站內部中的密度和分布策略了。
在之前的《TF-IDF算法在SEO中的衍生應用》一文章中,談到一個與密度和詞頻有關的算法,叫做TF-IDF。很多朋友說這篇文章依然比較深,不知道如何入手。這裡我們結合該一下Vector Space Model模型,用實戰來講解關鍵詞分布策略,由於Vector Space Model的復雜性,我對該模型就不做額外的介紹了,有興趣的朋友可以自己查詢。
同時為了方便我的博友查詢詞的權重情況,我做了一個excel表格,可以下載後自行更改查詢關鍵詞權重,找到最佳密度策略。
這裡我們首先設定幾個條件:
1.實戰針對谷歌,因為谷歌對錨鏈接給予的權重比較低,方便我們做測試。
2.實戰采用的“關鍵詞分布策略”這個長尾和本頁面做為案例
3.實戰對比的網頁是:www.***.cc/blog/lanzhouseo/keywords-fenbu/ 。該網頁目前在谷歌中排名第三 在不對兩個網頁進行任何外鏈促進排名的情況下,看最終排名結果(實際中上面網頁中的內容已經被轉發多次,積累了一定的頁面權重)
4.Google的總收錄量為100億
一、分詞
我們首先將該長尾區分為“關鍵詞”、“分布”和“策略”三個詞。搜索引擎中的分詞方式可能與我們實際主觀理解的不同。但為了講解這個理念和進行這個實戰,我們暫且將該長尾分為以上三個詞。
分詞後我們查詢競爭對手的網頁,得到詞頻數分別為:
關鍵詞:40次
分布:16次
策略:5次
(注:這裡推薦使用《Lynx浏覽器在線版》先對頁面進行html到文本的轉換,然後使用ctrl+f進行查找即可方便的查詢多個關鍵詞的詞頻)。
二、計算權重
結合TF-IDF算法我們分析出: 這裡我們得到了競爭對手在以上長尾中的權重總得分,為3.2286。接下來我們要對我們的關鍵詞密度做一個優化處理。
這裡我幫大家做了一個excel表格,大家可以下載。表格分上下兩部分,上面部分可以填入競爭對手的情況,下面部分可以輸入自己網站的情況。然後將總分值進行對比,找到符合自己網站的最佳關鍵詞密度。
這裡我略過算法部分,直接出結論:“關鍵詞”、“分布”、“策略”這三個詞,每個詞出現14次,或一起出現14次,是最優密度,權重得分為4.0126,如果再多,就會出現權重下降的情況。(其實按照算法,如果一起作為一個短語出現,即使只同時出現1次,也是同樣的得分。但往往我們在網頁內容創作時無法做到同時出現,所以要分別計算關鍵詞權重以及他們的總權重)。
下載:詞權重查詢表
三、分布
關於基於算法的策略,我們首先應該確定有幾個地方必須出現:
* 標題(完全匹配出現)
* 描述(匹配出現)
* 正文第一段落(最好完全匹配出現)
* 正文最後段落
其次我們應該確定還有些地方應該出現:
* 正文自然分布(可以不完全匹配)
* 圖片alt描述(完全匹配出現)
由於我是一邊寫作一邊進行測試,現在查詢了一下次數,已經全部超標。於是回頭修改一下。其他朋友可以確定自己需要在文章中出現的次數,然後再進行寫作,這樣會容易和簡單一些。
最後值得注意的一點就是,在密度方面我們要掌握好詞頻的上限。一般來說掌握在15次以下為佳。再多有堆砌作弊的嫌疑。
以上就是我在內容創作時采用的基於TF-IDF算法和Vector Space模型而采用關鍵詞密度和分別策略。一般而言,該關鍵詞策略對谷歌有非常好的效果(比如假象做為競爭對手的那個頁面,已經排在第三)。而對於百度來講,更注重關鍵詞的錨文本外鏈。但無論如何,我們要先贏在基礎和細節上。SEO本來就是一項關乎於網站細節的工作。
感謝 AimarYang 的投稿