網站內容與互聯網中內容的相似度太大,網站內容的重復是百度K站,降權的一個重要原因。不少新站長都不知道怎麼樣才算是網站內容重復,個人覺得重復不是單單指一兩篇文章的重復,應該還有別的方面。
重復情況:
一篇文章出現好多個URL的時候,不管這篇文章是否是原創,但是百度仍然會給予懲罰。如果你的是采集站,那麼你就要小心了,網站內容多有重復的有可能會被當作是采集站給處理掉,前些日子百度推出的綠蘿算法就是專業打擊采集站的。
也有這樣的一批網站,大多以圖片為主,文字很少,而圖片的URL都指向了同一地址,這樣的網站當蜘蛛來的時候很難保證會不會重復的收錄。再者網站的板塊出現的重復性,板塊裡面的內容從不更新,或者每個欄目裡面的文章都是一樣的,這樣的網頁就會重復度很高。
一些網站沒有設置404頁面,404頁面對蜘蛛是友好的表示,給予用戶一種提示,如果你這頁刪除了而沒有設置404或者設置錯了,那麼在蜘蛛那裡這個頁面還是存在的,來了就會進行收錄。
檢測方法
有些站長問到,既然內容重復的現象這麼多,那怎麼檢測呢?檢測很簡單,不少站長在寫軟文的時候,就在自己的軟文裡面復制一段話,放在百度裡面搜索一下,出現大量的紅字,也就是大家總說的飄紅,這就說明這文章重復度很高了。當然,也可以用title:+文章標題,找出相同的文章。或者也可以利用工具,判斷一些相似頁面的相似度,一般相似度80%就要進行處理了。
重復內容解決
現在的搜索引擎百度非常看重用戶體驗,文章內容是用戶要找的有價值的內容,所以文章的原創度要高,假如你的網站是一個采集文章比較多,簡單偽原創的網站,那寧可收錄少一點,也要增加原創內容。固定欄目的文章內容可以隨即調用,以避免頁面有重復的內容出現。我要說的剩下兩點大家就都知道了,就是標題、關鍵詞、描述每個頁面都需要不一樣的,不管是用規則設置還是手動修改,切勿相同,404是肯定要設置的,防止搜索引擎收錄死鏈接。以上由樂芬科技www.52lefen.com/wangzhanjianshezhishi/ 原創編輯。