重復內容是SEO中很常聽到的一個詞,這些內容有時候是為了方便用戶浏覽而設定的功能,而有些則是系統的因素造成的,如果網站中出現了大量的復制內容,很容易給搜索引擎判斷出並給予處罰,今天和大家總結到底什麼原因導致這些復制內容的出現。
有些復制內容是我們能發現的,但有些我們可能沒有注意到,但這些內容卻實實在在的對網頁的權重以及關鍵詞排名產生影響,本文就根據自己的經驗總結這些原因,希望看了本文能讓大家明白以後應該注意哪些地方,分別從九個方面來進行說明。
第一、網址規范化:如果網址不規范,則很可能會出現重復內容,這些重復內容我們自己感覺不到,比如最常見的就是網站的首頁有多個版本都可以訪問,顯示的結果都是首頁,但對搜索引擎而言,這些URL是不同的,會被定義為重復內容。因此解決的最好辦法就是用301對網頁進行重定向。
第二、復制產品:如果是電子商務類的B2C站點,有些產品會有代理商,因此我們的網頁會被代理商原封不動的復制過去,這就造成了很多一摸一樣的頁面,雖然我們允許代理商這麼做,但從SEO的角度來看,這並不是一個好現象。我們可以引導代理,讓他們網頁加上合適的內容,以和自己的網頁做區分。
第三、打印頁面:打印頁面是很多網站都會提供的一項基本功能,尤其是政府企業類的站點,但如果沒有使用robots.txt禁止抓取這些頁面的話,就會形成很多重復內容和頁面。站在SEO的角度,應該禁止抓取這些頁面。
第四、RSS訂閱:很多網站尤其是博客類或新聞類的網站,都會使用其他網站的RSS種子來自動生成網站的內容,其實這些內容已經在原始地和很多別的網站上出現了。這相當於直接進行了復制,也會造成重復內容。最好的解決方法是不要使用別人的RSS種子。
第五、Session原因:有些網站在訪問時候會定義一個Session ID,以區別不同的訪問者,但是當搜索引擎的蜘蛛在不同的時間訪問網站時,就會形成不同的ID,因為它的參數不同,但是這些ID最終的頁面是同一個,這就造成了不同的URL對應相同的內容,也是造成重復內容出現了一大原因。因此我們可以通過IP來進行判斷,如果是蜘蛛IP,那麼就不要產生Session ID。
第六、內容過少:網頁都會有很多公用的部分,比如導航和版權,以及產品分類等,除此之外就是正文內容,我們判斷網頁之間的區別依靠的就是網頁的內容,但如果網頁中正文內容過少,占網頁中總體比例過小,那麼搜索引擎很可能認為這些頁面是重復頁面。唯一的辦法就是增加內容,比如從功能上、用途上、用戶評論上下功夫。
第七、采集偽原創:大家做站需要更新,很多站長都會去采集別的網站來填充自己的內容,有時也有可能是會員在不同的網站發布同一篇文章,所以這些因素都會被當做是重復內容。這些內容也有可能被收錄,但是過一段時間有可能被刪除掉。這個大家都知道如何做。
第八、網站鏡像:網站鏡像會常用在較大型的網站上,尤其是下載站,需要不同的服務器進行均衡負載,方便了不同地區的用戶浏覽和下載資源,但是一個比較大的危害就是產生重復內容,時常聽到鏡像站被搜索引擎懲罰的例子。所以可以采用JS調用的方法或者是禁止抓取。
第九、排序方式:排序方式尤其在電子商務站點比較常見,比如網站的產品能按照銷量、價格、上架時間、好評度進行排列,但是不同的排列方式可能結果高度相似,只是很小的差別,這也能造成一定的重復內容。最好的解決途徑就是采用noindex,nofollow進行整站屏蔽。
好了,本文就到這裡吧,以後會繼續和大家分享其它相關的知識,歡迎大家和我交流,本文來自深圳網站建設,網址:http://www.zijiren.net/,轉載請保留版權,謝謝!
感謝 深圳網站建設 的投稿