有很多原因導致相同的的內容刊登在不同網站,重復內容有機會能夠讓搜索結果顯示相同資訊,讓搜索結果的質數下降。為避免這情況發生,Google 表示會采取不收錄重復內容網頁的措施。當然現實之中,大家都經常可發現重復內容的網頁出現在搜索結果內,尤以國內網站主。或者可以理解為Google 未算做得太徹底。不過作為內容的原作者,一定不希望自己的網站不被收錄,而被復制的網站卻收錄了。為此,我們不應把重復內容的問題掉以輕心。
一 站內和誇站重復內容
重復內容的網頁可分為站內和誇網站兩大類,前者大多是由於制作網站時的疏忽或內容管理系統的設定不當,導致不同URL顯示同一內容,Google網站管理員說明中心很詳細介紹減少站內重復內容的方法 。在以上網頁中有一小段其實是關於誇站重復內容的,如果你一不留神,可能錯過了。這小小一段文字其實才是重復內容最受網站制作者和SEOers 關注的地方。
二 誇站重復內容的成因
為什麼不同網站會刊登相同內容呢?原因有幾個:
A.原作者把內容轉發到其他網站或論壇,以增加閱讀率或作推廣宣傳之用
B.social bookmark /網志聯播等服務,特別是中文網站的服務,不少以自己網域的URL來顯示其他網站的內容,例如365Bloglink
C.網站參加了blog network,自動供稿(這就是「聯合顯示」)
D.不問自取你的網站內容,稱這行為「采集」,這是現在網站經常出現相同內容的主因.如何令Google相信你是原作者?
誇站重復內容最大問題是Google 有機會不能分辨誰是原作者,結果原作的網站反而不被收錄。因此解決的方法就是使搜索引擎知道你是原作者。 Google官方blog提議我們參考《 Ranking As The Original Source For Content You Syndicate 》一文。其實最重要而自己可以控制的一點,就是在自己的原文中加入這網頁的URL。
三 入原文的URL
最簡單的方法,就是在原文的網頁上加入這網頁的自我連結(例如在結尾加入)。有些網站采用這方法,但如果你覺得這方法不好看,就要謹記以下的方法:
當你手動把內容轉發到其他網站或論壇,請記得在文中加上這原文的URL
一般social bookmark、網志聯絡、blog network 和部分采集網都是讀取網站的RSS Feed 取得你的網站內容,因此你可以只在RSS Feed 加入原文的網址,Word***ess 用家可使用RSS 相關的插件,例如Better Feed和RSS Footer 。Feedburner用戶則可使用Feedflare做到相同的效果 。
四 另一些自保方法
上述的方法不能阻擋刻意偷取內容的網站,采集網站一般以程式讀取網頁的內容,加工減料去除原文網址。因此我建議大家制作了新內容後,應該盡快通知搜索引擎,希望可以第一時間收錄你的網頁資料。網志通常都有Ping 的功能,可以即時通知搜索引擎。而如果你的網站不是blog,則應該盡快更新你的sitemap,及用搜索引擎的站長工具,通知他們你的網站更新了,詳細方法可參考《 把網站加入到Yahoo及Google的方法(三) 》 。