作為我們優化人員,可能你會在日常的優化中收到關於站點有重復內容的警告。筆者今天在本文中將闡述關於如何處理重復的內容,來確保不會對你的搜索引擎排名照成影響。首先可能你想知道關於重復的內容有什麼含義。
重復的內容簡單的說就是在你的站點上兩個不同的URL地址有大量相同的文字。這種情況可能發生在你想提供給你的用戶一個友好的打印頁面,你為你的用戶添加一個沒有額外的廣告和導航的頁面,來方便用戶打印,但是這樣的話原始的頁面和打印的頁面就會被搜索引擎認為是重復的頁面。即使是你的站點的附加的移動站點也可能會被認為是重復的內容。等等情況都很容易出現重復的內容。當然我們不排除你是人為的故意添加重復的內容,因為大量的不同的url地址的重復內容可能會為你的站點帶來更多的流量。
如果重復的內容這麼常見到,那麼你可能想知道谷歌會如何處理這些重復的內容?答案可能會比較復雜,因為答案取決於谷歌的算法是否認為你的內容是否是為了欺騙搜索引擎而重復的。
如果谷歌的算法確認你是為了欺騙系統來獲得更多的流量而使用重復的內容的話,那麼你的站點將會受到懲罰。甚至可能你的站點會被谷歌刪除。
如果谷歌認為你的重復內容並非“惡意”,他們會簡單的挑選其中一個頁面來顯示在搜索結果中。這意味著,可能上文筆者提高過的你的打印頁面被抓取顯示,但是含有廣告頁面的網頁並不會顯示。你的網站訪問者可能看不到你真正想讓他們看到的頁面。
有幾種方法可能確保你想要顯示的網頁被搜索引擎抓取的。最簡單的方法就是使用noindex標簽,來使你的重復的頁面不會被搜索引擎抓取。當然我們也可以通過Robots.txt文件,來防止搜索引擎的蜘蛛爬行某些領域的目錄文件,達到屏蔽重復頁面的效果。
一個成功的站點需要注意的問題有很多。關於重復的內容這個問題是我們不能忽視的重要問題,合理的處理重復的內容,才能使你的站點獲得更好的發展。