自從百度今年推出一系列針對內容的算法升級之後,很多站長手足無措陣腳大亂大呼無從下手,到底怎樣的內容才是真正的原創?為什麼新浪、騰訊、搜狐等大站同樣是轉載卻被判定為原創?本文以36氪為實例分析說明站內優化的重要性。
提到站內優化,很多站長會不約而同說到文章內容的質量和更新頻率。其實,個人看來,這個理解過於狹隘。百度今年1月份在站長平台發布了一篇資訊《百度已支持Canonical標簽》,不知大家是否確有認真研究,本人已經多次親身證實,此標簽在很大程度上可以彌補內容在原創性上的不足(當然不是100%能夠實現內容的原創效果,這點希望大家明白)。我們來看看百度對Canonical標簽的理解:
一、Canonical標簽有什麼作用?
對一組內容完全相同或高度相似的網頁,通過使用Canonical標簽可以告訴搜索引擎哪個頁面為規范的網頁,能夠規范網址並避免搜索結果中出現多個內容相同或相似的頁面,幫助解決重復內容的收錄問題,避免網站相同內容網頁的重復展示及權重的分散,提升規范網頁的權重,優化規范網頁的排名。
二、什麼是規范網頁?
規范網頁是一組內容完全相同或高度相似的網頁的首選版本。
三、為什麼要指定規范網頁?
為了避免重復內容的收錄,百度會通過算法對網頁內容及鏈接進行識別,對內容完全相同或者高度相似的網頁,會計算出一個系統認為規范的網頁結果建立索引並供用戶查詢。
支持Canonical標簽以後,站長可以通過將 元素和 rel="canonical" 屬性添加到該網頁非規范版本的 部分,為搜索引擎指定規范網頁。添加此鏈接和屬性可以告訴百度:“在內容相同或高度相似的所有網頁中,該網頁為最規范最有價值的頁面,推薦將該網頁排在搜索結果中靠前的位置。
從上文可以看出,Canonical標簽是對網頁的規范性說明,百度蜘蛛在眾多雷同或類似的網頁中,會給予標記Canonical標簽的網頁更高的權重評估。
通過36氪的實例來分析下,Canonical標簽最後的展示效果。
我們site:www.36kr.com,隨機抽取一篇收錄結果來作為樣板來分析:
打開收錄頁面http://www.36kr.com/p/91746.html,我們在源代碼裡有發現Canonical標簽:,但是36氪也有一部分的收錄結果是沒有日期標記的,這說明,僅僅依靠站內的標簽代碼優化,是不具有說服力的,內容還是起著決定性作用。
當我們在做好站內內容建設的同時,如果能在內部代碼上作一點點小小的改動,也許能讓最後的結果大所不同。站內優化,不光光是高原創性高可讀性的優質文章,布局、源碼、頁頭頁腳的設計也同樣需要精心的裝扮。