最近用火狐打開我的網站,發現URL後面會出現一個圓圈,裡面有個“C”,不知大家是否注意到,越來越多的網站(尤其是Wordpress搭建的網站),在Firefox中都會出現這個圖標。如圖:
裡面是個C字母,alt提示“Current location matches the specifed canonical page”。
打開某些網頁時,此標志又會變成藍色,alt會提示“Go to the canonical page at http://…”。這個標志原來是canonical (權威鏈接標記)標簽在起作用,早在09年2月份,Google,Yahoo及Microsoft三大搜索引擎聯合推出了一個旨在減少重復內容困擾的方法,這對於廣大站長來說不啻是個好事情,不用再擔心因為網站上有重復的內容而影響到網站頁面的權重了。
造成重復內容的原因有很多,最常見的便是多個url地址指向了同一個頁面,比如:wordpress平台下的一篇日志頁面,包括了文章及評論內容。每個評論都可以有個固定的鏈接地址,如http://www.hiw3c.com/website-seo/#comment-01這樣的鏈接格式,如果有多個評論的話,則每條評論的鏈接都類似於上述格式,只是commentID號有所不同,這些鏈接其實都是指向同一篇文章的。蜘蛛來爬時,便會依次爬行一遍,這篇文章下如有10條評論,則爬了10次相同的頁面文章,相當於做了多次重復的工作,嚴重影響了抓取的效率,及耗費了帶寬。
重復內容造成的結果必然是蜘蛛不願意來爬,不同的url指向同一個頁面,也會影響到該頁面的權重。
比如文章鏈接:http://www.hiw3c.com/website-seo/和http://www.hiw3c.com/?p=220兩個URL不一樣,但是內容一模一樣。重復內容容易造成搜索引擎的懲罰,所以作為網站管理員和SEO人,需要考慮避免這種重復內容對搜索引擎優化不友好的效果的產生。
現在我們可以在該頁面的header區加上一句:
來聲明,該頁面中此url為權威地址。相當於給所有指向此頁面的地址做了個301轉向,那麼搜索引擎讀到此標記時,便自然會以此地址為主。
注意的是,該標簽只能作用於同一個域,不同域是不起作用的。也就是說如果文章被其它網站抄襲,也不會因為這個標簽而給你的原文章帶來權重。
另外,你如果想通過canonical把其它一些不重要的頁面指向某個重要的頁面,以此來達到增加某頁的權重,這個想法也是危險的,Google是可以檢測出來的。
再有就是如果你沒有加canonical標簽的話,搜索引擎們也會自已去判斷哪個地址是權重地址,只是既然要與搜索引擎打交道,那我們為什麼不按照標准去表示一下友好的態度呢?
所幸的是,在我們使用的WP系統中已經有插件支持啦。在WP插件Platinum SEO和SEO All In One中,都有關於這個canonical的選項。只要將對應的選項選上,則生成頁面的時候,會自動幫你產生這個標簽。在最新的WP2.9版本中已經支持,不在需要插件安裝就可以實現canonical標簽。下面我整理了代碼,需要的朋友直接復制就可以使用。
如果你的WP版本在2.9之前,需要通過插件(上面已經提到)或者手工 Hack 主題的 header.php 文件來使得博客支持。如在主題中加如下的代碼:
在 WordPress 2.9 發布之後,WordPress 已經默認支持這一標簽了,我們無需做任何動作,主題就支持這一標簽。我們可以在 WordPress 的源文件 wp-includes/default-filters.php 看到如下的代碼:
add_action( 'wp_head', 'rel_canonical' );
因此 WordPress 是調用 rel_canonical() 這個函數來輸出 rel=”canonical” 標簽的 HTML 代碼。 如果你還想使用以前自己的方法,那麼你可以通過下面代碼屏蔽掉它:
remove_action( 'wp_head', 'rel_canonical' );
除了canonical鏈接標簽,對於Google來說,你也可以在重復內容的頁面的部分加入NOINDEX標簽,但是很顯然,對於很多具有重復內容的動態網址來說,這個標簽很難派上用場。對於Yahoo,你甚至還可以通過Robots-nocontent語法來告訴Yahoo搜索引擎機器人哪些內容是最有用最新鮮的。除此之外,英文雅虎站長工具Yahoo Site Explorer還具有動態網址參數管理功能,不妨也可以登錄上去設置一下,以幫助Yahoo搜索引擎更好地識別網站上是重復內容。