這篇訪談有點早了,是今年3月份時的事。Matt Cutts針對Google的爬行,索引機制以及對301重定向,重復內容處理的問題做出了些回答。訪談的原文比較長,SEOmoz有人以插圖的形式很好的再現了這次訪談的大致內容,比較直觀,這裡我進行下轉載。
#1. 關於爬行和索引
關於索引問題,我想應該很多朋友都有體會,為什麼我的站Google收錄的很少?為什麼我發的反鏈Google都沒有收錄?
Google目前的索引量到底有多大,大家可以在Google裡搜索a試試,從這個結果應該能看出個大概。
About 25,420,000,000 results (0.17 seconds)
然後,根據資料,截止到2007年2月,互聯網上已經發現的網站數量是108m,810,358個。
我們暫且拿當今的Google索引量,除以兩年前的網站數目,也就是平均下來,每個站的Google收錄量不到300。那麼實際情況呢?
很多時候,並不是Google沒有發現你的頁面或者反鏈,只是覺得這些頁面或者反鏈不夠重要,沒什麼必要加入到他們的索引數據庫裡以供用戶查詢時返回結果。
那麼什麼樣的頁面才是重要的頁面?Google又是怎麼判斷的呢?PageRank是這份插圖所列舉的一個例子。
#2. 站內重復內容
這裡提到了盡量使用canonicalization來避免站內重復內容導致的索引問題。
#3. 關於aff鏈接
通常情況下,直接用AFF鏈接也不會輸出link credit。
#4. 301跳轉無法傳遞全部PR或者鏈接權重
Google官方年初就已經公開說明了301跳轉時權重會有所損失
Matt Cutts: That’s a good question, and I am not 100 percent sure about the answer. I can certainly see how there could be some loss of PageRank. I am not 100 percent sure whether the crawling and indexing team has implemented that sort of natural PageRank decay, so I will have to go and check on that specific case. (Note: in a follow on email, Matt confirmed that this is in fact the case. There is some loss of PR through a 301)。
說說我自己最近的一次301,是站內的301重定向跳轉。之前有個站拿XsitePro做的靜態頁面,後面轉到WordPress後,花了一個多月的時間才慢慢恢復(其中也有我自己的原因,頁面地址首字母大寫沒注意先),也有人說Mayday更新後也對301跳轉傳遞權重有影響。[來源]
另外,如果有朋友有機會轉移域名的,可以試下跨域名的canonical標簽,Google在09年底開始支持這個標簽,其後便在10年年初降低了301跳轉的作用。也許是用301重定向用來作弊的人太多,總之感覺這個做法比較像Google的習慣,啟用一個新的解決方案來逐步替換掉老的實現同樣的功能。
更多關於canonical標簽的資料請Google。
#5. 低質量的網頁內容會影響你的索引
Autoblog就是一個很明顯的例子。做英文SEO時,這種類型的垃圾站不是說你裝幾個插件用scrapebox發兩下就能有好的收錄表現。Google也有類似對新站的考察期,這點Autoblog Blueprint上也有講到。
#6. 關於PageRank Sculpting
之前很多人利用nofollow來控制PR流動,以此來提高特定頁面的權重/排名,這項技術被稱為Pagerank Sculpting(PR剪枝)。之後Google修改了nofollow的規則。
Matt Cutts: So what happens when you have a page with “ten PageRank points” and ten outgoing links, and five of those links are nofollowed? Let’s leave aside the decay factor to focus on the core part of the question. Originally, the five links without nofollow would have flowed two points of PageRank each (in essence, the nofollowed links didn’t count toward the denominator when dividing PageRank by the outdegree of the page)。 More than a year ago, Google changed how the PageRank flows so that the five links without nofollow would flow one point of PageRank each.
更直觀點的
圖片來源:http://www.cnblogs.com/shuchao/archive/2009/10/14/pagerank-sculpting.html
所以這次Matt Cutts再次申明了:Pagerank Sculpting並不是一個好主意。
訪談全文:http://www.stonetemple.com/articles/interview-matt-cutts-012510.shtml