在開始閱讀這篇文章之前,您需要知道的是,任何針對英文Google 的算法調整最終會遷移至中文Google,類似的算法調整在不久的時間內百度也會跟進,所有提升搜索引擎用戶體驗的工作不管哪個搜索引擎都會去做。
在開始講Google Panda 之前,我們先來了解下Google Panda 的來歷。09年的時候Google進行了咖啡因(Google Caffeine)的更新,主要解決了谷歌的抓取和索引速度。讓谷歌可以獲取的更加新鮮的內容(比如我的博客,一般會在3分鐘內被谷歌抓取和索引)。但是快速的抓取和索引使網頁質量判斷明顯下降,很多無用或者重復性質的內容被索引進去。也就是Google所稱的shallow-content site 膚淺內容的網站,在這些內容裡面大多是偽原創的文章,也可能是一些沒有參考價值的原創的內容。
針對搜索結果頁的頁面質量,谷歌先前推出的Google +1 也是為了解決這方面的問題。但是這對於判斷一個網頁的內容質量肯定不是一個完整的解決方案,於是Google Panda出現了,並且它將不斷的進行算法更新。Google panda的主要目的就是剔除那些低質量的頁面。即一個有效的頁面過濾機制(類似百度的頁面價值判斷)。需要說明的是Google Panda不是針對站點的懲罰,而是通過算法進行排名的調整。與此同時,原創內容和信息將獲得更好的排名,如研究、深度報道和周到詳見的分析等。
Google Panda的設計原理會是哪些?
進行定性研究(這是講的個人,而不是一個很大的問卷),找出它們認為質量差得原因。通過算法將此部分頁面排除掉。
使用結果來定義因素,將谷歌測量出來的低質量的頁面進行分析建模。來匹配哪些質量差的頁面。
從大量的Google Panda的討論文章來看,Google Panda主要的判斷依據是點擊流(Clickstream)、頁面內容(page content)和鏈接概況(link profiles),只要在這三者當中表現優異,就不會被列為膚淺的網站。從大量的分析看,目前Google Panda的適用級別為網頁級別,並沒有細化到關鍵詞級別。同時大量低質量頁面也會在無形中給整個站點帶來影響。
點擊流
准確的說應該是考察的是用戶參與度,或者是用戶針對頁面的反饋信息。主要考察指標可能是:
1、頁面跳出率與頁面停留時間或者回訪率
數據來源:Google Analytics,Google Toolbar和搜索結果頁不同鏈接的點擊時間間隔。
單純的跳出率不能反映頁面的質量,比如說我的博客文章,用戶可能看了一篇文章就達到了預期的效果,如果停留時間可可以作為參考依據。只有當兩個條件(跳出率高且停留時間短)同時滿足時,Google才會判定這個是個膚淺的網站。
2、被大量用戶屏蔽的網站
數據來源:Google Chrome插件:Personal Blocklist (by Google)
Personal Blocklist官方介紹:Personal Blocklist 擴展會將您希望阻止顯示的網址樣式提交給Google。當您阻止或者允許一個網址樣式顯示時,該擴展同時也會將展示此被阻止或者被允許的網址的搜索結果網頁提交給Google。您同意Google可以自由使用此信息來改進我們的產品和服務。
3、社會化網絡當中的鏈接流行度
數據來源:Google自己抓取主流的社會化網絡中的鏈接,如Twitter、Facebook、delicious等。
頁面內容
Google肯定會針對頁面進行分析,主要考察的是頁面中信息量。可能考察的信息為:
1、網站或頁面是否存在大量的重復內容
2、網站或網頁內包含的原創內容的占比
3、是否有大量的實質內容很少的頁面存在
4、頁面是否充斥大量無關廣告,影響信息的接收
5、頁面內是否有明顯的SEO痕跡,有填充內容存在
6、如果是模板頁面,模板頁面的共有部分的數據量
鏈接情況
1、社會化網絡中鏈接的流行度(前面已經提及)
2、是否存在大量的SPAM鏈接
如何應對Google Panda的更新?
1、查找網站內流量質量最差的頁面,並將這些頁面區隔開來。設法修改你的低質量頁面,但是不要太過,如果太過了容易招來懲罰。
2、給你網站的頁面分類,按類別去查看數據,比如說廣告數量、低質量內容百分比。按照情況進行修改會對搜索引擎屏蔽。(對於Wordpress的站點,可以參考下我的網站的Robots.txt文件哈 http://www.biaodianfu.com/robots.txt)
3、如果您的站點是采集過來的內容,嘗試移除他們或使用robots.txt來禁止Google 爬取,並停止采集,手動添加原創內容。
4、修改網站內的鏈接,保證每個頁面只有一個唯一的鏈接。保證鏈接的唯一型。
5、修改那些過度優化的頁面。去除重復堆積的文字等。
6、做一些提高用戶體驗的修改, 讓頁面具有更好的可讀性,如修改字體大小,字體樣式,字體顏色等
7、在頁面上添加用戶可能感興趣的內容,提供提供相關內容的鏈接。
8、到社交網站上推廣你的站點,或在網頁內添加社會化按鈕便於用戶分享。
9、檢查網站廣告的覆蓋率,減少頁面中廣告的數量,去除彈出廣告。
10、停止SPAM行為吧,SPAM傷身!
【相關閱讀】
專題閱讀:2011搜索引擎排名因素調查報告