眾所周知,花瓣網是一個圖片采集分享的網站,其網站內容多數都是網友通過采集工具采集自其他網站,其內容原創度極低。花瓣網的內容完全脫離的原創而存在,雖然脫離了原創,但花瓣網卻在百度上擁有8900萬的驚人收錄量。
若按眾SEO屌絲的seo“原創為主,外鏈為輔”的seo優化思維,那麼花瓣網作為一個ucg圖片分享網站。其海量的采集內容首先就與“原創”背道而馳,那麼在其驚人的收錄量背後又藏著什麼樣的秘密呢?今天Ian帶大家走進花瓣網,一起來鑒賞花瓣網的“SEO藝術”。
1、花瓣網的Robots.txt文件:先來看看搜索引擎到訪花瓣網後先看到的robots協議裡面的內容,這是分析網站收錄的重要步驟,可以讓我們大概了解這個網站的哪些url是被禁止抓取與允許抓取的。
User-agent: *
Disallow: /oauth/
Disallow: /*?md=
Disallow: /gift/goods/*&
Disallow: /pins/*/zoom/
Disallow: /pins/*/js-share/
Disallow: /?*
Disallow: /js/
Disallow: /css/
Disallow: /img/
#2014-5-26 add
Disallow: /404/
Disallow: /bookmarklet/*
Disallow: /cn/*
Disallow: /fm/*
Disallow: /jiaodiantu/*
Disallow: /sfile*
Disallow: /tag/*
Disallow: /UploaImage/*
Disallow: /zt/*
Disallow: /share_analytics.html*
2、首頁導出url:從花瓣網的所有url中可以篩選出一個重點頁面就是“http://huaban.com/all/”這個頁面,這個頁面是花瓣網驚人收錄的最主要搜索引擎爬蟲入口提供者,當然這不排除花瓣網在站長後台提交了sitemap從而促進了其網站的收錄。
/oauth/weibo/instant_login/ ——微博帳號登錄跳轉鏈接,robots中Disallow“/oauth/”,不允許抓取;
/oauth/qzone/instant_login/ ——QQ帳號登錄跳轉鏈接,robots中Disallow“/oauth/”,不允許抓取;
/oauth/douban/instant_login/ ——豆瓣帳號登錄跳轉鏈接,robots中Disallow“/oauth/”,不允許抓取;
/oauth/renren/instant_login/ ——人人帳號登錄跳轉鏈接,robots中Disallow“/oauth/”,不允許抓取;
/all/ ——最新采集聚合頁面,聚集花瓣網所有網友的采集並實時更新;
/about/ ——關於花瓣,介紹頁面;
/about/#goodies ——關於花瓣,介紹頁面,定位到安裝“花瓣采集工具”按鈕;
/fm/joinus/ ——加入我們,花瓣網團隊介紹與招聘頁面。
3、網站導航結構:花瓣網的導航分類是一個強而有力內容輸出,而且通過整站的導入鏈接,花瓣網的導航頁面(http://huaban.com/favorite/*/)聚集了極高站內鏈接數量,從而跟多數網站的導航一樣擁有了非常高的權重。但花瓣網的導航頁面內的內容跟“最新采集頁面”一樣,是對應著某個分類的實時更新。這再一次地為花瓣網的內容頁面提供了高權重的站內導向鏈接,通過站內鏈接的實時更新促進了內頁的搜索引擎的曝光率與收錄。
4、頁面的頻繁更新:搜索引擎喜歡經常更新的網站,而花瓣網的首頁與導航頁面都遵循著這個規則,通過用戶的不斷采集使得頁面實時地保持更新。
5、用戶產生內容,並讓內容圍繞用戶:不同於一般的機器采集網站,花瓣網的內容都是由用戶進行采集的。這使得其采集的內容都具有極強的標簽(畫板),在玩花瓣網這個平台的時候也不難發現,其編輯人員更熱衷於推薦分類明細的畫板到對應的頻道或首頁。這是因為此類畫板在對應標簽分類頻道中較受用戶的喜歡。通過尊重用戶體驗的原則使得日益強調“用戶體驗”的搜索引擎更喜歡像花瓣網這樣存在“活著的用戶”的網站。
6、用戶與用戶的內容之間的聯系:花瓣網作為UCG網站,其網站多數內容是圍繞著“用戶”、“用戶的采集”、“用戶的畫板”個3個點來建設站內鏈接的。通過這樣的網站站內鏈接結構,使得網站的“用戶”、“用戶的采集”、“用戶的畫板”都能獲得較高的站內權重,令花瓣網的百度收錄獲得了更多的入口。
1、收錄:8950萬
2、索引量:1億1701萬
3、權重:7
4、關鍵詞數:30352
5、預計百度流量:21542
6、外鏈數量:2900萬
7、外鏈覆蓋域名數量:6518
部門構成:運營部、推廣部、內容部、各個頻道運營、編輯部;
花瓣網推廣部總人數10人,其中推廣人員7位,輔助編輯2位,數據分析1位。
花瓣網作為國內最大的ucg圖片分享網站,其內容多數都是采集的,這樣的做法雖然違背了搜索引擎的“原創原則”。但是花瓣網利用其“注重用戶”的原則也獲得搜索引擎良好的關注。
原文