關於新建站點如何快速的被百度收錄,是很多SEOer在網站剛剛上線時最為關注的一個問題。並且收錄的快慢也成了領導頻繁追問的一件事,那如何通過使用百度鏈接提交工具快速的收錄我們的新站呢?今天我們請到了智聯招聘的SEO負責人-趙彥剛為大家分享他的心得! 在
關於新建站點如何快速的被百度收錄,是很多SEOer在網站剛剛上線時最為關注的一個問題。並且收錄的快慢也成了領導頻繁追問的一件事,那如何通過使用百度鏈接提交工具快速的收錄我們的新站呢?今天我們請到了智聯招聘的SEO負責人-趙彥剛為大家分享他的心得!
在介紹鏈接提交工具之前,最先開始做的就是在百度站長平台對新站點進行驗證,只有驗證成功後我們才能使用百度站長平台的鏈接提交工具以及其他的更多工具。驗證新站點的基本流程如下:
1、登錄百度站長平台(http://zhanzhang.baidu.com/)後,選擇左側“我的網站”欄目目下的“站點管理”選項,然後右側點擊“增加網站”如下圖:
2、這時,跳到添加網站的環節中,分為兩步,一是輸入你新站的域名,再進行對網站的驗證工作,如下:
上圖中,重點需要說明一下,如紅框中的文字,最好是驗證我們的主域名(像www.zhaopin.com這種)這樣後續再添加二級域名的時候直接選擇子鏈添加即可,不用再對網站進行驗證。另外如果主域名是vip站點,該子域名也會繼承主域名的vip權限。否則就要單獨進行驗證,也不會有這種vip權限繼承的能力。輸入主域名之後我們直接點擊下一步,選擇我們驗證網站的方式(文件驗證、HTML標簽驗證、CNAME驗證),並按照說明部署到我們的站點,點擊驗證按鈕。
當網站通過驗證之後,我們就可以使用鏈接提交工具了,目前鏈接提交工具分為自動提交和手動提交兩大塊,手動提交顧名思義自己手動復制粘貼去提交,相對簡單,我就不做過多說明。而自動提交中又分為:sitemap、主動推送、自動推送三種方式。三者都是將站點自身的URL自動推送至百度,而後等待百度爬蟲進行對頁面的抓取。最終的目的是一樣的。如果對這三種自動推送的安裝方式不熟悉的話,可以參考該鏈接(http://zhanzhang.baidu.com/college/courseinfo?id=267&page=2)進行配置安裝。本文我重點聊一下三者的注意事項和區別:
Sitemap提交:在配置sitemap文件時,無論是txt格式的文本文檔還是還是xml格式的文件。都不建議將其sitemap的文件名命名為sitemap.txt或sitemap.xml這麼大眾化且誰都能夠知道的文件名。如果你這樣設置,你的競爭對手或需要你網站內容的人很容易就能拿到你所有的頁面url。出於保險起見還是使用一些自己定義的較復雜的文件名。每一個url都必須包含http://,文件中包含的url不得超過5萬條,單文件大小不得超過10MB,一個站點最多提交5萬個sitemap文件,超出5萬個不再處理並會提示“鏈接數超”。如果是通過子域名的形式驗證的站點。那麼主域名下的sitemap文件是可以包含該域名下的所有域名的url的。
主動推送:對比sitemap而言在及時抓取上推送更快、發現更快、抓取更及時。如果是時效性文章不排除其收錄速度達到一瞬間的效率,這裡特別建議一下,最好是主動推送我們網站第一時間產生的新內容給百度其效果更佳;主動推送是有推送數量的限制,盡可能的不要推送重復的內容給百度。這樣會大大浪費自己的可推送資源。
自動推送:是我們將一段js代碼部署到我們的每一個網頁中,當有用戶進行訪問時,觸發了這段代碼,這段代碼自動將當前頁面的url推送給了百度。需要注意的是這段代碼無論是在PC站還是在移動站均可使用。是一個非常及時、便捷的輕量級鏈接推送工具。
在6月22日的時候,智聯招聘上線了一個新的站點。該站點實際上是在21日上線的。但由於還要線上調試,在21日是robots封禁了所有爬蟲的抓取。卻由於網站早在建設時就添加了自動推送的代碼,然後造成了21號上線,還沒有解禁爬蟲,百度爬蟲就來抓取了,並且收錄了首頁。如下圖(負責該站點的同事保留了截圖):
所以大家也看到了,由於自動推送的安裝,網站只要被訪問,立刻就推送給了百度,爬蟲第一時間抓取,然後快速收錄,這效率,還能有誰?
這只是第一天21號,然後在22號我們又將主動推送配置上了。然後其效果在百度站長工具的抓取頻次中是可以看到的,如下圖:
這是新站上線第二天,主動推送配置後的第二天,我們把事先准備的內容頁以及列表頁都利用主動推送一次性進行了推送。然後上圖就是其明顯的效果了。當然後續抓取的下降也是和我們每天發布的文章數量有直接關系。在6月28日又提交了sitemap,當天的抓取如上圖結尾處,又漲了上來。下圖是爬蟲訪問sitemap所提取的url數量,其效果不明覺厲!
當然,為什麼三者建議一起使用呢?下面說下Sitemap、主動推送、自動推送的區別:
sitemap是一個可以容納大體量、歷史數據的容器。它將我們網站所有的url裝在了裡面。個人覺得快速的抓取並不完全指望sitemap的提交方式,但對於已經產生的文章、現有的列表頁、tag標簽頁等都是最佳的選擇,當我們的頁面發生變化時,主動推送並不一定會再次推送,因為畢竟主動推送承擔更多的是對新產生頁面的及時推送,最重要的是有最大推送數量的限制;再說自動推送。如果你對歷史頁面進行了修改,沒有被訪問。那麼根本不會觸發自動推送js代碼,當然也就不會推送給百度。所以,歸其根本,sitemap是對已經產生的文章頁、現有的列表頁、tag標簽頁最大的助推工具。
主動推送,雖然有推送數量上的限制,但我們推送後的抓取速度已經通過智聯招聘的新站例子很好的诠釋了。所以主動推送更多的應該承擔對新產生的URL的及時推送作用。
自動推送,頁面被訪問了,就會被推送過去。那麼被訪問的和沒被訪問的就是熱門頁面或冷門頁面的概念。冷門沒被訪問我們有sitemap,以及冷門頁面產生時的自動推送。但對於熱門頁面,用戶都喜歡的頁面而言。在搜索引擎上也會有很大的需求,這類頁面是我們獲得流量的重要頁面,他們如果沒有被收錄,除了sitemap、主動推送外,還可以更頻繁的利用自動推送進行推送。這樣被抓取或者收錄的幾率又會大多少呢?而且這個相對sitemap和主動推送實現的成本更低些,加段代碼就搞定,何樂而不為呢?
所以,綜合上述的案例也好,三者的區別也罷。強烈建議你將其三個自動推送工具進行安裝,並讓三者協同工作,將抓取和收錄價值最大化。