1997年夏,李彥宏工資已經漲到了年薪8萬美元,但他總是覺得沒意思。一次學術會議上,李彥宏遇到了Infoseek CTO(首席技術官) 威廉·張。李彥宏拉威廉·張看ranklink. com。微軟、雅虎的人也在場。李彥宏輸入chinatimes,排在第一位的就是中國時報的網站,再搜IBM,IBM官方網站排在第一。“當時任何一個流行的搜索引擎都做不到。”威廉·張立即給李彥宏開了更高的工資,邀請他加入Infoseek,李彥宏欣然接受,離開華爾街來到硅谷,出任Infoseek主任工程師。這其實就是現實生活中類似於鏈接關系的應用。要判斷哪個頁面最具權威性,不能光看頁面自己怎麼說,還要看其他頁面怎麼評價。
李彥宏1997年就提交了一份名為“超鏈文件檢索系統和方法”的專利申請,這比GOOGLE創始人發明PR要早得多,不得不說這是非常具有前瞻性的研究工作。在這份專利中,李彥宏提出了與傳統信息檢索系統不同的基於鏈接的排名方法。
超鏈文件檢索算法的出現,在用戶搜索時,將得到的基於鏈接的相關性與基於關鍵詞匹配的傳統相關性綜合使用,得到更准確的排名。
在今天看來,這種基於鏈接的相關性計算是搜索引擎的常態,每個SEO人員都知道。但是在十三四年前,這無疑是非常創新的概念。當然現在的搜索引擎算法對鏈接的考慮,已經不僅僅是錨文字,實際上要復雜的多。這份專利所有人是李彥宏當時所在的公司,發明人是李彥宏本人。
2000年1月由李彥宏創立於北京中關村,致力於向人們提供“簡單,可依賴”的信息獲取方式。“百度”二字源於中國宋朝詞人辛棄疾的《青玉案·元夕》詞句“眾裡尋他千百度”,象征著百度對中文信息檢索技術的執著追求。
在1997至2000年間,李彥宏對自己的超鏈理論也通過論文著作逐步解析和完善,先後在IEEE(美國電氣與電子工程師協會)刊物上發表,並不斷在互聯網搜索領域研究新的解決方案,隨後李彥宏的新技術發明又申請了數項專利。
「5月20日」 百度大更新
官方(LEE)首次回復與更新有關問題:我們的系統在更新數據的過程中出了點狀況,問題被及時發現後,已經於5月20日中午修復,目前還有部分內容由於緩存等原因正在更新中,很快就會恢復正常。
事件背景: 早上一查,什麼排名都沒了,立馬看了下別人的站怎麼樣了,上一些seo論壇看了下大家反映的情況,總結下來基本情況是:獨立小站企業站全軍覆沒,門戶站,分類信息,博客,供求信息等熱門網站都上來了.目前情況未明,對策就是一邊照常維護,一邊觀察情況,淡定.
「8月27日」 百度發布SEO優化指南2.0
這份《百度搜索引擎優化指南2.0》對從事網站SEO的朋友有很好的指導意義。
背景:2010-08-18 百度發布搜索引擎優化1.0
「9月16日」 百度站長平台開放
裡程碑的事件,標志著百度對待站長的態度越來越開放!
「11月05日」 打擊交易平台的買賣鏈接行為
國內有幾家知名度非常高的鏈接買賣站,例如站長交易、阿裡微微等,都已成為百度監控對象,並形成一套相對網站的數據庫,而且也注冊了一系列潛伏的帳號來判斷那些網站是鏈接買賣的活躍帳號,通過人工+技術的方式進行判斷。
「10月23日」 百度打擊超鏈作弊的算法升級
主要對象為意圖通過超鏈作弊的方式操縱網站在百度搜索結果中排名的行為。
「8月22日」 百度預警:打擊采集作弊網站
在站長的反擊聲中,百度方面做出了讓步,這是第一次網頁更新時,通知了廣大站長!
「7月2日」 【裡程碑】6.22和6.28百度K站事件
針對百度大規模K站事件引起了站長的公憤,反百度聯盟在各大站長類論壇呼聲漸高,百度競價惡意點擊鳳巢正在啟動。數10萬草根站長發起惡意點擊百度競價行為。正因此事件,迫使百度首次回應K站問題,也使大部分網站的收錄量恢復提升,同時促使了百度在未來的每次大更新時都會發布公告。
「5月25日」 百度懲罰發布的低質新聞的網站
如果發現新聞站點為了獲取商業利益過度SEO/發布商業廣告/惡意導流/堆砌關鍵詞等,傷害普通用戶的搜索體驗,影響新聞產品專業權威形象的,百度會將其視為低質新聞站。
「5月2日」 百度發布Web2.0反垃圾攻略
為了扼制Web2.0頁面越來越嚴重的垃圾信息、群發信息,以及不斷蔓延的在Web2.0頁面做外鏈、做SEO的趨勢,百度站長平台發布了Web2.0反垃圾詳細攻略。
「4月28日」 百度進行大規模的算法升級和改版
百度搜索失靈問題還上了CCTV4新聞
「4月11日」 百度調整移動搜索排序算法
鼓勵網站運營者與站長進行手機頁的優化,同時新規則還將提升手機APP的排名。
「2月19日」 百度綠蘿算法上線
這一次百度算法終於有了名字!三個類型網站將會受到不同程度的影響:1、超鏈中介,2、出賣鏈接的網站,3、購買鏈接的網站。
「5月13日」 百度異常提醒工具即將上線
超鏈作弊,內容作弊、內容采集、網站被黑、網站被拔毛或是競爭對手惡意做的“垃圾外鏈”,都會收到通知。旨在幫助站長意識到哪些行為不是網站正常運營的手段,從而幫助站長及時的糾正運營問題,避免網站因作弊行為而被搜索引擎懲罰。
「5月15日」 百度星火計劃上線
百度建立了一個“原創聯盟”,這個聯盟的作用不僅僅是展現新聞媒體,另外也可能會簽署某些協議來人工提示那些是原創文章,以避免出現文章版權紛爭。
「5月17日」 百度發布“起源”算法
百度已經抽調大量人員組成原創項目組,致力構建原創環境,推動中文互聯網的前進。同時,百度披露了原創識別系統-“起源”算法的部分細節。
「5月17日」 百度石榴算法上線
本次算法主要針對彈出大量低質彈窗廣告,混淆頁面主體內容的垃圾廣告頁面為代表。這類行業站要注意了:大量低質彈窗廣告主要居中在游戲站、娛樂站、電影站、醫療行業等網站上,而廣告與內容混淆主要集中在下載站上。含有惡劣彈窗、大量混淆頁面主體內容等垃圾廣告的頁面排序會大幅下降。
「7月05日」 百度綠蘿算法2.0更新
打擊明顯推廣的軟文,百度將加大過濾軟文外鏈的力度,對長期發軟文的目標站點進行懲罰,和對這些發軟文的平台(網站)進行懲罰,兩方面雙管齊下,這將直接影響到軟文代發行業和一些門戶站編輯。
「7月20日」 出售二級域名或目錄用於作弊將株連整站
這次是點名道姓了太原新聞網,它出售了二級目錄,並用於淘寶客導購行為。如果這些行業站站長還不注意的話,要麼就被K站,要麼就直接清理出新聞源。
「7月27日」 百度突然減少大量網站收錄與外鏈
據博友觀察,個人博客形勢嚴峻。後來查了下SEO數據風向標,發現今天的百度的數據風向標全部下滑。從圖中可以看出,百度的收錄、反鏈幾乎全線下降。
「8月29日」百度說不存在所謂的大規模“k站”百度在官方論壇發布聲明:1.並不存在所謂大規模“k站”,請站長朋友們安心;2.Site語法查詢為估算值,精確度有限,請站長以百度站長平台索引量工具的數據為准。
「9月6日」百度將嚴厲處罰不相關的靜態搜索結果針對一部分網站利用熱門熱門關鍵詞生成大量的站內搜索結果頁來獲取搜索引擎流量,其中存在大量的不相關內容嚴重損害了搜索引擎的用戶體驗,並且侵占了相應領域的優質網站收益。對於此類網站百度將做出嚴厲的處理。
「12月5日」百度將從12月中旬開始,逐步淘汰“不具備唯一價值”的pc頁鼓勵站長建設移動化資源,以優化移動用戶搜索體驗。這就意味著以後在手機上用百度搜索大量的PC頁面將消失,取而代之的是移動版的頁面。
1.對買**鏈接進行了嚴厲的處罰,對導出鏈接超過40個(一些知名站點不受影響)的網站,如鏈接工廠、垃圾站、半年以內的站所導出的鏈接全部沒有權重,對於不相關友鏈全部降權十分之一左右。
2.增加了對隱藏鏈接的識別,現在網站上的那些隱藏鏈接一律沒有權重了。
3.針對購買GVM、教育機構、事業單位鏈接的行為進行了嚴厲打擊,百度已經建設了GVM、教育機構、事業單位數據庫,對此類網站給予專門的排名,同時此類網站導出的鏈接一律不給與權重。
4.對於針對百度產品進行優化的行為進行打擊,百度產品所導出的外鏈一律沒有權重。
5.百度對在友鏈平台**友鏈的網站所導出鏈接全部不給予權重,百度已經建設了一個友鏈平台的特征庫,比如在chinaz通過了的網站,阿裡微微的網站,阿裡微微自動掛鏈的網站,百度的系統都能自動監控到,發現了以後將這些網站加入**鏈接的網站數據庫,這個數據庫內的網站導出的鏈接都是沒有用的。
6.百度實現了對論壇發帖和回帖用戶的識別,被系統認為是垃圾貼和垃圾回復的(百度根據一些自動頂貼機的頂貼原理和一些萬能回復(就是很常見的回復)搞了一個特征庫,符合這個特征的就會被認為是垃圾鏈接內容)不給予權重,非原創(識別原理和識別原創文章的原理一樣)的回復,同一用戶重復發表的同樣內容的帖子或回復不給予權重。
7.百度會對國外空間和未備案網站加大檢查力度。
8.百度又根據了常見的采集軟件的偽原創方法增強了檢查偽原創的算法,像打亂段落,關鍵詞替換,截取一部分等方法百度現在都能檢測到,百度會針對網站偽原創和垃圾內容所占內容的比例進行處理(具體數額我不知道)而且會把偽原創的內容全部剔除。
9.百度對采集的內容收錄有一個數量限制(具體不知,但是大站沒有影響),達到數量以後就不收錄了。
10.百度對導出鏈接基本沒有但導入鏈接很多的網站加入疑似購買鏈接的數據庫,進行重點監控和人工排查,對於該網站的導入鏈接加入疑似**鏈接的數據庫進行監控和排查。
11.百度降低了外鏈對網站排名的影響,但降到了多大不知道。
12.百度對長時間原創的網站給予高權重。
13.百度分享的權重大大減少(很有可能直接沒了),因為刷百度分享的太多,百度沒有一個有效的解決方法,所以百度分享權重被大大減少,不過等到百度有了一個好的防作弊方法以後,百度分享權重一定很大。
14.僅對高質量博文給予高權重。
ps:高質量認定標准:字數,原創性,非垃圾內容,評論量(同用戶多次發布評論現在百度已經能識別了)。
15.除高質量博文導出鏈接外,其他全部不給予權重。
16.對於堆積字符,詞語等所生成無意義內容百度已經能識別,百度會認為這些內容是垃圾內容,進行懲罰。
17.一些在知名網站發外鏈的方法已經失效(比如通過書簽等等)。
18.百度將以上不給予權重的外鏈行為,視為作弊行為,百度會將這些外鏈加入到以疑似作弊網站數據庫,進行重點監控和人工排查。
超鏈算法升級,外鏈拒絕功能下線,百度自動識別垃圾外鏈(評論、視頻標題外鏈、垃圾博客外鏈、標簽外鏈等)。
百度進一步提高了自身產物關頭字排名的位次,搜羅百度百科百度地圖.百度知道.百度貼吧等屬於百度自己的產品。還有就是和百度合作的網站權重也相應提高了。
百度對信息越真實的網站排名會給予更好的排名。公司性質的網站要比中小個人網站排名更有優勢。
對於一些垃圾站點,剽竊網站.模擬網站一律不給予排名。
網站有彈窗廣告這樣的站點,百度給予降權。
介入D聯盟站點的給予適當降權。
網站頁面.站點裡面有大量JS代碼內容的給於適當降權處置賞罰。
導出的單向鏈接過多,給予降權處理針對鏈接的站點。
友情連接過多的站點,或者是不美觀站點友情連接網站的,給予降權處理。
博客評論和論壇簽名百度目前已經不給予外鏈權重。
對大型門戶網站的外鏈權重有必然的增強,對門戶網站的外鏈權重算法也做出了調整。
新站收錄幾乎不需要有什麼外部鏈接,只要有內容就行了。
更新時間:天天更新是7-9點調整為5-6點,晚上10-12點。周三大更新,調整為每周四大概凌晨4點更新。每月大更新的時間是11號和26號,尤其是26號,更新幅度最大,K站也是最多的。企業站內容較少的話,建議每周四前更新一下內容,內容多的話,最好是天天更新3篇。
百度對於分歧地域.不同城市.不同收集排名位置也有所改變,例如湖南與廣東長沙與深圳電信與網通等排名位置都不盡相同。
公司網站排名較之個人網站排名有優先權。這可能是百度對清理網站低俗內容專項的一種行動,又或者是百度對個人站不安心的緣故所致!
百度認為是垃圾站的排名也欠好。因為有個體網站為了省時.省事.省心,就使用了不異的模板,功效百度調整之後,百度流量就根基上缺失,以至於有些站基本上就沒有什麼流量。
權重高網站要比權重低的網站好很多。對於權重高的網站,在此次調整中不單沒有泛起關鍵詞排名降低,相反獲得了晉升。這可能就是站長日精於勤的緣故吧。
百度對搜素引擎的人工干預進一步加強:如你的網站關鍵詞排名很高,而內容簡單,無更新。雖然從百度獲得的流量很大,假如百度就有可能經由過程人工干預,給你網站關鍵詞降權甚至百度收錄中剔除去。
百度對站點一再的SPM內容進行降權。百度對於網站的原創性要求更高,對文章的質量要求更高。在自己的網站上發布的文章,但文章標題百度更新收錄規則和內容一定要百度下搜索不到的,然後在去各大論壇投稿一樣的。過一會再去百度下搜索看,只如果原創的基本上能排在第一位。還有一些網絡營銷專業人士認為,百度算法調整後,對新站的關愛水平比原來有所加強。
對門戶站的權重比較垂青,這是算法調整最直接得默認。追蹤一些關鍵詞可以看到的一個普遍現象:排名前兩名大部門依然是自力站點,從第三名起都是門戶頁面,直到第二頁起頭恢復獨立站。
百度針對論壇和博客站點導入鏈接降權,論壇簽名已經對百度失效.百度重點提升了自身產品百科.貼吧.知道.辭書.有啊.經驗.文庫等相關內容頁面的權重,現在百度這些產品的內容在第一頁都有浮現,一般都是百度百科和百度文庫。
[3月6日]為了滿足百度用戶的時效性需求,讓用戶更加方便快速地找到所求,百度網頁搜索結果中目前已上線內容發布時間,替代之前的快照時間。將網頁內容的產生時間更精准的告知用戶,降低用戶選擇成本,提升點擊效率,同時也能夠提升網站的轉化率。注意:對於搜索結果頁、列表頁、廣告頁這類頁面,搜索結果中將暫時不展示發布時間。
3月19日【移動搜索】百度LEE漫談移動化
從流量角度講2014年可以說是移動流量爆發式增長的一年。另外我可以告訴大家,有很多行業,移動搜索上的檢索量比PC搜索已經高出很多。當然不同行業並不一樣,大家可以分析一下你們的目標用戶,來決定主要朝哪個方向發力,當然另一個方向也要去做,不要把任何一邊浪費掉。
再有最重要的一點就是,今年百度站長平台增加了重要工作方向,就是支持移動搜索領域,目前百度站長平台內的工具,僅改版和閉站保護未對移動站點開放,我們還計劃開發一些專門針對移動站點的工具,包括我們在線上看到的官網圖標等等,之後移動端都會在站長平台有一個對接。
5月26日從百度取消referer關鍵詞說起
5月26百度站長平台消息.為了提高網絡環境的平安.百度即將取消refer顯示.關於什麼是refer設置.不了解的朋友可以去百度一下.取消refer後將有利於防止第三方竊取流量關鍵詞.對於seo行業或站長領域來說.這不算是什麼好消息.同時也意味著“百度權重”這個SEO參考的規范將不復存在而像站長工具.愛站等關鍵詞工具也很難生存下去.
估計SEO從業者每天都會使用站長工具.用以檢查關鍵詞排名.外鏈等基本SEO數據.實際上站長工具的數據來源都是百度.也就是采集百度搜索結果的相關數據.例如:某個關鍵詞前三頁的排名等.如果百度取消refer顯示.那麼站長工具就很難再采集到更多的SEO數據了這會給SEO人員和個人站長帶來很多的方便.確實自己的網站數據變得更安全了但這明顯是一把雙刃劍.
操作SEO經常要分析競爭對手.記得自從谷歌取消了雅虎外鏈後.搞英文SEO朋友就抱怨.以後再也不能檢查競爭對手的外鏈數據了百度在技術方面一直在效仿谷歌.其實谷歌早已推行了http技術.采集谷歌的數據比百度要更加困難.而如今百度也來這招.估計以後只能檢查自己網站的SEO數據了那個時候SEO會變得更加難做.因為我失去了大量珍貴的數據.沒有數據分析做網站優化就如同盲人摸象.
6月5日為何適配移動站點收錄量如此少
負責PC、移動站點適配的SEOer有沒有被老板責問“為什麼適配工作做了這麼久,移動收錄量怎麼還這麼低”?同行在一起有沒有討論過“百度是不是不待見PC移動適配這種方式?所以收錄那麼差”?好了,在杭州的VIP大講堂上我們有了答案,內容整理如下:
1,PC、移動適配現在有了新名字,叫跳轉適配,即利用單獨的網址向每種設備提供不同的代碼。這種配置會嘗試檢測用戶所使用的設備或ua,然後使用 HTTP 重定向和 Vary HTTP標頭重定向到相應的頁面。
2,對於跳轉適配中的PC和移動頁面,百度收錄了PC頁面等同於收錄了移動頁面,等同收錄的移動頁面不會體現在索引量工具的數據中。也就是說,你在索引量工具中查到的跳轉適配移動站收錄量是偏低的。
3,目前跳轉適配是主流的移動化技術手段之一,百度持全力支持的態度,後續會加大力度提升數據的准確性。
6月8日百度眼中的優質移動站點什麼樣
1.HTML5建站
1.1百度移動搜索歡迎一切適合移動化設備浏覽的網頁,但目前HTML5是最先進的語言,強烈建議使用,能為後面的適配等工作加分不少。
1.2域名設置上盡量簡短,移動站點推薦以m、wap做為二級域名名稱
1.3URL結構上盡量簡短且能夠表達頁面主意,目前動態url對PC搜索已不構成困難,但在移動端,咱們還是先做一段靜態化的工作吧
1.4移動化頁面特征盡量明顯。關於這個問題等待站長學院的相關文章吧,聽說已經有技術大牛在撰寫了。
1.5正確適配,或正確填寫sitemap,或正確標注applicable-device。
2.訪問速度
2.1培訓現場劉院長直接說“3秒以上死”,聽起來很可怕,足以見得響應速度對移動站點是多麼的重要。這個3秒包括網絡時間、服務器處理時間、頁面渲染時間,千萬別超呀!所以我們在選擇服務器、空間的時候要充分考慮速度的因素了。
2.2還有一點培訓上沒有講到,我覺認為非常重要,就是訪問的穩定性,這和PC端是一樣的。我關注過去年廣州沙龍時孫權老師提到的,網站服務器宕機一天對站點的整體排名表現都會有很長時間的影響。
3.死鏈率
3.1百度站長平台上上周發了《百度搜索標准死鏈官方文檔》,最近也反復說這個問題,看來是非常重視的,想想看,用戶在馬路上使用百度移動搜索,點開的結果是死鏈,或者顯示“此內容已過期”也真是夠惡心的——院長說這就屬於死鏈影響搜索用戶體驗,發生這種事情百度會很不開心。
3.2百度這麼重視死鏈,也一直讓我們提交死鏈,搞得我們很緊張,我曾經一度認為只要是報過404的頁面都需要進行提交。後面問了一下劉院長,給我的解釋是這樣的:1,只提交百度收錄的死鏈即可,即以前頁面正常的,被百度收錄後變成404的頁面。2,除了404死鏈,內容死鏈和跳轉死鏈也必須提交。
4.可訪問性
4.1跟《百度搜索網頁質量白皮書》裡說的差不多,網頁不能是死鏈(包括協議死鏈和跳轉死鏈),不能是必須有權限或必須登錄才能訪問的頁面。
4.2不能強迫用戶,這個應該是目前百度比較重視的問題,包括不能要求用戶下載APP才能看到網頁內容等——冰桶算法有一部分就是打擊這種行為的,相信百度後續會加大對這種手法的打擊。
4.3現階段百度還未公開宣傳可以讀懂FLASH、JS、圖片,所以不要將鏈接和文本通過上述方式輸出或表現(這點培訓中沒有講,但是結合現場其它內容,感覺應該加進來提醒大家)。
5.使用體驗
5.1減少用戶獲取內容的成本,一般移動站點使用樹形結構的話,可以控制在三層,即首頁-頻道-內容頁。
5.2盡量減少使用大屏廣告的行為,小心被冰桶掉。
5.3移動網頁面積有限,要在有限的空間裡做大量交互行為是一件很難的事情,這就要看站點的功力了,劉院長在培訓時著重講了交互要爽,大家盡量去看視頻吧。
6.內容價值
6.1百度對移動內容價值的判斷,絕大多數同《百度搜索網頁質量白皮書》裡講的一樣,尤其是內容質量那個篇章,做網站的不幾遍這個白皮書都不好意思跟同行打招呼。
6.2劉院長在培訓現場還強調了一個例子,就是網頁標題上寫的是XXX全劇劇情,但實際頁面上是XXX演員介紹——之前感覺這樣的內容還可以,畢竟都是跟同一個電視劇相關的。私下問了一下劉院長,劉院長說這種情況在百度內部是不允許的,屬於作弊,會被狠狠打壓,大家還是避免為妙。
7月7日 百度移動搜索結果排序傾斜策略簡析
百度之所以一直大力倡導大家對PC站點進行移動化處理,是因為在移動端排序上存在著向移動頁面、適配頁面傾斜的策略,後續這種策略的力度會更大,轉碼頁和PC頁的展現空間將更小。所以提倡大家提高PC頁移動化比例,減少移動流量損失。
10月 百度收錄排名周期更新
百度排名順序由原本的每周調整1次排名,現在1天都有可能3-4次的排名調整。
百度對新站的收錄時間縮短,從以前的半個月到一個月時間,縮短到而今的一到兩周。
新的站點,幾乎不需要去注重外部鏈接數目及質量了,只需要你盡量做好站內內容的質量和經常更新即可。
百度網頁的大更新是以前的星期三更新,更改為每一日更新。
網站收錄頁面有所增加。