什麼是消噪?
消噪是搜索引擎預處理過程中的一個基本步驟,消噪是在搜索引擎抓取完網頁在預處理過程中經過提取文字、分詞、去停止詞後進行的,指的是搜索引擎識別出網頁上對計算頁面排名沒有意義的,比如導航條、版權文字說明、廣告等等區塊。
搜索引擎需要處理的網頁數量非常龐大,而這部分無意義的內容也是非常大的,為了節省計算資源,更快的計算,搜索引擎在預處理時會將這些內容識別後剔除出去,這個過程就叫做消噪,而這些剔除的內容就叫噪音。
搜索引擎消噪原理
搜索引擎的消噪一般而言都是對於同一個網站的,搜索引擎不會因為某個網站的某個部分是噪音而判定另一個網站的對應部分也是噪音,而針對一個網站,現在搜索引擎的消噪原理可分為三類:
1、基於可視化信息原理。是指利用頁面中元素的布局信息,從而能夠利用布局信息對頁面進行劃分,保留頁面中間區域,而其它區域則認為是噪音。
2、基於網頁結構原理。即根據html標簽對頁面來分區,分出一些頁頭、導航、正文、廣告等等的區塊,只抓取正文等重要的部分。
3、基本模版原理。指的是從一組網頁中提取出相同的模板,而後利用這些模版從網頁中抽取有用的信息。
SEOer如何利用搜索引擎消噪原理
一、如何人工減噪?
想要減噪就需要從搜索引擎的消噪原理著手,根據搜索引擎原理可以進行如下人工減噪工作:
1、搜索引擎會基於可視化信息識別噪音,因此我們在建設網頁時如果想搜索引擎盡快消噪就應盡量遵循通用的原則,將正文內容安排在頁面中間區域,符合一般網站的規律,而不要弄一些非常個性化的頁面,增加搜索引擎識別噪音的難度。
2、搜索引擎會基於網頁結構識別噪音,既然是根據網頁HTML標簽來,那就是先抓取後區分,那麼這些與正文無關的內容如果不被抓取不就是減噪了?所以很多無用的區塊如頁頭、廣告、版權聲明等內容可以通過JS調用來實現,因為這些區塊在站內都是重復出現的,特別是廣告、版權、評論這些。一旦被收錄就要大量的消噪處理,甚至會造成重復。不過有一點一定要注意,就是放入JS的板塊一定要是你不想被抓取的板塊,可別把需要參與排名的內容也去掉了。
3、搜索引擎會基於網頁模版識別噪音,這一點都是針對同一個網站而言,一個網站的模板一樣,可以讓搜索更快的處理噪音,因此我們在建設網頁時應盡量采用同一套模版,尤其是在改版的時候不要輕易動模版,以幫助搜索引擎識別噪音區塊,試想一下,如果網站每個網頁的模板都不一樣,那麼搜索引擎對於每個頁面都需要重頭到尾的識別,大大增加處理時間。
二、如何進行人工加噪?
有人可能要說了,都說了減噪了,那加噪還不容易,減噪反過來就可以了,如果你這麼想。那木木SEO就要說了,這不神經嗎?告訴你如何減噪了,反過來用這加噪,故意讓文章不在中間區域?每個頁面重復無用內容?每個頁面用不同模板?肯定不是如此。人工加噪一般是希望自己網站上的內容被搜索引擎認為是原創,在正文區適當加噪可以“迷惑”搜索引擎。而加噪與減噪是相反的,加噪主要是針對不同的網站與網頁。
下面就是一些加噪方式:
1、模板與其他網站的不一樣,這就是為什麼建議大家不要和別人用一樣的模板,這樣可以避免網站模板的重復。
2、在正文標題下生成文章的發布日期、作者、來源等相關信息,這一般都是獨一無二的,比如盧松松博客文章底下也是有文章來源的。
3、在正文區左側或下部調用相關文章、推薦閱讀等模塊,這樣的站內調用產生的文字與鏈接也應該是區別於其它網頁的。
4、在正文區調用相關標簽,這樣產生的標簽文字和鏈接也是原創的,也是獨有的,這一點盧松松那也有。
注:相關網站建設技巧閱讀請移步到建站教程頻道。
收藏本文