DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁SEO優化 >> SEO優化集錦 >> 從搜索引擎工作原理折射出的SEO知識(中)
從搜索引擎工作原理折射出的SEO知識(中)
編輯:SEO優化集錦     

在前面一篇文章裡(搜索引擎工作原理折射SEO知識上)有說到搜索引擎的工作原理的前部分也就是如何通過蛛蛛來抓取網絡信息的問題。從中我們也了解到,蛛蛛的一些習性與SEO的一些操作小技巧。在今天的文章中我們會看到更多的有關於搜索引擎的內容,好了廢話就不多說了。

我們都知道蛛蛛它畢竟還只是個程序而已,他做的工作不會通過網站的前台來分析一個網站內容,而是通過網站的代碼來進行抓取信息的。而在網站的源代碼裡我們會看到好多html、js等一些程序的語句。而蛛蛛他只會對裡面的文章感興趣,也就是說他只提取網頁裡的一些文字。有些朋友可能就會說到了,那我們還寫什麼代碼?代碼不是起不到作用了嗎?

其實不是這樣的,在網站的標簽優化中我們都知道比如H標簽、nofollow標簽、alt標簽等。這些標簽還是能在蛛蛛抓取我們網站信息的時候起到強調與修飾作用。比如遇到圖片的時候,但蛛蛛並不能識別圖片裡的信息,那麼我們就會考慮去設置一下 alt標簽來幫助搜索引擎來識別圖片裡的信息;為了讓網站的一些權重不分散,我們在必要地方給鏈接加上了nofollow。

既然搜索引擎蛛蛛是對網站文字特別感興趣,那對於中文SEO優化來說。是不是會有個概念性的東西在這裡面,那就是“分詞”

最簡單的一個例子,比如我們中文裡面的“網站優化”這四個詞,在百度搜索引擎數據詞庫裡,其實是把網站與優化兩個不同的詞分開來存放的。當用戶來搜索網站優化這個詞的時候,搜索引擎的步驟也就是把網站這個詞庫裡的網頁信息與優化詞庫裡的信息做一個交集來檢索與排名。這點後面還會有說到。

在說到分詞的時候我們不得不提一個東西,那就是我們如何來看網站一個分詞情況:在百度搜索引擎裡面搜索“寧波何濤SEO”在出面的搜索結果裡面,我們看下網站的那個快照如圖

我們是不是很容易的看到在快照裡的顯示結果百度把這個詞分成了三塊不同背景色的詞組。這個只是其一,我們也可以在百度的搜索結果裡看到只要是我們搜索的詞,都會有標紅的情況。這個也是分詞的另一種表現形式。

有些朋友可能會說了,你說的那些是個別情況,我們在現實過程去搜索的詞遠遠比這個復雜,而且可能還會有一些語氣助詞等。做為越來越完善的搜索引擎而言。他們其實也早就考慮到了這個問題,首先是因為這些個語氣詞在搜索過程中實際上是起不到任何作用的。在搜索引擎進行預處理的時候,他們也會把這些詞給過濾。一方面是減少檢索負擔,另一方面也是為了增加內容的准確度。

在搜索引擎把蛛蛛抓取來的信息進行歸檔之前,還有個程度是必不可少的,他必須得做內容的重復審核。一重意思:搜索引擎必須把同一個網站裡的數據進行刪選。有一種情況:比如有人在搜索我的網站寧波SEO的時候,在排名結果中第一頁會出現我們的首頁與內容頁的可能性。其實做為一個成熟的搜索引擎來說,這種情況是要避免的。因為這樣的內容對用戶的用處不大,就相當於同一個內容給排了兩次。第二重:對於不同的網站而言,因為網絡上的內容那是成千上萬的。這裡面就會出現兩個不同的網站,但內容相同的情況。就是我們常說的網站內容轉載的問題,搜索引擎也會考慮到重復的信息進行刪選。

有了上幾步的重重審核,接下來的就是得做個有效的數據整理。我列兩張表給大家看下就明白了:

正向索引

文件ID

內容

文件1

關鍵詞1,關鍵詞2,關鍵詞7。。。關鍵詞x

文件2

關鍵詞1,關鍵詞7,關鍵詞8.。。關鍵詞Y

。。。。。

。。。

文件N

關鍵詞6,關鍵詞50.。。關鍵詞z

倒排索引

文件ID 內容 關鍵詞1 文件1,文件2,文件10,。。。文件m 關鍵詞2 文件1,文件4,。。。。文件n 。。。。。 。。。。。 關鍵詞7 文件1,文件2,文件8.。。。。。文件o

我簡單的解釋一下上面的表格裡的意思:正向索引表格,也就是搜索引擎臨時不能直接用於排名的數據表。這個裡面他是按照文件來分配每個關鍵詞的。也就是說主鍵是文件。我們再換到第二張表來看,搜索引擎已經把關鍵詞做為了主鍵,這也與我們搜索某個關鍵詞來找自己想要的信息一樣。我們可以發現:當用戶搜索關鍵詞7的時候,這個時候搜索引擎就沒有必要對每篇內容再進行檢索,它只要做的就是從關鍵詞的詞庫裡面提取出文件1,文件2,文件8等。

至少這幾個文件又是如何來排名的,這個也是下次我會寫出來的,感謝大家花時間來看我的文章整理。

文章摘自寧波何濤SEO博客:http://www.nb-seoer.com/post/154.html

感謝 何濤 的投稿

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved