《 頁面重構中的語義化 》所表達的好像不太好理解,我們可以換一個角度來看看。
在“表格布局”1 的時代,大家所使用的布局方式都是表格,沒有其它的方式可以選擇, Dreamweaver的可視化操作大大的簡化了頁面制作的過程,而且當時雖然網絡情況比現在差得多,但並沒有多少人會去關注頁面性能這塊。搜索引擎對於表格布局也無能為力,只能過復雜的算法去把內容抓取出來,而且很難知道哪些內容是重點,因為會正確使用標簽的頁面太少了。那搜索引擎如何得知頁面的重點呢?沒錯,就是頁面頭部的信息,在這個區域,標簽是有語義的,明確的指出頁面的標題、主要內容、作者、版權等等信息。
接著,WEB標准進入了國人的視野,它帶來了顛覆性的改變,從頁面制作方式到思維方式的種種改變。推薦使用“CSS布局”2 代替原先的“表格布局”,讓原先讓人遺忘的許許多多Html標簽重新被認識,並以較嚴格的方式使用,在一定程度上規范了頁面書寫的形式,像“標簽閉合”、“標簽、屬性使用小寫”、“使用DTD”等等。搜索引擎也很支持這種方式制作的頁面,因為算法不用像以前那麼復雜了,可以很簡便的得到內容的主次,提高抓取的質量。這也是為什麼WEB標准會更利於 SEO 。
那麼,如果標簽足夠表達內容的語義,頁面內容的語義就能以標簽的方式被傳遞給更多的用戶。因此, 所謂語義化,就是盡可能的理解要表達的內容,選擇適合的標簽,將內容轉換成浏覽器認識的語言,通過浏覽器傳達給用戶。 可以理解為將內容的語義通過標簽的方式表現。
寫過 XML 的同學可能體會會深些,在XML中,標簽是可以自定義的,但這些標簽的定義都是為了讓讀取更容易,或許可以看下常見的RSS,它就是一個標准化的XML格式,但RSS裡使用的標簽都是有語義的,你可以通過標簽很清楚的看出哪部分是代表什麼的。雖然(X)Html看起來比RSS復雜得多,但在搜索引擎看來,好的頁面不就是一個XML?
做為對《 頁面重構中的語義化 》的一個補充,歡迎討論。
1 使用表格單元格的劃分來進行頁面布局的方式。
2 使用樣式的定位屬性進行布局的方式。