大話HTML DOM與XML DOM的區別與聯系

DIV+CSS佈局教程網 >> 網頁腳本 >> XML學習教程 >> XML詳解 >> 大話HTML DOM與XML DOM的區別與聯系

編輯：XML詳解

本文內容的主題便是，為什麼開發者要認為“DOM Level 1規范的架構”是至關重要的，其突出的重要性在哪裡等等，以及還有Html DOM和XML DOM之間微妙的區別及內在的聯系。

51CTO推薦閱讀：XML DOM新手入門指南

W3C所制訂的DOM Level分為兩大模塊：Core和HTML。第一個大模塊是Core核心，W3C規范是這樣描述Core的：滿足軟件開發者和Web腳本編寫者，訪問和操控產品項目中包含的可解析的Html和XML內容。

第二個HTML模塊，規范描述為：HTML之中特定元素的功能，和恰到好處的、易用的、針對常見性任務的Html文檔操作機制。

以上可見兩者的重要性。同時Html模塊的意義也在於，解決了向後兼容的問題，這在當今符合DOM Level 1的浏覽器中已經可以提供適應的解決方案。

按照這樣的說法，如果您仍然不能理解上述的要義，我們則可以這樣認為，HTML文檔可以使用Core API和HTML API兩者；而XML文檔只能使用Core API。換句話說，HTML與XML重疊的部分有Core API，而HTML API則是不能共享的部分，顧名思義限於HTML文檔所使用。這是我們認識Core/Html的初步認識。

理解DOM Level 1 Core

理解DOM Level 1 Core之要義實質在於將Core看待成為許多節點（Nodes）而組成的文檔（Document），也就是說，此文檔結構中可允許存在著大量的條目項，其每一項都可理解為“節點”。討論該結構可以以兩個方面入手：一、一切皆是節點對象（Node Object，扁平化的角度去理解，flattened vIEw，乃適合於多態下的接口）；二、每個對象繼承於基類節點，實現了節點的接口（interface，OO繼承的角度去理解）。請觀察一下這段Html：

vIEw plaincopy to clipboardprint?  
<div id="myDiv">Hello World</div>    
<div id="myDiv">Hello World</div>

這是一個閉合的div標簽。從DOM Level 1的層面來分析可以有以下幾點內容：

◆標簽div可作為“節點對象Node Object（扁平化角度，前面已述）”，或者元素對象Element OBject（繼承的角度 - 元素繼承於Node）。

◆節點屬性id也可作為“節點對象Node Object（扁平化角度）”，或者屬性對象Attr. OBject（繼承的角度 - Attr繼承於Node）。

◆文本“Hello world”也可作為“節點對象Node Object（扁平化角度）”，字符串對象CharacterData對象（繼承的角度 - CharacterData繼承於Node），Text文本對象（繼承的角度 - Text繼承於CharacterData）。

稍微歸納一下，就是DOM 1 Core部分中一切皆是節點，節點以及其接口都可實現在每個對象身上（從繼承的角度理解出發），實現了節點接口才可以有節點的屬性、方法。——這是我們理解的前提。然後，根據特定的節點類型的不同，其接口的屬性和方法都是不同的，視乎DOM對該節點的設計而定。

理解DOM Level 1 Html

我們日常工作的時候，跟HTML文檔打交道，其實就是屬於W3C所規定的DOM Level 1 HTML模塊內的處理工作。HTML DOM的特性和方法不是標准的DOM實現，是專門針對HTML同時也讓一些DOM操作變的更加簡便。HTML模塊集中表現在HTMLElement接口上，即為全體元素類型的對象所實現的接口。就該文討論的范圍而言，HTMLElement接口的參與形式與上述的 Node節點接口非常地相似。一旦引入了OO設計觀，只要實現了HTMLElement接口的對象，就可以定義它為元素了。一份HTML文檔有相當多的都是元素，當然還有，表示文檔本身的HTMLDocument和集合容器HtmlCollection等等。

因此，要准確理解DOM 1 Html的模塊，必須認識其接口是基於元素的（Element-based），而不是基於節點的（Node-based）。那樣的話，元素方式與節點方式到底又有什麼區別呢（Element v.s Node），應該如何界定兩者呢？例如節點屬性（propertIEs of elements），當在“基於元素”的語境中，就是“屬性（attributes）”，並非獨立的節點對象。——盡管按照某個角度講，元素是節點的一種特例，我們仍可保留“節點”這一說法，一個標簽（tag）便是一個 “節點”。假如我們要得到id屬性的字符串的值是什麼，采用DOM 1 Core的方式就是：

vIEw plaincopy to clipboardprint?  
myElement.attributes["id"].value; // 從Node接口提供的屬性    
myElement.attributes["id"].value; // 從Node接口提供的屬性

等於下面的方法：

vIEw plaincopy to clipboardprint?  
myElement.getAttributes("id"); // 從Element實現的方法返回    
myElement.getAttributes("id"); // 從Element實現的方法返回

但使用DOM 1 Html方式的話，我們僅僅如此：

vIEw plaincopy to clipboardprint?  
myElement.id;    
myElement.id;

這般就可以獲取id了。此時此刻，你可能會認為，XML文檔本身就不一定缺省有id的屬性，而因為有你所說的HTMLElement.id屬性預先定義在API中，當然HTML中的每個元素就有id的屬性啦——這裡的意思沒有錯，也不妨礙我們的理解。的確全體的HTML元素均有id一項的屬性，不管HTMLDivElement\HtmlImageElement\……

Core or Html Module？

既然這樣，那我應該使用Core的API，還是HTML模塊的API？對於HTML的文檔來說，用Core或HTML Moduel實際差別不大。本來我們一直都不太強調這種界定，以致忽略了它們細微的差異。如果我們覺得還是模稜兩可的話，我們可進一步查探它們的明細。個人認為處理XHTML並使用Core API這樣更能夠說明XHTML的“X”，即表明這份HTML就是一份標准的XML文檔，以便與原有HTML 4.1從語義上區別開來。但請記住，當處理一份XML結構的文檔的時候，自然而然就是采用Core去處理。通過XHMLHttpRequest請求執行後所返回的responseXML結果，只能使用Core的API去處理分析，就不能夠采用Html的了。

小結

通過文本開發者應該明白到，HTML DOM與XML DOM之間，既有區別，又有聯系。一般而言，除了上述比較外，須值得一提的就是，Html是可以允許不Well-Form的，XML就不行。

上一頁:XML學習交流（1）目錄
下一頁:詳解用PHP讀取和編寫XML DOM(1)

XML詳解

WAP中級教程: 關於緩存(cache) 有了初級教程的基礎，相信大家已經能夠做不少事情了。在本章，我們
XML 和XSLT結合使你的網站設計渾然一體: 如果你還未考慮采用一種單一的、緊密結合的方式進行網頁設計的話，請看本文。　　在網絡發展初期，凝聚性
調用xsl來解析xml文檔(js異步: 建一個vs2003的web工程,取名為XMLTest 2.將工程目錄下的WebForm1.ASPx

XML基礎 XML與XSLT XML詳解

小編推薦

實例講解:開發SWING的XML框架(2) 使用 XStream 和 XSL-FO 生成 PDF 在.NET Framework中輕松處理XML數據(5-1) 使用 XSL-FO 創建可打印文檔：使用 XML 的可移植數據庫報表的再訪 WML教程7：WML的事件 XForms 數據類型使用 CSS2 顯示 XML 文檔基於事件解析的SAX模型分析 XML簡明教程（四） - asp.net簡介 XML與HTML的結合應用（二）

DIV CSS 佈局教程網

相關文章