一、Html的局限性分析
1.HTML的可擴展性差。雖然作為一般的應用,HTML應經夠用了,但是在處理數學和化學等符號時,Html有明顯的缺點,而且它無法進行擴展,這樣使它的發展收到了極大的限制。
2.鏈路丟失後不能自動糾正。由於Web頁面的URL地址經常改變,而在改變URL地址時必須手工修改這些信息,否則就會遇到“404URL地址未找到”的信息,這大大加重了Web頁面的維護工作量。
3.數據搜索的時間長。由於Html主要用來對網頁的顯示進行控制,導致了同一個數據在不同的網頁中有不同的存儲格式,這樣在進行數據搜索時就無法快速找到所需的資料。
4.Html對雙字節或者多國文字的支持不夠。例如中文信息頁面在不同的平台下會出現無法顯示等問題。
正是由於這些缺點,人們研究了能夠代替HTML的Web頁面制作語言。其中已經投入使用的有:可擴展標記語言XML、層疊樣式表(CSS)以及動態HTML(DHtml)等。
二、XML的組成
這裡簡要列舉幾種主要的XML技術:
1.DTD(文檔類型聲明)
DTD的主要功能是定義XML的內容模式;限制XML標記的數據范圍;定義屬性的數據類型。但由於它不是用XML編寫的,因此擴展性比較差;而且只提供了有限的幾種數據類型,因此它的作用是有限的。
2.XML Schema
XML Schema的作用和DTD類似。但不同的是,Schema文件所描述的是引用它的XML文件中的元素和屬性的具體類型。另外,由於它是由XML編寫的,Schema和DTD相比較還有以下優點:
◆XML Schema內容模型是開放的,可以隨意擴充,而DTD無法解析擴充的內容。
◆DTD只能把內容類型定義為一個字符串,而XML Schema允許把內容類型定義為整型、浮點型、布爾型或者許多其它的簡單數據類型。
◆XML Schema利用Namespaces將文檔中特殊的節點與Schema相聯系,一個XML文件可以有多個對應的Schema,而一個XML文件只能有一個DTD。
3.XLink
作為一種Web語言,XML的鏈接能力是非常重要的。XML的鏈接和定址機制包括XLink、XPath和XPointer。XLink提供功能強大的鏈接方法,可以在文檔之間建立單向或多向的復雜聯結關系,還有注釋鏈接、概要鏈接、擴展鏈接集等多種鏈接功能。XPath在XSLT和XPointer中使用,支持在XML文檔中相對於節點和節點集的定位。XPointer在XPath的基礎上提供對XML文檔的內容的內部結構(如一個字符串或者選擇的一個段落)的定位。XML的鏈接能力比Html有了很大的增強。
4.CSS與XSL
XML的一大特點就是內容與格式分離,也就是說,XML文檔中並不包含如何顯示/表示文檔的信息。CSS與XSL(XML Style Language)解決了XML文檔的顯示問題。
CSS(層疊樣式表)也可以用在Html和XML中。XSL完全使用XML的語法,功能比CSS要強大得多。
5.DOM
文檔對象模型(DOM)是一個與平台、語言無關的程序接口,它提供了動態訪問和更新文檔的內容、結構與風格的手段。可以對文當作進一步的處理,並將處理的結果更新到表示頁面。
DOM的目標就是為XML和HTML定義一個標准的編程接口,它包括核心、HTML和XML三部分。DOM的核心部分建立了一套底層的對象集,它們可以表示任何結構化的文檔。Html和XML提供了高層的接口,可以作為更方便的文檔視圖。DOM規范由對象和方法組成。程序員使用它們可以更容易地對特定類型的文檔進行訪問和操作。
6.Namespaces
Namespaces是用URL加以區別的、在XML文件的元素和屬性中出現的所有名稱的集合。在XML中,用戶可以自己定義標記和元素。因此,如果把多個XML文件合並為一個,就很可能出現沖突。Namespaces則解決了這個問題。
三、PHP對XML的支持
PHP對XML提供了的強大的支持。它使用了一個XML的“解析器”,並且為了支持這個解析器,它提供了20(PHP4)個XML的解析函數。下面是幾個最常用的PHP解析函數。
1. XML_parse
boolean XML_parse(int parser, string data, int [isFinal]);
本函數用來解析 XML 格式的文件資料。參數 parser 為解析代碼。參數 data 為解析的資料區塊 (chunk)。參數 isFinal 可省略,若設為 true 則系統會自動送出最後的資料部分 (pIEce) 給 data 參數。若無錯誤則返回 true 值。
2. XML_parser_create
int XML_parser_create(string [encoding]);
本函數用來初始化一個新的 XML 解析器。參數 encoding 可省略,為 XML 使用的字符集,默認值為 ISO-8859-1,其它尚有 US-ASCII、UTF-8 二種。成功則返回 parser 代碼供其它函數使用,失敗則返回 false 值。
3. XML_set_element_handler
boolean XML_set_element_handler(int parser, string startElementHandler, string endElementHandler);
本函數配置元素的標頭供 XML_parse() 函數使用。參數 parser 為解析代碼。參數 startElementHandler 及 endElementHandler 分別為元素開始與結束的標頭,其中的 startElementHandler 必須包括解析代碼、名稱、與屬性,而 endElementHandler 參數包括了解析代碼及名稱二個參數。若無錯誤則返回 true 值。
4. XML_set_character_data_handler
boolean XML_set_character_data_handler(int parser, string handler);
本函數配置字符資料的標頭。參數 parser 為解析代碼。參數 handler 包括解析代碼及資料字符串等二個元素。若無錯誤則返回 true 值。
5. XML_get_error_code
int XML_get_error_code(int parser);
本函數可取得 XML 在處理時的錯誤代碼。參數 parser 為解析代碼。若 parser 有錯則返回 false 值,否則就返回錯誤代碼 (如 XML_ERROR_BINARY_ENTITY_REF .... 等等)。
6. XML_error_string
string XML_error_string(int code);
本函數可取得 XML 在處理時的錯誤代碼。參數 code 為解析錯誤代碼。若無錯誤返回值為代碼的文字描述字符串。
7. XML_get_current_line_number
int XML_get_current_line_number(int parser);
本函數用來取得目前 XML 解析所正在處理的行號。參數 parser 為解析代碼。若 parser 有錯則返回 false 值,若無錯誤則返回行號數字。
8. XML_parser_free
boolean XML_parser_free(int parser);
本函數用來釋放目前 XML 解析所使用的內存。參數 parser 為解析代碼。若沒有錯誤則返回 true 值,否則返回 false 值。
四、案例解析
以下是用PHP5實現讀取一個以XML 1.0格式編寫的通訊錄address.XML,並顯示其內容的示例。詳解見有關注釋。
<? // //第一部分:幾個PHP Helper函數 // function read_file($filename) { //讀取文件 $lines=file($filename); //變量$contents是存放文件內容的變量 $contents=""; while(list($key,$value)=each($lines)) { $contents.=$value; } return $contents; } function start_element($parser, $name, $attrs) { //變量$depth存放標記的深度 global $depth; //變量$spacer存放標記前所有的箭頭符號 $spacer=""; for ($i=1;$i<$depth[$parser];$i++) { $spacer.="->"; } //設置標記顯示時的顏色 if($depth[$parser]==0) { $font_color="red"; } else if($depth[$parser]==1) { $font_color="green"; } else { $font_color="blue"; } //設置標記顯示時的字體 $font_size=5-$depth[$parser]; if ($font_size<2) { $font_size=2; } //顯示標記 echo "<font size=".$font_size." color=".$font_color.">"; echo $spacer.$depth[$parser]; if ($depth[$parser]<>0) { echo "、"; } echo $name."<BR>"; echo "</font>"; $depth[$parser]++; //如果是主標記就顯示紅色的水平線 if($depth[$parser]==2) { echo "<hr color=red size=1>"; } } /********************************* *當PHP遇到一個XML的結束標記時 * *調用,其作用是改變當前的層次 * *計數,並在主標記下顯示水平線 *