DIV CSS 佈局教程網

 DIV+CSS佈局教程網 >> 網頁腳本 >> XML學習教程 >> XML詳解 >> XML簡易教程之三
XML簡易教程之三
編輯:XML詳解     

XML的未來 現在你已經知道XML。確實,結構有點復雜,而且DTD有各種可以定義文檔可以包含的內容的選項。但還不只這些。考慮一個數據交換對其很重要的產業,如銀行。銀行使用所有權系統來跟蹤內部的交易,但是如果他們在Web上使用一種通用的XML格式,那麼他們必須描述交易信息給另一個機構或應用程
序(如Quicken或MS Money)。當然,他們也可以在Web頁面上
表示數據。FYI:這個標記不存在。它叫做OFEX,開放金融交易
格式(Open Financial Exchange)。

在某種情況下,如果PC上的IE 4碰到一個<SOFTPKG> 標記符,一
個函數會被啟動以給用戶更新已安裝的軟件的機會。如果你用
的是Windows 98,你可能看見過這種情況,但是不知道它是一
個XML應用程序。

這裡我們有三個XML應用程序,看起來與Andy Grove在70年代看
到的加法機、打字機和鉛筆不同。但是與最終出現在PC上的應
用程序相似,XML的好處可以被一般性地描述為:“當你使用人
類和機器可讀的標記符描述你的數據時,會有好事發生的。”

這些好事是什麼呢?我不知道。但是我也不知道我的PC上的下
一代程序將會是什麼樣。只要數據以這種方式標記,可以產生
不同的應用。

你開始考慮它會擴展到什麼程度了嗎?

我們有很多XML的實際應用可以談論,我會在不久的將來談到它
們的。既然我們都是網民,以後將是XSL(擴展樣式語言 -
eXtensible Style Language)了。

順便提一句,這個菜譜確實是我媽媽_的,而且很傑出。如果你
用之,再加半杯碎椰子。


我寫這篇文章是因為我真誠地關心你對我的看法。我擔心的是:如果你讀過我寫的XML簡介然後准備開始寫自己的XML文檔。於是你開始尋找一個已經建立的DTD來表示你的信息。你找到一個,如下所示:

 

<!ATTLIST fn

%attr.lang;

value CDATA #FIXED "TEXT">

<!ENTITY % attr.img "

img.type CDATA #REQUIRED

img.data ENTITY #REQUIRED">


馬上你就會認為Jay一定是一個白癡。他沒有說關於ATTLIST和ENTITY的任何事 - 不管它們是什麼。

那麼讓我們談談這件事,先有一點耐心。

上面這些行可能不好看,但實際上沒什麼。它們被用在DTD中來定義XML文檔中的屬性和實體。了解HTML的人會對這很清楚。屬性是帶有Html標記符的條目,用來更准確地描述標記符。在經常出現的<img src="/School/UploadFiles_7810/201104/20110413071303225.gif" height="20" width="20">中,有兩個屬性:height和width。你在後面會看到,在XML文檔使用屬性與之很相似。

對實體也沒有什麼新東西。如果你用過&,你就已經掌握了最基本的東西。一個被&和分號包圍起來的字符串用來表示另一個或一套字符。(這裡有ISO實體的完整清單。)

當然,XML中屬性和實體還有其它功能。這就不可避免地要引入語法,雖然不太多。一旦知道了這些,就會不費勁地使用XML文檔。

簡化菜譜

如果你讀過我寫的XML簡介,你會記得用簡單的標記符表示的菜譜中的組成成分,如<item>2 cups flour</item>。在寫完那篇文章後,我在網上漫游,發現關於菜譜的另一個XML文檔。其中的菜譜元素如下所示:

<ingredient quantity="2" units="cups">flour</ingredIEnt>

這種方法有一個實際的好處:可以更容易控制數據。用第一種方法,<item>標記符用來容納一堆不同的信息。如果我想提取組成成分的清單而不需要各成分的量,我就不會那麼做。

我可以用如下的結構取得相似的功能:


<item>flour

<quantity>2</quantity>

<units>cups</units>


這可以被處理,但是有兩個問題:首先,item元素包含了混合的內容:文本和其它標記符。我很快就發現應該盡量避免這種結構。其次是標記符幾乎沒有獨立的意義。很難想象只要units而不要實際的組成成分的情況。這些條目可以被簡單描述,我寧願把它們當作屬性。

首先要注意的是屬性名,quantity和units只有被能夠翻譯它們的應用程序處理時才有意義。

在被包含在有效的文檔中之前,應告訴DTD來允許它。對於上面的ingredIEnt元素,我們在DTD中只包含了以下代碼:

 

<!ELEMENT ingredIEnt #PCDATA>

<!ATTLIST ingredIEnt quantity CDATA #REQUIRED>

<!ATTLIST ingredIEnt units CDATA #REQUIRED>


第一行看起來很熟悉 - 在任何DTD中都能看到的標准元素定義。每個ATTLIST行都依次包含以下信息:


<!ATTLIST ingredIEnt quantity CDATA #REQUIRED>

這是屬性依附的元素。

<!ATTLIST ingredIEnt quantity CDATA #REQUIRED>

這裡定義屬性名。

<!ATTLIST ingredIEnt quantity CDATA #REQUIRED>

這裡設置屬性類型。CDATA代表字符數據。意味著處理器在屬性內可以得到文本。

<!ATTLIST ingredIEnt quantity CDATA #REQUIRED>

最後的部分定義屬性的缺省值。可以使用實際的數值,如3。這樣,XML中空白長度的屬性值將為3。輸入的值將覆蓋缺省值。

在上面的例子中我沒有設置特定的數量,而是使用XML的關鍵字#REQUIRED。它告訴處理器次屬性必須包含一個值。如果空白,文檔將不被處理。

缺省值有另外兩個關鍵字。第一個是#FIXED - 如果屬性值在整個文檔中保持相同的值。假設我定義一個image的標記符屬性,所有圖像的大小都相同,比如說100*50像素,就可以在DTD中這樣定義屬性:


<!ATTLIST picture length CDATA #FIXED "100 px">

<!ATTLIST picture width CDATA #FIXED "50 px">

 

另一個關鍵字是#IMPLIED,表示屬性可以包含值或是空的。

下面讓我們看看屬性類型。

如果你決定自己寫DTD,可能需要一本解釋ATTLIST語句中所有組合的XML的書。但是如果借用DTD,或許只知道CDATA和另外三種屬性就性了。

第一個是ID。它要求屬性的值在文檔中不重復。使用過數據庫的人都知道唯一標志符的必要性。DTD ATTLIST語句看起來象這樣:

<!ATTLIST element_name attribute_name ID #REQUIRED>

很難想象沒有#REQUIRED缺省值的ID屬性類型。如果那樣,任何重復的或空的ID都會迫使處理器返回一個錯誤。ID必須以字母或下劃線開始並且不能包含任何空格。

NMTOKEN類型也使用上面的命名規則。但是允許重復。它被用做傳遞數據給應用程序的保障。大多數程序語言,包括Java和Javascript,在模塊名中不能有空格。大多數情況下,最好保證屬性符合它們的規則。

最後是枚舉類型,不需要特定的關鍵字。而是用""符號包含在括號內的值,例如:

<!ATTLIST sibling (brother sister) #REQUIRED>

如果有有限的可能的屬性值,可以用這種方式。

不會認為今天的課程無趣吧,那麼就接著讀吧!

XML學習教程| jQuery入門知識| AJAX入門| Dreamweaver教程| Fireworks入門知識| SEO技巧| SEO優化集錦|
Copyright © DIV+CSS佈局教程網 All Rights Reserved