但是如果沒親眼見過,誰能想到呢。在用打字機、加法機和鉛筆作為計算的工具的時代,你能解釋PC和它的用途嗎?
這個例子可以用在解釋擴展標記語言(XML - eXtensible MarkupLanguage)上。現在還沒有和它相似的東西,所以很難做出比較。你可能聽說過XML是HTML的替代物或XML與HTML相似,可以定義自己的標記符。這兩種說法都不全對,就象說PC是存儲處方的機器一樣。
我媽媽是一個訓練有素的廚師,如果我用她的配方,我的家庭會省下很大一筆錢。我以簡單的開始。因此我打開文本編輯器,開始寫一些HTML代碼:
<HTML>
<H1 ALIGN=CENTER>Recipe</H1>
<FONT FACE size=2>Chocolate Chip Bars</FONT>
在寫完上面幾行後,我想接著寫我媽媽 的精妙菜譜。那麼怎麼做呢?一份老式的Web頁面。接下來呢?把我的頁面的URL送給對這個菜譜感興趣的人們,然後讓他們剝掉其中的<P>和<FONTFACE size=2>嗎?這得花些時間,我想得到實際的內容。
看看下面可能的XML標記:
<author>Carol Schmidt</author>
<recipe_name>Chocolate Chip Bars</recipe_name>
在XML中,標記符可以最好地描述內容。以這種方式,我可以肯定任何查找出現在<recipe_name>標記符中的“Chocolate Chip”的人都可以得到媽媽_的菜譜。進一步說,如果我的信息被象這樣的標記符(有意義的標記符)包圍 - 我可以告訴其它程序如何使用它們。我還可以通過編碼把<recipe_name>標記符中的內容放入數據庫的某個域中,然後把它輸出到一本書的硬拷貝中。還有,我可以用一個支持XML的字處理器使網頁的出版輕而易舉。
這就是XML的本質:使標記對人和機器都可讀。但是在實現這個目標之前,應該理解用XML編碼所涉及的東西。
文檔要組織良好一個XML文件必須滿足兩點:組織良好和有效。我們以一個組織良好的文檔開始。
我發明了一些描述菜譜的標記符,並把它們組織成一種合理和可讀的方式。它可能不是最好的標記,但是在下面的例子中工作得很好。
<?xml version="1.0"?>
<list>
<recipe>
<author>Carol Schmidt</author>
<recipe_name>Chocolate Chip Bars</recipe_name>
<meal>Dinner
<course>Dessert</course>
</meal>
<ingredients>
<item>2/3 C butter</item>
<item>2 C brown sugar</item>
<item>1 tsp vanilla</item>
<item>1 3/4 C unsifted all-purpose flour</item>
<item>1 1/2 tsp baking powder</item>
<item>1/2 tsp salt</item>
<item>3 eggs</item>
<item>1/2 C chopped nuts</item>
<item>2 cups (12-oz pkg.) semi-sweet choc. chips</item>
</ingredients>
<directions>
Preheat oven to 350 degrees. Melt butter;
combine with brown sugar and vanilla in large mixing bowl.
Set aside to cool. Combine flour, baking powder, and salt;
set aside.Add eggs to cooled sugar mixture; beat well.
Stir in reserved dryingredients, nuts, and chips.
Spread in greased 13-by-9-inch pan.
Bake for 25 to 30 minutes until goldenbrown;
cool. Cut into squares.
</directions>
</recipe>
</list>
這就是一份可以接受的XML文檔 - 告訴你XML是什麼:把數據以一種有實際意義的方式進行組織。
雖然這些標記符看起來有點象HTML,但是有很大的區別:文件中沒有指出數據如何表示的信息。版面指令,當我們准備好時,就會從其它地方出現。這和把地址簿的信息放在數據庫的字段和記錄中而不是放在字處理器產生的清單中的道理一樣。數據庫可以讓你把地址簿中的信息合成到標簽、信封、信件或其它任何想要的載體上面。最後,就是把這份菜譜文件合成到一種表現語言中,如HTML或CSS。
前面說過,XML文檔必須組織良好。這意味著文件必須滿足以下三項基本規則:
文檔以XML定義<?xml version="1.0"?>開始。 有一個包含所有其它內容的根元素,如上面例子中的<list>和</list>標記符。所有元素必須合理地嵌套,不允許交叉嵌套。 上面的例子中,幾個<item>元素被合理地嵌套<ingredients>和</ingredients>標記符中。但是下面的標記卻有嚴重的問題:
<ingredients><item></ingredients>chocolate chips</item>
於是"chocolate chips"沒有被包含在ingredients清單中。因此這份文檔就沒有組織好。這在HTML中可能不算什麼,因為浏覽器已經被設計成可以處理這種問題。
但是在XML中卻是致命的 - 應用程序將拒絕處理沒有組織好的文件。
我們現在知道組織良好非常重要,但是還不止這些