第四章 XML語法
二.元素的語法
元素由一對標識以及其中的內容組成。就象這樣:ajIE。元素的名稱和標識的名稱是一樣的。標識可以用屬性來進一步描述。
在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語來作為元素名稱。但是也必須遵守下列規范:
1.名稱中可以包含字母、數字以及其它字母;
2.名稱不能以數字或"_" (下劃線)開頭;
3.名稱不能以字母 xml(或 XML 或 XML ..)開頭
4.名稱中不能包含空格
5.名稱中間不能包含":"(冒號)
為了使元素更容易閱讀理解和操作,我們還有一些建議:
1.名稱中不要使用"."。因為在很多程序語言中,"."是作為對象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替;
2.名稱盡量簡短。
3.名稱的大小寫盡量采用同一標准。
4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。)
另外,補充一點關於屬性的說明。在Html中,屬性可以用來定義元素的顯示格式,比如:<font color="red">word</font>將把word顯示為紅色。而在XML中,屬性只是對標識的描述,與元素內容的顯示無關。例如同樣一句:<font color="red">word</font>,並不會將Word顯示為紅色。(那麼,有網友會問:如何在XML中將文字顯示為紅色呢?這就需要使用CSS或者XSL,我們在下面詳細講述。)
三.注釋的語法
注釋是為了便於閱讀和理解,在XML文檔添加的附加信息,將不會被程序解釋或則浏覽器顯示。
注釋的語法如下:
<!-- 這裡是注釋信息 -->
可以看到,它和Html中的注釋語法是一樣的,非常容易。養成良好的注釋習慣將使你的文檔更加便於維護,共享,看起來也更專業。
四.CDATA的語法
CDATA全稱character data,翻譯為字符數據。我們在寫XML文檔時,有時需要顯示字母,數字和其它的符號本身,比如"<",而在XML中,這些字符已經有特殊的含義,我們怎麼辦呢?這就需要用到CDATA語法。語法格式如下:
<![CDATA[這裡放置需要顯示的字符]]>
例如:
<![CDATA[<AUTHOR sex="female">ajIE</AUTHOR>]]>
在頁面上顯示的內容將是"<AUTHOR sex="female">ajIE</AUTHOR>"
第四章 XML語法
五.Namespaces的語法
Namespaces翻譯為名字空間。名字空間有什麼作用呢?當我們在一個XML文檔中使用他人的或者多個DTD文件,就會出現這樣的矛盾:因為XML中標識都是自己創建的,在不同的DTD文件中,標識名可能相同但表示的含義不同,這就可能引起數據混亂。
比如在一個文檔<table>wood table</table>中<table>表示桌子,
而在另一個文檔<table>namelist</table>中<table>表示表格。如果我需要同時處理這兩個文檔,就會發生名字沖突。
了解決這個問題,我們引進了namespaces這個概念。namespaces通過給標識名稱加一個網址(URL)定位的方法來區別這些名稱相同的標識。
Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語法如下:
<document XMLns:yourname='URL'>
其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網址。
假設上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為
<document XMLns:zhuozi='http://www.zhuozi.com'>
然後在後面的標識中使用定義好的名字空間:
<zhuozi:table>wood table</table>
這樣就將這兩個<table>區分開來。注意的是:設置URL並不是說這個標識真的要到那個網址去讀取,僅僅作為一種區別的標志而已。
六.entity的語法
entity翻譯為"實體"。它的作用類似Word中的"宏",也可以理解為DW中的摸板,你可以預先定義一個entity,然後在一個文檔中多次調用,或者在多個文檔中調用同一個entity。
entity可以包含字符,文字等等,使用entity的好處在於:1.它可以減少差錯,文檔中多個相同的部分只需要輸入一遍就可以了。2.它提高維護效率。比如你有40個文檔都包含copyright的entity,如果需要修改這個copyright,不需要所有的文件都修改,只要改最初定義的entity語句就可以了。
XML定義了兩種類型的entity。一種是我們這裡說的普通entity,在XML文檔中使用;另一種是參數entity,在DTD文件中使用。
entity的定義語法為:
<!DOCTYPE filename [
<!ENTITY entity-name "entity-content"
]
>
例如我要定義一段版權信息:
<!DOCTYPE copyright [
<!ENTITY copyright "Copyright 2001, AjIE. All rights reserved"
]
>
如果我的版權信息內容和他人共享一個XML文件,也可以使用外部調用的方法,語法象這樣:
<!DOCTYPE copyright [
<!ENTITY copyright SYSTEM "http://www.sample.com/copyright.XML">
]
>
定義好的entity在文檔中的引用語法為:&entity-name;
例如,上面定義的版權信息,調用時寫作?copyright;
完整的例子如下,你可以copy下來存為copyright.XML觀看實例:
<?XML version="1.0" encoding="GB2312"?>
<!DOCTYPE copyright [
<!ENTITY copyright "Copyright 2001, AjIE. All rights reserved">
]>
<myfile>
<title>XML</title>
<author>ajIE</author>
<email>ajIE@aolhoo.com</email>
<date>20010115</date>
©right;
</myfile>
第四章 XML語法
七.DTD的語法
DTD是"有效XML文檔"的必須文件,我們通過DTD文件來定義文檔中元素和標識的規則及相互關系。如何建立一個DTD文件呢?讓我們一起來學習:
1.設置元素
元素是XML文檔的基本組成部分。你要在DTD中定義一個元素,然後在XML文檔中使用。元素的定義語法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*>
說明:
"<!ELEMENT" 是元素的聲明,說明你要定義的是一個元素;
聲明後面的"DESCRIPTION",是元素的名稱;
"(#PCDATA, DEFINITION)*>"則是該元素的使用規則。規則定義了元素可以包含的內容以及相互的關系。下面的表格概要列出了元素的規則:
2.元素規則表:
Symbol
含義
舉例
#PCDATA
包含字符或文本數據
<MYFILE(#PCDATA)>
元素MYFILE包含一個文本數據
#PCDATA, element-name
包含文本和其它子元素
<MYFILE(#PCDTATA,TITLE)>
MYFILE元素必須包含文本和TITLE子元素
,
使用逗號分隔排序
<MYFILE (TITLE,AUTHOR,EMAIL)>
MYFILE元素必須依次包含TITILE,AUTHOR,EMAIL三個子元素
|
使用"|"表示或者
<MYFILE (TITLE | AUTHOR | EMAIL)>
MYFILE元素必須包含TITLE,或者AUTHOR或者EMAIL子元素。
name
只能使用一次
<MYFILE (TITLE)>
MYFILE元素必須包含TITLE子元素,而且只能使用一次。
name?
使用一次或者不使用
<MYFILE (TITLE,AUTHOR?,EMAIL?)>
MYFILE元素必須包含TITLE子元素,而且只能使用一次;可以包含或者不包含AUTHOR和EMAIL子元素,但是如果使用,只能一次。
name+
使用至少一次或多次
<MYFILE (TITLE+,AUTHOR?,EMAIL)>
MYFILE元素必須包含TITLE子元素,而且使用至少一次;接下來可以跟隨AUTHOR子元素,也可以不跟;最後必須包含EMAIL子元素,而且只能使用一次。
name*
使用一次,多次,或者根本不使用
<MYFILE (TITLE*)>
MYFILE元素可以包含一個,多個或者不包含TITLE子元素
( )
設置組,可以嵌套
<MYFILE(#PCDATA | TITLE)*>
元素MYFILE包含一個或者更多的文本或者TITLE子元素。
<MYFILE((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>
MYFILE元素必須包含一些內容,內容或者是一個注釋;也或者是多個組,組裡包含:一個,多個或者沒有TITLE子元素,接著是一個或者沒有AUTHOR子元素,再接著是一個必須的EMAIL子元素。