文檔定義模型為XML文檔提供了規范,DTD的引入雖然解決了XML文檔的規范化問題,但它文件格式類型和XML文件格式類型不一致,同時DTD提供的數據類型有限有時候無法滿足行業的需求,所以引入了Schema。Schema模式可以確定XML文檔的元素和屬性的結構、元素的順序、元素和屬性的數據值,根據范圍、枚舉以及樣式匹配等。
一、Schema初識
XML Schema語言也被稱為XML Schema Definition (XSD),它的作用是定義一份XML文檔的合法組件群(XML文檔的結構),就像DTD的作用一樣。 XML Schema以XML語言作為基礎,也可以說XML Schema自身就是XML的一種應用。
1、Schema作用
XML Schema和DTD的作用一樣,都是用來定義一個XML文檔的結構的模式,那麼為什麼有了DTD還要有XML Schema呢? 因為,XML Schema比DTD作用更加強大。
Xml Schema 比 DTD的優越性:
(1)模式是可擴展的
(2)模式比 DTD 功能更豐富且更有用
(3)模式是用 XML 編寫的
(4)模式支持數據類型
(5)模式支持名稱空間
(6)不需要在學習其他的語言
(7)可以直接使用XML編輯器來編寫XML Schema
(8)可以直接使用XML解析器來解析XML Schema
(9)可以使用XML DOM來靈活的操作XML Schema
(10)可以使用XSLT技術來轉換XML Schema
2、對比學習
1.1 作用上
兩者相同,都是定義了一個XML文檔的結構的模式。
1.2 用法上
兩者作用相同,但是語法上有些區別。Schema是DTD的擴展,同樣支持元素和屬性的定義,並且定義的語法相似,但Schema可以給元素和屬性添加相應的數據類型,同時還引入了全局和局部元素聲明的語法,另外根據元素和屬性的數據內容引入了簡單類型和復雜類型。
所謂的簡單類型(SimpleType)和復雜類型(ComplexType),它們本身並不是具體的數據類型,它們只是對節點或者自定義類型的類型作一個抽象的說明。
也就是說Schema的引入使得模式的聲明更加類似於我們使用的編程語言。
二、實例詳解
2.1 Schema實例
清單1:User.xml文檔結構
XML/HTML Code復制內容到剪貼板
- <?xml version="1.0"?>
- <用戶列表>
- <用戶>
- <用戶名>xx</用戶名>
- <密碼>123456</密碼>
- <用戶類型>1</用戶類型>
- </用戶>
- </用戶列表>
清單2:使用全局組件形式來定義Schema,User.xsd
XML/HTML Code復制內容到剪貼板
- <!-- 使用全局組件形式定義 -->
- <?xml version='1.0' encoding='utf-8'?>
- <xs:schema xmlns:xs='http://www.w3.org/2001/XMLSchema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>
- <xs:element name='用戶列表' type='userlist'/>
- <xs:complexType name='userlist'><!-- 使用complexType聲明該類型為復合類型的元素 -->
- <xs:sequence><!-- 使用sequence說明下面的元素必須按順序在XML文檔中顯示 -->
- <xs:element name='用戶' type='user'/>
- </xs:sequence>
- </xs:complexType>
- <xs:complexType name='user'>
- <xs:sequence>
- <xs:element name='用戶名' type='user'/>
- <xs:element name='密碼' type='user'/>
- <xs:element name='用戶類型' type='user'/>
- </xs:sequence>
- </xs:complexType>
- </xs:schema>
清單3:使用局部形式定義Schema,User.xsd
XML/HTML Code復制內容到剪貼板
- <!-- 使用局部形式定義 -->
- <?xml version='1.0' encoding='utf-8'?>
- <xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>
- <xs:element name='用戶列表'>
- <xs:complexType>
- <xs:sequence>
- <xs:element name='用戶'>
- <xs:complexType>
- <xs:sequence>
- <xs:element name='用戶名' type='xs:string'/>
- <xs:element name='密碼' type='xs:string'/>
- <xs:element name='用戶類型' type='xs:integer'/>
- </xs:sequence>
- </xs:complexType>
- </xs:element>
- </xs:sequence>
- </xs:complexType>
- </xs:element>
- </xs:schema>
清單2和清單3的都定義了User.xsd,它們的作用是相同的,都是為了驗證XML文檔的合法性,但定義的方法不同,清單2是使用全局組件的形式定義,而清單3使用的局部形式定義,具體的區別請看下文。
2.2 基本用法
上文中我們分別從作用和用法上對Schema和DTD進行了對比分析,Schema和DTD最大的區別在於Schema引入了數據類型,其它的如元素和屬性的聲明等類似於DTD,在下面討論時就不再詳述。
Schema基本內容導圖:
2.2.1 引用語法
當一個模式文件建立好以後,可以用它來驗證某一個XML文檔的有效性,也就是說檢驗某個XML文檔是否遵循了模式文件的定義。 那麼,XML文檔怎麼來引用一個模式文檔呢?
Schema模型的引用更類似於前面所說的命名空間的應用方法,具體實例如下:
XML/HTML Code復制內容到剪貼板
- <?xml version='1.0' encoding='utf-8'?>
- <用戶列表 xmlns:xsi=http://www.nishishui.org/2000/XMLSchema xsi:noNamespaceSchemaLocation='user.xsd'><!-- 引用user.xsd -->
- <用戶>
- <用戶名>我是誰</用戶名>
- <密碼>123456</密碼>
- <用戶類型>1</用戶類型>
- </用戶>
- </用戶列表>
2.2.2 元素類型
(1)按照內容的不同分為簡單和復雜元素,分別使用simpleType和complexType標示。
簡單元素:元素中內容只能是文本,不包含其它的元素和屬性。
XML/HTML Code復制內容到剪貼板
- <?xml version='1.0' encoding='utf-8'?>
- <xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>
- <xs:element name='age'>
- <xs:simpleType><!-- 使用關鍵字simpleType聲明簡單元素 -->
- <!--restriction關鍵字結合minInclusive和maxInclusive控制了XML中元素可接受的值范圍為0~100-->
- <xs:restriction base="xs:integer">
- <xs:minInclusive value='0'/>
- <xs:maxInclusive value='100'/>
- </xs:restriction>
- </xs:simpleType>
- </xs:element>
- </xs:schema>
復雜元素:元素中包含其它的元素和屬性。它有四種類型,分別是空元素、只包含其他元素、只包含正文、包含正文又包含其他元素。
XML/HTML Code復制內容到剪貼板
- <?xml version='1.0' encoding='utf-8'?>
- <xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>
- <xs:element name='age'>
- <xs:complexType><!-- 使用關鍵字complexType聲明復雜元素 -->
- <!--sequence控制XML內容中元素出現的順序-->
- <xs:sequence>
- <!-- 定義具體的元素,這些都是簡單元素-->
- <xs:element name='firstname' type='xs:string'/>
- <xs:element name='lastname' type='xs:string'/>
- </xs:sequence>
- </xs:complexType>
- </xs:element>
- </xs:schema>
(2)按照定義位置可分為局部和全局元素。
全局元素:<element>元素的父元素必須是<schema>;
局部元素:局部元素聲明只能出現在復雜類型(<complexType>元素)定義內部。即<element>元素的父元素只能是<all>、<choice>或<sequence>元素。
XML/HTML Code復制內容到剪貼板
- <?xml version='1.0' encoding='utf-8'?>
- <xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>
- <xs:element name='用戶' type='user'/><!-- 全局元素 -->
- <xs:element name='用戶名' type='xs:string'/><!-- 全局元素 -->
- <xs:element name='密碼' type='xs:string'><!-- 全局元素 -->
- <xs:complexType name='user'>
- <!--sequence控制XML內容中元素出現的順序-->
- <xs:sequence>
- <!-- 定義具體的元素,這些都是簡單元素-->
- <!-- 定義局部元素,使用ref關鍵字引用,並使用minOccurs和maxOccurs制定元素出現的最少和最多的次數-->
- <xs:element ref='用戶名' minOccurs='0' maxOccurs='1'/><!-- 局部元素-->
- <xs:element ref='密碼' minOccurs='0' maxOccurs='1'/><!-- 局部元素-->
- </xs:sequence>
- </xs:complexType>
- </xs:element>
- </xs:schema>