什麼是樣式單
對於一批XML數據,應用處理程序要綜合XML文檔、文檔類型說明(Dtd/Schema)以及樣式單三方面要素來處理和顯示它。
在XML文檔中只包含了數據信息,並沒有涉及文檔如何顯示。不錯,制定XML標准的目的是要使數據結構化,賦予其明確的語意,使之易於進行數據交換。XML早已不再把目光局限在文字圖象的顯示上,而是要建立它們之間的內在關系。可以說,XML文檔本身是重內容而不重形式。
可是,XML結構化地組織信息固然好,但如果不加修飾地把一大堆枯燥的數據擺在那裡,也足以令人眼花頭痛。
樣式單(StyleSheet)是一種專門描述結構文檔表現方式的文檔,它既可以描述這些文檔如何在屏幕上顯示,也可以描述它們的打印效果,甚至聲音效果。樣式單一般不包含在XML文檔內部,而以獨立的文檔方式存在。
樣式單可以實現非常復雜的顯示效果,但由於樣式描述與數據描述相分離,顯示細節的描述並不影響文檔中數據的內在結構。
樣式單的最大優點是:XML關於文檔浏覽的基本思想是將數據與數據的顯示分別定義。這樣一來,XML格式文檔不會重蹈某些Html文檔結構混雜、內容繁亂的覆轍,XML的編寫者也可以集中精力於數據本身,而不受顯示方式的細枝末節的影響。不僅如此,樣式單還帶來另一個好處,即定義不同的樣式表可以使相同的數據呈現出不同的顯示外觀,從而適合於不同應用,甚至能夠在不同的顯示設備上顯示。這樣,XML數據就可以得到最大程度上的重用性,滿足不同的應用需求。
XSLT
W3C已經給出了兩種樣式單語言的推薦標准,一種是層疊樣式單CSS(Cascading Style Sheets),另一種是可擴展樣式單語言XSL(eXtensible Stylesheet Language)。本章講的是XSL。
XSL本身就是一個XML文檔,它是通過XML進行定義的,遵守XML的語法規則,是XML 的一種具體應用。因此系統可以使用同一個XML解釋器對XML文檔及其相關的XSL文檔進行解釋處理。XSL由兩大部分組成:第一部分描述了如何將一個XML文檔進行轉換,轉換為可浏覽或可輸出的格式;第二部分則定義了格式對象FO(fomatted object)。由於到目前為止,W3C還未能出台一個得到多方認可的FO,因此本章主要XML變換--XSL transformations(XSLT)。現在一般所說的XSL大都指的是XSLT。
XSLT的應用
XSLT主要的功能就是轉換,它將一個沒有形式表現的XML內容文檔作為一個源樹,將其轉換為一個有樣式信息的結果樹。在XSLT文檔中定義了與XML文檔中各個邏輯成分相匹配的模板,以及匹配轉換方式。它可以很好地描述XML文檔向任何一個其它格式的文檔作轉換的方法,例如轉換為另一個邏輯結構的XML文檔、HTML文檔、 XHtml文檔、VRML文檔、SVG文檔等等,不一而足。
使用XSL定義XML文檔顯示方式的基本思想是:通過定義轉換模板,將XML源文檔轉換為帶樣式信息的可浏覽文檔。
限於目前浏覽器的支持能力,大多數情況下是轉換為一個Html文檔進行顯示。
在XML中聲明XSL樣式單的方法為:<?XML-stylesheet type="text/xsl" href="mystyle.xsl"?>
至於具體的轉換過程,既可以在服務器端進行,也可以在客戶端進行。
XSLT樣式單文檔舉例
下面是一個具體的xslt樣式單文檔:
<?XML version="1.0" encoding="gb2312" ?>
<xsl:stylesheet XMLns:xsl="http://www.w3.org/tr/WD-xsl">
<xsl:template match="/">
<Html>
<HEAD>
<TITLE>學生花名冊</TITLE>
<STYLE> .title{font-size:15pt; font-weight:bold;
color:blue } .name{color:red}
</STYLE>
</HEAD>
<BODY>
<P class="title" >學生花名冊</P>
<xsl:apply-templates select="學生花名冊"/>
</BODY>
</Html>
</xsl:template>
<xsl:template match="學生花名冊">
<table BORDER="1">
<THEAD>
<td> <B>姓名</B> </td>
<td> <B>籍貫</B> </td>
<td> <B>年齡</B> </td>
<td> <B>電話</B> </td>
</THEAD>
<xsl:for-each select="學生" order-by="名字">
<tr>
<td><B><xsl:value-of select="名字"/></B></td>
<td><xsl:value-of select="籍貫"/></td>
<td><xsl:value-of select="年齡"/></td>
<td><xsl:value-of select = "電話號碼"/></td>
</tr>
</xsl:for-each>
</table>
</xsl:template>
</xsl:stylesheet>
模板在XSLT中的應用
將上例的XML文檔用XSL樣式轉換為HTML文檔的步驟是:先用XML解釋器將XML文檔解釋成DOM對象,相當於建立了原文檔的一個節點樹。然後用XML解釋器解釋XSL文檔,用模板匹配的方法去遍歷XML節點樹,將樹中的節點按模板的設定轉換為模板指示的顯示語言,即Html語言。
要了解這段程序,就要先了解模板。xsl:template是模板元素,用於定義模板,通常每個xsl:template有一個節點匹配屬性,由"match="指定。在對模板進行匹配時使用"xsl:apply-templates",用"select"屬性選擇要匹配的模板,相當於一個調用的過程。比如在
<xsl:apply-templates select="學生花名冊"/>
這段語句中用到了xsl:apply-templates,於是系統就跳到了用<xsl:template match="學生花名冊">括起的“函數”中生成Html代碼。
如果在xsl:apply-templates語句中沒有指定select屬性,那麼就調用所有可以調用的模板。
接著介紹xslt常用的幾條語句。
介紹一下XSL的幾條主要語句:
xsl:stylesheet 聲明語句
xsl:for-each select = "" 循環語句,遍歷與引號中的屬性值相同的節點
xsl:value-of select = "" 賦值語句,取出引號中指定的屬性值
分析XSLT代碼執行過程
在作過XML聲明和XSL聲明之後,系統最先匹配XML源樹的根節點。根節點用"/"表示,它的匹配方法在一對<xsl:template match="/">括起的源碼中聲明。按照這段代碼,首先生成帶有樣式信息的Html文檔的開頭一段代碼:
<Html>
<HEAD>
<TITLE>學生花名冊</TITLE>
<STYLE> .title{font-size:15pt; font-weight:bold; color:blue }
.name{color:red}
</STYLE>
</HEAD>
<BODY>
<P class="title" >學生花名冊</P>
接著,系統看到了<xsl:apply-templates select="學生花名冊"/>的指示,於是,它在XML源樹中尋找標記為“學生花名冊”的節點進行匹配。就象函數調用一樣,現在系統跳到了用<xsl:template match="學生花名冊">括起的“函數”中繼續生成下面的 Html代碼:
<table BORDER="1">
<THEAD>
<td> <B>姓名</B> </td>
<td> <B>籍貫</B> </td>
<td> <B>年齡</B> </td>
<td> <B>電話</B> </td>
</THEAD>
現在,系統又接到了新的指示 <xsl:for-each select="學生" order-by="名字">。這條指示要求系統尋找標記為“student”的子節點,並按照“名字”下的內容將這些節點排序,然後一一處理。
對於每一個“學生”子樹中的內容,系統為其生成表中一行的內容。每一行包含四列,分別把標記為“名字”、“籍貫”、“年齡”、“電話號碼”的子節點的內容填進去。其中“名字”下的內容還是粗體顯示。對應到本例中的XML數據,生成的Html代碼為:
<tr>
<td><B>李華</B></td>
<td>河北</td>
<td>15</td>
<td>62875555</td>
</tr>
<tr>
<td><B>張三</B></td>
<td>北京</td>
<td>14</td>
<td>82873425</td>
</tr>
處理完<xsl:for-each select="學生" order-by="名字">中的內容,系統繼續生成Html代碼:
</table>
至此,系統已處理完<xsl:template match="學生花名冊">中的所有內容,可以“函數返回”了。系統返回到<xsl:template match="/">括起的源碼中,完成Html最後兩行代碼的生成:
</BODY>
</Html>
把上面的Html代碼串起來,就是生成的轉換結果文件。
XSLT文件文檔結構
前面說過,XSLT文檔本身是XML文檔,因此文檔的第一句自然是:
<?XML version="1.0" encoding="gb2312"?>
接下來是樣式單部分:
<xsl:stylesheet version="1.0"
XMLns:xsl="http://www.w3.org/tr/WD-xsl">
... ...
</xsl:stylesheet>
XMLns:xsl指示了XSL的命名空間,在XSLT標准中,定義了XSLT的命名空間為 http://www.w3.org/1999/XSL/transform,然而在IE5中不支持這個名字空間,需要用到微軟自己的名字空間http://www.w3.org/tr/WD-xsl。
XSLT在進行轉換時,首先遍歷XML源文檔樹,找到要處理的節點,然後將定義好的模板信息施加到該節點中。
下面將要介紹xslt樣式單的語法。
樣式單模板xsl:template
xsl:template元素有一個mode屬性,可以根據需要去匹配不同模式的模板。若將前例作如下修改:
<xsl:template match="/" mode="blue">
...
<TITLE>學生花名冊</TITLE>
<STYLE> .title{font-size:15pt; font-weight:bold; color:blue }
...
<xsl:template match="/" mode="red">
...
<TITLE>學生花名冊</TITLE>
<STYLE> .title{font-size:15pt; font-weight:bold; color:red }
如果要將TITLE輸出為藍色,則用下面語句匹配:
<xsl:apply-templates select="/" mode="blue"/>
如果要將title輸出為紅色,則寫為:
<xsl:apply-templates select="/" mode="red"/>
此外,模板總是與節點相對應的,一個節點可能對應於不同的模板,那麼如何確定各模板匹配的先後次序呢?XSLT中可為xsl:template設置優先級,寫法是:
<xsl:template match="student" priority="n"> //n為優先級數
xsl:value-of計算節點值
在使用XSLT進行轉換時,常常需要獲取節點值,使用xsl:value-of元素可達到這個目的,如下例:
<xsl:value-of select="籍貫"/>
得到的是學生原籍的值,select屬性指定要獲取的是哪一個節點的節點值。
xsl:for-each循環處理
使用xsl:for-each可對所選節點依次進行處理,如例中在生成表格處理中,就是利用循環將各個學生的信息取出放入表格中的,寫法是:
<xsl:for-each select="student" order-by="name">
...
</xsl:for-each>
可以認為<xsl:for-each select="">能實現多個 <xsl:apply-templates select="">的功能。
xsl:sort排序處理
對於用xsl:for-each或xsl:apply-templates匹配的節點,可使用xsl:sort將所選節點內容進行排序
按大小寫排序
<xsl:sort case-order="upper-first" select="@id"/> 以id為關鍵字按大寫優先排序
<xsl:sort case-order="lower-first" select="@id"/> 以id為關鍵字按小寫優先排序
按字母順序排序
<xsl:sort order="ascending" select="@id "/> 以id為關鍵字按字母升序排序
<xsl:sort order="descending" select="@id "/> 以id為關鍵字按字母降序排序
按數據類型排序
<xsl:sort data-type="text" select="@id"/> 以id為關鍵字按文本類型排序,如對於一組id數據101,2,44,305 來說,排序結果是101,2,305,44
<xsl:sort data-type="number" select="@id"/> 以id為關鍵字按數據類型排序,上面一組數據的排序結果是2,44,101,305
另外,還有一種指定排序的方法,就是在前面學生花名冊例中所使用的order-by: <xsl:for-each select="student" order-by="name"> 也可使得輸出學生時按名字排序。
元素與屬性創建
XSLT是一個動態的樣式單,在處理過程中可產生新的元素或元素屬性,方法如下:
內 容 元 素 舉 例 轉換結果 創建元素 xsl:element <xsl:element name="TITLE">學生花名冊</xsl:element> 學生花名冊 創建屬性 xsl: attribute <TITLE><xsl:attribute name="style">color:blue </xsl:attribute>學生花名冊</TITLE > <TITLE style="color:blue">學生花名冊</TITLE> 創建文本 xsl:text (可以保護文本中的空白字符) <xsl:text> 這是學生花名冊 </xsl:text > 這是學生花名冊 創建處理指令 xsl:processing-instruction <xsl:processing-instruction name="XML-stylesheet"> href="book.css" type="text/CSS" </xsl:processing-instruction> <?XML-stylesheet href="book.css" type="text/CSS"?> 創建注釋 xsl:comment <xsl:comment> 以下是學生花名冊,請勿刪改! </xsl:comment> <!-- 以下是學生花名冊,請勿刪改!-->節點拷貝
在對XML文檔進行處理時,XSLT還可以通過拷貝的方式復制節點,方法是利用 xsl:copy和xsl:copy-of。其中xsl:copy只拷貝當前節點,不包括子節點和屬性;而xsl:copy-of的拷貝內容則包括當前節點、子節點和屬性。例如對於:
<p id="p1">A <B>is a char</B> </p>
如果樣式單寫為如下形式:
<xsl:stylesheet version="1.0"
XMLns:xsl="http://www.w3.org/1999/XSL/transform">
<xsl:template match="p">
<DIV>
<xsl:text> copy-of : </xsl:text>
<xsl:copy-of select="."/>
</DIV>
<DIV>
<xsl:text> copy : </xsl:text>
<xsl:copy/>
</DIV>
</xsl:template>
</xsl:stylesheet>
轉換後生成如下代碼:
<DIV>
copy-of : <p id="p1">A <B>is a char</B> </p>
</DIV>
<DIV>
copy : <p/>
</DIV>
由此可見,兩種拷貝方式結果大相徑庭。
輸出格式與編碼問題
XSLT是一個轉換語言,它的目的是將XML源文檔轉換為另一種格式文檔,它的輸出結果可以是HTML文檔,也可以是帶CSS的XML文檔。具體的輸出格式由xsl:output 指定。如果要輸出為HTML文檔,則寫為: <xsl:output method="Html"/>
同樣,要輸出XML文檔寫為: <xsl:output method="XML"/>
如果文檔中不出現xsl:output,將缺省輸出為XML文檔,但如果在匹配模板時使用了 <HTML>標記,則輸出為HTML文檔。輸出為HTML文檔時系統都會自動加上下面語句: <!DOCTYPE html PUBLIC "-//W3C//Dtd Html 4.0 transitional//EN">
此外,還可以利用xsl:output指定編碼方式,如UTF-8,UTF-16,GB2312等。例如: <xsl:output method="html" encoding="GB2312"/> 它指定了該XSLT的輸出結果是Html格式,編碼方式為中文。