xml(可擴展標記語言)看起來可能像某種w3c標准——現在沒有什麼實際影響,即使以後能派上用場,也是很久以後的事。但實際上,它現在已經得到了應用。所以,不要等到XML已被加進了你最喜愛的Html編輯器中才開始使用它。它現在就可以解決各種內部問題和b2b系統問題。
在sparks.com,我們使用XML來標准化從Java對象到Html數據顯示等不同系統之間的數據表示。
特別需要指出的是,我們發現,只要以非常基本的xml結構來實現標准化,就可以更容易地共享和操作數據。在這一過程中,我們發現了使用XML的很多有效方法。下面詳細介紹我們現在的應用情況。
標准化
在使用xml之前,建立與你要使用的信息不同的XML數據格式。
生成動態XML
從數據庫中生成Html並不新鮮,但生成XML卻很新鮮。這裡我們介紹具體的生成步驟。
用xsl作為模板語言
xsl(可擴展樣式表語言)是定義XML數據顯示格式的好方法,如果寫成幾個靜態模板會更有效。
生成Html
XML加上xsl就等於html。這聽起來似乎不對,但用戶所見的我們的Html頁面其實就是XML和xsl共同產生的效果。
一、標准化
XML的能力來自於它的靈活性。但不幸的是,它有時太靈活了,以至於你會面對一個空白的頁面,發愁該怎麼解決問題。
在任何XML的項目中,第一步工作都是創建標准的數據格式。為此你要作出以下決定:
• 要涉及哪些數據
• 是否要使用dtd(文件類型定義)
• 是否要使用dom(文檔對象模型)或sax(XML的簡化api)解析
確定數據:
因為沒有標准的xml格式,開發者可以自由地開發自己的格式。然而,如果你的格式只能被一個應用程序識別,那麼你只能運行這個程序來使用該格式。如果還有其他程序也能讀懂你的xml格式,那顯然會更有幫助。如果某個xml格式被修改,則使用它的系統可能也需要被修改,所以你應該建立盡可能完整的格式。因為大多數系統忽略它們無法識別的標簽,所以改變一個XML格式的最安全的方法是添加標簽,而不是修改標簽。
單擊此處查看XML數據格式實例
在sparks.com,我們查看了不同的產品展示需要的所有產品數據。盡管並不是所有的頁面都使用全部數據,但我們還是由此開發出適用於所有數據的非常完整的XML數據格式。例如,我們的產品明細信息頁面顯示的數據要比產品浏覽頁面多。然而,我們在這兩種情況下仍然使用相同的數據格式,因為每個頁面的xsl模板都只使用它所需要的字段。
是否使用dtd
在sparks.com,我們使用組織良好的xml,而不使用僅僅是正確的xml,因為前者不需要dtd。dtd在用戶點擊和看到頁面之間加入了一個處理層。我們發現這一層需要太多的處理。當然,在以XML格式與其他公司通信時,使用dtd還是很不錯的。因為dtd能在發送和接受時能保證數據結構正確。
選擇解析引擎
現在,可以使用的解析引擎有好幾個。選擇哪一個幾乎完全取決於你的應用需要。如果你決定使用dtd,那麼這個解析引擎必須能使你的XML被dtd驗證。你可以將驗證另放到一個進程中,但那樣會影響性能。
sax和dom是兩個基本的解析模型。sax基於事件,所以在xml被解析時,事件被發送給引擎。接下來,事件與輸出文件同步。dom解析引擎為動態xml數據和xsl樣式表建立層次樹狀結構。通過隨機訪問dom樹,可以提供XML數據,就象由xsl樣式表來決定一樣。sax模型上的爭論主要集中於對dom結構的內存降低過度和加快xsl樣式表解析時間縮短方面。
然而,我們發現使用sax的很多系統並沒有充分發揮它的能力。這些系統用它來建立dom結構並通過dom結構來發送事件。用這種方法,在任何XML處理之前必須從樣式表中建立dom,所以性能會下降。
二、生成動態XML
一旦建立了XML格式,我們需要一種能夠將其從數據庫中動態移植的方法。
生成XML文檔相對來說比較簡單,因為它只需要一個可以處理字符串的系統。我們建立了一個使用java servlet、enterprise Javabean server、jdbc和rdbms(關系型數據庫管理系統)的系統。
• servlet通過把生成XML文檔的任務交給enterprise Javabean (ejb)來處理產品信息請求。
• ejb使用jdbc從數據庫裡查詢所需的產品詳細信息。
• ejb生成XML文件並把它傳遞給servlet。
• servlet調用解析引擎,從XML文件和靜態的xsl樣式表中創建Html輸出。
(有關xsl應用的其他信息,請參閱用xsl作為模板語言。)
生成XML的例子
在Java中創建XML文檔字符串的真正代碼可以分成幾個方法和類。
啟動xml生成過程的代碼放在ejb方法裡。這一實例會立即創建一個stringbuffer,以便存儲生成的XML字符串。
stringbuffer XML = new stringbuffer();
xml.append(XMLutils.begindocument("/browse_find/browse.xsl", "browse", request));
xml.append(product.toXML());
xml.append(XMLutils.enddocument("browse");
out.print(XML.tostring());
後面的三個XML.append()變元本身就是對其他方法的調用。
產生文件頭
第一個附加方法調用xmlutils類來產生XML文件頭。我們的Java servlet中的代碼如下:
public static string begindocument(string stylesheet, string page)
{
stringbuffer XML = new stringbuffer();
xml.append("<?XML version="1.0"?> ")
.append("<?XML-stylesheet href="")
.append(stylesheet).append(""")
.append(" type ="text/xsl"?> ");
XML.append("<").append(page).append("> ");
return XML.tostring();
}
這段代碼生成了xml文件頭。<?xml>標簽把本文件定義為支持1.0版本的XML文件。第二行代碼指向用以顯示數據的正確樣式表的位置。最後包括進去的是項級標簽(本實例中為<browse>)。在文件末尾,只有<browse>標簽需要被關閉。
<?xml version="1.0"?> <?XML-stylesheet href="/browse_find/browse.xsl" type="text/xsl"?> <browse>
填入產品信息
完成了文件頭後,控制方法會調用Java對象來產生它的xml。本例中調用的是product對象。product對象使用兩個方法來產生它的xml表示。第一個方法toxml()通過產生<product>和</product>標簽來建立product節點。然後它會調用internalxml(),這樣就能提供產品xml所需的內容。internalXML()是一系列的stringbuffer.append()調用。stringbuffer也被轉換成字符串並返回給控制方法。
public string toXML()
{
stringbuffer XML = new stringbuffer("<product> ");
xml.append(internalXML());
XML.append("</product> ");
return XML.tostring();
}
public string internalXML()
{
stringbuffer XML = new
stringbuffer(" ")
.append(producttype).append(" ");
XML.append(" ").append(idvalue.trim())
.append(" ");
XML.append(" ").append(idname.trim())
.append(" ");
XML.append(" ").append(page.trim())
.append(" ");
厖?
XML.append(" ").append(amount).append(" ");
XML.append(" ").append(vendor).append(" ");
XML.append(" ");
XML.append(" ").append(pubdesc).append(" ");
XML.append(" ").append(vendesc).append(" ";
厖?
return XML.tostring();
}
關閉文件
最後,xmlutils.enddocument()方法被調用。這個調用關閉xml標簽(本例中為),並最終完成架構好的XML文件。來自控制方法的整個stringbuffer也轉換成字符串,並返回給處理最初http請求的servlet。
三、用xsl作為模板語言
為了得到html輸出,我們把生成的xml文件和控制XML數據如何表示的xsl模板相結合。我們的xsl模板由精心組織的xsl和Html標簽組成。
開始建模板
我們的xsl模板開始部分與下面這段代碼類似。第一行代碼為必需代碼,將本文件定義為xsl樣式表。xmlns:xsl=屬性引用本文件所使用的XML名稱空間,而version=屬性則定義名稱空間的版本號。在文件的末尾,我們關閉標簽。
由<xsl:template>開始的第二行代碼確定了xsl模板的模式。match屬性是必需的,在這裡指向XML標簽<basketpage>。在我們的系統裡,<basketpage>標簽裡包含<product> 標簽,這使得xsl模板可以訪問嵌在<product>標簽內的產品信息。我們又一次必須在文件末尾關閉<xsl:template>標簽。
接下來,我們來看一看組織良好的Html。由於它將被xml解析引擎處理,所以必須符合組織良好的XML的所有規則。從本質上來講,這意味著所有的開始標簽必須有對應的結束標簽。例如,通常不被結束的<p>標簽,必須用</p>關閉。
<xsl:stylesheet XMLns:xsl="http://www.w3.org/1999/xsl/transform"
version="1.0">
<xsl:template match="basketpage">
<Html>
<head>
<title>shopping bag / adjust quantity</title>
</head>
<body bgcolor="#cccc99" bgpropertIEs="fixed" link="#990000" vlink="#990000">
<br>
?br> </xsl:template>
</xsl:stylesheet>
在模板的主體內,有很多xsl標簽被用於為數據表示提供邏輯。下面解釋兩個常用的標簽。
choose
<xsl:choose>標簽類似於傳統編程語言中if-then-else結構的開始部分。在xsl中,choose標簽表示在代碼進入的部分中,賦值將觸發動作的發生。擁有賦值屬性的<xsl:when>標簽跟在choose標簽後面。如果賦值是正確的,位於<xsl:when>的開始和結束標簽之間的內容將被使用。如果賦值錯誤,就使用<xsl:otherwise>的開始和結束標簽之間的內容。整個部分用</xsl:choose>來結束。
在這個例子裡,when標簽會為quantity標簽檢查XML。如果quantity標簽裡含有值為真的error屬性,quantity標簽將會顯示列在下面的表格單元。如果屬性的值不為真,xsl將會顯示otherwise標簽間的內容。在下面的實例裡,如果error屬性不真,則什麼都不會被顯示。
<xsl:choose>
<xsl:when test="quantity[@error='true']">
<td bgcolor="#ffffff"><img height="1" width="1" src="http://img.sparks.com/images/i-catalog/sparks_images/sparks_ui/clearpixel.gif"/></td>
<td valign="top" bgcolor="#ffffff" colspan="2"><font face="verdana, arial" size="1" color="#cc3300"><b>*not enough in stock. your quantity was adjusted accordingly.</b></font></td>
</xsl:when>
<xsl:otherwise>
</xsl:otherwise>
</xsl:choose>
for-each
<xsl:for-each>標簽可以用來對相似XML數據的多種情況應用同一個樣式表。對於我們來說,可以從數據庫中取出一系列產品信息,並在web頁上進行統一格式化。這裡有一個例子:
<xsl:for-each select="package">
<xsl:apply-templates select="product"/>
</xsl:for-each>
for-each 循環在程序遇到標簽時開始。這個循環將在程序遇到標簽時結束。一旦這個循環運行,每次標簽出現時都會應用這個模板。
四、生成Html
將來的某一時刻,浏覽器將會集成xml解析引擎。到那時,你可以直接向浏覽器發送xml和xsl文件,而浏覽器則根據樣式表中列出的規則顯示XML數據。不過,在此之前開發者們將不得不在他們服務器端的系統裡創建解析功能。
在sparks.com,我們已經在Java servlet裡集成了一個xml解析器。這個解析器使用一種稱為xslt (xsl transformation)的機制,按xsl標簽的說明向xsl模板中添加XML數據。
當我們的Java servlet處理http請求時,servlet檢索動態生成的xml,然後xml被傳給解析引擎。根據XML文件中的指令,解析引擎查找適當的xsl樣式表。解析器通過dom結構創建Html文件,然後這個文件再傳送給發出http請求的用戶。
如果你選擇使用sax模型,解析器會通讀xml源程序,為每個xml標簽創建一個事件。事件與XML數據對應,並最終按xsl標簽向樣式表中插入數據。