比如,當你進行基於事件的編程的時候,你可以創建函數來響應用戶定義的事件(比如OnClick事件)。在利用SAX進行編程的時候,需要注意的是,是解析器而不是用戶產生事件。
比如考慮下面一個簡單的文檔。
<?XML version="1.0"?>
<parts>
<part>TurboWidget</part>
</parts>
當SAX2在處理這個文檔的時候,它產生如下的一系列的事件:
StartDocument( )
StartElement( "parts" )
StartElement( "part" )
Characters( "TurboWidget" )
EndElement( "part" )
EndElement( "parts" )
EndDocument( )
可以把SAX2看成是一個有拉特點(PUSH)的解析器,SAX2產生事件,然後你可以自己去處理些事件。實際上,當SAX2在解析一個文檔的時候,SAXXMLReader讀該文檔並產生一系列的事件,你可以選擇一些事件進行處理。
創建一個應用SAX的應用程序框架
SAX2產生的事件包括如下的種類:
¨ 和XML文檔內容相關的事件(ISAXContentHandler)
¨ 和DTD相關的事件(ISAXDTDHandler)
¨ 出現錯誤時發生的事件(ISAXErrorHandler)
為了處理這些事件,你需要實現一個相關的處理類,該處理類需要包含一些方法來處理相關的事件。你必須對你想要處理的事件實現相關的處理。如果你不想處理某一個事件的話,只需要簡單的忽略它就可以。在實際應用中,我們首先要繼承這些接口,用C++我們可以創建一個類,在這個類的方法中,我們可以告訴應用程序在接收到一個事件的時候如何進行處理。下面是建立一個基於SAX的應用的基本步驟:
1. 創建頭文件當使用SAX2的時候,我們需要用到動態連接庫MSXML.DLL,為了使用MSXML中包含的SAX2接口,你必須在程序的頭文件(一般在stdafx.h中)中包含下列的代碼:
#import
using namespace MSXML2;
2. 建立具體的操作(handler)類,SAX2主要定義了三個基本的操作類,它們分別是ISAXContentHandler,ISAXDTDHandler和ISAXErrorHandler。
ISAXContentHandler是用來處理SAX2解析器對文檔內容進行解析時所產生的消息的,ISAXXMLReader通過方法putContentHandler來注冊這個實例。而ISAXDTDHandler是用來處理和DTD相關的基本的消息的,ISAXXMLReader通過方法putDTDHandler來注冊這個實例。ISAXErrorHandler提供了對在解析過程中遇到錯誤時產生的錯誤事件的處理,ISAXXMLReader通過方法putErrorHandler來注冊這個實例
因為這三個類都是用來對事件進行處理的,並且需要在接口ISAXXMLReader中進行注冊。但是它們的基本使用方法類似,所以我們這裡只詳細描述對接口ISAXContentHandler 的操作。
ISAXContentHandler接口接收關於文檔的內容變化的事件,這是實現SAX應用所需要的最重要的接口,如果應用在遇到基本的解析事件的時候需要被通知的話,ISAXXMLReader通過方法putContentHandler來注冊這個實例,然後ISAXXMLReader就使用這個實例來報告基於文檔的事件,比如元素的開始,元素的結束和相關的字符串數據等等。ISAXContentHandler 包括了很多的方法:比如startDocument,endDocument,startElement,endElement等等。實際上它包含了好接個startXXX和endXXX對來建立不同的信息集合的抽象。比如startDocument方法在文檔信息開始的時候被調用,而在startDocument以後被調用的方法就被認為是文檔信息項(item)的子項。在文檔信息內容結束的時候endDocument就被調用,表示文檔信息的結束。 實際上是SAX2在解析文檔的時候,當處於文檔某一位置的時候,會激發相應的方法,比如當一個文檔開始的時候,就會激發startDocument方法,在實際實現的時候,我們可以在我們繼承ISAXContentHandler類的實現類中,重載該方法,實現我們自己想要的處理。我們可以把這些方法看成是ISAXContentHandler接口提供給我們的。需要注意的是事件被處理的順序和信息在文檔中的位置是一致的。
同時需要注意的是,如果我們需要在我們的應用中對這些消息進行處理的話,我們就要繼承處理這些消息的類,比如我們只需要對文檔內容進行處理,而忽略對DTD和解析過程中錯誤(Error)的處理,那麼我們只需要創建一個新的類,該類繼承ISAXContentHandler接口,因為ISAXContentHandler中定義了很多的事件處理方法,而事實上我們只需要對我們所關心事件的處理方法進行重載,對我們不關心的事件可以簡單的忽略它。
比如我們只關心startElement和endElement事件,而且我們假設我們建立的類的名稱為CXMLContentDeal,我們的類就可以如下面所示:
class CXMLContentDeal : public ISAXContentHandler
{
public:
CXMLContentDeal();
virtual CXMLContentDeal ();
virtual HRESULT STDMETHODCALLTYPE startElement(
/* [in] */ wchar_t __RPC_FAR *pwchNamespaceUri,
/* [in] */ int cchNamespaceUri,
/* [in] */ wchar_t __RPC_FAR *pwchLocalName,
/* [in] */ int cchLocalName,
/* [in] */ wchar_t __RPC_FAR *pwchRawName,
/* [in] */ int cchRawName,
/* [in] */ ISAXAttributes __RPC_FAR *pAttributes);
virtual HRESULT STDMETHODCALLTYPE endElement(
/* [in] */ wchar_t __RPC_FAR *pwchNamespaceUri,
/* [in] */ int cchNamespaceUri,
/* [in] */ wchar_t __RPC_FAR *pwchLocalName,
/* [in] */ int cchLocalName,
/* [in] */ wchar_t __RPC_FAR *pwchRawName,
/* [in] */ int cchRawName);
}
然後我們可以重載方法startElement和endElement來進行和應用相關的特殊的處理。
3. 通過接口ISAXXMLReader創建一個解析器。XMLReader是SAX應用實現的主要的接口,XMLReader的作用是這樣的。首先,XML的開發人員使用這個接口來注冊他們對其他SAX接口的實現(比如ContentHandler,DTDHandler,ErrorHandler等等),另外,XMLREADER通過setFeature和setProperty兩個方法來配置SAX解析器的行為,最後,XMLReader封裝了解析的功能。示例代碼如下:
ISAXXMLReader* pRdr = NULL;
HRESULT hr = CoCreateInstance(
__uuidof(SAXXMLReader),
NULL,
CLSCTX_ALL,
__uuidof(ISAXXMLReader),
(void **)&pRdr);
4. 創建相應的事件(handler)處理類,這裡不妨假設我們只處理和文檔內容相關的事件。示例代碼如下:
CXMLContentDeal * pMc = new CXMLContentDeal();
注意這裡CXMLContentDeal是繼承接口ISAXContentHandler的類。
5.在解析器中注冊事件處理類,示例代碼如下:
hr = pRdr->putContentHandler(pMc);
6.開始進行文檔的解析,示例代碼如下
hr = pRdr->parseURL(URL); file://這裡的URL是指一個具體XML文檔的位置
7.釋放解析器對象
pRdr->Release();
以上就是基於SAX的應用程序的框架結構,我們可以看到,實際的事件處理是在我們的繼承類CXMLContentDeal中實現的,在我們這個示例代碼中,每當文檔中一個新的元素開始的時候,都會激活方法startElement,每當一個元素結束的時候,都會激活方法endElement。我們可以在startElement和endElement中寫入和應用相關的特定的代碼。