SAX2解析器讀XML文檔,然後產生基於特殊符號的事件。SAX2解析器實際上並不為該文檔在內存中創建一棵樹結構,它序列的一個文檔的內容並產生相關的事件。
比如,當你進行基於事件的編程的時候,你可以創建函數來響應用戶定義的事件(比如OnClick事件)。在利用SAX進行編程的時候,需要注意的是,是解析器而不是用戶產生事件。
比如考慮下面一個簡單的文檔。
<?XML version="1.0"?>
<parts>
<part>TurboWidget</part>
</parts>
當SAX2在這個文檔的時候,它產生如下的一系列的事件:
StartDocument( )
StartElement( "parts" )
StartElement( "part" )
Characters( "TurboWidget" )
EndElement( "part" )
EndElement( "parts" )
EndDocument( )
可以把SAX2看成是一個有拉特點(PUSH)的解析器,SAX2產生事件,然後你可以自己去些事件。實際上,當SAX2在解析一個文檔的時候,SAXXMLReader讀該文檔並產生一系列的事件,你可以選擇一些事件進行。
創建一個應用SAX的應用程序框架
SAX2產生的事件包括如下的種類:
¨ 和XML文檔內容相關的事件(ISAXContentHandler)
¨ 和DTD相關的事件(ISAXDTDHandler)
¨ 出現錯誤時發生的事件(ISAXErrorHandler)
為了這些事件,你需要實現一個相關的類,該類需要包含一些方法來相關的事件。你必須對你想要的事件實現相關的。如果你不想某一個事件的話,只需要簡單的忽略它就可以。在實際應用中,我們首先要繼承這些接口,用C++我們可以創建一個類,在這個類的方法中,我們可以告訴應用程序在接收到一個事件的時候如何進行。下面是建立一個基於SAX的應用的基本步驟:
1. 創建頭文件當使用SAX2的時候,我們需要用到動態連接庫MSXML.DLL,為了使用MSXML中包含的SAX2接口,你必須在程序的頭文件(一般在stdafx.h中)中包含下列的代碼:
#import
using namespace MSXML2;
2. 建立具體的操作(handler)類,SAX2主要定義了三個基本的操作類,它們分別是ISAXContentHandler,ISAXDTDHandler和ISAXErrorHandler。
ISAXContentHandler是用來SAX2解析器對文檔內容進行解析時所產生的消息的,ISAXXMLReader通過方法putContentHandler來注冊這個實例。而ISAXDTDHandler是用來和DTD相關的基本的消息的,ISAXXMLReader通過方法putDTDHandler來注冊這個實例。ISAXErrorHandler提供了對在解析過程中遇到錯誤時產生的錯誤事件的,ISAXXMLReader通過方法putErrorHandler來注冊這個實例
因為這三個類都是用來對事件進行的,並且需要在接口ISAXXMLReader中進行注冊。但是它們的基本使用方法類似,所以我們這裡只詳細描述對接口ISAXContentHandler 的操作。
ISAXContentHandler接口接收關於文檔的內容變化的事件,這是實現SAX應用所需要的最重要的接口,如果應用在遇到基本的解析事件的時候需要被通知的話,ISAXXMLReader通過方法putContentHandler來注冊這個實例,然後ISAXXMLReader就使用這個實例來報告基於文檔的事件,比如元素的開始,元素的結束和相關的字符串數據等等。ISAXContentHandler 包括了很多的方法:比如startDocument,endDocument,startElement,endElement等等。實際上它包含了好接個startXXX和endXXX對來建立不同的信息集合的抽象。比如startDocument方法在文檔信息開始的時候被調用,而在startDocument以後被調用的方法就被認為是文檔信息項(item)的子項。在文檔信息內容結束的時候endDocument就被調用,表示文檔信息的結束。 實際上是SAX2在解析文檔的時候,當處於文檔某一位置的時候,會激發相應的方法,比如當一個文檔開始的時候,就會激發startDocument方法,在實際實現的時候,我們可以在我們繼承ISAXContentHandler類的實現類中,重載該方法,實現我們自己想要的。我們可以把這些方法看成是ISAXContentHandler接口提供給我們的。需要注意的是事件被的順序和信息在文檔中的位置是一致的。
同時需要注意的是,如果我們需要在我們的應用中對這些消息進行的話,我們就要繼承這些消息的類,比如我們只需要對文檔內容進行,而忽略對DTD和解析過程中錯誤(Error)的,那麼我們只需要創建一個新的類,該類繼承ISAXContentHandler接口,因為ISAXContentHandler中定義了很多的事件方法,而事實上我們只需要對我們所關心事件的方法進行重載,對我們不關心的事件可以簡單的忽略它。
比如我們只關心startElement和endElement事件,而且我們假設我們建立的類的名稱為CXMLContentDeal,我們的類就可以如下面所示:
class CXMLContentDeal : public ISAXContentHandler
{
public:
CXMLContentDeal();
virtual CXMLContentDeal ();
virtual HRESULT STDMETHODCALLTYPE startElement(
/* [in] */ wchar_t __RPC_FAR *pwchNamespaceUri,
/* [in] */ int cchNamespaceUri,
/* [in] */ wchar_t __RPC_FAR *pwchLocalName,
/* [in] */ int cchLocalName,
/* [in] */ wchar_t __RPC_FAR *pwchRawName,
/* [in] */ int cchRawName,
/* [in] */ ISAXAttributes __RPC_FAR *pAttributes);
virtual HRESULT STDMETHODCALLTYPE endElement(
/* [in] */ wchar_t __RPC_FAR *pwchNamespaceUri,
/* [in] */ int cchNamespaceUri,
/* [in] */ wchar_t __RPC_FAR *pwchLocalName,
/* [in] */ int cchLocalName,
/* [in] */ wchar_t __RPC_FAR *pwchRawName,
/* [in] */ int cchRawName);
}
然後我們可以重載方法startElement和endElement來進行和應用相關的特殊的。