PHP中的XML應用(二)

DIV+CSS佈局教程網 >> 網頁腳本 >> XML學習教程 >> XML詳解 >> PHP中的XML應用(二)

PHP中的XML應用(二)

編輯：XML詳解

行解析?
　　在完成所有的准備工作後，現在腳本終於可以解析XML文檔：

　　XML_parse_from_file()，一個自定義的函數，打開參數中指定的文件，並以4kb的大小進行解析
xml_parse()，和xml_parse_from_file()一樣，當發生錯誤時，即XML文檔的格式不完全時，將會返回false。

　　我們可以使用xml_get_error_code()函數來得到最後一個錯誤的數字代碼。將此數字代碼傳遞給xml_error_string()函數即可得到錯誤的文本信息。輸出XML當前的行數，使得調試更容易。

　　當解析文檔時，對於Expat需要強調問題的是：如何保持文檔結構的基本描述？

　　如前所述，基於事件的解析器本身並不產生任何結構信息。不過標簽(tag)結構是XML的重要特性。例如，元素序列<book><title>表示的意思不同於<figure><title>。書名和圖名是沒有關系的，雖然它們都用到"title"這個術語。因此，為了更有效地使用基於事件的解析器處理XML，必須使用自己的棧(stacks)或列表(lists)來維護文檔的結構信息。

　　為了產生文檔結構的鏡像，腳本至少需要知道目前元素的父元素。用Exapt的API是無法實現的，它只報告目前元素的事件，而沒有任何前後關系的信息。因此，需要建立自己的棧結構。

　　腳本范例使用先進後出(FILO)的棧結構。通過一個數組，棧將保存全部的開始元素。對於開始元素處理函數，目前的元素將被array_push()函數推到棧的頂部。相應的，結束元素處理函數通過array_pop()將最頂的元素移走。

　　對於序列<book><title></title></book>，棧的填充如下：

　　開始元素book：將"book"賦給棧的第一個元素($stack[0])。
　　開始元素title：將"title"賦給棧的頂部($stack[1])。
　　結束元素title：從棧中將最頂部的元素移去($stack[1])。
　　結束元素title：從棧中將最頂部的元素移去($stack[0])。

　　PHP3.0通過一個$depth變量手動控制元素的嵌套來實現范例，這就使腳本看起來比較復雜。PHP4.0通過array_pop()和array_push()兩個函數來使腳本看起來更簡潔。

　　如何收集XML文檔中的元素信息？

　　為了收集每個元素的信息，腳本需要記住每個元素的事件。通過使用一個全局的數組變量$elements來保存文檔中所有不同的元素。數組的項目是元素類的實例，有4個屬性（類的變量）

　　$count -該元素在文檔中被發現的次數
　　$chars -元素中字符事件的字節數
　　$parents -父元素
　　$childs - 子元素

　　注意：PHP的一個特性是你可以通過while(list() = each())loop遍歷整個類結構，如同你遍歷整個相應的數組一樣。所有的類變量（當你用PHP3.0時還有方法名）都以字符串的方式輸出。

　　當發現一個元素時，我們需要增加其相應的記數器來跟蹤它在文檔中出現多少次。在相應的$elements項中的記數元素也要加一。

　　我們同樣要讓父元素知道目前的元素是它的子元素。因此，目前元素的名稱將會加入到父元素的$childs數組的項目中。最後，目前元素應該記住誰是它的父元素。所以，父元素被加入到目前元素$parents數組的項目中。

　　顯示統計信息
　　剩下的代碼在$elements數組和其子數組中循環顯示其統計結果。這就是最簡單的嵌套循環，盡管輸出正確的結果，但代碼既不簡潔又沒有任何特別的技巧，它僅僅是一個你可能每天用他來完成工作的循環。

　　腳本范例被設計為通過PHP的CGI方式的命令行來調用。因此，統計結果輸出的格式為文本格式。如果你要將腳本運用到互聯網上，那麼你需要修改輸出函數來產生Html格式。

　　如何用PHP&XML編制一個迷你搜索引擎實例？
　　讓我們首先來熟悉一下我們程序中用到的那個XML（保存為xyz.XML）。

<?XML version="1.0" encoding="gb2312" ?>
<links>采用PHP和XML技術構建的搜索引擎
<web memo="memo1" url="">name1</web>
電腦網絡
<web memo="nemo2">name2</web>
程序設計
<web memo="memo3">name3</web>
PHP
<web url="http://www.phpbuilder.com/" memo="[英文]PHP開發資源。">
www.PHPbuilder.com</web>
<web url="http://www.fokus.gmd.de" memo="[英文]PHP開發手冊。 ">
PHP Manual</web>



</links>

　　它的結構相當簡單，根元素就是links，sub代表著一個類別，web就是一個網站的信息，其中包含著屬性，url代表網站的聯接，memo為備注信息，<web>？？</web> 、？？中包含的為元素的數據在這裡就是類別和網站的名稱，這是符合上面的規定的。

　　現在我們來回答上面提出的問題：為什麼要用XML來編制搜索引擎？
　　第一個原因就是有時候由於各種原因我們可能不能用到數據庫（MySQL或者其他）；
　　其次，對於小數據量的搜索引擎來說，它的數據量很小，如果用數據庫來做，效率未必有多高；

　　最重要的一點是，這個搜索引擎維護起來相當的簡單，並且不用編寫繁瑣的數據庫的維護的程序。例如，我們要添加一個類別或者網頁，只要編輯文本的文件，加上一福紈eb>???</web>或是????就可以了，而且，如果想把一個類別移動到另一個地方的話，我們只要將這一部分的sub復制過去就行了。

　　下面一個最簡單的用PHP顯示XML的范例。

　　下面的程序是將解析XML並按照樹形結構輸出至浏覽器，並顯示每層的元素總數。

<?PHP
$file = "demo.xml";// XML文件
function xml_parse_from_file($parser, $file) {// 解析XML文件的函數 }
function start_element($parser, $name, $attrs) {//遇到了開元素標記如<a href="link">就執行這一段}
function stop_element($parser, $name) {//遇到了開元素標記如</body>就執行這一段}
function data($parser, $data) {……}
function showcount(){ //顯示每一層的元素總數}

global $level,$levelcount,$maxlevel;
$level = -1;
$parser = XML_parser_create();// 產生解析器的實例
XML_set_element_handler($parser, "start_element", "stop_element"); // 設置處理函數
XML_set_character_data_handler($parser, "data");
xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0);
$ret = XML_parse_from_file($parser, $file); // 解析文件
if(!$ret) {
dIE(sprintf("XML error: %s at line %d", xml_error_string(xml_get_error_code($parser)), XML_get_current_line_number($parser)));
}
XML_parser_free($parser); // 釋放解析器
showcount();
?>

　　在上面的程序的基礎上，可以顯示一段子樹，我們依照元素的層數和他在該層的第幾號來對他進行定位

　　例如：

　　　　links （0，1）
　　　　+----web （1，1）
　　　　+----sub （1，2）
　　　　| +----web （2，1）
　　　　| +----sub （2，2）
　　　　| | +----web （3，1）
　　　　| | +----sub （3，2）
　　　　:
　　　　:
　　　　:
　　下面的代碼是我們的搜索引擎的基礎。因為，要顯示出一個子類別（如程序設計->PHP->）的信息就要用到他。

<?PHP
……
function start_element($parser, $name, $attrs) {
global $level,$levelcount,$maxlevel,$hide,$lev,$num,$PHP_SELF;
$level += 1;
if($level>$maxlevel)
$maxlevel=$level;
$levelcount[$level]+=1;

if($hide){ //判斷是否在子樹的范圍內，$hide==FALSE 為在
if($level==$lev&&$levelcount[$level]==$num)
$hide=FALSE;
}else{
if($level<=$lev)$hide=TRUE;
}

if(!$hide){
……//輸出
}
}
function data($parser, $data) {
global $level,$hide;
if(!$hide){
if(trim($data)!=""){ echo trim($data); }
}
}
……
global $hide,$lev,$num,$PHP_SELF;
$level = -1;
$hide = TRUE;
echo "<a href=$PHP_SELF>Root</a>";
if($lev==""){
$lev=0;$num=1;
}
……
?>

　　mini的搜索引擎到底如何做呢？

　　作了若干的鋪墊，下面我們就來看一下我們的搜索引擎的主要文件。

　　第一段為仿sina，yahoo的按照類別查詢
　　第二段為搜索查詢部分(把整個樹遍歷一遍)顯示符合的內容。

　　XML3.PHP

　　關鍵字匹配采用eregi函數，我們假設輸入的文字都是不會導致錯誤的。

<全文完>

上一頁:如何快速通過XSL轉換XML文件
下一頁:使用PHP 5.0 輕松解析XML文檔（1）

XML詳解

XML編程方面的擴展 - asp.net: 出一個問題,XML技術目前最大應用是什麼? 我相信你一定馬上說是數據交換,傳輸封裝等,同時還舉出s
XML 編程思想: 使用 Atom 格式連鎖新聞及其他內容: 　Web 上總有一些站點提供系列的文章、事件和其他記錄事項，用於分享和交叉引用。隨著 Web 很大
XML入門指南(4)XML元素: 　XML元素是可以擴展的，它們之間有關聯。　　XML元素有簡單的命名規則。XML元素是可以擴展的

XML基礎 XML與XSLT XML詳解

小編推薦

BPEL 映射器中的 XPath 函數和運算 XML將走向何方 - asp.net 通過 XML 進行發布將 XSL-FO 用於換頁和表將XML應用程序從DB2 8.x遷移到Viper XML認證教程，第 6 部分: XML Schema XML簡明教程第2課: 處理XML文檔用ASP和Microsoft.XMLDOM分析遠程XML文件使用PHP 5.0 輕松解析XML文檔（4）進行JSON和XML的操作說明介紹

DIV CSS 佈局教程網

相關文章