可擴展標識語言XML(Extensible Markup language)就是由這樣一系列法則組成,它實質上是一種定義語言——任何人、任何行業都可遵循這些法則,定義各種標識來描述信息中的所有元素,然後通過一種被稱為分析程序的小型程序進行處理,使信息能“自我描述”。
計算機通信方式的這個變化看似簡單,然而它的意義不僅僅是改變了Html僵化的固定標識集,它的出現,從根本上改變了舊式的信息構造方式,創造了一種讓所有計算機系統均可進行“智能”交流的語言,使得基於信息傳輸的互聯網在信息檢索和獲取的方面發生了一種革命性變革,為整個互聯網的智能化奠定了基礎。自從1998年初XML由W3C(World Wide Web Consortium,世界廣域網組織)設計完成以來,這個標准便如野火般漫延至科學和工業領域。
這種狂熱源自互聯網所帶來的一體化願望。一些經過精選的規則使XML能夠實現上述的一體化功能:其一就是標簽總是成對出現,其功能就像我們通常使用的括號一樣,同時它們又具有引號的功能,可多層次嵌套——嵌套規則采用計算機中常見的樹結構,對於程序員來說簡直是驚人的方便:例如,你的報表以樹的形式表示,那麼寫一小段軟件來改變數據或顯示最新結果是非常輕而易舉的事。其二是它所依賴的一個新標准——通用計算機代碼,這是一個支持世界上所有主要語言的混合文本符號編碼系統:在Html中,一個文件通常用一種語言,它可以是中文、英文、日文、阿拉伯文其中的任一種,假如你的軟件碰巧不能識別這種語言符號,你就不能使用它,而用來閱讀按XML規則編寫的網頁的軟件則可以處理各種語言的任意組合,因此,XML使得信息不但能在不同的計算機系統間交換,還能跨國、跨文化地界交換。
以前,連接到網絡的計算機和網絡所能做的交互僅限於接收表格——填好後與網絡服務器來回交換直至工作完成,而XML由於通過給內容貼上標簽來描述其意義,與顯示介質無關,所以,可使用一種名叫“格式表”的規則來給不同的設備進行自動重格式化工作——這個正處於發展階段的、供XML格式表用的標准被稱為XSL(可擴展的格式表語言):視力上有殘疾的人使用格式表,能把XML網頁譯為盲文或可聽的語言;若想在汽車裡實現網上沖浪,那麼使XML頁面發出朗讀聲是輕而易舉的事;至於要做到在進行交易時,每個你所需要的文件顯示的正好是你想要的東西,更是輕而易舉——XML附加上的結構和語義信息,允許計算機設備立刻處理大量工作,大大減輕了網絡服務器的負擔,極大地降低網絡通信量:當大多數網絡信息用行業專用的XML標簽標明時,要准確找到你所需要的信息將變得十分簡單——在這裡,使用XML就如同為互聯網作了一個圖書館卡片目錄。1999年2月完成的RDF(資源描述框架)使數十億通過超鏈接連接起來網頁可以在XML的支持下發揮更大作用。W3C由此制訂一個基於XML、稱為XLink的超文本鏈接標准:此標准支持多目標目錄選擇,能夠在點擊處直接插入其它網頁的相關文本或圖像,而不須關閉網頁。然而,XLink最大的用途還在於它能將網頁的使用指向一些核心數據庫中的條目,而非頁面本身。當頁面地址變更時,制作者只需修改數據庫記錄便能更新所有指向它的鏈接,這有助於消除表示鏈接已被破壞的常見錯誤——“404文件未找到”。
XML為科學家們交流理論、計算及實驗結果提供了一條特別便利的途徑:MathML(數學標識語言)支持數學家在網頁中插入等式和幾行簡單文字,於是讀者就可以把這些表達式直接插入代數軟件供計算和畫圖用;CML(化學標識語言)和AML(天文學標識語言)能幫助研究人員檢索大量雜志引文,並迅速篩選到恰好適用於他們研究課題的論文,例如,天文學家可以輸入一個星系在天空中的坐標,以獲得關於此天體的圖像、研究論文及儀器數據的目錄……XML還將有助於進行實驗及分析實驗數據:通過AIML(天文儀器標識語言),它支持全世界的天文學家通過浏覽器控制天空中的望遠鏡,甚至可能控制衛星;遺傳學家運用BSML(生物序列標識語言)來交流和處理因基因圖譜繪制和基因序列分析工程產生的信息洪流,使研究者能輕易搜索巨大的遺傳密碼數據庫,並把最終片段顯示成有意義的圖譜而不是雜亂無章的字母序列……
在設計一門新語言之前,設計者們必須在三件事上達成一致:允許使用何種標簽,標簽元素怎樣相互嵌套以及怎樣處理。語言的詞匯和結構——通常編寫進DTD(文件類型定義)。XML標准不強迫語言設計者使用DTD,但大多數基於XML開發的新語言都帶有DTD——它使程序員較易編寫出能理解標識並對它作出巧妙處理的軟件。所以,未來的網絡設計者不僅要精通文字和圖像的制作,還要精通DTD、數據樹、超鏈接結構、元數據和格式表的相互依存的多層次系統結構——為第二代網絡設計的更為堅實的基礎結構。