教育技術領域引導著一些有趣的 XML 元數據實際應用的發展方向。在這個領域已有大量的規范、標准和開發技術,但這一切的核心是 IEEE 學習對象元數據(IEEE Learning Objects Metadata,LOM)規范。在本文中,Uche Ogbuji 介紹了 LOM,並說明它甚至會使那些與教育技術沒有直接聯系的人感興趣。
計算機輔助教育學科一直充當知識管理技術的急先鋒,而且一般而言也一直是大范圍學習環境的最早用戶——從小學教育到職業培訓再到企業學習資源。這個領域的實踐者最先認識到個人計算機的重要性:他們很快把多媒體光盤投入實際應用,在 XML 元數據技術的實際應用方面他們也首開先河。
圍繞著如何將 XML 內容格式和基於 XML 的元數據系統用於支持學習和教育技術,已經出現了一個實踐的溫床。在這些萌芽中,關注的基本單位是 學習對象。根據電氣和電子工程師協會(IEEE)學習技術標准化委員會(Learning Technology Standards Committee,LTSC)的定義和描述,學習對象是指:
[學習對象是]任意的實體,可以是數字化的也可以是非數字化的,可以在技術支持的學習期間使用、重用或引用。技術支持的學習例子包括:基於計算機的培訓系統、交互式學習環境、計算機輔助的智能教育系統、遠程學習系統、協同學習環境等等。學習對象的例子包括:多媒體內容、教育性內容、學習目標、教育型軟件和軟件工具,以及在技術支持的學習期間所涉及的人、組織和事件等等。
學習對象也被稱為 學習資源,其中的“資源”和資源描述框架(Resource Description Framework,RDF)中的“資源”具有類似的含義。這個行業冒然地采用 XML 作為學習對象的關鍵技術,而且在某些方面,有關學習對象的研究已經為語義 Web 技術開拓了全新的領地。教育技術領域從來都不被認為是富有魅力的,也沒有受到外界的很大關注,但是在這一領域發生的許多事情將會引起閱讀本專欄的許多人的興趣。在本文中,我將介紹這個領域以及學習與教育知識管理的重大進展,重點放在學習對象的元數據上。
多種標准,非凡的一致性
本專欄的讀者肯定會清楚,在一些領域存在多種競爭性的 標准,彼此獨立而又針對相同的問題空間。學習對象也經歷了自身的標准紛爭,但大部分研究已經逐漸走向協調和一致。學習對象的標准化先驅,是由歐洲遠程教育創作和分布式網絡聯盟(Alliance of Remote Instructional Authoring and Distribution Networks for Europe,ARIADNE)開發的,90 年代中期它完成了教育元數據和學習對象索引系統。教育管理系統項目(Instructional Management Systems,IMS)和高級分布式學習(Advanced Distributed Learning,ADL)計劃 1997 年在美國出現,致力於開發分布式學習技術的標准。前者已經發展成為 IMS 全球學習協會,主要的工作也轉向學習對象的詞匯表和元數據(IMS 學習資源元數據規范)。後者是 可共享內容對象參考模型(Sharable Content Object Reference Model,SCORM)的大本營,這是一個面向 Web 的內容聚合數據模型,關注學習對象的結構和運行時環境(請參閱 參考資料)。
SCORM 大量使用 XML,尤其是在 課程結構格式(Course Structure Format)的定義中,這是表示課程結構的一個系統,使教育資料能夠跨平台、跨系統進行交互。作為教育內容管理的標准,SCORM 被廣泛地接受,它的對手是一個教育內容元數據管理標准——IEEE LTSC 的 學習對象元數據(Learning Object Metadata,LOM)。LOM 源於 ARIADNE 的元數據研究以及 IMS 元數據,和世界上絕大多數主要教育技術組織一樣,這兩個組織都已經向 LOM 看齊。LOM 與 SCORM 都非常靈活且易於擴展,因此盡管學習對象有許多不同的推建標准,但在很大程度上有一個共同的基礎。
LOM 基礎
LOM 定義了一個 基本模式,這個模式為學習對象元數據定義了數據元素的層次結構。層次結構的最高層有9個范疇,這裡引用 LOM 規范自身的明確定義加以描述:
對於每個數據元素,LOM 都規定了名稱、說明、大小、示例值、數據類型以及其他重要細節。下面列出了一些有趣的數據元素例子。在列表中,我使用了一般的約定,在各層的名稱之間用點號表示層次關系,比如,“General.Identifier.Catalog”表示“Catalog 是 General 范疇中的一種 IdentifIEr”。
一些數據元素必須使用一組約束的值(程序員稱之為 枚舉類型)。在本體論(ontology)和 LOM 之類的元數據技術中,這種固定的、已充分理解的值的集合稱為 詞匯表(vocabularIEs)。在 LOM 以及基於 LOM 的規范中,詞匯表是一個重要的概念。IMS 開發了 Vocabulary Definition Exchange(詞匯表定義交換,VDEX),一種可供機器和人類閱讀的詞匯表交換格式。
XML 中的 LOM
受 IEEE LTSC 特許的一項活動是為 LOM 開發 XML 綁定。這項活動仍在進行之中,但是標准的 XML 綁定還沒有被批准和發布。我確實找到了一份關於綁定的建議(從 google 搜索“IEEE 1484.12.3” ——該規范的正式名稱要到完成的時候才會產生)。我看到建議的綁定是基於 W3C XML Schema(WXS)。我本來希望最後的規范支持 RELAX NG,我認為 RELAX NG 是一種優秀的 XML 模式定義語言,但我猜想之所以選擇 WXS,可能是因為規范的大部分涉及到把 LOM 數據元素映射到 WXS 類型系統;RELAX NG 沒有自己的類型系統,而是借用了 WXS 的類型系統。當然,如果能夠在 LOM 的內容模型方面(比如哪個屬性、元素和文本放在哪裡)看到標准的 RELAX NG 模塊,那就更好了。
清單 1 是一個例子,根據我所找到的建議,LOM XML 綁定實例可能是這個樣子。
清單 1. 一種可能的 LOM XML 格式
<lom XMLns="http://ltsc.IEee.org/xsd/LOMv1p0">
<general>
<title>
<string XML:lang="en">Ecologues</string>
<string XML:lang="la">BUCOLICA</string>
</title>
<language>la</language>
</general>
<technical>
<location type="URI">
http://classics.mit.edu/Virgil/eclogue.Html
</location>
</technical>
</lom>
在 XML 綁定標准化之前,可能還會考慮到其他的 XML 設計問題。 有一個問題吸引了我:我曾經仔細考慮過在 XML 屬性而不是內容中表示 URL,因為它們實際上是提供給機器閱讀的;但是定位元素的字符數據是 URL。這可能是因為這個數據已經受到 type 屬性的限制。這種情況下通常可以選擇方法是,用另一個嵌套的元素以 URL 作為屬性,而把供人類閱讀的標題放在元素內容中。
LOM 世界和 RDF 世界
大量有意義的工作還剛剛開始,主要是為了協調 LOM 與其他元數據標准。每個 LOM 數據元素都有類似的 Dublin Core 元數據元素,兩者之間存在重疊。非常靈活的 Dublin Core 元數據編輯器工具(請參閱 參考資料),能夠從任何網頁中提取 Dublin Core 元數據,並把結果轉化成 LOM 或 IMS 元數據。這是一個很好的暗示,LOM 之類的元數據項目可以很快在其直接領域之外得到應用。我對 IBM developerWorksXML 專區的主頁進行這種處理,結果得到了如下的 LOM XML 文檔(根據草案標准):
清單 2. 從 XML 專區主頁提取的 LOM 元數據
<?XML version="1.0" encoding="UTF-8" ?>
<lom XMLns="http://ltsc.IEee.org/xsd/LOMv1p0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://ltsc.IEee.org/xsd/LOMv1p0
http://www.rdn.ac.uk/oai/lom/lom.xsd">
<general>
<title>
<string>developerWorks : XML</string>
</title>
<description>
<string>
The XML zone on the developerWorks Web site is designed for
developers. You'll find tools, samples, standards information,
education, news and events, and links to XML community forums
and Web sites.
</string>
</description>
<!-- Many other keyWords snipped -->
<keyWord>
<string>XML resources</string>
</keyWord>
<keyWord>
<string>XML programming</string>
</keyWord>
</general>
<lifeCycle>
</lifeCycle>
<technical>
<format>text/Html</format>
<location>http://www.ibm.com/developerworks/XML/</location>
</technical>
<educational>
<learningResourceType>
<source>DCMIType</source>
<value>Text</value>
</learningResourceType>
</educational>
</lom>
為 LOM 開發 RDF 綁定的正式研究計劃(IEEE 1484.12.4)正在進行之中。對於 XML 綁定,還沒有任何正式的標准發布,只有一個開發草案可用。一個積極的信號表明,列出的主要貢獻者中有 Eric Miller,他為 Dublin Core 做了開創性的工作,目前工作於 W3C。看到不同的元數據研究互相結合是一件好事。
結束語
重復一次,即使那些與教育技術無關的人,也會對 LOM 及相關標准感興趣。許多這方面的研究推動了數據建模、與應用程序無關的數據分類、基於 XML 的元數據以及其他技術的不斷發展。教育技術的供應商對這些元數據技術的采用率如此之高,也給我留下了深刻的印象。盡管學習對象的各個方面還沒有到位,開發人員卻已經有足夠的工具和例子可以嘗試。該領域的許多方面仍在不斷發展之中,許多工作仍然非常活躍,如果我遺漏了什麼,或者您有什麼新的想法,請參與 Thinking XML 討論論壇。