大型的專利組織都抱有雙重目標:一方面簡化電子專利編檔,另一方面保持這種檔案在部門之間的兼容性。這方面努力的背後,XML 技術發揮著領導作用,圍繞著專利編檔的 XML 格式進行了很多思考和工作。本欄目中,Uche Ogbuji 分析了 XML 專利電子編檔的背景,並和專利專家 Carl Oppedahl 討論了 XML 編檔的實際情況。
United States Patent and Trademark Office (USPTO)一直努力將電子編檔付諸實踐。對於一個主要職責就是和關注未來的客戶打交道的部門而言,這並不奇怪。況且大型專利部門要處理海量的數據,他們需要能得到的一切幫助來保持數據流的清晰。從 1998 到 2000 年,USPTO 為專利文檔開發了 SGML DTD,2000 年該機構開始把目光投向 XML,啟動了一項新的計劃,准備到 2002 年開發出 XML DTD。這項研究還擴展到了和商標有關的文檔。
這一努力中 USPTO 並不孤單,還有其他兩家大型專利機構: European Patent Office (EPO)和 Japan Patent Office (JPO)。後者是電子編檔的先驅,可以追溯到 1990 年。其中作為協調專利機構的國際權威, World Intellectual Property Organization (WIPO) 正致力於關於專利編檔和處理的數據交換的標准化。WIPO 標准稱為 Electronic Patent CoOperation Treaty (E-PCT)或 Annex F。它包括一組 XML DTD,類似但不同於大型專利機構開發的那些 DTD。本文簡要討論標准電子專利編檔的 WIPO XML 格式,並就 XML 有關的專利編檔與一位專家進行探討。
E-PCT DTD
從 WIPO 網站上查找真正的 XML DTD 碰了幾次壁後,我終於在 OASIS Cover Pages(請參閱 參考資料)上找到了 2001 年 6 月的專利申請主體的 E-PCT DTD 工作草案。該模式顯然是由理解 XML 並了解信息體系結構的人設計的。非常清晰,任何熟悉 XML 的人即使不了解專利編檔也可以使用。
我發現該 DTD 中主要的毛病是一些完全不必要的縮寫。多數元素都涉及散文體的內容,遵循類似 XHtml 和 Docbook 的慣例(盡管名稱和那些標准不一定相同)。表格模型基於人所共知的 CALS 標准,其中包括用於個人以及組織名稱、地址、文獻引用和專利交叉索引的設計好的內容模型。它還包括 MathML DTD 以處理公式(化學和數學公式也可以作為特殊類型的圖片包含進來),並提供了生物學數據參考。元數據元素提供了專利專用的元數據,但多數和編檔有關的法律細節似乎要留待其他 DTD 完成。
專利電子編檔還具有互操作性嗎?
USPTO 所支持的電子編檔方法需要使用一個名為 PASAT 的應用程序編輯專利申請,還有一個應用程序 ePave 用於提交和其他任務。對 PASAT 的不滿可以看作是電子編檔沒有推廣的原因之一,但因為其輸出是 DTD 已公開的 XML,應該能夠使用任何適當的工具編輯,這種能力被稱為 跨平台的編檔。可以選擇的一種工具稱為 PatXML,來自 EPO。另外一種是 PCT-SAFE Editor (PSE),WIPO 提供的 E-PCT 編檔工具。這兩種工具都支持導出到 USPTO XML 編檔格式。開發 Annex-F 的最終目標之一是使所有編檔人員能夠選用喜歡的任何編輯工具——無論是專利機構開發的還是商業軟件廠商提供的——並且所有主要專利機構都能夠電子化地歸檔所生成的申請。人們期望 XML 在所有這類系統中的應用能夠加速整合的進程。
與 Carl Oppedahl 的對話
Oppedahl & Larson LLP 法律服務公司提供專利、版權、商標和其他知識產權服務。他們以緊跟技術前進的步伐而自豪,事實上他們很早就出現在 Internet 上並獲得了域名“patents.com”。他們也是基於 XML 的電子編檔方式的最早采用者之一,發表了一些有用的文章指導此類系統的應用。這些文章在有關 XML 驅動的系統之間的互操作性問題方面提供了有趣的經驗。
我就跨平台編檔的實際問題采訪了Oppedahl & Larson LLP 的合伙人 Carl Oppedahl,從他的文章中我得知他在技術(包括 XML)和法律方面都有淵博的知識。
Uche Ogbuji:業界對 PASAT 抱怨什麼,為什麼一些用戶喜歡用 PatXML 和 PCT-SAFE?
Carl Oppedahl:PASAT 是十多年前開發的,人們發現這個程序不太穩定——有時候會突然崩潰,所做的工作也丟失了。其他的編輯工具如 PatXML 和 PCT-SAFE Editor 是最近開發的,更加穩定。 還有一個區別可能對某些用戶很重要,PCT-SAFE Editor 是一種有效的 XML 編輯器,其用戶界面符合人們對標簽式(如 HTML、SGML 或 XML)編輯器的期望。使用 PCT-SAFE Editor 創建和編輯——也需跨越好幾天——的文件是一個 XML 文件。 也許最好把 PASAT 和 PatXML 稱作 XML“編輯工具”。這些程序創建的文件都采用某種非 XML 的私有格式。作為用戶,您可以單擊一個按鈕“導出 XML”,這時候程序將創建一個新的文件,這個文件是一個 XML 文件。 因此對一些用戶而言——比如在使用電子編檔專利申請之前已經熟悉 Html 編碼的用戶,PCT-SAFE Editor 可能提供了一種更加熟悉的用戶界面。UO:您用過專利申請不是 XML 格式的電子編檔工具嗎?如果是這樣,XML 的應用對用戶的體驗有很大的影響嗎?
CO:是的。編檔 PCT(國際)專利申請的設計者選擇這樣一種方式,允許用戶使用 XML 或者 PDF 格式編制檔案。當然,這種決策有利也有弊。一方面,允許使用 PDF 編檔,可能使 PCT 專利機構失去標記化的計算機可識別數據的許多長處。另一方面,允許 PDF 編檔可能使專利機構成功地說服更多的檔案編制人員放棄紙張,而改用電子編檔。UO:您是否曾經閱讀過專利申請的原始 XML 正文?如果是這樣,那麼這種功能有用嗎?如果沒有,那麼在需要時可以閱讀原始數據,您認為這一點好不好?
CO: 大部分電子編檔人員從來沒有看過專利申請的原始 XML 代碼。當然,對於精心設計和實現的系統,一般而言應該避免多數用戶查看原始 XML 代碼,即使不查看原始代碼也應該能夠達到他們所有的目標。比方說,很多人開車,但從未實際打開引擎蓋看一看發動機。 我們的專利法律服務公司致力於實現跨平台的編檔——使用工具在一個專利機構中編輯專利申請書,然後在不同的機構中歸檔。因為這種跨平台的方法相對而言還沒有經過驗證(直到現在),偶爾會遇到一些小麻煩,這時候就需要用記事本打開 XML 文件。我們使用記事本作必要的修改,以便順利完成跨平台的編檔工作。
UO:您有沒有使用過不是專門用於專利編檔的工具(即一般的 XML 或文本工具)加工、查看或者處理電子編檔的 XML 文檔?
CO:我們沒有特別留意[使用一般的 XML 編輯器],雖然認為不妨試一試。 上面已經提到,我們經常發現需要使用記事本至少是查看(有時候還要編輯)XML 代碼以克服各種跨平台的兼容性問題。
UO:您觀察過 EPO 和 PCT XML 格式嗎?這兩種格式相差很遠嗎,與 USPTO 格式相比呢?是否有哪種格式更清晰易讀?
CO:事實上,EPO、WIPO(PCT)、USPTO 和 JPO(Japan)已經花了多年時間開發一種通用的 DTD 和其他通用標准(稱為 Annex F),用於專利申請的電子編檔。研究的目的是為了在 USPTO、EPO 和 PCT 的工作中長期使用單獨一種 XML 格式。 我們的專利公司率先實現了這種跨平台的編檔,為此我們必須使用記事本打開 XML 文件以調整引用外部文件的語法,如內嵌的圖像。除了這類相當細小的變動之外,我們發現不同專利機構的 XML 格式基本相同,同樣簡單易懂。
UO:您願意使用商業化工具利用 XML 格式更好的實現跨平台支持嗎?
CO:我非常樂於嘗試使用標准的、得到廣泛應用的、被證明為穩定的 XML 編輯器來編輯專利申請,並使用 Annex F DTD。 當然,要知道,專利電子編檔的第一步是編輯 XML,第二步則是將 XML 文件交給專利機構中的提交引擎,後者接受 XML 文件,並使用專利申請序列號返回正式的編檔收條。雖然我可以想象在第一步中引入商業化的 XML 工具,但是不知道在第二步中是否能夠改變。
UO:您傾向於繼續使用專利機構所提供的工具,並希望其跨平台的特性得到改進嗎?
CO:在專利電子編檔這個特殊領域中,遇到的一個問題是編檔人員可能遇到不同繪圖工具(如 Visio、PowerPoint)生成的圖片文件(作為專利的圖示),這些圖片來自發明者所用的各種不同格式(如 PDF、Microsoft Word、JPG、GIF、TIF)。因此,專利機構取得一致意見,對嵌入到 XML 申請書中的圖片格式和大小有嚴格的限制。所以對於編檔人員,需要能夠接受各種各樣的圖片文件,並通過某種方法轉換成可接受的格式和可接受的大小。 為此,專利機構提供的一些 XML 編輯工具嘗試簡化圖片格式的轉換和附加(嵌入)過程。這些工具在一定程度上也實現了這種簡化,與商業化的和現成的 XML 編輯器相比,它們是更好的選擇(尤其是對於那些不熟悉 XML 的人而言)。
UO:照您看來,真正的跨平台專利編檔工具出現還需要多長時間?您認為 XML 的采用加速了這一過程嗎?
CO:在專利機構中總是存在預算緊張和人員安排的問題,一下子實現所有的目標非常困難。USPTO 的預算是由議會決定的,現在還常常受到質疑。比如,現在 US Patent Office 提供了一些有限的、非正式的跨平台支持,如果它能夠在這方面投入更多的資源我將非常高興。
毫無疑問,XML 是我們專利公司最初少數跨平台專利編檔取得成功的 唯一原因。沒有 XML 就一切都不可能了。最重要的是,不同專利機構的人們投入了多個人年開發專利編檔的 Annex F DTD,使我們最初的跨平台編檔得以步入成功的大門。開發通用 DTD 的這些努力開花結果了。
結束語
看到 XML 在如此之多的專門領域實現了自己的諾言是非常令人高興的( 上一篇文章中我考察了 XML 在金融領域的應用, 再前一篇文章則分析了教育內容管理)。就 DTD 達成一致僅僅是第一步,這一反復出現的教訓也應該使我們冷靜下來。必須開發處理工具(本例中就是專利申請的編制和後續處理)為 XML 格式通信提供互操作框架。由於 XML 應用的大量艱苦工作和少數專利編檔專家的開拓性研究,專利申請的電子編檔和處理也許很快會得到普及。