CRM系統:基于C IDOC CRM的虛擬博物館語義網絡架構
物館之間相同的數據,也可以容納不同的數據。CIDOC CRM模
型可以方便地使文化遺產領域的各種數據得到映射,從而使得
集成并且解釋領域內各種異構數據成為可能。
基于以上考慮,我們設計了語義層包括:用OWL 表示的
CIDOC CRM文物數據模型,數據模型到各個博物館后臺數據
庫的映射以及請求重新形成(Query Reformulation)機制。當用
戶根據CIDOC CRM數據模型發出請求時,系統自動根據模型
與相關博物館間的映射機制對請求進行重新形成,轉換成對應
博物館能夠執行的請求。
(2)數據映射機制和查詢轉換機制
本系統的數據映射機制和查詢轉換機制的設計具有以下
特點:
①目標數據源,即系統中基于本體的語義模型是根據CI2
DOC CRM獨立于各個博物館源數據預定義的,而源數據模型
又是各自獨立并且獨立于目標數據模型的。
②目標數據和源數據模型具有不同的結構,系統需要在設
計階段定義從各個源模式到目標模式的映射規則,在指令執行
階段由查詢轉換機制自動完成映射。
③當新的數據源加入時,相應的映射規則也要隨之創建。
④如果目標數據模式發生改變,映射規則也應隨之改變。
假設本系統命名為I,則I可以表示為一個三元組( T,
{ Si } , {Mi } ) , 其中T是基于本體概念語義模型的目標模式
(以下簡稱目標模式) , { Si } 是多個分布式博物館數據庫源模
式(以下簡稱為源模式)集合, {Mi } 就是從源模式到目標模式
轉換關系集合。也就是對于任意一個數據庫源模式Si ,就有一
個映射關系Mi 與之對應,完成從Si 到T的映射, 1≤i≤n, n是
分布式博物館源數據模式的個數。
無論是源模式還是目標模式,對于一個命名為H的模式,
它的組成元素由對象集合O和關系集合R構成,記作ΣH。由
于請求是針對目標模式發出的,所涉及到的目標模式元素在源
模式中有些是不存在的,這部分模式元素稱為源的虛擬模式元
素,記作VS。因而對應于從源模式S到目標模式T的映射分
為兩種情況: ①直接匹配,從一個或多個源數據模式元素( ∈
ΣS )直接映射到目標數據模式元素( ∈ΣT ) ; ②間接匹配,源
與目標模式元素之間并不存在直接對應關系,只能由一個源模
式中虛擬的模式元素( ∈VS )映射到目標模式元素( ∈ΣT ) 。
源模式中,VS 經過一系列由源到目標的映射規則ms
A {Mi }重
新解釋為由源模式元素( ∈ΣS )組成的表示。
映射規則是指如何將源模式中的VS 部分通過操作運算
轉換為由ΣS 組成的表達式表示。其中操作運算包括標準運
算符Selection σ, Union ∪, Natural Join þ ü | , Projection π, and
Renameρ以及根據系統數據需要自定義的一些其他操作運算,
如組合關系Composition,郵編、街道組合(Composition)成地址;
與之相反的分解關系Decomposition等。這些關系的設計都是
在系統設計階段完成的。
如上所述,系統在設計時收集所有映射規則信息,在處理
請求時,由查詢轉換機制進行請求指令重新翻譯。原理如下:
假如用戶的請求指令是建立在關系代數的基礎上的,那么將遵
循Select2Project2Join模式。如果q代表一個用戶請求,當q被
發出時,系統自動將q解釋成qRe , qRe就是一個在系統I中數
據源能夠執行的用戶指令。對于請求q具有形式:π(X)σP ( r1
þ ü |
r2
þ ü | ⋯rN ) , 1≤i≤N , attr ( q) = X, 其中, P是選擇謂詞; q是針
對ΣT 中的對象和關系發出的,目標模式中的每一個關系ri 都
與{Mi }中的一系列映射規則相聯系,表示為Sj ×m s
A ri ,代表
將映射規則序列m s 作用于某數據源Sj 可以得到目標關系ri。
其中m s ∈{Mj } , 1≤j≤n, n指數據源的個數。將q中的ri 用
∪ ( Sj ×mS )替代從而獲得qRe ,這樣當向數據源Sj 發送由qRe
分解的請求時,系統同時將相應的映射規則mS 也發送給Sj ,
數據源Sj通過Σsj就能夠正確地獲取目標系統中的關系ri。
例如,用戶可針對圖3中基于本體語義模型的瀏覽器向導
發出以下查詢請求:“西周材質為銅的禮器有哪些?”。這個請
求是建立在CIDOC CRM模型的目標模式基礎上的,涉及到了
E22, E41, E57, P1, P4, P45, P108模式元素,與源數據模式中的
元素不吻合,這就需要根據表1與圖3之間的映射規則由系統
的查詢轉換模塊將指令翻譯成表1所在系統能夠執行的請求:
ΠAntique_name (σDATE_FROM > 1134BC∧DATE_TO < 781BC∧
MATER IAL = bronze∧USUAGE = gift Antique_table)
其中σ表示Selection,π表示Projection; Antique_table為表名。
31112 其他模塊
UDD I是分布式Web服務的信息注冊規范,它主要實現注
冊和發現功能。服務發布者可以根據這一規范進行注冊,以便
被需要該服務的用戶發現。當用戶通過瀏覽器發出請求后,命
令被轉換為UDD I查找命令,UDD I提供給用戶Web服務的名
稱和地址,命令分發模塊負責綁定和調用目標服務。分散在各
個地方數字博物館的服務執行完后,將各自的返回結果發送給
信息重組模塊進行信息的整合重組,最后返回給用戶。
312 Web服務層
Web Services在系統集成方面是非常適用的技術。全國乃
至世界各地的文物博物館都可以提供基于Web Services的服務
接口,供其他的應用程序調用,達到共享服務的目的。在Web
Services的模型下,任意的服務消費者(即接口使用者)只需理解
一種通用的組件接口(即Web Services) ,就可以利用現有的In2
ternet上的Web服務,而無須考慮Web服務的內部實現機制、操
作平臺、開發語言等。此外對服務的調用是SOAP ( Simp le Ob2
jectAccess Protocol) [17 ]消息機制下的遠程調用,因此兩者實現
的是松散耦合機制。即使在日后的運作過程中,當Web服務產
生了接口上或功能上的更改,服務的消費者可以通過Web Ser2
vices的描述性文檔發現這樣的更改,自動適應這種更改。
針對目前數字博物館系統的分散和異構特性,我們選用
Web Services技術進行集成。一般各個分散的數字博物館系
統都提供基于關鍵字的查找以及基于圖片內容檢索的功能,對
這些功能函數進行改造以Web服務的形式發布并在文物私有
UDD I注冊中心注冊以便服務的發現。圖4所示的系統中的分
布式博物館、中間層和瀏覽器用Web Services技術連接起來。
下面結合圖4說明虛擬文物博物館參觀者在瀏覽器發出
請求后的處理流程:
(1)虛擬博物館瀏覽者通過瀏覽器提交文物的查詢請求,
UDD I接收查詢要求,確定目標Web服務名稱和綁定地址。
(2)如果查找請求是基于關鍵字或基于內容的查找,那么
由系統的命令分發模塊直接將請求定向到相應的博物館,調用
相應的Web服務。
(3)如果查找請求是基于語義的,那么命令定向到語義層
處理,語義層接到請求后,根據CIDOC CRM模型與后臺博物
館數據庫數據結構的映射關系,將查找請求重新翻譯成當地數
據庫格式能夠理解的請求,再調用后臺博物館的Web服務。
(4)從各個博物館返回的調用結果經系統信息重組機制
匯總轉換返回到服務調用者。
313 用戶接口設計
瀏覽器是將博物館大量信息對外展示的窗口,所以瀏覽器
設計也相當重要。本系統瀏覽器的檢索入口部分主要包含基
于關鍵詞、圖像內容以及基于語義的檢索。基于關鍵字和圖像
內容的檢索服務主要是通過Web服務從博物館舊系統中集成
過來的。用戶輸入查詢關鍵字或者是上傳需要匹配的圖片,分
布在各地博物館的Web服務在當地執行任務,將結果各自傳
給信息重組機制最后通過瀏覽器呈現給用戶。
基于語義的查找部分是建立在基于本體語義搜索引擎基
礎上的。為了幫助用戶較好地形成查找問題,我們設計了基于
視角(View2based)的瀏覽器[ 18, 19 ]。所謂視角就是將描述文物
信息的術語歸類,每一類稱為一個視角。例如,我們把描述文
物的信息分為四個視角類型共九個視角,每個視角下又包含若
干個術語,具體如表2所示。
表2 文物視角信息
視角類型視 角
文物特征文物類型、文物材質
文物創作創作者、創作時間、創作地點
文物用途使用人、使用地點、使用場合
文物展覽博物館
用戶可以根據視角中術語來形成查找問題,如在圖6所示
的現實界面右側,用戶通過選擇文物類型中的“銅器”,文物材
質中的“黃銅”,創作時間中的“周”,使用場合中的“禮物”,就
形成了以下查找:周朝用作禮物的、材質為黃銅的銅器是什么?
通過以上選擇,查找命令在圖6的右下角形成,點擊“提交”按
鈕就啟動查詢。查找到的文物可能是一個集合,用戶可以根據
以上查找機制繼續提煉查找結果。當用戶點擊某一個文物的
小圖標時,此文物相關的信息將展示在圖6所示頁面的左側。
展示界面中間部分提供了本文物相關查找的查找入口,如查找
與本文物相同創作時間、相似使用場合的作品等。
4 結論
本系統利用CIDOC CRM概念模型及Web Services技術,
構建了領域內智能型知識搜尋及信息查找的分布式架構。使
得數字博物館在查詢使用上不再局限于關鍵詞或是圖片基于
內容的查找,而且在不改變原有系統數據的基礎上,最大程度
地實現了數據共享與交換。另外還為數據進一步推論、驗證提
供了基礎。實踐證明文化遺產領域的概念參考模型CIDOC
CRM更適合用于數字博物館數據的描述。本系統的一系列架
構,配合不同領域的Ontology,可應用在電子、電機、醫藥、航天
等Ontology定義的各個領域。由于CIDOC CRM模型是從認識
論的角度對文物描述而制定的,而對于文物的多媒體信息描述
不是很全面,另外為保護文物的屬地特性,對于某些文物信息
的版權控制也顯得相當重要。為滿足以上要求,國際上已有相
關組織分別使用MPEG27 和MPEG221[ 20 ]標準對CIDOC CRM
進行擴展融合[ 21, 22 ] ,以使數字博物館數據得到更加全面的基
于語義的描述。
參考文獻:
[ 1 ] Time Berners Lee, James Hendler, Ora Lassila. The Semantic Web
[ J ]. Scientific American, 2001, (5) .
[ 2 ] Vernadat F B. Enterp rise Modelling and Integration: Princip les and
App lications[M ]. France: Chapman & Hall, 1996.
[ 3 ] ICOM /CIDOC CRM Special Interest Group. CIDOC CRM version
31419 [ EB /OL ]. http: / / cidoc. ics. forth. gr/docs/ cidoc_cr m _ver2
s