CRM系統:基于C IDOC CRM的虛擬博物館語義網絡架構
基于C IDOC CRM的虛擬博物館語義網絡架構
3
劉宏哲, 鮑 泓, 余杰華
(北京聯合大學信息技術研究所, 北京100101)
摘 要: 在語義網絡架構下,以基于本體的概念參考模型CIDOC CRM作為數據描述的基礎,用Web Services技
術建立基于語義的網上虛擬文物博物館分布式系統的相關機制。
關鍵詞: 語義網絡; CIDOC CRM; Web Services; 本體; 虛擬博物館
中圖法分類號: TP393 文獻標識碼: A 文章編號: 100123695 (2006) 0420050204
A SemanticWeb Architecture of VirtualMuseum Based on CIDOC CRM
L IU Hong2zhe, BAO Hong, YU J ie2hua
( Institute of Inform ation Technology, B eijing Union University, B eijing 100101, China)
Abstract: The most important purpose of digital museum is antique information sharing and p rocessing, but the distributed
and heterogeneity nature of the local digitalmuseum p revent the goal from achieving. How to solve the p roblem using semantic
Web architecture with Ontology2based concep tual reference model C IDOC CRM andWeb Services technology is exp lored.
Key words: SemanticWeb; C IDOC CRM; Web Services; Ontology; VirtualMuseum
文物具有很高價值也有很強的區域性,這一特點決定了文
物藏品保管者(博物館和個人)在不同地理空間相對獨立地保
存文物。盡管某些博物館已經開始實施文物數字化工程,但基
本上都是基于本地數據庫的,各個博物館的數字化工程在數據
格式、計算機平臺以及具體技術上都存在很大差異,難以實現
互通互連,從而削弱了數字化文物資源共享的優勢。對數字博
物館資源的搜索主要有基于內容的和元數據的兩種?;趫D
像內容檢索技術(CB IR)具有其不可替代性但同時也不能解決
全部問題。現有的基于元數據的搜尋引擎主要是利用關鍵詞
查詢的方式,由于同一個關鍵詞在不同的語義環境中意義有可
能不同,同時一個語義可以由意義相近的不同詞語來表示,這
就造成關鍵詞查找的不準確性。隨著現有資源的日益龐大,這
些問題在現有的網絡架構下愈來愈難獲得良好的解決。選擇
一種體系結構和實現技術將現有的異構系統集成并使得以上
問題得到解決是一項重要的任務。本文闡述了如何用基于本
體的CIDOC CRM模型對文物領域的概念進行分類和建立關
聯構建語義網絡。
1 語義網絡架構
網絡儲藏著越來越多來自不同數據源的、具有不同表示格
式的信息,表示、維護、查詢、處理這些信息變得越來越困難。
人們希望Web提供的信息不僅僅是機器可識別的,而且是機
器可以理解的。基于這種需求,語義網絡( SemanticWeb)架構
應運而生。Internet之父Tim Berners2Lee給出如下定義: Se2
manticWeb是一個網絡,它包含了文檔或文檔的一些部分,描
述了事物間的明顯關系,包含了語義信息,以利于機器的自動
處理[ 1 ] 。
圖1為語義Web層次框架圖。在這個層次框架中, XML層
表示數據, RDF表示數據的含義,本體(Ontology)表達數據含義
正式的、共同的理解, Logic提供了對有含義數據的智能推理。
Proof是指一旦我們所構建出來的系統能夠根據本體論來驗證
邏輯以及推論出結果,便可以用此機制來驗證事情的對與否。
2 本體及文物領域本體概念參考模型
智能網絡的組成之一是本體(Ontology) ,它是實現語義
Web的重要技術。在哲學上,Ontology是有關存在的本質以及
何種事物存在的理論,這是它作為一門學科所研究的理論。在
真實的世界中,每一個領域都會被描述成一個知識本體。同一
個術語在不同的領域、時代背景下甚至是使用不同的用法,其
意義就可能大不相同。用本體理論可以事先定義好這些術語
代表什么意義、屬于什么領域以及與其他術語之間的關系,完
成機器與人之間語義的交互。目前知識本體已被廣泛地應用
于信息領域的信息檢索。
為了使基于本體制定出來的資料在概念上具有共同點,提
高信息的可重用性和信息之間的可交換性,應該采用統一的模
型[ 2 ]。在文化遺產(或稱文物博物館)領域,國際上的一些團
體或相關組織制定了相應的本體模型,且較成熟的模型有多
個, 其中包括CIDOC CRM[ 3 ] , ABC Ongology[ 4 ] , CDWA[ 5 ] ,
AAT[ 5 ] , TGN[ 5 ] ,ULAN[ 5 ] , INCOCLASS[ 6 ]等模型。本系統選用
CIDOC CRM來構建文物領域本體模型[ 7 ] ,其中CIDOC是組成
ICOM ( International Council forMuseums)組織的二十幾個委員
會( Committee ) 之一, 其全名是ComitéInternational pour la
DOCumentation,簡稱為CIDOC。CIDOC 的成員中原本都是文
化遺產領域的專家以及技術人員制定的文化遺產信息(Cultu2
ral Heritage Information)領域的概念參考模型(Concep tual Refe2
renceModel, CRM) 。
CIDOC CRM目前已經演變到v31419版本[ 3 ] ,該版本將文
化遺產領域定義出84個實體、141個關系,涵蓋了圍繞特定文
物發生的歷史史實、人文藝術、考古遺跡、時間地點人物以及版
權聲明等信息。隨著模型的不斷擴展,實體和關系數量可能還
會增加。
CIDOC CRM是這些標準中嚴格遵循本體原則的一個模
型,由于有較長的歷史,所以發展得比較完善。此模型目前被
多個本領域很有影響的項目所采用[ 8, 9 ] ,并且這個隊伍還在不
斷地加大。下面我們舉例說明如何用CIDOC CRM模型描述
一個文物的信息.
模型中的所有實體和關系名稱都來自于CIDOC CRM規
范。在數據庫表中兩個字段數據之間是沒有關聯的,而CI2
DOC CRM不但可以表示數據,還可以表示數據之間的關系。
例如, E22ManMade Object (文物“鼎”)與E57 Material (材質)
之間由關系P54 Consists of (組成成分)連接,這樣表示的概念
具有上下文,從而賦予了它一定的含義。
CIDOC CRM是構建文化遺產領域的信息系統所用的共同
標準。因為每個系統需求的差異,所以我們在設計時便可以只
針對需求決定使用哪些實體和關系,如徐悲鴻博物館可能側重
于對于圖畫作品的作者、主題、風格流派、創作背景等,而考古
博物館則側重于墓葬遺址的產生、演變以及發現過程等。不同
的博物館之間所選用的實體和關系可能不同,但是都是基于一
個統一的模型,它們之間重疊部分就可以達到共享和交換。特
定博物館的CIDOC CRM模型應該由領域專家和技術人員合
作根據系統需求或者已有數據情況設計, 正如參考文獻
[ 10, 11 ]中闡述的觀點, CIDOC CRM模型設計的總體原則是模
型應該能夠容納各種數據,使得數據庫表的信息到模型的映射
不會有信息丟失。圖4表示CIDOC CRM模型對博物館1~N
的數據的映射集成。
各個地方數字博物館的模型設計完成后,需要將CIDOC
CRM概念模型轉換為網絡本體語言OWL (OntologyWeb Lan2
guage) [ 12, 13 ]表示的邏輯模型,此過程用斯坦福大學開發的本體
編輯工具ProtégéOWL[ 14 ]實現。
3 系統體系結構設計
本系統在語義網絡架構下,用CIDOC CRM 作為數據描述
的基礎形成文物數據的語義表示,用Web Services[ 15 ]技術將物
理上分布的、異構的各個地方博物館集成為一個虛擬的網上文
物博物館。
從邏輯上,虛擬文物博物館可分為三大部分:Web服務
層、中間層和用戶接口層。Web服務層是指各地數字博物館
系統通過Web Services的接口提供的Web服務;中間層主要包
括語義中間層、Web服務的注冊發現機制UDD I[ 16 ]、命令查詢
轉換、命令分發以及信息重組等模塊;而最上層是直接與用戶
交互的瀏覽器。系統總體結構圖如圖5所示。
311 中間層
31111 語義層
(1) CIDOC CRM本體模型
由于文物的屬地特性,將分布于全國甚至是世界各地的文
物數據存放在一個系統里從技術上或者是經濟上幾乎是不可能
的事。所以合理的解決方案應該是通過中間系統使得物理上分
散的數據無縫連接成一個虛擬整體,支持查找等信息處理操作。
中間系統典型的設計是它接收并且解釋從用戶界面來的操作請
求,并把它分發給相應的后臺系統中執行;而相應的后臺系統執
行完請求,將返回結果匯總給用戶。但由于不同的后臺數字博
物館建立時所采用的數據結構的差異,使得返回信息很難融合。
過去通常的解決辦法是通過設計一個統一數據格式來改造已有
的數據,各個博物館的數據會有不同程度的丟失。這樣做顯然
不能很好地容納多個博物館數據的差異,而且數據之間的關系
也無法表達。更好的解決辦法是將各不相同的數據映射到一個
共同的基于本體語義模型,而這個模型的復雜程度可以容納博
強力推薦:
天柏客戶關系管理系統
天柏客戶關系管理系統(CRM)是一款集專業性、實用性、易用性為一體的純B/S架構的CRM系統,它基于以客戶為中心的協同管理思想和營銷理念,圍繞客戶生命周期的整個過程,針對不同價值的客戶實施以客戶滿意為目標的營銷策略,通過企業級協同,有效的“發現、保持和留住客戶”,從而達到留住客戶、提高銷售,實現企業利潤最大化的目的。通過對客戶進行7P的深入分析,即客戶概況分析(Profiling)、客戶忠誠度分析(Persistency)、客戶利潤分析(Profitability)、客戶性能分析(Performance)、客戶未來分析(Prospecting)、客戶產品分析(Product)、客戶促銷分析(Promotion)以及改善與管理企業銷售、營銷、客戶服務和支持等與客戶關系有關的業務流程并提高各個環節的自動化程度,從而幫助企業達到縮短銷售周期、降低銷售成本、擴大銷售量、增加收入與盈利、搶占更多市場份額、尋求新的市場機會和銷售渠道,最終從根本上提升企業的核心競爭力,使得企業在當前激烈的競爭環境中立于不敗之地。
關鍵詞:CRM,CRM系統,CRM軟件,客戶關系管理,客戶管理軟件,客戶管理系統,客戶關系管理軟件,客戶關系管理系統