




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、開放源代碼的數字資源管理系統DSpace和Fedora的分析和比較1背景我們對目前國際上流行的開放源代碼的數字資源管理系統進展了重點的分析和試用,尤其對目前流行的兩種開放源代碼數字資源管理系統DSpae1和Fedra2的體系構造、主要功能特點等做一些系統的分析和比較,希望可以為關注這些研究的單位和研究人員提供一些借鑒和參考。2DSpae的分析DSpae系統是IT和HP實驗室合作研究開發的為教育科研機構創立穩定的環境來長期保存和獲得原生數字材料,捕捉、存儲、索引、保存以及傳播數字財產的系統平臺。2002年10月,該平臺開場在IT正式效勞根本存檔元素。每一個數字條目由一個數字館藏擁有,它可以出如今
2、其他的數字館藏中,但是只有唯一的所有者擁有館藏。數字條目被進一步劃分為命名的數字流包(BundlesfBitstreas)。數字流(BitStreas)是由比特位組成的一般的計算機文件。具有親密聯絡的數字流可以組成數字流包。每個數字流與一種數字流格式相關聯。因為提供長期保存效勞是DSpae效勞的一個重要方面,所以獲取用戶提交的文件的特定格式是很重要的。在DSpae中,一個數字流格式是用來指向一個特定文件格式的唯一方法。例如:對irsftrd2000格式的數字流的解釋是通過指向irsftrd2000應用程序的引用來隱式地定義。數字流格式比IE類型或者文件名后綴更能準確表達格式。例如:對irsft
3、rd2000格式的數字流的解釋是通過指向irsftrd2000應用程序的引用來定義的;而采用IE類型的Appliatin/s-rd和文件名后綴的,d覆蓋了irsftrd應用的多種版本,每種版本對應可能特性不同的數字流5。2.2DSPae的體系構造DSPae系統分為三層,每一層由一系列組件組成。DSpae的體系構造6其中存儲層(StrageLayer)負責對數字條目數字對象和關聯的元數據QualifiedDublinre元數據標準進展存儲,數字內容存儲在文件系統中,以數字流和數字流包的形式與條目相關聯,條目中可以包含不同類型的文件。業務邏輯層(BusinessLgiLayer)由處理DSpae系
4、統各個獨立功能的一系列組件組成,如:閱讀、檢索、用戶組管理和受權、工作流管理、內容管理等。應用層(AppliatinLayer)提供終端用戶交互和接口功能,基于eb的用戶界面,批量數據導入工具,AI元數據供應等。考慮到長期保存的需要,DSpae提供對NRI句柄的支持,保證給每個數字條目一個全球唯一的標識符。2.3DSpae的主要功能特點(1)DSpae中的元數據支持DSpae中的存檔內容具有3種元數據。描繪元數據每個數字條目對應有一個QualifiedDublinre描繪元數據記錄。QualifiedDublinre之外的其他關于數字條目的描繪元數據可以以序列化的數字流的形式存在。數字空間群和
5、數字館藏具備一些簡單的描繪元數據,存在于系數據庫中。管理元數據包括技術元數據,數字化過程元數據和受權策略等數據。大多數存在于DSpae的關系數據庫表中。構造元數據包括的信息有:如何展示一個數字條目,或者是將個數字條目內部的數字流給用戶;數字條目組成部分之間的關系。例如:組成一個論文的一組TIFF圖,每幅圖代表其中一頁,構造元數據可以將其中的每一張圖像表示為一頁,并表示每頁的順序信息5。(2)DSpae中的電子用戶(E-Peple)DSpae中的許多功能如:文檔發現和提取都可以匿名使用,但是用戶必須經過身份驗證才能行使如提交,E-ail通知訂閱或管理的功能。用戶可以通過分組來方便地管理。DSpa
6、e中把用戶叫做“E-Peple,因為在有些時候一些用戶可能是機器而非真正的人。DSPae中保存的每個E-Persn的信息如下:郵件地址;姓名;用戶是否可以通過eb界面登錄,或者是必須使用X509驗證7;密碼;訂閱的數字館藏列表;電子用戶是通過自己注冊產生,還是通過該機構的個人信息數據庫產生。(3)DSpae中的受權策略DSpae中采用基于分組的資源控制策略,權限策略可以針對個別的用戶和匿名用戶,也可以適用于電子用戶工作組。對用戶用戶組的受權必須明確地聲明,缺省情況下,DSpae中采用“否認受權策略。而且權限也不能隨意擴展,比方說,某個用戶具有某個數字條目的讀權限,但不一定具備與該條目關聯的數字
7、流文件的讀權限。(4)可定制的工作流機制DSpae中的館藏資源的提交和管理基于一個可以定制的工作流過程運行。一般情況下,一個數字館藏的工作流分3個步驟,并且每個步驟對應有可以行使該操作的電子用戶組,假如某個步驟沒有對應的操作用戶組,那么該步驟在實際的過程中將被忽略。當某個步驟被激活時,執行該步驟的任務被參加到相關的用戶組的“任務池中,并且組中的用戶獲得通知,從“任務池中取出該任務處理,完成后進入下一步。工作流流程可以通過DSpae提供的管理員工具來定制,具有管理員身份的用戶可以根據館藏資源的詳細提交過程使用管理工具定義合適的資源提交流程。(5)資源的唯一標識符策略在DSpae中采用美國國家研究
8、推進機構(TherpratinfrNatinalResearhInitiatives,NRI)的句柄系統(HandleSyste)8來生成資源標識。每個DSpae站點要從NRI獲得一個唯一的前綴,站點本身可以運行一個句柄效勞部分5。(6)DSpae中的資源開放效勞DSpae系統實現了AI-PH協議9,通過公開提供可匿名訪問的數字條目的D元數據。另外,數字館藏構造也采用AI協議的“集合(Sets)機制公開。DSpae中采用L的開放源AIat框架來提供這項功能。DSpae系統以一種簡單的方式支持SFX10的penURL協議11。假如使用機構有一個SFX效勞器,DSpae將給每一個數字條目頁上顯示一
9、個penURL鏈接,自動使用D元數據。另外,DSpae可以響應外來的penURL懇求。目前,只是簡單地把penURL中的信息傳遞給檢索子系統,會給出一個結果列表,在列表頂部會給出最相關的數字條目。(7)DSpae的檢索和閱讀功能DSpae的索引和檢索模塊提供一個簡單的API,允許對新內容作索引,重建索引以及在指定范圍內檢索。這個API來自免費的Java搜索引擎Luene12。Luene支持字段檢索、停詞(Stprds)、詞干(Steing)以及不重建索引增加新的索引內容的才能。閱讀子系統提供了一個簡單的API來指定一個索引,或該索引的一部分。可以被閱讀的索引有IteTitle,Itelssue
10、Date和Authrs。閱讀范圍可以從數字空間群到數字館藏。(8)數據的導入導出DSpae包括導入和導出數字條目的批處理工具,采用簡單的目錄構造組織,D元數據存成XL文件。這些工具可以用來作為在DSpae和其他系統之間遷移的基矗還提供一個基于ETS13的導出工具,將數字條目導出成ETS格式的元數據記錄,但還不提供對ETS格式的元數據的導入功能,DSpae開發組方案在將來的版本中提供基于ETS的元數據導入工具。3Fedra的分析Fedra(FlexibleExtensibleDigitalbjetandRepsittyArhiteture)系統2是由Andre.elln基金會資助,由Virgin
11、ia和rnell大學結合開發的開放源代碼系統,遵守zilla開放源代碼協議。Fedra是一個通用的數字對象管理系統。可以用在很多地方,包括:數字圖書館、內容管理、數字資產管理、資源保存等。2001年發布Fedra1.0版,目前最新版本2.0版。3.1Fedra的數據模型(1)Fedra的數字對象框架數字對象框架(DigitalbjetArhiteture,DA)最早是illiaY.Ars于1997年提出的,后來在Fedra系統中得到實現。Fedra中的數字對象的構造模型如圖2所示。數字對象的構造模型14PersistentID(PID),數字對象唯一標識符(DigitalbjetIdentif
12、ier),用來唯一地標識一個數字對象,以便于在命名空間內唯一地引用該數字對象。系統元數據(Systeetadata),描繪整個數字對象,用來管理該數字對象和建立數字對象的索引。數據元素(Datastrea),是數字對象所包含的數據,它可能是元數據,也可能是數據本身。假如是元數據,可能是各種格式的,比方Dublinre,AR。假如是數據本身,可能是文本、圖像、音頻、視頻數據。一個數字對象包含一個或者多個數據元素。數據發布器(Disseinatr),是數字對象內部的一種構造,對應著一種發布數字對象內容的方式。包括兩部分:接口定義(BehavirDefinitin)和接口的實現(Behavireha
13、nis),分別對應著對數據內容的操作接口和對數據內容操作的接口的實現14。(2)Fedra的倉儲倉儲(Repsitry)是存儲管理數字對象的容器,是Fedra系統中非常重要的實體。倉儲實現了數字對象的存儲管理,并且通過一定的訪問控制策略提供了數字對象內容發布的機制。數字對象存放在倉儲里面,一個數字對象對外部可見的只是它的唯一標識符,與數字對象的交互只能通過倉儲訪問協議進展14。3.2Fedra的體系構造Fedra是一個三層構造的系統,采用靈敏可變的數字對象倉儲體系構造。Fedra的體系構造圖15最上層是管理和訪問接口層,定義了系統的公共視圖,構建于ebServies技術之上。倉儲提供了兩個相關
14、的ebServies,管理ebServie和訪問ebServie。Fedra管理接口定義了管理倉儲的公開接口,包括創立、修改、刪除數字對象或者數字對象的數據元素包含數據和元數據。Fedra訪問接口定義了訪問數字對象的公共接口。中間層是內部效勞層,包含管理子系統,訪問子系統,平安子系統。管理子系統和訪問子系統分別實現了管理和訪問接口。底層是存儲于系統,負責讀寫數字對象和數字對象元素。數字對象的元素可以是分布的。存儲子系統需要負責實時懇求和緩存分布的數據。Fedra支持通過HT-TP協議和FTP協議訪問分布式資源。3.3Fedra的主要功能特點16(1)靈敏的數字對象模型Fedra數字對象模型提供
15、很大的靈敏性,支持創立各種類型的對象,包括:文檔、圖像、電子書、多媒體學習對象、數據集、元數據等。Fedra中的元數據模型可以用數字對象中的一個或多個數據流描繪和訪問,可以是一個本地的元數據集合,一個標準的元數據集合,或者是D元數據的擴展。(2)以ebServie方式發布管理和訪問效勞Fedra倉儲系統提供的管理和訪問效勞作為ebServie進展發布,通過SDL(ebServiesDesriptinLanguage)進展描繪。同時訪問效勞接口還提供了基于eb頁面的調用實現。外界對數字對象的訪問通過調用數字對象提供的行為中的詳細方法來進展。數字對象的行為作為分布式的ebServie進展實現,用S
16、DL進展表述,通過HTTPGET/PST或者SAP(SiplebjetAessPrtl)進展訪問。(3)內容版本控制通過Fedra管理接口修改數據元素或者是數據發布器可以自動地生成新版本的相應內容。Fedra對象包含一個所有版本的記錄,對以往版本內容的訪問可以通過在Fedra訪問效勞(API-A和API-A-LITE)懇求之上參加時間戳來實現。(4)XL格式的數據存儲和導入導出缺省情況下,Fedra數字對象在Fedra系統中以FedrabjetXL(FXL)格式編碼的XL文件形式存儲。數字對象中的內容數據保持本身的格式以數據元素(DataStrea)的形式存放在系統的序列化存儲區。數字對象可以
17、遵照FedrabjetXL(FXL)Shea或者是etadatsEndingandTransissinStandard(ETS)13Shea格式編碼過的XL文件的格式提交到Fedra存儲系統和從系統中導出。在Fedra的將來版本中還將支持PEG2/DIDL和ETS1.3標準。(5)對象之間的關聯支持Fedra提供對象之間關聯關系的聲明。對象到對象的關聯元數據用來表示對象之間的各種關系,包括:某個對象是一個數字館藏的成員,是否另一個對象的一部分從另一個對象派生,或者是等價于另外一個對象等。這些關系定義在Fedra的關聯本體集合中。(6)簡單檢索功能Fedra自動地為存儲系統創立兩種索引。缺省的檢
18、索索引是有關對象的屬性和D元數據元素。在Fedra2.0中,有一個新的基于RDF的資源索引,包含對象之間的關聯關系。這兩種索引都可以通過基于表現性狀態傳輸協議REST(RepresentatinalStateTransfer)17這種面向資源的eb效勞接口來檢索。(7)AI元數據采集效勞每個Fedra數字對象有一個原始的D記錄,符合AIPH2.0協議9標準所定義的Shea標準,這種元數據可以使用AIPH2.0標準訪問。(8)管理工具Fedra2.0系統提供一個遷移工具可以實現批量的對象導入和導出。遷移工具在2個新增強的命令行工具:Fedraingest和Fedra-exprt的根底上實現,可以
19、在不同的倉儲之間實現對象的挪動和復制,包括從以前的版本晉級。Fedra倉儲系統中包含一個管理員客戶端中的批處理工具,可以批量創立根底4DSpae和Fedra的比較通過上述對兩個系統的分析,可以總結出兩個系統之間的一些共同點和區別如下。4.1一樣點(1)都基于開放和模塊化的體系構造。DSpae基于一個三層構造而且數據模型基于AIS參考模型;Fedra使用靈敏可擴展的數字對象和倉儲體系構造。(2)都支持長期保存的問題,可以給同一種內容提供多種數字格式,使用技術元數據并保證一個全球唯一的標識符來訪問每個數字對象。(3)都支持數字對象,可以是原生的或者是數字化的,不受特定的文件格式或數字內容類型的限制
20、。(4)都采用ETS標準作為數據交換的格式。(5)都實現了AI協議,提供元數據采集效勞,方便系統之間的互操作。(6)系統都采用純Java實現,具有良好的跨平臺性。4.2不同點(1)處理數據的方式不同。DSpae中的數據和元數據作為獨立的兩個實體,Fedra中的數據和元數據被封裝在數字對象內部。(2)對內部數據的管理和訪問方式不同。DSpae直接將數據和元數據暴露給最終用戶,直接操作內部數據。Fedra為管理效勞提供2種公共的API(API-,API-lite),為訪問效勞提供2種公共的API(API-A,API-A-Lite),都通過ebServie的方式提供,不用直接操作內部數據。(3)信息
21、模型不同。DSpae的信息模型基于一些數字空間群(unities),由用戶和用戶組組成,包含數字館藏(lletins),再順次包含條目(Ites)。Fedra系統中把各種資源統一成數字對象,本身不直接支持館藏(lletin)的概念。為了描繪館藏,需要使用一個數字對象來表示包含適當的館藏描繪信息、權限元數據和創立數據對象的模版的館藏對象。(4)數據的導入導出支持不同。DSpae中提供終端用戶交互和接口功能,基于eb的用戶界面,批量數據導入導出工具。數據導入格式是DSpae內部的格式,數據導出格式可以是簡單的ETS編碼的文件。Fedra中提供客戶端形式的批量數據導入導出工具,格式采用ETS標準編碼,方便與其它系統之間交換數據。(5)元數據支持的靈敏程度不同。DSpae中內置的支持允許一些簡單修飾符的D元數據,假如要擴展其它的元數據方案,需要對數據庫構造進展修改。Fedra中的元數據模型可以是一個本地的元數據集合,一個標準的元數據集合,或者是D元數據的擴展。Fedra只提供對D元數據集中的元素進展索引和檢索的支持,假如對其他的元數據字段做索引和檢索,可以擴展一個外部的應用程序來實現,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 八步附近美容店活動方案
- 公交公司黨建活動方案
- 不可數名詞的用法與特點:初一英語核心知識點梳理
- 運輸車隊合作協議合同
- 公益捐贈合作協議
- 公會獎勵活動方案
- 公共交通管理活動方案
- 公務員書法培訓活動方案
- 公司diy手作活動方案
- 面粉購銷合同協議書
- 2024年攀枝花市仁和區向招考社區工作者真題
- BIM在公路工程中的三維可視化應用-洞察闡釋
- 離散數學考試題及答案
- 安徽省安慶望江縣聯考2025年七年級英語第二學期期中質量檢測模擬試題含答案
- 2024-2025學年人教版數學一年級下學期期末模擬試卷(含答案)
- 安徽省合肥一中2025屆高三最后一卷英語試題及答案
- 有關工廠實習心得體會模版
- 2025年江蘇省蘇州吳中、吳江、相城區初三英語一模試題及答案
- 2025年組織行為學專業考試試題及答案
- 智能化汽車中的專利戰略布局-洞察闡釋
- 不寐的中醫護理常規
評論
0/150
提交評論