數(shù)字檔案館技術(shù)及應(yīng)用_第1頁
數(shù)字檔案館技術(shù)及應(yīng)用_第2頁
數(shù)字檔案館技術(shù)及應(yīng)用_第3頁
數(shù)字檔案館技術(shù)及應(yīng)用_第4頁
數(shù)字檔案館技術(shù)及應(yīng)用_第5頁
全文預(yù)覽已結(jié)束

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)字檔案館技術(shù)及應(yīng)用一、數(shù)字檔案館的特征和功能數(shù)字檔案館是一個數(shù)字檔案信息系統(tǒng),它通過網(wǎng)絡(luò)將分散異構(gòu)的數(shù)字化檔案信息聯(lián)結(jié),實現(xiàn)資源共享。(一)數(shù)字檔案館的主要特征(1)信息存儲的數(shù)字化。數(shù)字化檔案信息是數(shù)字檔案館的資源基礎(chǔ),它有兩個來源:一是館藏檔案的數(shù)字化。主要體現(xiàn)為將存儲于不同載體的模擬檔案信息如紙質(zhì)檔案、聲像檔案信息等通過數(shù)字化處理轉(zhuǎn)換成數(shù)字形式。二是直接接收歸檔的電子文件。電子文件是基于網(wǎng)絡(luò)生成的原生數(shù)字信息。將這兩個來源的數(shù)字化信息進(jìn)行組織和管理,建立數(shù)據(jù)庫系統(tǒng)。(2)信息存取的網(wǎng)絡(luò)化。網(wǎng)絡(luò)是數(shù)字檔案館存在和運(yùn)行的保障。數(shù)字檔案館賴以網(wǎng)絡(luò)而生存,網(wǎng)絡(luò)出現(xiàn)故障,數(shù)字檔案館的運(yùn)作就要受到影響。是網(wǎng)絡(luò)將用戶端、Web服務(wù)器、檢索系統(tǒng)、對象數(shù)據(jù)庫等數(shù)字檔案館的各個組成部件連接,實現(xiàn)對數(shù)字檔案信息的網(wǎng)上發(fā)布、查詢和檢索。(3)信息資源的分布式管理。對各個分布式的數(shù)字對象資源進(jìn)行收集、存儲、發(fā)布和檢索。它要求各個數(shù)字檔案館遵循統(tǒng)一的高層協(xié)議,對基于不同系統(tǒng)平臺和應(yīng)用軟件產(chǎn)生的異構(gòu)數(shù)字檔案信息進(jìn)行整合,建立一個全面的數(shù)字資源庫,并提供統(tǒng)一的檢索入口。(二)數(shù)字檔案館的主要業(yè)務(wù)功能(1)數(shù)字檔案信息的收集和存儲。通過數(shù)字化技術(shù)將現(xiàn)有的館藏數(shù)字化,并通過在線和脫機(jī)方式接收各個立檔單位歸檔的電子文件及其元數(shù)據(jù)。在此基礎(chǔ)上,將不同格式和類型的數(shù)字化檔案信息轉(zhuǎn)換成統(tǒng)一格式,進(jìn)行壓縮處理和存儲。(2)數(shù)字檔案信息的組織和管理。對數(shù)字化對象進(jìn)行標(biāo)引和著錄,建立目錄和索引,并對電子文件及元數(shù)據(jù)進(jìn)行組織,分解出元數(shù)據(jù)和對象數(shù)據(jù),集成為元數(shù)據(jù)庫和對象數(shù)據(jù)庫。(3)數(shù)字檔案信息的發(fā)布和查詢。提供目錄級和文件級查詢服務(wù),以及基于內(nèi)容的多媒體信息檢索服務(wù)。(4)數(shù)字檔案信息的安全和權(quán)限管理。由于檔案本身的保密性,所以數(shù)字檔案館的安全和權(quán)限管理尤為重要。可利用身份認(rèn)證、數(shù)據(jù)加密、數(shù)字水印、數(shù)字簽名以及防火墻等技術(shù)實現(xiàn)對用戶身份的識別及權(quán)限控制,以及數(shù)字檔案館的安全管理。數(shù)字檔案館是傳統(tǒng)檔案館的未來發(fā)展趨勢,但數(shù)字檔案館建設(shè)必須以傳統(tǒng)檔案館為基礎(chǔ)和依托。一方面,傳統(tǒng)檔案館的實體館藏是數(shù)字檔案館的資源基礎(chǔ);另一方面,數(shù)字檔案館是傳統(tǒng)檔案館向網(wǎng)絡(luò)空間的延伸。傳統(tǒng)檔案館的資源在網(wǎng)絡(luò)環(huán)境中可以被更多的人遠(yuǎn)程獲取。此外,數(shù)字檔案館是收集和管理電子文件的重要方式。傳統(tǒng)檔案館以紙質(zhì)檔案為主要管理對象,它的一套管理機(jī)制和方法適用于紙本文件而不適用于電子文件,而數(shù)字檔案館則可以實現(xiàn)電子文件的在線歸檔、組織和利用,完成對電子文件整個生命周期的控制。二、數(shù)字檔案館關(guān)鍵技術(shù)數(shù)字檔案館是以計算機(jī)硬、軟件技術(shù)為基礎(chǔ),以網(wǎng)絡(luò)通信技術(shù)為支撐,并輔以各種高新技術(shù)而建立的一種集成信息系統(tǒng)。數(shù)字檔案館在信息的收集、存儲、組織、管理和利用的過程中,必須借助各種高新技術(shù)。具體包括:(1)檔案數(shù)字化過程中的主要技術(shù):文字圖像掃描技術(shù)、光學(xué)字符識別(OCR)、視音頻捕捉、多媒體信息壓縮等技術(shù)。對于音頻、視頻以及靜態(tài)圖像、活動影像等多媒體信息必須確定數(shù)字化的規(guī)范格式。(2)數(shù)字檔案信息加工、組織和管理過程中的主要技術(shù):應(yīng)該以標(biāo)準(zhǔn)化方式對數(shù)字化資源進(jìn)行加工和組織。在傳統(tǒng)檔案著錄和標(biāo)引的基礎(chǔ)上,根據(jù)規(guī)范的元數(shù)據(jù)標(biāo)準(zhǔn),抽取相應(yīng)的元數(shù)據(jù),并建立元數(shù)據(jù)集。在此過程中,需要采用多媒體信息標(biāo)引技術(shù)、信息抽取技術(shù)、海量信息存儲和組織技術(shù)、數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)集成技術(shù)、超大規(guī)模數(shù)據(jù)庫技術(shù)等。(3)數(shù)字檔案信息發(fā)布和查詢過程中的主要技術(shù):多媒體數(shù)據(jù)壓縮和傳輸技術(shù)、分布式資源與運(yùn)行管理技術(shù)、圖像與視頻數(shù)據(jù)檢索技術(shù)、基于內(nèi)容的信息檢索技術(shù)等。(4)數(shù)字檔案館的安全和權(quán)限管理中的主要技術(shù):防火墻技術(shù)、密鑰技術(shù)、身份認(rèn)證技術(shù)、數(shù)字簽名技術(shù)、數(shù)字水印技術(shù)等。需要指出的是,在數(shù)字檔案館的建設(shè)過程中,對于維護(hù)檔案信息的真實性、完整性和可靠性,以及保密性方面有著很高的要求。如果檔案在數(shù)字化和利用過程中喪失了其完整性和可靠性,那么數(shù)字圖書館存在的基礎(chǔ)將會動搖。這需要在數(shù)字化過程中采用最佳技術(shù)盡量減少信息失真,并在信息傳輸和利用過程中采用各種安全保障技術(shù)。三、數(shù)字檔案館的發(fā)展階段數(shù)字檔案館建設(shè)必須以檔案館業(yè)務(wù)工作自動化為基礎(chǔ),我國數(shù)字檔案館建設(shè)一般需要經(jīng)歷以下三個階段:第一個階段:檔案館自動化階段。實現(xiàn)檔案實體管理和檔案信息組織的自動化。具體包括:檔案登記、借閱、催還以及庫房管理等日常業(yè)務(wù)和實體管理的自動化,以及檔案信息的自動分類、自動編目和自動標(biāo)引,信息檢索計算機(jī)化,建立內(nèi)部局域網(wǎng)。第二個階段:單個數(shù)字檔案館建設(shè)階段。主要包括館藏數(shù)字化、檔案網(wǎng)站建設(shè),以及接收電子文件進(jìn)館并提供利用等內(nèi)容。目前中國很多數(shù)字檔案館項目正處于這個階段。而大規(guī)模接收電子文件進(jìn)館工作還沒有真正展開。第三個階段:多個數(shù)字檔案館互聯(lián)階段。實現(xiàn)多個數(shù)字檔案館之間的互操作,以各個數(shù)字檔案館共同遵循的高層協(xié)議為基礎(chǔ),整合各個檔案館的資源并提供統(tǒng)一的檢索入口。我國大部分省級以上的綜合檔案館,國家專業(yè)系統(tǒng)和大型企業(yè)的檔案館,以及有關(guān)高校的檔案館已經(jīng)具有檔案自動化的基礎(chǔ),館藏數(shù)字化工作正在持續(xù)進(jìn)行,目錄型和全文型數(shù)據(jù)庫也在紛紛建立。全國90%以上的省市檔案機(jī)構(gòu)已經(jīng)建立了檔案網(wǎng)站,經(jīng)國家檔案局批準(zhǔn),中國檔案報社主辦的中國檔案信息門戶網(wǎng)站——“中國檔案網(wǎng)”已經(jīng)于2007年7月開通??傮w上,我國東部發(fā)達(dá)地區(qū)的數(shù)字檔案館建設(shè)處于第二階段即單個數(shù)字檔案館建設(shè)階段,而中西部地區(qū)的數(shù)字檔案館建設(shè)還處于由第一階段向第二階段的過渡期。四、我國綜合性數(shù)字檔案館的典型模式——深圳數(shù)字檔案館深圳數(shù)字檔案館是中國建設(shè)的第一個綜合性的數(shù)字檔案館,始建于2000年,工程分為3期,2002年完成了第1期目標(biāo),2008年1月第2期目標(biāo)“深圳市市民中心電子文件接收管理系統(tǒng)”已經(jīng)通過了專家鑒定。深圳數(shù)字檔案館在功能上屬于電子政務(wù)系統(tǒng),并把它作為政府信息的綜合發(fā)布平臺,主要完成以下幾個方面的建設(shè)任務(wù):(1)基礎(chǔ)設(shè)施的構(gòu)建。建立檔案館內(nèi)部網(wǎng)、與政府連接的政務(wù)網(wǎng)、與互聯(lián)網(wǎng)連接的公眾網(wǎng)三個層次,并實行三網(wǎng)物理隔離,形成三個相互獨(dú)立的網(wǎng)絡(luò)。(2)檔案信息資源建設(shè)。包括館藏檔案的數(shù)字化、各立檔單位檔案文件材料的接收、各種具有檔案性質(zhì)的專題信息資源庫里的檔案信息的采集,以及互聯(lián)網(wǎng)上具有檔案價值的信息的搜集。(3)應(yīng)用系統(tǒng)的開發(fā)。主要是建立信息的采集、管理、利用和維護(hù)模塊。深圳數(shù)字檔案館應(yīng)用系統(tǒng)的建設(shè)目標(biāo)是建成一個可擴(kuò)展的網(wǎng)絡(luò)應(yīng)用系統(tǒng),其功能涵蓋檔案數(shù)字化加工、電子檔案信息的采集、處理、存儲、歸檔、組織、發(fā)布、利用及數(shù)字資源管理全過程。采用的關(guān)鍵技術(shù)包括:大量并發(fā)查詢、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、海量數(shù)據(jù)存儲、網(wǎng)絡(luò)安全、圖像分類、智能檢索、人工語言向自然語言轉(zhuǎn)換、視頻點播、虛擬現(xiàn)實技術(shù),等等。深圳數(shù)字檔案館應(yīng)用系統(tǒng)的功能如圖所示。深圳數(shù)字檔案館應(yīng)用系統(tǒng)結(jié)構(gòu)圖(4)標(biāo)準(zhǔn)規(guī)范建設(shè)。在數(shù)字檔案館建設(shè)過程中制定各類管理性、業(yè)務(wù)性和技術(shù)性標(biāo)準(zhǔn)規(guī)范。深圳數(shù)字檔案館的標(biāo)準(zhǔn)規(guī)范體系包括管理、業(yè)務(wù)、技術(shù)三個層面。管理性標(biāo)準(zhǔn)規(guī)范包括計算機(jī)安全法規(guī)與標(biāo)準(zhǔn),數(shù)字檔案館工作人員、用戶及設(shè)備管理規(guī)范,利用管理規(guī)定,以及數(shù)字檔案館信息資源合法性的確認(rèn)等。業(yè)務(wù)性標(biāo)準(zhǔn)規(guī)范包括術(shù)語標(biāo)準(zhǔn)以及相關(guān)的電子文件和電子檔案管理的標(biāo)準(zhǔn)、規(guī)范。技術(shù)性標(biāo)準(zhǔn)規(guī)范包括數(shù)字檔案館軟硬件基礎(chǔ)設(shè)施建設(shè)技術(shù)標(biāo)準(zhǔn),軟件系統(tǒng)工作平臺技術(shù)標(biāo)準(zhǔn),數(shù)據(jù)存儲壓縮格式規(guī)范,數(shù)據(jù)長期保存格式規(guī)范,數(shù)據(jù)加密算法規(guī)范,網(wǎng)絡(luò)數(shù)據(jù)傳輸規(guī)范和數(shù)字水印標(biāo)準(zhǔn)等。目前深圳市檔案館已經(jīng)完成了《電子郵件公文歸檔與管理規(guī)則》、《電子文件元數(shù)據(jù)標(biāo)準(zhǔn)》、《電子文件生命周期表》、《通用電子文件保管期限表》等標(biāo)準(zhǔn)和規(guī)范的起草工作。(5)人才隊伍建設(shè)。深圳數(shù)字檔案館的人才隊伍建設(shè)貫徹以管理型人才為基礎(chǔ),以復(fù)合型人才為重點的指導(dǎo)思想。根據(jù)數(shù)字檔案館業(yè)務(wù)工作的劃分,所需人才的類型有:檔案采集、處理與數(shù)據(jù)庫加工人才;信息技術(shù)及計算機(jī)系統(tǒng)和網(wǎng)絡(luò)設(shè)計與開發(fā)人才;檔案信息分析、研究與咨詢?nèi)瞬?數(shù)字檔案館理論與方法研究人才;數(shù)字檔案館系統(tǒng)運(yùn)營與服務(wù)的管理人才。在中國數(shù)字檔案館建設(shè)過程中,電子文件的在線接收和管理是一個難題,令人鼓舞的是,深圳數(shù)字檔案館(二期工程)在該領(lǐng)域邁出了重要的一步。深圳數(shù)字檔案館系統(tǒng)(二期)以電子文件為管理對象,將ISO15489文件管理規(guī)范、ISO14721數(shù)字資源長期保存參考模型(OAIS模型)、ISO23081文件元數(shù)據(jù)總則與中國國情相融合,以電子文件元數(shù)據(jù)標(biāo)準(zhǔn)為核心,以O(shè)AIS模型為依據(jù),設(shè)計了一套全程控制電子文件真實、完整與長期可讀的管理系統(tǒng),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論