數字圖書館史料數字化_第1頁
數字圖書館史料數字化_第2頁
數字圖書館史料數字化_第3頁
數字圖書館史料數字化_第4頁
數字圖書館史料數字化_第5頁
已閱讀5頁,還剩11頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數字圖書館史料數字化

編者按:本文主要從緣起;歷史文獻的

數字化;文物史料的數字化;文物史料的數

字化,迎接史料數字化時代,對數字圖書館

史料數字化進行講述。其中,主要包括:數

字化是史料處理的必由之路,歷史文獻作為

人類精神產品,具有可復制性和可移植性,

并且必須依托載體而存在,建立數字圖書館

的關鍵在于以統一的標準和規范為基礎,表

現為同一類型文件格式的統一,文物為人類

有形的史跡遺存,它具有不可復制性和唯一

性,文物數字化的終極形式為數字化博物館,

最新技術為虛擬現實,無論文獻數字化和文

物數字化,歸根結底,就是把史料統一為計

算機數據,這些數據經互聯網而整合成為一

個大的史料數據庫,新史料學有四個基本特

八占、、??

一、文獻多媒體化;

二、文物虛擬現實化;

三、史料極大豐富;

四、計算機網絡檢索技術成為史料學的

命脈,等。具體材料請詳見:

提要:隨著信息技術的進步,史料數字

化已成潮流。把史料分為歷史文獻和史跡遺

存兩類進行研究,提出了建立對應的數字圖

書館和數字博物館的解決方案,并對實現這

一方案的具體技術從理論到實踐作了歸納

和總結。

關鍵詞:史料;數字化;數字博物館;

虛擬現實

緣起

史料包括歷史文獻與史跡遺存,是史學

研究的基礎。中國歷史悠久,歷代文獻遺物

浩如煙海,近現代又有大批新史料發現與累

積。史學界對史料的整理和研究歷來非常重

視。王國維使用兩重證據法,“取地下之實

物與紙上之遺書辨證,取異族之故書與吾國

之故籍互相補證,取外來之觀念與固有之材

料互相參證”,進行古史新證,解決了許多

重大史學問題。顧頡剛等“古史辨”派以疑

古辨偽為宗旨,進行了系統的古史辨偽,

“古史辨”作為對“古書”與“古事”的

一種史料考訂工作,頗有意義。[1]以傅斯

年為代表的史料學派提出了“史學即是史

料學”的觀點,傅氏認為:“只要把材料整

理好,則事實自然顯明了。一分材料出一分

貨,十分材料出十分貨,沒有材料便不出

貨”,他們徹底從故紙堆中脫身而出,宣稱

不讀書只找材料,“上窮碧落下黃泉,動手

動腳找東西”,[2]在考古等領域很快取得

舉世矚目的成績,一舉超越前人的成就。陳

寅恪和陳垣等諸先生也都十分重視史料,把

考實作為治史方法的前提。郭沫若、呂振羽、

翦伯贊、侯外廬、范文瀾等先生高舉馬克思

主義史學觀之利器,”將歷來為封建學者所

湮沒、改造、曲解的古代史料,加以重新辨

別、整理和闡發”,開辟了中國歷史研究的

新途徑。

人類已經進入信息時代,我們現在不僅

面臨著用新技術來整理舊史料的問題,而且

隨著考古新發現的不斷涌現和科技的發展,

史料的容量和形式急劇膨脹。以何種方法處

理、存儲史料,并且能夠讓學者從中方便迅

速地檢索和得到所需的信息,是當前史料學

的一個大問題。

數字化是史料處理的必由之路。第一,

把各種史料統一為計算機數據,方便存儲和

檢索;第二,使史料的物理體積大大縮小,

方便攜帶;第三,可以低成本無差錯拷貝,

方便傳播和普及。目前,不論是印刷文檔、

手寫稿,還是電子文檔、音像文件、甚至于

遺址與文物,越來越多的史料逐漸被數字化,

出現了數據倉庫、數據集市、數據采集等新

概念和信息數字化處理方法,逐步形成了大

數據量存儲和管理模式。全球范圍內,建立

史料數據庫逐步成為潮流。聯合國推動

MemoryoftheWorld計劃以挽救某些瀕臨滅

絕的人類文明,西方各國也無不積極推動數

字圖書館、數字博物館或數字典藏建設,如:

美國有國會圖書館的AmericanMemory計劃

和六所大學所主導的數字圖書館計劃等;加

拿大有國家數字典藏計劃;日本和IBM合作

的數字博物館計劃;大英圖書館的敦煌數據

數字化計劃等,不勝枚舉。自上世紀90年

代中期以來,因特網技術對整個社會的影響

程度全面加深,信息科技已然啟開了社會全

面急速變遷的序幕。借助網絡之一利器,分

散在世界各地的史料數據資源得以有效整

合,因特網已經成為一個超大型的史料數據

庫。但是,從總體來看,史料數字化的研究

和實踐才剛剛起步,還處于探索階段,因此,

對史料數字化進行整體的研究是很有必要

的。

下面,把史料按照其性質分為兩類進行

討論,其一為人類精神產品類史料一一文獻;

其二為物質產品類史料一一文物。

歷史文獻的數字化

歷史文獻作為人類精神產品,具有可復

制性和可移植性,并且必須依托載體而存在。

國家標準局批準公布的GB4894—85《情報與

文獻工作詞匯一一基本術語》定義道:“文

獻是記錄有知識的一切載體”。根據這一標

準定義,歷史文獻就是以文本、圖形、符號、

音像、軟件等各種形式固化在一定物質載體

上的歷史資料,其物質載體為:紙、膠片、

磁帶、光盤等。歷史文獻數字化的目標是將

原來在各種物理載體上存儲的信息,統一轉

變為最基本的比特,用0和1來表示,成為

計算機可以識別的數據。

歷史文獻數字化的終極形式為數字圖

書館的出現。所謂數字圖書館,就是利用現

代信息技術對有價值的圖像、文本、語音、

音響、影像、影視、軟件和科學數據庫等多

媒體信息進行收集,組織規范性的加工和壓

縮處理,使其轉化為數字信息,然后通過計

算機技術進行高質量保存和管理,實施知識

增值,并通過網絡通訊技術進行高效、經濟

地傳播、接收,使用戶可以在任何時間、任

何地點,都能從網上得到各種服務,為公民

的終身學習機會做出貢獻,成為國家的知識

基礎設施。[3]

建立數字圖書館的關鍵在于以統一的

標準和規范為基礎,表現為同一類型文件格

式的統一。當前,數字圖片格式主要有BMP、

GIF、JPG、PCX、TGA、TIF等;數字音頻格

式有WAV、MP3、MIDI等;數字視頻格式有

mpg、mov、avi、rm等;網頁格式有html,vrml,

xml,sgml等;數據庫有

Oracle,SQLServer,Sybase,DB2,Informix,

Access等。文獻數字化的過程中一般采取最

通用的文件格式,這樣既便于為最多的人服

務,又便于數據的升級。數字圖書實現形式

主要有兩種:一是采用掃描錄入方式將書籍

資料按原貌逐頁存儲為圖象文件;二是以文

本方式存儲文獻內容,輔之以全文檢索系統

構成全文檢索數據庫。前一種方式適合古籍

善本和以往出版圖書的數字化,后一種適合

新出版圖書的數字化。

建立數字圖書館的設想首先由美國人

提出,1994年6月,美國召開了“第一屆數

字圖書館理論與實踐年會”。同年9月,美

國國家科學基金會、國家宇航局和國防部高

級研究署聯合公布了一項為期4年、投入

2440萬美元的《數字圖書館啟動計劃》,在

斯坦福大學、密西根大學、伊利諾斯大學、

卡耐基-梅隆大學、加州大學伯克利分校和

圣?巴巴拉分校等6所高校進行數字圖書館

的分項研究,同年10月,美國國會圖書館

推出數字化項目,領導與協調全國的公共圖

書館、研究圖書館,將其收藏的圖書、繪畫、

手稿、照片等轉換成高清晰度的數字化圖像

并存儲起來,通過互聯網供公眾利用。繼美

國之后,英國、法國、日本、德國等西方發

達國家以及亞洲的新加坡、韓國也先后提出

各自的數字圖書館計劃,投入巨額實施資金。

我國數字圖書館建設開始于1997年,

北京圖書館作為國家圖書館,經國家計委批

準建立了“中國試驗型數字圖書館”項目,

并開展了與此有關的專題科研。同年12月,

我國民營計算機高科技企業北京世紀超星

信息技術有限公司將其遠程圖書瀏覽器安

裝到瑞得在線網站上,創建了國內首家以圖

像存儲為主的數字圖書館一一超星數字圖

書館,此后,國家連續實施了“中國數字圖

書館工程”和“中國數字圖書館示范工

程”,國內各大圖書館和高校紛紛跟進,掀

起了一股數字化潮流。據不完全統計,目前

國內的中文數字圖書館已達數百家之多,以

學術專業書籍為主要內容的超星數字圖書

館的數字圖書已超過到40萬種,中國數字

圖書館也已達20萬種以上。此外,書生之

家“中國圖書網”和方正apabi數字圖書館

也都非常有實力。

目前,我國科技期刊的全文數據庫主要

有“中國期刊網”、“萬方數字化期刊網”

和“維普中文科技期刊全文數據庫”等,以

中國期刊網為例,收有幾年來5300種期刊

的全部文章,重要期刊幾乎被網羅殆盡。

除此之外,因特網上一些小型的數字書

庫更是數不勝數,如:香港中文大學中國文

化研究所“華夏文庫”及“古文獻資料

庫”;臺灣的漢學研究中心典藏目錄及數據

庫,包括典藏國際漢學博士論文摘要資料庫、

明人文集聯合目錄及篇目索引資料庫、兩漢

諸子研究論著目錄資料庫、經學研究論著目

錄資料庫、敦煌學研究論著目錄資料庫、外

文期刊漢學論著目次資料庫、國際漢學資源

機構錄資料庫,可進行資料庫整合查詢;北

京書同文數字化技術有限公司的《四庫全

書》、《四部叢刊》、《康熙字典》的電子版等

等。[4]千萬不要小看這些局部的文獻數字

化工作,集腋成裘,聚沙成塔,這些數據經

因特網而整合為一體,完全不受其物理距離

的影響,從長遠看,分散的學術單位與個學

者是文獻數字化的真正主力軍,整個因特網,

就是一個大的數字圖書館集合。

文物史料的數字化

文物為人類有形的史跡遺存,它具有不

可復制性和唯一性。根據中華人民共和國文

物保護法第二條之規定,文物包括以下內容:

具有歷史、藝術、科學價值的古文化遺址、

古墓葬、古建筑、石窟寺和石刻;與重大歷

史事件、革命運動和著名人物有關的,具有

重要紀念意義、教育意義和史料價值的建筑

物、遺址、紀念物;歷史上各時代珍貴的藝

術品、工藝美術品;重要的革命文獻資料以

及具有歷史、藝術、科學價值的手稿、古舊

圖書資料等;反映歷史上各時代、各民族社

會制度、社會生產、社會生活的代表性實物。

具有科學價值的古脊椎動物化石和古人類

化石同文物一樣受國家的保護。需要注意的

是第四款規定的革命文獻資料以及手稿、古

舊圖書資料等為文物與對史料的分類并不

矛盾,這類文物其內容為文獻,其物質載體

為文物。

文物作為史料的價值,在于其中包含的

歷史信息。所以對文物信息的擷取與整理一

直受到人們的重視。如對甲骨文的墨拓、整

理而成的《甲骨文合集》,如對青銅器進行

整理而成的《兩周金文辭大系圖錄考釋》,

這些信息擷取成果目前大多以文獻的形式

而存在。現代以來,經科學考古而發現的遺

址和遺物都有詳細的考古報告。報告中的繪

圖形式有平面圖、剖面圖、結構圖、局部圖、

分解圖、透視圖以及器物繪畫等;照相有地

貌全景、發掘區全景、不同角度和感光的遺

物特寫,其他如專業技術鑒定報告、文物修

復與模型制作、拓印圖片等等,有的還附有

航拍圖片和電影、錄像。考古報告是對文物

環境、外觀、結構、尺寸、顏色、紋理、成

份、氣味等信息的全面擷取。文物的數字化

即為文物信息的數字化。

文物數字化的終極形式為數字化博物

館,最新技術為虛擬現實。

虛擬現實技術是上世紀90年代以來為

科學界和工程界所廣泛關注的技術。它利用

計算機生成一種模擬的實物與環境,通過多

種傳感設備使用戶“投入”到該環境中,實

現用戶與該環境直接自然交互。虛擬現實技

術的產生首先源于軍事訓練的需要,現在已

經廣泛應用于航空、航海、醫學訓練,建筑

和環境規劃,影視制作,甚至于核試驗的虛

擬。對大眾來說,最切身的感受是虛擬現實

技術使我們在電影侏羅紀公園中看到了栩

栩如生的恐龍。現在虛擬現實技術已經做到

了網絡的分布式互動,支持多人實時通過網

絡進行交互活動,每個用戶在一個虛擬現實

環境中,通過計算機與其它用戶進行交互動

作,并共享信息。我們可以在許多網吧中看

到玩“大地勇士”游戲的青年,他們同分布

在世界各地的人們在虛擬的“埃及金字塔”

中進行激烈槍戰。

文物的虛擬現實只是靜態實物的虛擬,

因此,在技術實現上要容易得多,我們把所

有依據科學考古而得到的文物信息輸入計

算機,就能借助虛擬現實生成程序來“制造”

出三維的虛擬現實文物,借助這一技術,許

多不易接觸、難得一見的歷史文物可以被普

通學者摩拳于股掌之間。另外,使用360度

全景攝影技術拍攝的高質量圖像也可以生

成逼真的虛擬情景,從而使得用戶可以使用

普遍微機通過鼠標和鍵盤真實的感受到和

虛擬現實一樣效果,不過它的人機交互性能

要差許多。在日本早稻田大學網站,我們可

以看到該校建筑學系編纂的從1996年到

2002年對埃及PyramidsofDahshur的8次考

古發掘報告,其中包括了用vrml技術制作

的虛擬現實墓室結構和用

QuickTimeVRPanorama全景攝影技術制作的

金字塔外部環境。

我國的數字博物館建設和文物數字化

工作已經開始起步,故宮博物院是具有600

年歷史、8000座殿宇樓閣、百萬件文物的我

國最大博物館,其網站于2001年7月16日

開通,最初只收錄了各類圖片4000余張,

實現了文物影像的細節瀏覽和虛擬展廳的

360度旋轉展示[5]o到T2002年7月30日,

由中國故宮博物院和日本凸版印刷公司共

同建立的故宮文化遺產數字化應用研究所

召開記者招待會,宣布以故宮太和殿為中心

的紫禁城虛擬現實工程目前進展順利[6]o

這說明故宮文物的數字化工作已經進入了

虛擬現實的實質性階段。北京四方臺數字技

術有限公司使用360度全景攝影技術,已經

制作了所有中國世界遺產的虛擬實景,此外

他們還制作了中國古城鎮民居、中國歷史文

化名城、寺廟及宗教建筑等虛擬實景專題。

臺灣今年啟動了“數位典藏國家型科技計

劃”,其專題內容包括:“臺灣建筑史”、

“不朽的殿堂一漢代的墓葬與文化”、“玄

奘西域行”、“商王大墓重現”、“火器與

明清戰爭”等等,在實施過程中,虛擬現實

就是其中的一種重要技術手段[7]。使用虛

擬現實技術還可以重現已經不存在的歷史

人物、建筑、地理環境等。今年1月,中國

刑警學院法醫系教授趙成文,依據古長沙國

丞相夫人辛追顱骨的X光片、出土時拍攝的

面部照片,以及長沙市馬王堆漢墓帛畫和相

關歷史文獻資料,使用自己研制的警星CC

K-3型人像模擬系統成功地復原了這一

2000多年前的人物相貌,雖然這一技術還有

待完善,但是不能否認它很好的發展前景。

總體看來,數字博物館的建設正在受到人們

的重視,而虛擬現實技術也處于發展與普及

過程之中。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論