數(shù)字圖書館資源的高級應(yīng)用_第1頁
數(shù)字圖書館資源的高級應(yīng)用_第2頁
數(shù)字圖書館資源的高級應(yīng)用_第3頁
數(shù)字圖書館資源的高級應(yīng)用_第4頁
數(shù)字圖書館資源的高級應(yīng)用_第5頁
已閱讀5頁,還剩31頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、淺談數(shù)字圖書館建設(shè)和深度應(yīng)用以中美合作項目BHL為例1. 發(fā)展現(xiàn)狀和趨勢2. 我們的項目經(jīng)驗許哲平 中國科學(xué)院植物研究所 文獻(xiàn)信息中心BHL(Biodiversity Heritage Library, 生物多樣性遺產(chǎn)圖書館)中國節(jié)點孫坦,2006,E-Science條件下的數(shù)字圖書館建設(shè)CSDL的實踐與規(guī)劃1. 發(fā)展現(xiàn)狀和趨勢 生物多樣性數(shù)據(jù)的全球共享和訪問政策和決策受益于建立在大量數(shù)據(jù)之上的知識庫和信息庫。1. 發(fā)展現(xiàn)狀和趨勢1. 發(fā)展現(xiàn)狀和趨勢桂文莊,2009,再談什么是e-Science1. 發(fā)展現(xiàn)狀和趨勢數(shù)據(jù)庫:Mysql,PostgreSQL,H2,Oracle數(shù)據(jù)標(biāo)準(zhǔn):Dubli

2、n Core、行業(yè)標(biāo)準(zhǔn)等數(shù)據(jù)采集(1)編目: 信息系統(tǒng):數(shù)據(jù)庫管理系統(tǒng)-條形碼-RFID(射頻識別), 方法:手動輸入-網(wǎng)絡(luò)復(fù)制-批量提取(2)內(nèi)容:人工掃描、OCR及校對-自動化掃描,直接出Djvu和JPEG 2000數(shù)字圖書館資源的應(yīng)用層次框架圖傳統(tǒng)圖書館-數(shù)字圖書館-虛擬圖書館1. 發(fā)展現(xiàn)狀和趨勢2、我們的項目經(jīng)驗項目介紹系統(tǒng)框架工作流程系統(tǒng)界面未來工作The cited half-life of publications in taxonomy is longer than in any other scientific disciplineMacro-economic case fo

3、r open access, Tom MoritzCurrent taxonomic literature often relies on texts and specimens 100 years old.Levinus VincentElenchus tabularum, pinacothecarum, 1719 2.1 項目介紹2.1 項目介紹 2.1 項目介紹BHL Members: BHL-ChinaChinese Academy of Science Institute of Botany (currently)Chinese Academy of Science Institut

4、e of ZoologyChinese Academy of Science Institute of MicrobiologyChinese Academy Science - Institute of Oceanography1,2,3 all inBeijing4 in Qingdao, ShandongJune, 2009, sign an MOU with BHL, funded by Chinese National Committee for DiversitasSeptember,2009, BHL China is available online.2.1 項目介紹Whats

5、 the role of the expert knowledge base and long-history experiences in difference industry while facing Giants ?2.1 項目介紹2.2 系統(tǒng)框架BHL China PortalMYSQLData Collection and Clean by Standards (DC, DwC,TaxonX) - from manual proofreading database to automatical Taxon Finder Metadata Annotation: Multiple l

6、anguage type: Chi, Pin-Yin, EngVarious downloadable format: pdf, duvj, text et al. Bibliography DataName dataOther related data數(shù)據(jù)匯總層數(shù)據(jù)整理層服務(wù)產(chǎn)出層Drupal-Based CommunityMYSQLUser ManagementData ContributionRelationship with other sitesMoodle-Based E-Learning CommunityMYSQL1. Web Service for BHL、EOL、CVH2.

7、 Full Text Search (Sphinx+MYSQL)3. Open Library Viewer4. NameSearch(PHP+Flex)5. .MYSQLInternet ArchiveLibrary Online: Public Domain, Open Access, CC License, e-library and more othersPartners 語義分析圖書期刊文章 2.2 系統(tǒng)框架First Stage (Collecting,資源收集) Book Scanning name Parsing Full Data Downloading Searching

8、by names and Fulltext Book Sharing in CMS (Drupal 7)Second Stage (Standardization,標(biāo)準(zhǔn)化) Query Results by Dublin Core Showing on the map by KML Filter by TaxonX Specimen, Image, Observation data by Darwin Core, IPTC, EMLFuture Stage (Application,應(yīng)用) Multimedia Visualization Semantic Web Sharing in Mob

9、ile Platform Integrated with other platform發(fā)展計劃2.2 系統(tǒng)框架1. 4月簽署MOU;2.8月初掃描儀運抵北京,組織工作人員培訓(xùn);3. 8月底正式開始圖書掃描工作;4. 優(yōu)化工作流程,掃描速度由200頁/時提高到750頁/時。 工作進(jìn)展-數(shù)據(jù)采集-圖書掃描2.3 工作流程OCR tool : ABBYY FineReader Engine 92.3 工作流程CN MarcUS MarcMarcEditorXML-MARCDATABASEDublin CoreUserZebraZ39.502.3 工作流程 基于Zebra的Z39.50服務(wù)器處理后效果

10、:清晰簡潔,拉丁名可全文查找多種格式:PDF、djvu,Marc.xml 等2.3 工作流程 2.3 工作流程自動建議搜索的物種名方便輸入中英文版本新聞和博客鏈接到BHL-ChinaFlickr群組的照片2.3 系統(tǒng)界面和功能外部鏈接: EOL, Ubio含有特定物種名的目標(biāo)頁列表,方便轉(zhuǎn)換掃描原始圖像識別后文本2.3 系統(tǒng)界面和功能快捷的物種名檢索續(xù)整合bhl-US和BHL-China數(shù)據(jù),一次性快速返回所有結(jié)果2.3 系統(tǒng)界面和功能全文檢索含有特定物種名的頁碼列表2.3 系統(tǒng)界面和功能物種名-書籍-頁碼-地理位置2.3 系統(tǒng)界面和功能與外部的書目中心、出版社、網(wǎng)上書店、圖書館建立鏈接方便用戶切換評論導(dǎo)出格式: XML, BibTex, Google Scholar2.3 系統(tǒng)界面和功能未來工作計劃多源數(shù)據(jù)集成搜索多媒體圖書館管理和搜索系統(tǒng)應(yīng)用和推廣基于語義分析的智能搜索引擎空間數(shù)據(jù)提取和集成多源數(shù)據(jù)集成搜索多源數(shù)據(jù)集成搜索多媒體圖書館管理和搜索系統(tǒng)多媒體圖書館管理和搜索系統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論