國內三大中文期刊全文數據庫的比較_第1頁
國內三大中文期刊全文數據庫的比較_第2頁
國內三大中文期刊全文數據庫的比較_第3頁
國內三大中文期刊全文數據庫的比較_第4頁
國內三大中文期刊全文數據庫的比較_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

國內三大中文期刊全文數據庫的比較

中國期刊網全文數據庫》、《維普中文科技期刊數據庫》和《萬方數據庫資源系統數字化期刊》是國內影響力和利用率很高的綜合性中文電子期刊全文數據庫,這三個數據庫已經成為大多數高等院校、公共圖書館和科研機構文獻信息保障系統的重要組成部分。在互聯網中,這三大數據庫也成為中文學術信息的重要代表,體現了我國現有的中文電子文獻數據庫的建設水平。就上述三大數據庫的收錄情況、檢索功能、檢索結果、檢索界面、用戶服務等方面進行全面的比較,并通過檢索實踐舉例進行比較分析,以供參考。收錄情況收錄范圍與數量《中國期刊網全文數據庫》(本文中簡稱“知網”)是由清華同方光盤股份有限公司、光盤國家工程研究中心和中國學術期刊(光盤版)電子雜志社共同研制出版的綜合性全文數據庫。該數據庫收錄自從1994年來公開出版發行的6600余種國內核心期刊和一些具有專業特色的中英文期刊全文,累積全文文獻618萬多篇,題錄1500萬余條,按學科分為理工A(數理科學)、理工B(化學化工能源與材料)、理工C(工業技術)、農業、醫藥衛生、文史哲、經濟政治與法律、教育與社會科學、電子技術與信息科學九大類,126個專題文獻數據庫。《中文科技期刊數據庫》(本文中簡稱“維普”)由科技部西南信息中心主辦,重慶維普資訊有限公司制作。其前身為《中文科技期刊篇名數據庫》。該數據庫收錄了自1989年以來國內出版發行的12000種期刊,其中全文收錄8000余種,按學科分為經濟管理、教育科學、圖書情報、自然科學、農業科學、醫藥衛生、工程技術等7大類,27個專輯,200個專題,按《中圖法》編制了樹型分類導航和刊名導航系統,基本覆蓋了國內公開出版的具有學術價值的期刊,同時還收錄了中國港臺地區出版的108種學術期刊,積累700余萬篇全文文獻,數據量以每年100萬篇的速度遞增。《萬方數據資源系統數字化期刊》(本文中簡稱“萬方”)是萬方數據庫資源系統三大組成部分之一,由中國科技信息研究所屬下的北京萬方數據股份有限公司創辦。萬方期刊收錄了我國自然科學的大量期刊以及社會科學的部分期刊,范圍包括基礎科學、醫藥衛生、農業科學、工業技術、人文科學等5大類,以及英文版期刊、中國科學系列雜志,共2500多種期刊。期刊收錄情況通過對三個期刊數據庫收錄情況進行統計分析,得到以下結果:根據《中文核心期刊要目總覽》(2004年版)統計,我國核心期刊共1800種,由這三個數據庫收錄的期刊統計結果顯示,”知網”收錄核心期刊1391種,“維普”收錄1490種,“萬方”收錄1300種核心期刊。從絕對數量來看,三者的核心期刊收錄量相差不大,但從以上三大數據庫核心期刊收錄量分別占期刊總數的百分比來看,分別為21.08%(“知網”)、18.63%(“維普”)和52%(“萬方”),“萬方”數據庫占有絕對優勢。文史哲類期刊收錄情況。“維普”收錄了5種,占此類期刊總量的0.055%;”知網”收錄了451種,占此類期刊總量的4.995%;而“萬方”收錄了500種,占此類期刊總量的5.5%。說明“維普”在收錄文史哲類期刊中所占比例很低,也比較符合它《中文科技期刊數據庫》的名稱。醫藥衛生類期刊收錄情況。“維普”收錄1153種,占此類期刊總量的12.77%,”知網”收錄809種,占此類期刊總數的8.96%,“萬方”收錄588種,占此類期刊總數的6.51%。農業類期刊“維普”收錄756種,占此類期刊總數的8.37%,”知網”收錄531種,占此類期刊總數的5.869%,“萬方”收錄了246種,占此類期刊總數的2.72%。另外,在自然科學與工業技術、教育與社會科學、政治經濟與法律等類目中,“維普”的收錄量都是排名第一。通過比較”知網”和“維普”收錄期刊名錄,得知兩數據庫期刊收錄重復率約為50%,說明兩數據庫互補性很強,相互不可替代。而“萬方”收錄期刊與這兩個數據庫的重復率較高,在80%以上。從上述分析看,這三個數據庫基本覆蓋了科學技術和社會科學的各個領域。其中“維普”期刊的收藏量占有絕對優勢,幾乎覆蓋了中國出版的所有中文期刊,并且收錄了大量內部發行期刊,收錄的年限最長,其中收錄自然科學和工程技術方面的期刊量比”知網”多出近50%,但在文史哲類方面則幾乎是空白,因此,“維普”適合用戶進行科技文獻的回溯性檢索。”知網”重點收錄了國內公開出版的核心期刊與具有專業特色的中西文期刊,綜合性上做得較好。而“萬方”收錄期刊數量為三者中最少,但核心期刊比率很高,收錄文獻的質量最高。檢索功能檢索入口比較通過對三個數據庫的使用、檢索及測試,筆者得出以下結論:(1)三個全文數據庫都配備了強大的檢索系統,提供了導航檢索、簡單檢索和復合檢索等三種檢索方式,其中導航檢索都包括了學科分類導航和期刊名稱導航兩項功能,讀者不需要輸入具體的檢索詞,就可按照分類或期刊名稱,通過層層遞進的方式,檢索到某一專題下的論文,并按題錄鏈接瀏覽全文。檢索方法簡單易學。數據庫檢索選擇范圍靈活,可以選擇一個或多個專輯進行檢索,在同一專輯下,可選擇一個或多個專題進行檢索。(2)三個數據庫都提供了關鍵詞、篇名、刊名、作者、機構、文摘等6個的檢索入口。同時根據各自系統的特點,”知網”的檢索入口最多,還提供了引文、基金、全文、ISSN、主題詞、年、期等7個特有的檢索入口。“維普”則提供了第一作者、分類號、任意字段等3個特有的檢索入口。而“萬方”沒有提供其他檢索入口。(3)通過”知網”的“全文檢索”和“維普”的“任意字段檢索”,在對相同檢索詞進行檢索時發現,前者的命中率較高,在一定程度上彌補了主題標引缺乏規范化所帶來的漏查,有利于提高文獻的查全率,但往往檢出的文獻太多,用戶難以挑選到合適的文章,該檢索方式對于檢索前沿性課題文獻信息或文獻量較少的冷門課題較為適用;而后者(“維普”的“任意字段檢索”)是在文章中除正文以外的其他任何部分進行檢索,檢出率雖然低于全文檢索,但相對比較實用。檢索策略比較簡單檢索“知網”和“萬方”的簡單檢索只有一個檢索框,不支持同時輸入多個運算符,就是說一次只能輸入一個檢索詞。而“維普”的簡單檢索支持同一檢索框內同時輸入多個運算符組配的詞。高級檢索“知網”有四個檢索框,提供多個檢索項目進行邏輯組合檢索,有檢索結果排序方式和檢索年限設定和專輯的選擇;“萬方”提供有兩個檢索框,提供多個檢索項目進行邏輯組合檢索,可以限定檢索內容的大類和檢索期刊的所在地區;“維普”提供四個檢索框,可以實現檢索條件的組配,還可以限定檢索期刊范圍,提供了檢索年限的設定。檢索特殊功能比較“知網”在每個檢索入口提供了檢索詞字典,通過使用它可以規范所輸入的檢索詞,有利于更全更準地檢索文獻信息。“維普”在主題標引用詞的基礎上,編制了同義詞庫,有助于相關文獻的檢索,提高文獻的查全率。而在進行作者字段檢索時,可以通過調用同名作者庫實現作者單位的限定,提高查準率。另外進行了期刊類型的劃分,分為全部期刊、重要期刊和核心期刊,使檢索可根據需要靈活選擇。同時“維普”還提供了中圖法分類號的檢索功能。對于關鍵詞不規范的學科和領域,通過分類號檢索,能提高某一學科文獻的查準率。《萬方數據資源系統數字化期刊》在檢索時,可以對期刊所分布的地域進行限定。但筆者認為這一功能實用性不強。檢索結果檢索效果的比較對于三大數據庫,在設定相同檢索條件的情況下(檢索入口和檢索限定一致),分別選擇“題名”、“關鍵詞”、“著者”和“分類”等四個檢索入口進行檢索,得出的結果見表1。表1檢索結果數量統計表

檢索結果檢索字段“知網”返回數量“萬方”返回數量“維普”返回數量篇名汽車22576176337874知識產權35432811776關鍵詞計算機9442864047126003國際貿易515911675806著作張安將16724張靖龍901分類高等教育理論11689156應用化學14473047通過檢索返回數量統計表中的數據分析,可以得出這三種數據庫的自身特點、收錄的范圍和學科類別的情況。比如通過著者字段的檢索,張安將教授是從事化學研究的,他所發表的論文是科技方面的,在上表中”知網”收錄了16篇,“萬方”收錄了5篇,而“維普”收錄了24篇;張靖龍教授是從事文學研究的,在上表中”知網”收錄了9篇,“萬方”收錄了0篇,“維普”收錄了1篇。從這個對比中可以看出,三個數據庫中綜合性最強的是”知網”,收錄理工科科技信息文獻最多的是“維普”。全文瀏覽的比較三個數據庫中的文獻都可以瀏覽原版的圖像全文,也可以用文獻瀏覽器上提供的OCR識別系統進行文字識別處理文獻。其中”知網”的全文要用CAJ全文瀏覽器或AcrobatReader瀏覽器;“維普”的全文需要用VIP瀏覽器打開(已改為AcrobatReader瀏覽器);而“萬方”使用AcrobatReader瀏覽器打開,有些文獻可以在IE中直接打開。單從數字化水平來說,筆者認為“萬方”的數字化技術在三者中是最好的,它所用的是全球通用的PDF格式全文,方便交流,從打開的頁面上看,制作得也比較精細。其他兩個所用的是自己公司生產的瀏覽器,文獻頁面存在一定的缺陷,特別是“維普”的全文甚至出現手寫文字。當然數據庫數字化的水平也在不斷進步中,比如:”知網”也推出了PDF的下載方式,自身的CAJ瀏覽器也在不斷完善;“維普”頁面數字化水平也在不斷提高,同時從最新的信息來看,“維普”也將推出PDF格式的全文。可以說未來的趨勢就是三大全文數據庫都會提供通用的PDF格式的全文,并最終過渡到統一的格式。顯示、排序與去重功能比較“知網”的檢索結果是按照主題的相關度和文獻的日期排序輸出,可以設定每頁顯示文獻的數量。“維普”的檢索結果是按照時間的倒序排列,同時間段按期刊順序排列,用戶不用翻頁就可以瀏覽最新的文獻。“萬方”在初次檢索時不能設定檢索結果顯示的順序,但在二次檢索中可以設定是通過“升序”或“降序”排列。數據庫的去重功能做得都不夠好,有待于進一步完善技術。(不是很理解這句話的意思,倒是希望有進一步分析。)文摘結果顯示比較通過文獻的文摘就可以了解一篇文章的基本情況,而不用瀏覽全文,這樣科研人員就可以通過瀏覽文摘了解是不是自己找的文章,可以節約大量的時間。“知網”的文摘顯示內容有:篇名、作者、刊名、機構、引用鏈接、被引用鏈接、聚類檢索、摘要、光盤號。“維普”的文摘顯示內容有:標題、刊名、作者、關鍵詞和摘要。“萬方”的文摘顯示內容有:光盤號、題名、作者、機構、刊名、ISSN號、CN號、藏號、關鍵詞、分類號和摘要。三個數據庫中文摘做得最好的是”知網”,不僅可以從中獲得文獻的基本情況,而且能通過超級鏈接的方式,找到更多與查找主題相關的內容。界面友好性一個數據庫的特點和優越性可通過它的檢索界面表達出來的,界面友好、使用簡單的數據庫可以很快地讓讀者接受,讀者也能比較容易地從海量文獻中檢索出自己要找的文獻信息,反之,一個數據庫收錄了很多優秀的文獻信息,數字化水平也很高,但是檢索界面比較復雜、缺乏人性化,這樣就會使數據庫的使用大打折扣。“知網”配備了功能強大的網絡數據庫全文檢索系統,從它的檢索界面中可以看出,該數據庫檢索方法簡單、靈活,即使不具有專業檢索知識的用戶也很容易掌握。“維普”通過分類和導航實現文獻的瀏覽,還能通過初級和高級檢索進行檢索,頁面之間銜接的比較清楚,從單個頁面上看,也一目了然。“萬方”通過多種途徑檢索文獻,但是頁面過于復雜、繁瑣,很難讓初次接觸的讀者順利地檢索到文獻,或達到很高的查準率和查全率,同時在頁面的組織、導航的實現上也有待完善。但是和外文全文數據庫相比,國內這三大數據庫都沒有開發相應的個性化檢索功能,智能服務程度不高,不能不說是一個遺憾。用戶服務在服務方式上,三個數據庫都提供了檢索服務卡、光盤、局域網等檢索方式,同時還提供了建立鏡象站點、包庫、流量計費等服務方式。從訂購價格上看,“維普”最為便宜,且使用和維護比較方便。“萬方”則價格相對較高。從用戶角度上看,在選擇數據庫時可根據本單位具體特點及

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論