2019文獻檢索與利用(清華大學)第四節課-中文數據庫檢索式及檢索技巧.課件_第1頁
2019文獻檢索與利用(清華大學)第四節課-中文數據庫檢索式及檢索技巧.課件_第2頁
2019文獻檢索與利用(清華大學)第四節課-中文數據庫檢索式及檢索技巧.課件_第3頁
2019文獻檢索與利用(清華大學)第四節課-中文數據庫檢索式及檢索技巧.課件_第4頁
2019文獻檢索與利用(清華大學)第四節課-中文數據庫檢索式及檢索技巧.課件_第5頁
已閱讀5頁,還剩49頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

文獻檢索與利用(理工類)

典型中文數據庫檢索與利用趙軍平清華大學圖書館學科服務組62782367zhaojunping@除了中國知網外,您知道可以檢索中文文獻的平臺還有哪些嗎?它們之間的關系如何?您用過專業檢索方式進行檢索嗎?(24%)檢索結果太多,沒法挑選相關文獻;檢索結果太少,找不到相關文獻;檢索結果不少,但是方向似乎偏了,無相關文獻;檢索結果太爛,有價值的文獻太少;我只想找綜述文獻,但是出來的都是具體技術;……檢索文獻時,你是否遇到過此類問題?典型中文數據庫檢索與利用中文檢索平臺介紹以中國知網為例學習文獻檢索

典型中文數據庫檢索與利用中文檢索平臺介紹1.中國知網

2.中文科技期刊庫

3.萬方數據資源系統以中國知網為例學習文獻檢索

中國知網中國知網是中國學術期刊電子雜志社編輯出版的以《中國學術期刊(光盤版)》全文數據庫為核心的數據庫,目前已經發展成為“

CNKI數字圖書館”。收錄資源包括期刊、博碩士論文、會議論文、報紙、專利、標準、科技成果、工具書等學術與專業資料;覆蓋理工、社會科學、電子信息技術、農業、醫學等學科范圍,數據每日更新,支持跨庫檢索。正式出版的7877種學術期刊;特色期刊(如農業、中醫藥等)收錄率100%;獨家或唯一授權期刊共2300余種。目前本校讀者可訪問的主要數據庫如下:全文數據庫中國學術期刊網絡出版總庫(1915年-)中國優秀碩士論文全文數據庫(1999年-中國博士論文全文數據庫(1999年-)中國重要會議論文全文數據庫(1999年-)中國專利數據庫(1985年-)中國重要報紙全文數據庫(2000年-)國家標準全文數據庫(1950年-)中國行業標準全文數據庫(1950年-)中國年鑒全文數據庫(1999年-)中國工具書網絡出版數據庫德國SPRINGER公司期刊數據庫題錄/文摘數據庫中國引文數據庫(1979年-)國家科技成果數據庫(1978年-中國標準數據庫國外標準數據庫哈佛商業評論數據庫事實數據庫中國工具書網絡出版總庫漢語大詞典&康熙字典(知網版)數值數據庫中國經濟社會發展統計數據庫等全文數據庫最多中文科技期刊庫《中文科技期刊數據庫》(全文版)是重慶維普資訊有限公司開發研制的中文電子期刊數據庫,收錄我國自然科學、工程技術、農業科學、醫藥衛生、經濟管理、教育科學和圖書情報等學科12000余種期刊的2300余萬篇文章的全文,每年增加約250萬篇。該數據庫中的期刊回溯至1989年,但有部分期刊收錄不完整。該數據庫檢索入口較多、輔助手段較為豐富。同時,由于本館未定購人文社科版,該類文獻只提供文摘,無法獲取全文。

有很多獨家收錄的期刊,在中國知網和萬方數據中檢索不到。萬方數據資源系統萬方數據資源系統是建立在因特網上的大型科技、商務信息平臺,內容涉及自然科學和社會科學各個專業領域。包括:學術期刊、學位論文、會議論文、專利技術、中外標準、科技成果、政策法規、新方志、機構、科技專家等子庫。我館僅購買了期刊文獻的全文,萬方數據提供多數專利的全文。我館沒有購買中國學位論文全文庫、中國學術會議論文全文庫、西文會議論文全文庫等全文數據庫,所以即使檢索到全文數據庫的文獻,也不能查看和下載其全文,只能查看其簡單信息或詳細摘要信息。2008年萬方數據獲得中華醫學會旗下115種醫學核心期刊的獨家數字出版權。這是由三家有競爭關系的數據公司開發的數據庫,數據有大量重復,但是又各有獨家特有的數據,檢索信息時需要互相補充。檢索算符基本相同,但是檢索式制定細節略有區別。進入方式:圖書館主頁——資源——數據庫導航數據滯后于原文獻出版,IP(+用戶名密碼)控制全文下載典型中文數據庫檢索與利用中文檢索平臺介紹以中國知網為例學習文獻檢索檢索方式簡單檢索高級檢索專業檢索檢索式的制定及調整

CNKI簡單檢索界面已知文獻題名,可用此界面檢索CNKI高級檢索界面CNKI專業檢索界面典型中文數據庫檢索與利用中文檢索平臺介紹以中國知網為例學習文獻檢索檢索方式檢索式的制定及調整選擇檢索詞掌握檢索式表達語法熟悉檢索式調整技巧檢索效果及評價指標

檢索詞

檢索詞:指表征研究課題主要概念的關鍵性詞語,是構成檢索提問式的最基本單元。檢索詞通常從課題的主要概念(課題名稱、采用的具體技術/方法、新穎點)中提取,需要找出隱含概念、同義詞,將泛指概念具體化,排除重復概念……

一、從題目、技術要點提取檢索詞

一般來說,理工類課題名稱基本上能反映出檢索的主題內容。例1:“模糊變頻空調”主要概念:模糊、變頻空調檢索式:變頻空調and模糊(布爾算符)概念單元最小化,不使用過長的詞組和短語。如果不知道怎么切分怎么辦?高級檢索頁面檢索結果其次,從技術要點中的具體方法、技術及創新點中提取例2:電子行業用聚合物基屏蔽復合材料研究本項目采用顆粒表面包覆與功能設計的思想,以高剪切的機械力化學法即機械沖擊顆粒復合系統(PCS)將分散、混合與固著等操作步驟相結合,把導電顆粒(包括微纖)均勻連續地包覆在聚合物顆粒表面,然后將這種復合顆粒熔融成型,制造出聚合物基屏蔽復合材料。主要概念:電子行業、屏蔽、復合材料、包覆檢索式:電子行業

and

屏蔽and復合材料and包覆

用目標、行業背景限定范圍,防止檢索偏題;主要概念:多點激勵(振動激勵、聲學激勵、結構激勵)、車內噪聲(噪音、聲源)、傳遞函數、識別(獲取)數據庫檢索結果:

在中國知網文獻中檢索,采用主題字段檢索式1:

主題=多點激勵*車內*噪聲*傳遞*識別

檢索結果為0檢索式2:

主題=激勵*車內*(噪聲+噪音+聲源)*傳遞*(識別+獲取)檢索結果為23條記錄

例3:“基于多點激勵的車內噪聲傳遞函數識別方法””

二、找出隱含概念、同義詞當檢索詞的同義詞大于兩個時,專業檢索會比高級檢索方便得多唐山

城市由于唐山是一個城市,該項目實際為“城市綜合防災的研究”災害

地震、洪水、火災研究

決策支持系統、專家系統所采用的研究手段是決策支持系統和專家系統。例4:項目“唐山綜合防災研究”

三、泛指概念具體化主要概念:

城市、唐山、災害、地震、洪水、火災、決策支持系統、專家系統數據庫檢索結果:在中國期刊網中檢索(1980-2009),采用主題字段

檢索式1:

SU=唐山*綜合防災*研究

andYEbetween(1980,2009)

,命中5條

檢索式2:

SU=(城市+唐山)*(災害+地震+洪水+火災)*(決策支持系統+專家系統)andYEbetween(1980,2009),命中41條例5:項目“河豚毒素的液相色譜分析”從該項目名稱上看,其主要概念為“河豚毒素”、“液相色譜”和“分析”,但由于液相色譜本身就是一種分析方法,它隱含了“分析”這一概念。主要概念:河豚毒素、液相色譜數據庫檢索結果:中國期刊網(數據年代1980-2009),采用主題字段檢索式1:河豚毒素*液相色譜*分析,命中15條檢索式2:河豚毒素*液相色譜,命中28條

四、排除重復概念②選用意義明確的詞語。③不使用過長的詞組和短語。④同義詞、近義詞、縮略詞要找全。

檢索詞的要求選各學科的專用術語、規范用語。收集規范詞、同義詞的方法從已有的檢索結果中獲得以課題的主要概念作為檢索詞,在相關數據庫中試檢,并從題名、摘要、關鍵詞中收集規范詞、同義詞。

從綜述文章中獲得從主題詞表中獲得

主題詞表是許多數據庫對文獻資料進行主題分類的依據。比較成熟的研究主題,可以從主題詞表中查找。檢索式表達語法不同文獻類型的檢索字段是不同的文獻檢索與利用-應用實例常用的可檢索字段主題,SU=,檢索范圍包括題名、關鍵詞、摘要題名,TI=,檢索范圍只有題名年,YE=(between),用于限制檢索年代關鍵詞,KY=,作者提供的關鍵詞及機標關鍵詞摘要,AB=,摘要或機標摘要作者,AU=機構,AF=(%)核心期刊,HX=Y……文獻檢索與利用-應用實例29核心期刊核心期刊是期刊中學術水平較高的刊物。起源:布拉德福定律、加菲爾德定律。

在信息爆炸的年代在核心期刊中檢索并閱讀相關文獻,可以用最少的精力獲得最大的信息量。將科研成果發表在核心期刊上可以增加自己的研究成果被同行看到的幾率。如果檢索到的文獻質量太差,可以選擇只在核心期刊中檢索30中國科研評價常用核心期刊外文數據庫中文數據庫理工科SCIEEI中國科學引文數據庫(CSCD)《中國科技期刊引證報告》《中文核心期刊要目總覽》文科藝術SSCIA&HCI中文社會科學引文索引(CSSCI)圖書館主頁——電子期刊——核心期刊查詢系統文獻檢索與利用-應用實例專業檢索常用算符文獻檢索與利用-應用實例名稱符號說明應用舉例邏輯算符(用于同一字段、不同檢索詞)*邏輯“與”,連接限定詞,縮小檢索范圍TI=數字*版權查找篇名中同時含數字和版權兩個詞的文章+邏輯“或”,連接同義詞,擴大檢索范圍TI=數字期刊+電子期刊查找篇名中包含數字期刊或電子期刊的文章-邏輯“非”,排除TI=汽車發電機-噪聲查找篇名中含有汽車發動機但不含噪聲的文章邏輯算符(用于不同字段間)and邏輯“與”,縮小檢索范圍TI=數字*版權andSU=學位論文or邏輯“或”,擴大檢索范圍TI=數字版權orTI%數字期刊not邏輯“非”,排除SU=數字*版權notTI=音像注意:檢索算符需半角輸入,字段標記需大寫或用漢字專業檢索常用算符

名稱符號說明應用舉例位置算符(跟在字段名稱后)=精確檢索AF=北京大學機構名稱嚴格為北京大學,“北京大學數學系”等則不能命中%模糊檢索(按字檢索)AF%北京大學機構名稱模糊含北京大學,包括北大各系,但不含“北京師范大學”位置算符(用于檢索詞間)/SENN同段,按次序出現,間隔小于N句FT='轉基因/SEN0水稻'/NEARN同句,間隔小于N個詞AB='轉基因/NEAR5水稻'/PREVN同句,按詞序出現,間隔小于N個詞AB='轉基因/PREV5水稻'/AFTN同句,按詞序出現,間隔大于N個詞AB='轉基因/AFT5水稻'/PEGN全文,詞間隔小于N段AB='轉基因/PEG5水稻'$N檢索詞出現N次TI='轉基因$2'詞間位置算符需大寫,且必須用半角引號括住檢索式的形式:(SU=(A+B+C)*(D+E)*(F+H+G))and(TI=A+B)andYEbetween(2009,2012)即:同一字段內的邏輯運算符用*,+,-

不同字段間的邏輯運算符用and、or、not

括號必須在西文半角狀態輸入,字段名稱必須大寫或用漢字。檢索效果評價指標

檢索效果:檢索時產生的有效結果。檢索效果直接反映了檢索系統性能的好壞、檢索式的好壞衡量檢索效果的指標查全率(recallratio)查準率(precisionratio)理想的檢索狀態查全率(R)和查準率(P)都達到100%R

100%:數據庫中收錄的全部相關文獻均被檢出P

100%:檢索出來的文獻全部相關

實際檢索時是否可能??①查某篇文獻:已知文獻線索,獲取原文。②查某個事實數據:查某種金屬的熔點,某種材料的電阻。查找某類產品由哪些廠家生產,哪個牌號最好等。結果:查到:查全率和查準率均為100%。未查到:查全率和查準率均為0。

1957年,英國Cranfield航空學院圖書館館長、情報學家C.W.C1everdon領導下的研究小組進行了著名的Cranfield試驗。

試驗結果證實:查找課題相關文獻時,查全率和查準率呈反變關系。

無論怎樣調整檢索策略和改進系統效率,都無法使P和R同時接近100%。0R-P曲線CADB查全率R查準率P關系曲線不可能的原因系統層面:存貯誤差:對原始資料的內容特征揭示有失真,如分類、主題標引不當檢索誤差:計算機檢索時嚴格字面匹配,而不是內容匹配,這與檢索者所要求的內容相關有偏差用戶層面:檢索策略不合適:如數據庫、檢索詞

實際檢索時通常采取折中的辦法:在查準率可以接受的情況下,盡可能查全。科技查新通常要求查準率為40%-60%。常規處理辦法極端情況1 如某個人正在寫一本書或撰寫綜述文章、或者著手一項長期研究計劃,需要對相關的文獻情況做全面了解,為了保證不遺漏任何相關的文獻,他會要求查全率很高,而查準率可以很低。 對應于R-P曲線中的A點。這意味著分離相關文獻與無關文獻需要更多的時間。0R-P曲線AB查全率R查準率P極端的情況2為跟蹤研究動態,需要及時獲得某一主題的最新文獻。則可能不要求查全率,但期望有較高的查準率。對應于R-P曲線中的B點。可能漏掉許多相關文獻。0R-P曲線AB查全率R查準率P

檢索技巧常用的檢索字段①主題:通常包括文獻題名、文摘、關鍵詞等字段。

②題名:重點突出、查準率高。③關鍵詞:作者抽取的文章重點信息④文摘:概括全文內容⑤全文:內容全面

查準率由高到低:題名>關鍵詞>文摘>主題>全文

查全率由高到低:全文>主題>文摘>關鍵詞>題名選用主題(Subject/Title/Abstract)檢索字段,并利用檢索式進行文獻檢索,檢索結果更全面、準確。必要時采取其他字段(如題名)進行限制。技巧檢索結果太多,沒法挑選相關文獻;檢索結果太少,找不到相關文獻;檢索結果不少,但是方向似乎偏了,無相關文獻;檢索結果太爛,有價值的文獻太少;我只想找綜述文獻,但是出來的都是具體技術。

怎么辦?檢索結果過多☆增加“與”邏輯關系(檢索詞或其他檢索字段)☆選擇更專指的檢索詞,排除無關概

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論