




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第一章數(shù)字文獻檢索基礎(chǔ)2023/9/111《數(shù)字文獻檢索》第1章數(shù)字文獻檢索基礎(chǔ)1.1數(shù)字文獻及其檢索概述1.2數(shù)字文獻的檢索技術(shù)1.3數(shù)字文獻的檢索策略1.4檢索效果評價2023/9/112《數(shù)字文獻檢索》1.1數(shù)字文獻及其檢索概述1.1.1文獻及數(shù)字文獻概述1.文獻的概念2.文獻的類型3.數(shù)字文獻的概念1.1.2數(shù)字文獻的檢索語言1.數(shù)字文獻檢索2.數(shù)字文獻檢索語言2023/9/113《數(shù)字文獻檢索》1.文獻的概念世界上最早的文獻:產(chǎn)生于距今大約10000~40000年前的舊石器時代。最古老的文獻:石刻圖像、楔形文字文獻、紙草文獻、克里特線性文字文獻、甲骨文獻等。文獻定義:記錄有知識的一切載體。文獻構(gòu)成:由知識、載體和記錄方式3個要素構(gòu)成,知識是內(nèi)容,載體是形態(tài),記錄方式是構(gòu)成文獻的手段,三者不可分割。2023/9/114《數(shù)字文獻檢索》2.文獻的類型
(1)按文獻出版形式和內(nèi)容劃分①圖書
②報刊③科技報告④政府出版物⑤會議文獻
⑥學位論文
⑦專利文獻⑧標準文獻
⑨產(chǎn)品樣本
⑩其他零散資料
(2)還按文獻載體形式、文獻加工層次等劃分(3)圖書、期刊特點,ISBN、ISSN含義2023/9/115《數(shù)字文獻檢索》3.數(shù)字文獻的概念數(shù)字文獻指以數(shù)字形式把文字、圖像、聲音和動畫等多種形式的信息,存儲在光、磁等非紙介質(zhì)的載體中,并通過網(wǎng)絡(luò)通信、計算機或終端等方式再現(xiàn)出來的資源。主要的類型有:按表現(xiàn)形式:數(shù)據(jù)庫、電子圖書、電子期刊、電子報紙等還可按性質(zhì)和功能、生產(chǎn)途徑和發(fā)布、生產(chǎn)方式、數(shù)據(jù)傳播范圍、存儲介質(zhì)等劃分。2023/9/116《數(shù)字文獻檢索》(1)全文數(shù)據(jù)庫1)數(shù)據(jù)庫,是以一定的組織方式存儲在一起的相關(guān)數(shù)據(jù)的集合,是數(shù)字文獻最早的形式,也是數(shù)字文獻的主要構(gòu)成部分,包括全文數(shù)據(jù)庫、文摘/題錄數(shù)據(jù)庫、參考數(shù)據(jù)庫等類型。①全文數(shù)據(jù)庫,即收錄有原始文獻全文的數(shù)據(jù)庫,以期刊論文、會議論文、政府出版物、研究報告、法律條文和案例以及商業(yè)信息等為主。國內(nèi)有中國期刊全文數(shù)據(jù)庫、中文科技期刊數(shù)據(jù)庫等、國外有ProQuest系統(tǒng)、EBSCOhost系統(tǒng)以及SpringerLink系統(tǒng)等2023/9/117《數(shù)字文獻檢索》(2)文摘/題錄數(shù)據(jù)庫是指包含各種數(shù)據(jù)、信息或知識的原始來源和屬性的數(shù)據(jù)庫。它報道文獻信息的存在,揭示文獻信息的內(nèi)容。按數(shù)據(jù)庫內(nèi)容,可劃分為書目數(shù)據(jù)庫、文摘數(shù)據(jù)庫、索引(題錄)數(shù)據(jù)庫。書目數(shù)據(jù)庫主要是針對圖書進行內(nèi)容及存儲地址的報道與揭示的,如各圖書館的館藏機讀目錄數(shù)據(jù)庫;文摘和索引數(shù)據(jù)庫則相對期刊論文、會議論文、專利文獻和學位論文等進行內(nèi)容和屬性的認識與加工,它提供確定的文獻來源信息,供人們查閱和檢索。SCI、SSCI、EI、ISTP是世界上最權(quán)威的四大索引,均屬文摘/題錄數(shù)據(jù)庫。2023/9/118《數(shù)字文獻檢索》(3)參考數(shù)據(jù)庫是指包含大量事實、數(shù)據(jù),以及其他類型文獻信息的數(shù)據(jù)庫,具體有數(shù)值數(shù)據(jù)庫、指南數(shù)據(jù)庫、術(shù)語數(shù)據(jù)庫、視頻數(shù)據(jù)庫、英語學習數(shù)據(jù)庫和考試系統(tǒng)等。數(shù)值數(shù)據(jù)庫,指以數(shù)值為主要內(nèi)容的數(shù)據(jù)庫,如統(tǒng)計數(shù)據(jù)庫、化學反應(yīng)數(shù)據(jù)庫等;指南數(shù)據(jù)庫,是有關(guān)機構(gòu)、人物等相關(guān)信息的簡要描述,如公司名錄、產(chǎn)品目錄等;術(shù)語數(shù)據(jù)庫,即專門存儲名詞術(shù)語信息、詞語信息等的數(shù)據(jù)庫,如電子版百科全書、網(wǎng)絡(luò)詞典等。視頻數(shù)據(jù)庫,是指能夠以多媒體方式播放的相關(guān)信息內(nèi)容的數(shù)據(jù)庫,如愛迪科森網(wǎng)上報告廳、超星學術(shù)視頻等;英語學習系統(tǒng),主要是指以英語學習為主要內(nèi)容的數(shù)據(jù)庫,如新東方多媒體學習庫、冰果英語和EBSCO的學生英語學習中心(SRC)等;考試系統(tǒng)是指提供試題和模擬考試的數(shù)據(jù)庫系統(tǒng),如銀符考試系統(tǒng)、起點考試系統(tǒng)等。2023/9/119《數(shù)字文獻檢索》(4)電子圖書、電子期刊和電子報紙電子圖書:直接以數(shù)字形式出版的圖書或印刷型圖書的數(shù)字化形式,是以電子版的方式呈現(xiàn)的,并通過計算機或電子閱讀器進行閱讀的一種電子文獻。如國外的NetLibrary、Ebrary;國內(nèi)的超星、書生和方正Apabi電子圖書等。電子期刊:是指所有以電子形式存在的期刊,包括印刷型期刊的電子版、無印刷版的網(wǎng)絡(luò)型電子期刊、與紙本期刊并行的電子期刊,如Science、Nature等電子刊,如Elsevier、Wiley、Springer、Kluwer等出版商的電子期刊等。電子報紙:指綜合運用多媒體技術(shù)、網(wǎng)絡(luò)技術(shù)和通信技術(shù),完成出版、發(fā)行、利用全過程的新聞媒體。電子報紙的內(nèi)容可以是文字、表格、彩色圖形、圖像,甚至是聲音、動畫等的多媒體信息。2023/9/1110《數(shù)字文獻檢索》4.數(shù)字文獻檢索數(shù)字文獻檢索:是指通過檢索系統(tǒng),采用一定的技術(shù)手段,根據(jù)一定的原則,在數(shù)據(jù)庫或其他形式的數(shù)字文獻中自動找出用戶所需相關(guān)信息的過程。廣義的檢索包括:信息的存儲和檢索兩個過程狹義的檢索僅包括:用戶的信息檢索過程。在數(shù)字文獻檢索發(fā)展歷程:脫機檢索、聯(lián)機檢索、光盤檢索和網(wǎng)絡(luò)檢索四個階段。網(wǎng)絡(luò)檢索已成為廣大用戶獲取信息的主要方式。
2023/9/1111《數(shù)字文獻檢索》廣義的信息檢索過程2023/9/1112《數(shù)字文獻檢索》5.數(shù)字文獻檢索語言檢索語言,是信息存儲與檢索過程中用于描述文獻特征和表達用戶信息提問的一種專門語言。所謂檢索的運算匹配就是通過檢索語言的匹配來實現(xiàn)的。文獻具有外部特征和內(nèi)容特征。外部特征有題名(書名、篇名和刊名)、著者(個人、團體)、號碼(專利號、標準號、國際標準書號ISBN和國際標準刊號ISSN等)、機構(gòu)名(責任者所屬機構(gòu)、出版發(fā)表機構(gòu))以及時間等;內(nèi)容特征指文獻內(nèi)容所屬的學科和文獻內(nèi)容的研究對象。注意著者與機構(gòu)名的區(qū)別。2023/9/1113《數(shù)字文獻檢索》文獻檢索語言與檢索途徑關(guān)系2023/9/1114《數(shù)字文獻檢索》(1)分類檢索語言:《中圖法》結(jié)構(gòu)2023/9/1115《數(shù)字文獻檢索》TB一般工業(yè)技術(shù)TD礦業(yè)工程TE石油、天然氣工業(yè)TF冶金工業(yè)TG金屬學與金屬工藝TH機械、儀表工業(yè)TJ武器工業(yè)TK能源與動力工程TL原子能技術(shù)TM電工技術(shù)TN無線電電子學、電信技術(shù)TP自動化技術(shù)、計算機技術(shù)TQ化學工業(yè)TS輕工業(yè)、手工業(yè)TU建筑科學TV水利工程工業(yè)技術(shù)所含學科較多,其下位類用二個大寫英文字母表示2023/9/1116《數(shù)字文獻檢索》
H31英語
H32/H37各種常用外國語均可仿H31分
H32法語
H33德語
H34西班牙語
H35俄語
H36日語
H37阿拉伯語H3常用外國語2023/9/1117《數(shù)字文獻檢索》H311語音H311.9朗誦法、演講術(shù)H312文字H313語義、詞匯、詞義H313.1基本詞匯H313.2同義詞、多義詞、反義詞H313.3熟語、俗語H313.5外來語H313.6略語H313.9詞源H314語法H314.1構(gòu)詞法H314.2詞類H314.3句法H315寫作、修辭H315.9翻譯H316詞典H317方言H319語言教學H31英語2023/9/1118《數(shù)字文獻檢索》H319.1教學改革H319.2教學計劃、教學大綱H319.3教學法英語學習方法入此。仿H193分H319.4讀物以提高閱讀能力為目的各科簡易讀物、對照讀物、注釋讀物入此。H319.6習題、試題H319.9會話口語、會話教材、聽說讀練習、視聽教學入此H319語言教學2023/9/1119《數(shù)字文獻檢索》
R1預防醫(yī)學、衛(wèi)生學
R2中國醫(yī)學
R3基礎(chǔ)醫(yī)學
R4臨床醫(yī)學
R5內(nèi)科學
R6外科學
R71婦產(chǎn)科學
R72兒科學
R73腫瘤科學
R74神經(jīng)病學與精神病學
R75皮膚病學與性病學
R76耳鼻咽喉科學
R77眼科學
R78口腔科學
R79外國民族科學
R8特種醫(yī)學
R9藥學R醫(yī)藥、衛(wèi)生2023/9/1120《數(shù)字文獻檢索》R3基礎(chǔ)醫(yī)學
R31醫(yī)用一般科學
R32人體形態(tài)學
R33人體生理學
[R34]人體生物化學、分子生物學
[R35]人體生物物理學
R36病理學
R38醫(yī)學寄生蟲學
R392醫(yī)學免疫學
R394醫(yī)學遺傳學
R395醫(yī)學心理學、病理心理學2023/9/1121《數(shù)字文獻檢索》R4臨床醫(yī)學
R44診斷學
R45治療學
R47護理學
R48臨終關(guān)懷學
R49康復醫(yī)學2023/9/1122《數(shù)字文獻檢索》(2)關(guān)鍵詞檢索語言關(guān)鍵詞:能夠代表文獻研究的主要內(nèi)容、具有檢索意義的一些重要語詞。目前最主要的檢索語言。制作數(shù)據(jù)庫時,對文獻進行自動標引,提供相應(yīng)的關(guān)鍵詞檢索途徑。可從文獻題名、文摘、關(guān)鍵詞、全文等途徑進行關(guān)鍵詞檢索。利用檢索技術(shù),對關(guān)鍵詞進行組配,完成比較復雜的檢索。2023/9/1123《數(shù)字文獻檢索》1.2數(shù)字文獻的檢索技術(shù)1.布爾邏輯檢索技術(shù)計算機匹配:字字比較匹配,分別輸入“非典”、“SARS”檢索詞,輸出不同的結(jié)果,對表達同一概念的語詞的多樣性(同義詞)如何處理?舉例:《私營企業(yè)人力資源研究》如何檢索?組配:對多個詞組(甚至單字)進行布爾邏輯組配布爾邏輯檢索是指通過標準的布爾邏輯關(guān)系算符來表達檢索詞與檢索詞間的邏輯關(guān)系的檢索方法。
主要的布爾邏輯關(guān)系詞有:邏輯與(AND)、邏輯或(OR)、邏輯非(NOT)2023/9/1124《數(shù)字文獻檢索》邏輯與邏輯與也稱邏輯乘:使用符號“and”或“*”表示所連接的兩個檢索詞必須同時出現(xiàn)在結(jié)果中才滿足檢索條件。檢索式可表達為:AandB或A*B。如“圖書館and服務(wù)”,要求結(jié)果必須同時包含“圖書館”和“服務(wù)”這二個詞組。使用“邏輯與”技術(shù),可以增加限制條件,縮小檢索范圍,增強檢索的專指性,提高信息檢索的查準率。檢索式中,邏輯與用得越多,檢索結(jié)果就越少。2023/9/1125《數(shù)字文獻檢索》邏輯或邏輯或也稱邏輯和:使用符號“or”或“+”表示所連接的兩個檢索詞中任意一個出現(xiàn)在結(jié)果中就滿足檢索條件。檢索式可表達為:AorB或A+B如“文獻or知識”,要求結(jié)果包含“文獻”或包含“知識”或同時包含“文獻”和“知識”。使用“邏輯或”技術(shù),常用于連接同義詞、相關(guān)詞等,可以擴大檢索范圍,防止漏檢,提高信息檢索的查全率。2023/9/1126《數(shù)字文獻檢索》邏輯非邏輯非也稱邏輯差:使用符號“not”或“-”表示所連接的兩個檢索詞中應(yīng)從第一個概念中排除第二個概念。檢索式可表達為:AnotB或A-B如“文獻not圖書”,要求結(jié)果必須包含“文獻”但不包含“圖書”。使用“邏輯非”技術(shù),可以剔除不需要的概念,縮小檢索范圍,提高信息檢索的查準率;但這種方式也會排除掉相關(guān)信息,影響檢索信息的查全率。2023/9/1127《數(shù)字文獻檢索》舉例例如檢索:“打印機驅(qū)動程序”檢索詞:打印機、驅(qū)動程序檢索表達式:打印機and驅(qū)動程序例如檢索:“微型計算機”方面的有關(guān)信息檢索詞:微型計算機、微機檢索表達式:微型計算機or微機2023/9/1128《數(shù)字文獻檢索》舉例例:檢索“唐宋詩歌”的有關(guān)信息檢索詞:唐、宋、詩歌;檢索表達式:(唐+宋)*詩歌;唐*詩歌+宋*詩歌;錯誤表達式:唐+宋*詩歌;唐*宋*詩歌;唐+宋+詩歌;唐*宋+詩歌;2023/9/1129《數(shù)字文獻檢索》注意布爾邏輯檢索技術(shù)應(yīng)用非常廣泛,但在實現(xiàn)方式上有所差異,即所使用的邏輯算符可能是不同的。如使用“邏輯與”時,有的數(shù)據(jù)庫用“and”算符,有的使用“*”算符。選擇方式:以下拉菜單形式選擇邏輯算符和檢索字段輸入方式:提供檢索式輸入框,直接輸入檢索式一般情況請按以下規(guī)則使用邏輯符號,但并非所有數(shù)據(jù)庫和搜索引擎都是如此,具體請參考所用數(shù)字資源。中文數(shù)據(jù)庫用:“*+-”或“andornot”西文數(shù)據(jù)庫常用:“andornot”搜索引擎常用:“︺,-”2023/9/1130《數(shù)字文獻檢索》2.截詞檢索技術(shù)主要應(yīng)用于西文數(shù)字文獻的檢索定義:是指在檢索式中用截詞符號表示檢索詞的某一部分允許有一定的詞形變化。原因:在西方語言如英語的語境中,動詞、名詞常有會詞形的變化(動詞的詞態(tài)、名詞的單復數(shù)),出現(xiàn)詞干相同、詞義相近的檢索詞或有英、美不同拼寫法的詞。作用:檢索時不遺漏相關(guān)詞,擴大檢索范圍,提高查全率。截詞符一般用“?”、“*”、“$”和“!”等,不同的系統(tǒng),不同的數(shù)據(jù)庫,其代表的含義可能有所不同。截詞方式根據(jù)截詞的位置不同,分為前截斷、后截斷、前后截斷和中截斷。2023/9/1131《數(shù)字文獻檢索》截詞位置前截斷(左截斷、后方一致):允許檢索詞前有若干變化。如*physics就可檢索到physics、astrophysics、biophysics、chemophysics、geophysics等詞的結(jié)果。后截斷(右截斷、前方一致):允許檢索詞尾有若干變化。如comput*將檢索出computer、computing、computerised、computerized、computerization等結(jié)果。前后截斷(中間一致):詞干的前后各有一個截詞符,允許檢索詞的前端和尾部各有若干變化形式。如*computer*可檢索computer、computers、computerize、computerized、computerization、minicomputer、minicomputers、microcomputer、microcomputers等結(jié)果。中間截斷(前后一致):允許檢索詞中間有若干變化。例如wom*n可檢索出woman、women。英美的不同拼法,defen*e可檢索出defence、和defense的結(jié)果。2023/9/1132《數(shù)字文獻檢索》請注意在不同的數(shù)據(jù)庫和聯(lián)機檢索系統(tǒng)中,所使用的截詞符號沒有統(tǒng)一的標準,有的用“?”,有的用“*”,有的用“#”,用的用“$”等。即便常用的“?”和“*”在不同的數(shù)據(jù)庫中其用法也是不一定相同的。在允許截詞的檢索工具中,一般是指后截斷,部分支持中間截斷,左截斷比較少見。大多數(shù)數(shù)據(jù)庫在模糊匹配方式下,默認前方一致檢索,詞尾可省略截詞符。如精確匹配,則不能省略截詞符。我們將要使用的一些數(shù)據(jù)庫,一般用“?”代表一個字符,用“*”代表任意一個字符串。2023/9/1133《數(shù)字文獻檢索》3.鄰近檢索技術(shù)
鄰近檢索又稱位置檢索,主要是通過位置符號來規(guī)定多個檢索詞在結(jié)果中的相對位置。例如檢索生物防治的文獻,若用檢索式:“biologicalandcontrol”檢索,則會將“抑制生物”(controlbiological)的文獻也查出來,這顯然不是所需文獻。主要位置算符:(W)、(nW)、(N),(nN)2023/9/1134《數(shù)字文獻檢索》(1)(W)算符(W)算符:表示此算符兩側(cè)的檢索詞必須按此前后順序相鄰排列,詞序不可變,且兩詞之間不許有其他的詞或字母,但允許有一空格或標點符號。如:biological(W)control
相當于檢索:biologicalcontrolCD(W)ROM相當于檢索CDROM或CD-ROM。
2023/9/1135《數(shù)字文獻檢索》(2)(nW)算符(nW)算符:(nW)是nwords的縮寫,表示此算符兩側(cè)的檢索詞之間允許插入最多n個詞,且詞序不可變。如wear(1W)material*相當于檢索wearmaterials、wearofmaterials等詞。注意與”wearmaterial*”、“wearandmaterial*”等檢索式的區(qū)別2023/9/1136《數(shù)字文獻檢索》(3)
(N)和(nN)算符(N)是near的縮寫,表示此算符兩側(cè)的檢索詞必須緊密相連,詞序可變,詞間不允許插入其他詞或字母,但允許有一空格或標點符號。(nN)表示兩詞間可插入最多n個詞,詞序可變。如檢索式:environment(2N)protect*就可檢索出包含“environmentprotection”、“environmentoftheprotection”、“environmentofwaterprotection”、“protectionofforestenvironment”等內(nèi)容的結(jié)果如檢索式:Information(1N)retrieval可檢索出:informationretrievalretrivealofinfor
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030中國片劑和顆粒包衣系統(tǒng)行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 2025至2030中國照明控制組件行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 2023-2028年中國玻璃移門行業(yè)市場全景評估及投資前景展望報告
- 2019-2025年中國植物藻類提取物行業(yè)發(fā)展趨勢預測及投資戰(zhàn)略咨詢報告
- 2025-2030年中國旅游縫紉制品行業(yè)深度研究分析報告
- 2025年中國有機玻璃球型罩行業(yè)市場發(fā)展前景及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 2022-2027年中國鋁包木窗行業(yè)市場調(diào)研及投資戰(zhàn)略研究報告
- 2025年中國齒輪減速電機行業(yè)發(fā)展前景及投資戰(zhàn)略咨詢報告
- 襯裙等行業(yè)深度研究分析報告(2024-2030版)
- 低功耗硬件設(shè)計-洞察及研究
- 2024年安徽省農(nóng)業(yè)信貸融資擔保有限公司招聘筆試參考題庫附帶答案詳解
- 浙教版 人教版 培智生活語文四年級下冊 部分教案
- 《新能源汽車動力電池及管理系統(tǒng)檢修》 課件 模塊1 新能源汽車動力電池及管理系統(tǒng)認知
- 地方病防治課件
- 住院醫(yī)師規(guī)范化培訓急診科出科理論考核A卷
- 供應(yīng)商稽核查檢表
- 免疫檢驗 免疫應(yīng)答之 非特異性免疫
- GB/T 20490-2023鋼管無損檢測無縫和焊接鋼管分層缺欠的自動超聲檢測
- 生活中的化學知識課件
- 利用“智慧教育平臺”激活農(nóng)村學校教育智慧
- 光伏發(fā)電項目施工組織設(shè)計
評論
0/150
提交評論