第一節信息檢索及其類型第二節信息檢索語言第三節信息檢_第1頁
第一節信息檢索及其類型第二節信息檢索語言第三節信息檢_第2頁
第一節信息檢索及其類型第二節信息檢索語言第三節信息檢_第3頁
第一節信息檢索及其類型第二節信息檢索語言第三節信息檢_第4頁
第一節信息檢索及其類型第二節信息檢索語言第三節信息檢_第5頁
已閱讀5頁,還剩27頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第一節第一節 信息檢索及其類型信息檢索及其類型第二節第二節 信息檢索語言信息檢索語言第三節第三節 信息檢索技術信息檢索技術第四節第四節 檢索工具檢索工具第二章第二章 信息檢索基礎知識信息檢索基礎知識第一節第一節 信息檢索及其類型信息檢索及其類型一、一、信息檢索的概念信息檢索的概念二、二、信息檢索的類型信息檢索的類型三、三、信息檢索的意義信息檢索的意義一、信息檢索一、信息檢索 信息檢索:是指將信息信息檢索:是指將信息(主要指文獻信息)按一定(主要指文獻信息)按一定的方式組織和存儲起來,并的方式組織和存儲起來,并根據用戶的需要找出相關信根據用戶的需要找出相關信息的過程。息的過程。 信息檢索信息檢索

2、存儲存儲檢索檢索存儲:是對信息進行著錄、存儲:是對信息進行著錄、標引、整序,編制檢索工標引、整序,編制檢索工具和建立檢索系統的過程。具和建立檢索系統的過程。檢索:是指面向信息需求檢索:是指面向信息需求而進行高度選擇性的查找而進行高度選擇性的查找過程。過程。原始文獻原始文獻加工整理加工整理數據庫數據庫提提 問問檢檢 索索輸輸 出出存存 儲儲檢檢 索索二、信息檢索的類型二、信息檢索的類型(一)按檢索內容劃分(一)按檢索內容劃分2、數據檢索數據檢索 是以數據為檢索內容的信息檢索,要求從檢是以數據為檢索內容的信息檢索,要求從檢索系統存儲的大量原始調查數據和其它統計數據中索系統存儲的大量原始調查數據和其

3、它統計數據中查出所需的數字資料查出所需的數字資料。1 1、書目檢索、書目檢索 是以文獻線索為檢索內容的信息檢索。是以文獻線索為檢索內容的信息檢索。3 3、事實檢索、事實檢索 是以具體事項為檢索內容的信息檢索,要求從檢索是以具體事項為檢索內容的信息檢索,要求從檢索系統存儲的各種原始信息資源中查出專門的事實材料。系統存儲的各種原始信息資源中查出專門的事實材料。4 4、全文檢索、全文檢索 即檢索系統存儲的是整篇文章或整本圖書。即檢索系統存儲的是整篇文章或整本圖書。5 5、圖像檢索、圖像檢索 即以圖形、圖像或圖文信息為檢索內容的信息檢索。即以圖形、圖像或圖文信息為檢索內容的信息檢索。6 6、多媒體檢索

4、、多媒體檢索 是以文字、圖像、聲音等多媒體信息為檢索內容的是以文字、圖像、聲音等多媒體信息為檢索內容的信息檢索。信息檢索。 (二)按是否使用檢索工具劃分(二)按是否使用檢索工具劃分 1 1、直接檢索、直接檢索 就是指利用一次文獻進行檢索,這是以前比較常用的就是指利用一次文獻進行檢索,這是以前比較常用的一種查找方法。所花時間多和精力大,檢出文獻少。一種查找方法。所花時間多和精力大,檢出文獻少。 2 2、間接檢索、間接檢索 就是指利用各種檢索工具獲得文獻線索,再根據線索就是指利用各種檢索工具獲得文獻線索,再根據線索去查找原始文獻線索的方法。去查找原始文獻線索的方法。 (三)按信息檢索手段劃分(三)

5、按信息檢索手段劃分 1 1、傳統信息檢索、傳統信息檢索 就是手工信息檢索,是利用各種印刷型檢索工具來就是手工信息檢索,是利用各種印刷型檢索工具來查找文獻的一種方法。查找文獻的一種方法。 2 2、現代信息檢索、現代信息檢索 現代信息檢索即計算機信息檢索,是指利用計算機現代信息檢索即計算機信息檢索,是指利用計算機和網絡來處理和查找文獻信息的檢索方式。和網絡來處理和查找文獻信息的檢索方式。1、信息檢索是現代人才的基本生存技能、信息檢索是現代人才的基本生存技能2、信息檢索是現代人才信息素質的重要方面、信息檢索是現代人才信息素質的重要方面3、信息檢索是科學交流的重要途徑、信息檢索是科學交流的重要途徑4、

6、信息檢索是開發信息資源的工具、信息檢索是開發信息資源的工具5、信息檢索是管理決策的基礎、信息檢索是管理決策的基礎6、信息檢索是繼承和借鑒前人成果,避免重、信息檢索是繼承和借鑒前人成果,避免重 復研究的必由之路復研究的必由之路7、信息檢索是治學之道、信息檢索是治學之道三、信息檢索的意義三、信息檢索的意義第二節第二節 信息檢索語言信息檢索語言一、一、檢索語言的含義及作用檢索語言的含義及作用二、二、檢索語言的類型檢索語言的類型一、檢索語言的含義及作用一、檢索語言的含義及作用檢索語言:檢索語言:是根據檢索需要而創造的一種人工語言。是根據檢索需要而創造的一種人工語言。作用:作用:1、保證不同標引人員表征

7、文獻信息的一致性。、保證不同標引人員表征文獻信息的一致性。 2、使內容相同及相關的文獻集中化。、使內容相同及相關的文獻集中化。 3、保證檢索提問與文獻信息標引的一致性。、保證檢索提問與文獻信息標引的一致性。 4、保證檢索者按不同需求檢索文獻信息時,、保證檢索者按不同需求檢索文獻信息時, 都能獲得最高的查全率和查準率。都能獲得最高的查全率和查準率。二、檢索語言的類型二、檢索語言的類型檢索語言的類型檢索語言的類型表述文獻外表表述文獻外表特征的語言特征的語言表述文獻內容表述文獻內容特征的語言特征的語言題名題名責任者責任者號碼號碼引文引文分類法分類法主題法主題法標題詞法標題詞法敘詞法敘詞法關鍵詞法關鍵

8、詞法分類語言分類語言 按知識門類的邏輯次序將信息系統地組織和按知識門類的邏輯次序將信息系統地組織和劃分的語言,具體體現為用分類號和類名來表達劃分的語言,具體體現為用分類號和類名來表達信息的主題概念。信息的主題概念。 中國圖書館圖書分類法中國圖書館圖書分類法 美國國會圖書館分類法美國國會圖書館分類法 杜威十進位分類法杜威十進位分類法 IPCIPC國際專利分類法國際專利分類法 標題詞語言標題詞語言 是從文獻的題目和內容中抽出來,經過規范是從文獻的題目和內容中抽出來,經過規范化處理的主題語言。化處理的主題語言。關鍵詞語言關鍵詞語言 直接從文獻信息的標題、摘要或內容本身抽直接從文獻信息的標題、摘要或內

9、容本身抽取出來的用于揭示信息主題內容的自由詞。取出來的用于揭示信息主題內容的自由詞。敘詞語言敘詞語言 是以表達文獻主題內容的概念單元為基礎,是以表達文獻主題內容的概念單元為基礎,經過規范化處理,可以進行邏輯組配的一種主語經過規范化處理,可以進行邏輯組配的一種主語語言。語言。第三節第三節 檢索技術檢索技術一、一、概念檢索概念檢索二、二、布爾邏輯運算符組配檢索布爾邏輯運算符組配檢索三、三、截詞檢索截詞檢索四、四、字段限制檢索字段限制檢索五、五、位置運算符位置運算符六、六、檢索技巧和方法檢索技巧和方法一、概念檢索一、概念檢索 檢索標識是具體的檢索詞或詞組,每檢索標識是具體的檢索詞或詞組,每個檢索詞表

10、達一個概念,具體檢索時,將個檢索詞表達一個概念,具體檢索時,將檢索詞與數據庫中的文獻特征標識進行類檢索詞與數據庫中的文獻特征標識進行類比,兩者相同,則該記錄為命中文獻。比,兩者相同,則該記錄為命中文獻。二、二、 布爾邏輯算符組配檢索布爾邏輯算符組配檢索 布爾邏輯組配運算是采用布爾代數中的布爾邏輯組配運算是采用布爾代數中的邏輯邏輯“與與”邏輯邏輯“或或”、邏輯、邏輯“非非”等算符,等算符,將檢索提問式轉換成邏輯表達式,限定檢索將檢索提問式轉換成邏輯表達式,限定檢索詞在記錄中必須存在的條件或不能出現的條詞在記錄中必須存在的條件或不能出現的條件。凡符合布爾邏輯所規定的條件的文獻,件。凡符合布爾邏輯所

11、規定的條件的文獻,既為命中文獻。既為命中文獻。 布爾邏輯運算符布爾邏輯運算符1、邏輯、邏輯“或或”2、邏輯、邏輯“與與”3、邏輯、邏輯“非非” 1、邏輯、邏輯“或或”(和)(和)AB用符號用符號“or”或或“+”表示,其邏輯表達式為:表示,其邏輯表達式為: A or B 或或 A+B 其意義為檢索記錄中凡含有檢索詞其意義為檢索記錄中凡含有檢索詞A或檢索詞或檢索詞B,或同時含有檢索詞或同時含有檢索詞A和和B的,均為命中文獻。的,均為命中文獻。 2、邏輯、邏輯“與與”AB用符號用符號“and”或或“*”表示,其邏輯表達式為:表示,其邏輯表達式為: A * B 或或 A and B 其意義為檢索記錄

12、中必須同時含有檢索詞其意義為檢索記錄中必須同時含有檢索詞A和和B的文獻,才算命中文獻。的文獻,才算命中文獻。 3、邏輯邏輯“非非” AB用符號用符號“not”或或“-”,其邏輯表達式為:,其邏輯表達式為: A not B 或或 A-B 其意義為:檢索記錄中含有檢索詞其意義為:檢索記錄中含有檢索詞A,但不能,但不能含有檢索詞含有檢索詞B的文獻,才算命中文獻。的文獻,才算命中文獻。三、截詞檢索三、截詞檢索 截詞檢索主要是利用檢索詞的詞干或不完整的詞形進截詞檢索主要是利用檢索詞的詞干或不完整的詞形進行檢索。行檢索。 截詞符一般用截詞符一般用“?”、“ :”、“#”表示表示1、后方截詞、后方截詞:用于

13、前方一致的派生詞檢索。:用于前方一致的派生詞檢索。 如:信息如:信息? 則表示在數據庫中含有信息、信息技術、信息檢索等則表示在數據庫中含有信息、信息技術、信息檢索等方面的文獻記錄均為命中文獻。方面的文獻記錄均為命中文獻。2、前方截詞、前方截詞:用于后方一致的派生詞檢索。:用于后方一致的派生詞檢索。 如:?經濟如:?經濟 則數據庫中含有經濟、工業經濟、農業經濟等方面的則數據庫中含有經濟、工業經濟、農業經濟等方面的文獻均為命中文獻。文獻均為命中文獻。 3、有限截詞、有限截詞 在檢索詞后面加上一個或一個以上(最多在檢索詞后面加上一個或一個以上(最多4個)的個)的“?”,空一格,再加一個,空一格,再加

14、一個“?”。如:。如: Comput? ? 可檢索出:可檢索出: Computer,Computers,Computing 截詞檢索在不同的計算機檢索系統中規截詞檢索在不同的計算機檢索系統中規定不同,請使用時注意。定不同,請使用時注意。四、字段限制檢索四、字段限制檢索 為了縮小檢索范圍,可利用字段代碼來限制為了縮小檢索范圍,可利用字段代碼來限制檢索詞出現的字段,以提高檢索速度和命中率。檢索詞出現的字段,以提高檢索速度和命中率。 如:如:rice in ti(表示只在題目字段中查找文獻)(表示只在題目字段中查找文獻) rice in de(只在主題詞中查找)(只在主題詞中查找) rice in

15、ab(只在文摘中查找)(只在文摘中查找) au = Smith,J.C (查作者為查作者為Smith,J.C 的的 文章文章) py = 1998(只查只查1998年的文章年的文章) la =Chinese (只查語種為中文的文獻只查語種為中文的文獻) 五、位置運算符五、位置運算符WithWith:設定需檢索的兩個詞或詞組在同一字段中,但設定需檢索的兩個詞或詞組在同一字段中,但不限制位置的先后。不限制位置的先后。NearNear:設定需檢索的兩個詞或詞組在同一語句中,相設定需檢索的兩個詞或詞組在同一語句中,相對于對于“with”with”更接近。此外,在使用更接近。此外,在使用“near”ne

16、ar”運算符運算符時,還可以在該運算符后添加一個數字以便進一步限時,還可以在該運算符后添加一個數字以便進一步限定兩個詞之間的鄰近程度,如定兩個詞之間的鄰近程度,如“near3” near3” 設定需檢索設定需檢索的兩個詞或詞組在同一句子中且相隔不超過的兩個詞或詞組在同一句子中且相隔不超過3 3個單詞。個單詞。 1 1、檢索策略、檢索策略 計算機檢索,實際上是由計算機將用戶輸入的檢計算機檢索,實際上是由計算機將用戶輸入的檢索策略與系統中存儲的文獻特征標識及邏輯組配關系索策略與系統中存儲的文獻特征標識及邏輯組配關系進行類比、匹配,并把完全匹配的文獻輸出的過程。進行類比、匹配,并把完全匹配的文獻輸出

17、的過程。 檢索策略檢索策略是科學地運用檢索詞和邏輯運算符正確是科學地運用檢索詞和邏輯運算符正確地構造邏輯提問式的原則和方法。其核心內容在于檢地構造邏輯提問式的原則和方法。其核心內容在于檢索策略的構造與檢索的步驟。索策略的構造與檢索的步驟。 六、檢索的技巧和方法六、檢索的技巧和方法 A A、弄清用戶的提問要求,并確定要查找的文獻、弄清用戶的提問要求,并確定要查找的文獻 學科范圍、類型、文種、時間等。學科范圍、類型、文種、時間等。 B B、選擇相關的數據庫并確定在待檢數據庫中的、選擇相關的數據庫并確定在待檢數據庫中的 檢檢索途徑,以便制定適合所選擇數據庫的檢索策略。索途徑,以便制定適合所選擇數據庫

18、的檢索策略。 C C、對情報提問進行概念分析、對情報提問進行概念分析 D D、擬定檢索邏輯式、擬定檢索邏輯式 E E、對數據庫文檔進行查找,檢出相關文獻并分析、對數據庫文檔進行查找,檢出相關文獻并分析檢索結果。檢索結果。 F F、如有必要,對提問式進行反饋、修改,重復第、如有必要,對提問式進行反饋、修改,重復第五步,直到用戶滿意為止。五步,直到用戶滿意為止。制定檢索策略的步驟:制定檢索策略的步驟:A A、擴大檢索范圍、擴大檢索范圍2、檢索技巧和方法、檢索技巧和方法* * 概念的擴大。概念的擴大。* * 范圍的擴大。范圍的擴大。* * 增加同義詞、近義詞、相關詞和縮略詞。增加同義詞、近義詞、相關

19、詞和縮略詞。* * 用用“or”or”、”?”?”、敘詞表、敘詞表* * 年代的擴大。年代的擴大。* * 去掉連字符可擴大檢索范圍。去掉連字符可擴大檢索范圍。* * 換另外的數據庫或是另外的光盤繼續進行檢索。換另外的數據庫或是另外的光盤繼續進行檢索。B B、縮小檢索范圍的方法、縮小檢索范圍的方法* * 核心概念的限定。核心概念的限定。* * 核心期刊的限定。核心期刊的限定。* * 語種的限定。語種的限定。* * 用布爾邏輯算符用布爾邏輯算符“and”and”或者或者“not”not”組組配檢配檢 索詞。索詞。* * 使用位置算符使用位置算符“near”near”和字段算符和字段算符“in”in”提提 高查準率。高查準率。* * 使用使用“Index”Index”和敘詞表和敘詞表, ,選擇確切的檢選擇確切的檢索索 詞縮小檢索范圍詞縮小檢索范圍第四節第四節 檢索工具檢索工具 檢索工具:檢索工具:是在不同學科范圍內對是在不同學科范圍內對某階段出版的有關文獻進行收集、整理某階段出版的有關文獻進行收集、整理或對新文獻加以及時報道的二次文獻。或對新文獻加以及時報

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論