信息組織(檢索一)課件_第1頁
信息組織(檢索一)課件_第2頁
信息組織(檢索一)課件_第3頁
信息組織(檢索一)課件_第4頁
信息組織(檢索一)課件_第5頁
已閱讀5頁,還剩44頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2、6 信息檢索(一)1、信息檢索概述2、信息檢索發展歷史2、6 信息檢索(一)一、信息檢索概述:信息檢索是一門關于信息資源存儲、整序、查找理論和方法的學科,是利用一定的檢索算法,借助于特定的檢索工具,從結構化或非結構化的數據中獲取有用信息的過程。一、信息檢索概述:信息檢索是一門關于信息資源存儲、整序、查找文檔集合(document collection)在信息檢索中,把文檔看作一個檢索單元,組成檢索對象的多個文檔稱為文檔集合。用戶提交的檢索需求又稱查詢(query)。文檔集合(document collection)在信息 原理: 相 關 反 饋 檢索系統查詢的內部表示文檔的內部表示匹配檢索

2、結果查詢請求文檔集合用戶 原理:查詢的內檢索步驟 明確需求,分析主題選擇檢索工具或數據庫提交檢索表達式顯示與優化檢索結果完成確定檢索式構造檢索表達式修改檢索式檢索步驟 明確需求,分析主題選擇檢索工具或數據庫提1、信息檢索的類型按檢索內容分:數據檢索(Date Information Retrieval):事實檢索(Fact Information Retrieval): 文獻檢索(Document Information Retrieval) 1、信息檢索的類型按檢索內容分:數據檢索(Date Info 數據檢索(Date Information Retrieval): 是針對回答某一問題數據

3、的檢索。如回答“2005年經濟增長率是多少”?事實檢索(Fact Information Retrieval): 查找某一事件發生的時間、地點、經過等情況。它即包括對數值的檢索、運算和推導,也包括概念比較、判斷,比數據檢索復雜。 數 文獻檢索(Document Information Retrieval)是關于對某一主題文獻的線索的查找,通常通過目錄、索引、文摘等二次文獻,查找出原始文獻,所以,又稱為“書目檢索”。 文獻檢索(Do 2)按組織方式 3)按檢索設備 手工檢索機器檢索聯機檢索光盤檢索網絡檢索全文檢索超文本檢索超媒體檢索 2)按組織方式 手工2、信息檢索研究內容:信息檢索是一門關于信

4、息資源存儲、整序查找理論和方法的學科,其研究內容主要包括: 檢索服務檢索策略檢索系統信息表音著錄法數據庫檢索語言檢索理論研究內容2、信息檢索研究內容:信息檢索是一門關于信息資源存儲、整序1、檢索理論研究內容包括:信息與信息資源定義;信息檢索的定義、類型、特點、作用、研究對象、方法、內容、理論基礎、術語規范、原理與原則、相關學科等的研究。1、檢索理論研究內容包括:2、檢索語言研究原指受控語言的集合,現指受控語言和自然語言(未規范的書面語言)。其研究內容包括:關鍵詞、主題詞、詞表編制、分類表編制、概念分析、規范檔、代碼標識等。尤其還包括網絡數據庫中不同檢索語言的轉換、自動分類、自動標引、網絡檢索根

5、據等的研究。2、檢索語言研究原指受控語言的集合,現指受控語言和自然語3、數據庫的研究數據庫建設規劃與協調共享收錄信息與文獻的篩選文檔結構、維護與更新版權、市場跨庫檢索等3、數據庫的研究數據庫建設規劃與協調共享4、著錄法研究包括國內外著錄標準的研究各種著錄方法的研究電子型文獻及網絡信息的著錄研究4、著錄法研究包括國內外著錄標準的研究5、標引和組織法的研究標引:通過對信息資源的分析,選用確切的檢索標識反映信息資源內容的過程。組織方法:即排檢法,主要是詞表的編制與選用。當前研究重點為網絡信息資源的標引與排序、數字資源的全球統一分類體系、自動標引與排序、智能搜索引擎、網格研究等。5、標引和組織法的研究

6、標引:通過對信息資源的分析,選用6、檢索系統研究 檢索系統是由有序化的信息資源、設備、檢索方法和策略等組成的集合體。其研究內容主要包括:系統設計、運行和評價。6、檢索系統研究 檢索系統是由有序化的信息資源、設備、檢7、檢索策略研究所謂檢索策略是指:在分析信息需求提問時確定的檢索途徑與檢索用詞,并明確各詞之間邏輯關系和查找步驟的安排。包括:用戶需求提問分析檢索式表達檢索符號的設置與應用、步驟優化等。7、檢索策略研究所謂檢索策略是指:在分析信息需求提問時確8、檢索服務研究服務范式檢索效果用戶培訓服務手段檢索服務研究8、檢索服務研究服務范式檢索效果用戶培訓服務手段檢索服務3、信息檢索的研究方法信息檢

7、索的研究涉及到諸多學科,如認知科學、計算機科學、信息科學、語言學、邏輯學以及概率論、最優化理論、模式識別、系統分析等,因此研究方法也多種多樣。3、信息檢索的研究方法信息檢索的研究涉及到諸多學科,如認知科除各科學通用的觀察法、實驗法、調查法、模擬法、歸納與演繹法、分析與比較法外,還采用:文獻計量學方法目錄學方法分類法主題法排序法咨詢法除各科學通用的觀察法、實驗法、調查法、模擬法、歸納與演繹法、二、信息檢索發展簡史20世紀中期以前:完全手工階段1950S:第一個計算機情報檢索試驗系統1960s:批處理檢索(脫機檢索)1970s- 1980s:聯機檢索1990以后:Internet信息檢索二、信息檢

8、索發展簡史20世紀中期以前:完全手工階段信息檢索的源起信息檢索源起于19世紀前期。由于近代科學團體的大量涌現,文獻數量的增多,導致了文獻檢索業務社會分工的出現。19世紀20世紀初,出現了多種覆蓋各個專業的檢索工具,其中一些經長期發展調整,成為世界著名的檢索工具,如美國的工程索引、化學文摘、英國的科學文摘等。信息檢索的源起信息檢索源起于19世紀前期。由于近代科學團體的、20世紀中期以前:手工檢索階段一般以1830年柏林科學院在柏林和萊比錫出版的文摘刊物藥學總覽為手工檢索的開端。以1876年美國圖書館協會第一屆大會的召開為規范化信息檢索工作的正式起點。、20世紀中期以前:手工檢索階段一般以1830

9、年柏林科學院直到20世紀40年代,信息檢索還只有手工檢索一種方式。這一時期的特點表現為:以印刷文獻,(圖書、期刊、會議、專利文獻等)為主要檢索對象;以各類(文摘、題錄、和目錄性)工具書為檢索工具;以圖書館的參考咨詢部為開展信息檢索的中心機構。直到20世紀40年代,信息檢索還只有手工檢索一種方式。這一時手工檢索工具:手工檢索工具:2、計算機化檢索階段(20世紀50年代初-90年代初) 1951年,世界上出現了最早的計算機檢索系統。自20世紀60年代起,隨著計算機性能的提高,儲存量的增大,價格的下降,為計算機檢索的發展提供了堅實的物質基礎。2、計算機化檢索階段(20世紀50年代初-90年代初) 3

10、、網絡化檢索階段(20世紀90年代初期-):信息檢索的主流平臺轉移到以WWW為核心的網絡環境中。1994年春,網上出現了第一個web搜索引擎。網絡檢索以極低的費用、海量的信息、迅速地存取以及對多媒體功能的支持等,對聯機檢索和光盤檢索造成沖擊。3、網絡化檢索階段(20世紀90年代初期-):信息檢索的手工信息檢索工具檢索性工具書書目、索引、文摘參考性工具書百科全書、類書、政書、年鑒、名錄、手冊詞語性工具書字典、詞典圖錄性工具書地圖、歷史圖錄、人物圖錄、文物圖錄、藝術圖錄、科技圖錄等邊緣性工具書位于工具書和非工具書之間,如資料匯編、史書、方志等。手工信息檢索工具檢索性工具書書目、索引、文摘手工檢索工

11、具的排檢技術1、字順排檢技術2、分類排檢技術3、主題排檢技術4、時序排檢技術(多用于編制年表、年譜等)5、地序排檢技術(集中某一地區的有關信息)手工檢索工具的排檢技術1、字順排檢技術介紹幾種著名的科技檢索期刊1、美國工程索引(The Engineering Index,簡稱EI)。1884年10月創刊。目前由美國工程信息公司負責編輯。EI名為索引,實際上是文摘性刊物,是世界著名的工程技術方面的綜合性檢索工具。特點:1)收錄范圍大。收錄50多個國家26種文字的5400多種工程期刊、會議錄、科技報告年報道量約22萬條。中國有60多家期刊被EI收錄。介紹幾種著名的科技檢索期刊1、美國工程索引(The

12、 Engi2)報道的學科多、內容廣。較全面地報道了工程技術各個領域和科學管理方面的文獻。3)報道的文獻質量高。大多經編輯人員精選,比較有參考價值的才予以收錄。4)查找方便。可根據文獻主題或姓名查找。對于光盤數據庫和網絡數據庫還可以根據著者的工作單位、刊物名稱、年代等途徑查找。2)報道的學科多、內容廣。較全面地報道了工程技術各個領域和科EI的出版形式包括有: 工程索引月刊 印刷版 工程索引年刊 工程索引累積索引 縮微版 磁帶版 機讀版 光盤版EI的出版形式包括有: EI的檢索途徑 確定主題詞核對工程敘詞表確定正確主題詞EI的主題索引 文獻正文 EI的個人著作索引已知著者姓名已知團體機構EI年刊本

13、中的勞動者單位索引原文個人團體著者主題EI的檢索途徑 確定主題詞核對工程敘詞表EI的主題索2、英國科學文摘(Science Abstracts,簡稱SA)1898年創刊,由英國電氣工程師學會負責編輯出版。分4個分輯出版: A輯 物理文摘,半月刊。 B輯 電器與電子學文摘,月刊。 C輯 計算機與控制文摘,月刊。 D輯 信息技術,月刊。 2、英國科學文摘(Science Abstracts,簡SA是科學技術方面的綜合性文摘,文獻來源包括50多個國家4200多種的期刊、科技報告、會議文獻、學位論文等。以英美文獻為主,年報道量大約40萬條。SA有印刷版、縮微版、磁帶版、網絡版、光盤版等不同形式的出版物

14、。SA是科學技術方面的綜合性文摘,文獻來源包括50多個國家42SA的體系結構 1、文摘(SA的正文,最主要的組成部分) 2、輔助索引 主題指南主題索引 著者索引 參考文獻索引 圖書索引 會議索引 團體著者索引SA的體系結構 1、文摘(SA的正文,最主要的組成部分)主題SA的檢索途徑分類索引主題索引著者索引SA的分類索引主題索引著者索引3、美國化學文摘(Chemical Abstracts,簡稱CA)1907年創刊,由美國化學學會化學文摘服務社編輯出版,現為周刊。每年出版兩卷,每卷26期。特點:范圍廣(不僅報道化學化工文學,還報道生物醫學相關文獻。收錄150多個國家56種文字的約14000種化學

15、化工期刊,年報道量達773000條,其中專利占123000條,占據了化學化工世界95%的文獻)。出版迅速、內容準確、詳細、索引系統完備。出版物形式有:印刷、縮微、磁帶、光盤、網絡版。3、美國化學文摘(Chemical Abstracts,CA的索引體系 期索引關鍵詞索引著者索引專利索引登記號索引索引指南登記號索引資料來源索引卷索引累積索引化學物質索引普通主題索引分子式索引環系索引雜原子索引專利索引著者索引CA的索引體系期索引關鍵詞索引著者索引專利索引登記號索引索引4、美國科學引文索引(Science Citation Index,SCI)1961年創刊,雙月刊,美國費城“科學信息研究所”編輯出

16、版。收錄40多個國家的科技期刊、會議錄、論文集、專著、叢書等。報道范圍為數、理、化、農、林、醫、生物科學、工程技術等。有印刷版、數據庫、聯機版、網絡版。4、美國科學引文索引(Science Citation SCI的主要用途1、作為檢索工具可以從引文入手進行檢索,提供了一條新的檢索途徑。2、作為分析工具常被用于引文分析,在研究工作中得到廣泛應用: 1)文獻評價 2)科學史研究 3)科學交流模式研究SCI的主要用途1、作為檢索工具可以從引文入手進行檢索, SCI的結構1、引文索引2、來源索引3、輪排索引4、專利引文索引5、機構索引SCI的結構1、引文索引2、來源索引3、輪排索引4、專利引文SCI

17、的檢索途徑1、引文途徑2、主題途徑 3、來源著者途徑 4、著者機構途徑 5、綜合循環檢索法SCI的檢索途徑1、引文途徑2、主題途徑 3、5、美國生物學文摘(Biological Abstracts, BA)創刊于1926年,有美國“生物學文摘生物科學情報服務社”編輯出版,半月刊,一年兩卷,摘錄110多個工架9000多種期刊、以及專題論文、科技報告、學位論文、圖書、會議文獻、檔案資料等16000多種文獻。5、美國生物學文摘(Biological AbstracBA的結構1、文摘2、索引 著者索引 生物系統索引 屬種索引 主題索引BA的結構1、文摘6、日本科學技術文獻速報1958年創刊,由日本情報中心編輯出版。內容以理工科為主,但不包括數學和天文學。收錄一萬多種期刊和其他出版物,以日文文獻為主,一般只收錄原始文獻、評論性文章、實用技術資料等。分12個分冊,各冊每年第一期于4月出版,最末一期于次年3月

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論