計算機檢索基礎課件_第1頁
計算機檢索基礎課件_第2頁
計算機檢索基礎課件_第3頁
計算機檢索基礎課件_第4頁
計算機檢索基礎課件_第5頁
已閱讀5頁,還剩74頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二節文獻檢索基本知識2.11檢索原理檢索表達式文獻標識檢索工具(系統)是否匹配否輸出結果為零得到檢索結果是情報工作人員2.11檢索原理文獻著錄:是指按照一定規則分析、選擇、記錄文獻信息的過程。

款目分類標引(歸類)——依據一定的分類語言對信息資源的內容特征進行分析、判斷,賦予分類標識的過程。幾種常用分類法:中國圖書館分類法(99年,第四版)中國科學院圖書館分類法杜威十進制分類法(DDC)國際十進制分類法(UDC)美國國會圖書館分類法(LCC)2.11檢索原理2.11檢索原理中國圖書館分類法(中圖法)基本22大類A馬列毛鄧B哲學宗教…T工業技術TB一般工業技術TD礦業工程TE石油天然氣工業…TV水利工程TB1工程基礎科學TB2工程設計與繪測TB3工程材料學…TB9測量學TB30工程材料一般性問題TB31金屬材料…TB37耐腐蝕材料Z綜合性圖書…主題標引——在主題分析的基礎上,以一定的詞表或標引規則為信息資源賦予主題詞、表達其內容特征的過程。受控標引(依據詞表—《漢語主題詞表》)自由標引2.11檢索原理《漢語主題詞表》包括主表、附表、詞族索引、范疇索引和英漢對照索引分3卷:第1卷:社會科學部分,收錄主題詞23500

余條第2卷:自然科學部分,收錄主題詞65200

余條,非正式主題詞12913條第3卷:附表如:論資產者在市場經濟初期的作用受控標引:資產階級-市場經濟自由詞標引:資產者-市場經濟問題:兩種不同的標引方式會對檢索產生什么樣的影響?弄清檢索類型檢索題目:1.余秋雨.《歷史的臉譜》北京:文化藝術出版社.2007年

2.楊叔子,吳波,胡春華等.網絡化制造與企業集成[J].中國機械工程,2000,11(1-2):45-493.中國2006年的外匯儲備是多少美金?選擇檢索途徑選擇檢索工具選擇檢索方式如何檢索A.數據(data)檢索B.事實(fact)檢索C.文獻(document)檢索2.21信息檢索的類型(根據檢索的內容來看)檢索題目:1.余秋雨.《歷史的臉譜》北京:文化藝術出版社.2007年

2.楊叔子,吳波,胡春華等.網絡化制造與企業集成[J].中國機械工程,2000,11(1-2):45-493.中國2006年的外匯儲備是多少美金?外部特征的檢索途徑:文獻載體的外表上標記的可見的特征,如題名(刊名、書名、篇名)、作者、出版地、號碼等內容特征的檢索途徑:文獻所載知識信息中隱含的、潛在的特征,如分類號、主題詞等,據此有分類途徑(分類號),主題途徑(關鍵詞、主題詞)和分類主題途徑。檢索題目:1.余秋雨.《歷史的臉譜》北京:文化藝術出版社.2007年

2.楊叔子,吳波,胡春華等.網絡化制造與企業集成[J].中國機械工程,2000,11(1-2):45-493.中國2006年的外匯儲備是多少美金?ABCDEFGH2.22文獻信息檢索途徑二者的比較受控詞檢索自由詞檢索檢索詞規范化的詞(人工語言)自然語言字段受控詞字段題名、摘要、正文等除主題詞字段外的其他字段產生標引人員文章本身適用不知道具體的題名(書刊名、題名)知道具體的題名,適合查事實或數據時優點揭示深入、廣泛,不需要輸入過多的檢索詞不需要查詞表,檢索時可隨意表達,可查具體數據或事實缺點依賴標引;主題詞選取難;不適于查具體的數據或事實型容易漏檢小練習:A受控字段:資產階級B受控字段:資產者C題名字段:資產階級D題名字段:資產者1:用下列檢索方法檢索論文1,哪種方法能夠命中?2:用下列檢索方法檢索論文2,哪種方法能夠命中?3.用下列檢索方法檢索,哪種既能檢索到論文1又能檢索到論文24.如果用題名字段進行檢索,如何才能又檢索到論文1又檢索到論文2論文1:論資產者在市場經濟初期的作用論文2:論民族資產階級對中國資本主義萌芽的影響檢索工具的類型1(據文獻收錄內容):

綜合型:包含多種學科(理工或人文或社科或全部或某類)如《CNKI中國期刊全文數據》、《科學引文索引》、《工程索引》

專業型:只包含某一學科,如《化學文摘》、《物理文摘》

專題型:只包含某一特定對象或專題,如《中藥炮制研究文獻目錄》

單一型:某一特定類型文獻,如《專利文獻通報》Whichone?檢索題目:1.余秋雨.《歷史的臉譜》北京:文化藝術出版社.2007年

2.楊叔子,吳波,胡春華等.網絡化制造與企業集成[J].中國機械工程,2000,11(1-2):45-493.中國2006年的外匯儲備是多少美金?2.23檢索工具檢索工具的類型3(據功能):目錄(catalogue):對一個單獨的出版實體(書、刊等)進行記載,指明基本內容和收藏地,如館藏目錄(OPAC),聯合目錄、國家書目等題錄文摘(abstract)全文(fulltext)(計算機)對文獻中的內容按照條目進行揭示,并指明出處。題錄只提供簡單的信息,文摘除基本信息外還提供文章的摘要,全文型檢索工具可直接獲取原文,一般為網上數據庫Whichone?檢索題目:1余秋雨.《歷史的臉譜》北京:文化藝術出版社.2007年

2.楊叔子,吳波,胡春華等.網絡化制造與企業集成[J].中國機械工程,2000,11(1-2):45-493.中國2006年的外匯儲備是多少美金?2.24檢索工具手工檢索——印刷型檢索工具計算機檢索——計算機檢索系統2.24檢索方式檢索型的工具書(二次文獻)(很少用)參考型工具書(三次文獻):年鑒、百科全書、手冊等詞語型工具書(三次文獻):字典、詞典其他(三次文獻)2.24檢索方式手工檢索:手冊(Handbook)——簡明扼要地概述某一專業或某一方面的基本知識以及一些基本的公式、數據、規章和條例等

特點:簡潔、實用、便于查找例如:《建筑工程手冊》《數學手冊》《世界近代史知識手冊》《各國貨幣手冊》2.24檢索方式手工檢索年鑒(Yearbook)——記錄一年之內的大事集,它將一年之內的重要時事、統計數據等匯集起來并按年度連續出版。

特點:數據新、系統、全面、權威例如:《中國科技統計年鑒》《上海經濟年鑒》《中國人物年鑒》《中國教育年鑒》2.24檢索方式手工檢索表譜性工具書——以簡略的文字來記錄史實、時間、地理等資料的工具書,可查考歷史年代、歷史大事、換算不同的年、月、日,以及查考人物生平與官職、地理沿革等功能

分年表:如《中外歷史年表》、《自然科學大事年表》;歷表:如《中華實用歷書》、《百年通歷》;表譜:查考人物、官職、地理及科技數據等資料:如《物理學常用數表》、《歷代名人表譜》其他2.24檢索方式手工檢索政書——記載歷代典章制度的史書,是中國特有的工具書種類圖錄性工具書——以圖像為主、文字為輔反映客觀事物的工具書如地圖、歷史圖錄、人物圖錄、藝術圖錄2.24檢索方式手工檢索計算機檢索的優點檢索方便、靈活,速度快,可直接獲取全文,對相關文獻可進行有效鏈接缺點所檢即所得,可能由于人為或計算機系統的因素而查找不到2.24檢索方式計算機檢索計算機檢索系統檢索終端通信網

INTERNET服務器(數據庫/文檔)計算機檢索2.24檢索方式認識數據庫數據庫是組織信息的一種常見的方法,內容結構如下:文檔1(file):一張表就是一個文檔字段(field)記錄(record)文檔2文檔n數據庫(database)數據庫結構圖字段(數據庫)=款目(著錄、標引)=檢索點/檢索入口/檢索字段(檢索界面)/檢索項/檢索途徑和內容相關的字段:基本索引字段,如題名、摘要和外部特征相關的字段:輔助索引字段,如作者、作者單位數據庫的類型:綜合型(多學科,如EI、SDOL);單一型(單一學科,如數學評論、AIP)全文型(可直接獲取全文,如SDOL、Springer);文摘型(只有摘要,不能直接獲取原文,如EI、SCI);專利數據庫、學位論文庫(PQDD)、期刊數據庫(中國期刊網、SODL)、會議論文庫(ISTP,萬方會議論文庫)、綜合型(EI|、SCI)數據型數據庫、事實型數據庫WhichDatabase?選擇數據庫時應考慮數據庫的以上特點以及語種、年限等因素。AreyousearchingInternetgame?計算機檢索語言——讓計算機能夠理解的語言計算機檢索2.24檢索方式1.張藝謀在九十年代拍攝的電影是哪幾部想表達復雜的概念2.SO2、NO2、CH4分別對大氣層的影響3.學生(除小學生外)對網絡游戲認識的調查用邏輯算符把若干個檢索詞或詞組連接起來,構成一個檢索式,指定這些詞在文獻中出現或不出現的條件:

1.邏輯“與”——“同時”的關系:邏輯算符:AND;*例如:查分布式網絡系統方面的文章

分布式AND網絡系統(分布式*網絡系統)查中國科學院王曉光的文章

中國科學院AND王曉光(中國科學院*王曉光)

邏輯組合檢索2.邏輯“或”——“或者”的關系:邏輯算符:OR;+

例如:查二氧化硫方面的文章

二氧化硫ORSO2(二氧化硫+SO2)

查傳感器方面的文章

sensorORdetector(sensor+detector)3.邏輯“非”——“不屬于”的關系邏輯算符:NOT;-

例如:查非酒精料方面的文章

飲料NOT酒精(飲料–酒精)

4.

嵌套檢索——根據檢索需求多次運用邏輯算符例:查本科生或研究生的就業問題

(本科生OR研究生)AND就業查有關造紙廢水處理方面的文章

(papermakingORpaperpulp)ANDwastewaterAND(treat

ORtreatment)使用邏輯組合檢索需注意的問題:

1.中文數據庫中多用*、+、-符號;英文數據庫一般用ANDORNOT表示布爾邏輯運算2.有些數據庫可多次使用二次檢索3.有括號時,先執行括號里面的運算,沒有括號時,ANDORNOT的運算順序在不同的系統里有不同的規定,如在Dialog里,是按照NOTANDOR的順序執行碰到下列情況怎么辦?ManagemanagementmanagingColorcolourSinksinkingsanksunk截詞檢索

用某個符號來代替英文單詞的一部分,通常用于相同詞干或部分拼寫相同的詞,常用的截詞符(wildcardsortruncation)有:*?$等無限截詞(一個符號可代替任意個字母):Treat*:Treattreatingtreatedtreatmentsul*ate:sulphatesulfate有限截詞(一個符號只代替零或一個字母):Wom?n:womanwomen其他類型的截詞:springer如:詞根截詞SDOS使用截詞檢索需注意的問題:

1.僅對英文數據庫2.不同的系統使用的截詞符號是不一樣的,使用前應查看檢索提示或相關幫助EISDOS檢索時會經常遇到這樣的問題?……這些數字表明,這所大樓的構造是不合理的,究其根本原因,是對地基的控制出了偏差。……這篇文章研究了數字控制技術在智能化機械加工中的應用,并提出了一種新的方法……我們發明了一種新的方法,以實現對這種新型設備數字化的控制檢索式:“數字

and控制”位置檢索位置符號(proximityoperators):指定詞與詞位置關系的符號W/n——算符兩側的兩個檢索詞按此前后銜接的順序排列,詞序不可變,詞與詞之間相互距離不超過n個詞N/n——算符兩側的檢索詞之間的距離不超過n個詞,詞序可變Same——算符兩側的檢索詞在同一個子字段或同一個自然句中(Sentence)Paragraph——算符兩側的檢索詞在同一個段落中

摘要:智能交通系統是解決當今交通問題最有前途的手段之一,而交通信息的分析與處理是其核心問題。首先介紹智能交通系統的信息特征及其分析要求,剖析了當前國內外常用的分析方法在信息處理與輔助決策方面存在的不足,提出了一個完整的、針對智能交通行業的交通信息智能分析與輔助決策系統模型。該模型以數據挖掘技術為核心,全面運用了新一代決策支持系統理論和計算智能技術,最后闡述了模型的各主要組成部分及其關鍵技術與實現方案。關鍵詞:數據挖掘;智能交通;信息分析;決策支持小練習:下面哪個檢索式可以找到下列文章?A.智能交通

Same

模型

B.數據

Same

分析

C.數據挖掘

Same

模型

D.數據挖掘

Paragraph

模型使用位置檢索需注意的問題:1.英文數據庫常用2.多數用于數據庫的專業檢索方式(需輸入檢索指令的檢索)3.不同的數據庫用到的位置算符不一樣,使用前查看檢索提

示或相關幫助EISDOL精確(exact)檢索——檢索特定的句子或詞組EI使用精確檢索需注意的問題:不同的數據庫對精確檢索的規定不一樣,部分數據庫使用””,如EI(“intelligentcontrol”);部分數據庫使用空格即可,如IEE/IEEE(intelligentcontrol);還有一些數據庫通過特定程序控制,springer禁用詞擴大檢索范圍的方法考慮同義詞或近義詞(使用布爾邏輯符or連接)使用上位詞(如飛行器航天飛機載人航天飛機)使用截詞符選擇較大檢索范圍的字段如摘要縮小檢索范圍的方法使用and、not等限制檢索范圍使用位置算符選擇檢索范圍較小的字段使用二次檢索使用下位詞使用精確檢索2.3檢索步驟明確檢索需求、確定查找范圍選擇檢索工具確定檢索詞,構造檢索表達式實施檢索策略修改檢索策略索取原文第一步:明確檢索需求、確定查找范圍檢索目的:大致分為三種類型普查型

——需要全面收集有關某一主題的文獻資料,強調“查全率”。如查新攻關型

——需要收集某一特定方面的文獻資料,旨在解決科研生產中的關鍵問題,不強調文章的數量,解決問題即可。探索型

——了解和掌握某一領域的研究現狀,最新研究動向和研究成果,要求查到的文章具有新穎和及時的特點,對“查全率”和“查準率”不一定有較高的要求查找范圍:主題、學科范圍、文獻的類型、年限、語種第二步:選擇檢索工具印刷型檢索工具網絡數據庫WWW館藏目錄……文摘數據庫和全文數據庫文摘數據庫

大的公司全文數據庫1

學術出版社全文數據庫2

代理公司全文數據庫3

學會、協會文摘數據庫全文數據庫數據量較多較少收集范圍各家出版社自家出版社學科整合自然出版文摘數據庫1文摘數據庫2

網絡資源和專業數據庫網絡資源專業數據庫內容經過審核否是信息是有組織的否是信息被永久收藏否是內容廣泛,無所不包是否第三步:確定檢索詞,構建檢索表達式主題詞:用于主題字段的檢索詞,規范化

檢索詞(詞表)關鍵詞:用于非主題字段(題名、摘要等)的檢索詞,非規范化檢索詞表達內容特征的途徑:主題途徑、分類途徑、主題分類途徑——

提煉檢索詞表達外部特征的途徑——直接輸入檢索詞即可,如作者,ISSN號等確定檢索詞的方法:第1步:簡短寫出主題句第2步:將所有和主題相關的關鍵詞和短語標出來第3步:如果選用主題詞檢索,查詞表;如果選用關鍵詞檢索,對關鍵詞進行補充(頭腦風暴)、替換和刪除補充——同義詞、近義詞、縮寫、不同拼寫例如:網絡因特網webWWW(wideworldweb)brainstorm,brainstorm,brain-storm,brain-storms,brainstorming,brainstorming,brain-storming替換

——當檢索詞過于寬泛,可用下位詞替換;當檢索詞太狹義,過于具體,可用上位詞替換例如:火箭發動機、液體火箭發動機、液氫/液氧發動機刪除

——沒有檢索意義的詞;存在蘊含關系可合并的詞例如:研究、探討、討論、系統;計算機因特網—>因特網檢索題目:用放電等離子燒結技術制備新型NdFeB永磁材料的研究第二步:刪除不必要的關鍵詞:第三步:對核心關鍵詞進行補充技術、研究(刪除理由:沒有檢索意義);制備、新型、材料(刪除理由:意義蘊含,且“新型”意義模糊)放電等離子燒結——同位詞SPS(縮寫)上位詞等離子燒結NdFeB——同位詞釹鐵硼(漢語名稱)上位詞稀土鐵硼上上位詞永磁構造檢索表達式注意:在構造檢索表達式之前一定弄清所用數據庫的檢索功能和合法和操作算符,這樣才能有效地進行檢索嵌套檢索、邏輯組合檢索、截詞檢索、位置檢索、字段選擇、精確檢索(釹鐵硼OR稀土鐵硼ORNdFeBOR永磁)AND(SPSOR放電等離子燒結OR等離子燒結)第四步:實施檢索策略檢索詞?檢索式?檢索系統?檢索途徑:主題途徑、分類途徑、分類主題途徑?檢索方式:簡單檢索、高級檢索、專業檢索?第五步:修改檢索策略檢索結果過多——縮小檢索范圍檢索結果過少——擴大檢索范圍檢索結果相關度小——修改檢索詞、檢索式,更換檢索系統第六步:獲取原文獲取原文的途徑:館藏目錄——查找原始出版物,如期刊、圖書、學位論文等全文數據庫——通過網絡直接下載原文原文傳遞——通過圖書館的原文傳遞服務獲取原文的步驟:分析文獻源(source):出版物、年、卷、期、頁碼是否在校全文數據庫中是OK學校是否有印刷版是OK提交圖書館進行原文傳遞否否知道文獻的題名,還可償試用篇名檢索摘要數據庫鏈接到原文原文數據庫直接下載NSTL原文傳遞搜索引擎直接下載查找原文的過程中應注意的問題:1.識別文獻類型(GB/T7714-2005

):

1)趙凱華,羅蔚茵.新概念物理教程:力學[M].北京:高等教育出版社,1995

2)MARTING.ControlofelectronicresourcesinAustralia[M]//PATTLELW,COXBJ.Electronicresources:selectionandbibliographiccontrol.NewYork:TheHaworthPress,1996:85-96.3)InternationalFederationofLibraryAssociationandInstitutions.Namesofpersons:nationalusagesforentryincatalogues[M].3rded.London:IFLAInternationalOfficeforUBC,1977.圖書4)中國力學學會.第3屆全國實驗流體力學學術會議論文集[C].天津:[出版者不詳],19905)鐘文發.非線性規劃在可燃毒物配置中的應用「C]//趙瑋.運籌學的理論與應用中國運籌學會第五屆大會論文集.西安:西安電子科技大學出版社,1996468-4716)GANZHAVG,MAYREW,VOROZHTSOVEV.Computeralgebrainscientificcomputing:CASC2000:proceedingsoftheThirdWorkshoponComputerAlgebrainScientificComputing,Samarkand,October5-9,2000[C].Berlin:Springer,c2000.會議論文7)U.S.DepartmentofTransportationFederalHighwayAdministration.Guidelinesforbandingexcavatedacid-producingmaterials,PB91-194001[R].Springfield:U.S.DepartmentofCommerceNationalInformationService,1990.8)WorldHealthOrganization.Factorsregulatingtheimmuneresponse:reportofWHOScientificGroup[R].Geneva:WHO,1970.科技報告9)張志祥.間斷動力系統的隨機擾動及其在守恒律方程中的應用[D].北京:北京大學數學學院,1998.10)CALMSRB.Infraredspectroscopicstudiesonsolidoxygen[D].Berkeley:Univ

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論