




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、搜索引擎使用技巧現(xiàn)代信息檢索和科技信息檢索的結(jié)晶搜索之前先思考 在你使用搜索引擎搜索之前,應(yīng)該先花幾秒種想一下,我要找的東西網(wǎng)上可能有嗎?如果有,可能在哪里,是什么樣子的?網(wǎng)頁(yè)上會(huì)含有哪些關(guān)鍵字?這次搜索,你應(yīng)該使用新浪還是搜狐?Google還是百度?分析你的需求,比較不同搜索引擎的強(qiáng)項(xiàng)和弱點(diǎn),然后為這次搜索選擇最適合的搜索工具。 選擇搜索引擎 1、搜索引擎的收錄范圍。使用搜索引擎首先應(yīng)該了解它收錄的范圍是什么,這樣才能知道在這里是否能找到自己所需的資料。全球性網(wǎng)站雖然收錄的范圍很廣,但針對(duì)某一范圍而言,往往不如本要范圍的搜索引擎更為豐富。搜索引擎的收錄范圍包括:(1)地域范圍:一般大型網(wǎng)站均
2、面向全球(如:YAHOO!),一些中小型網(wǎng)站一般收錄某一區(qū)域的信息(如:亞洲網(wǎng)路主要收錄亞洲地區(qū)網(wǎng)站)。(2)語(yǔ)言范圍:常見(jiàn)有簡(jiǎn)體中文(GB碼)、繁體中文(Big5碼)、英文。(3)網(wǎng)站類型范圍:大多數(shù)搜索引擎提供WEB頁(yè)搜索,但也有一些搜索引擎提供FTP、BBS、新聞組等檢索內(nèi)容。(4)專業(yè)范圍:有些網(wǎng)站專門收錄某一主題、某一行業(yè)方面和信息。選擇搜索引擎2、明確它的設(shè)計(jì)目的和發(fā)展走向,有的專用于檢索WEB信息,有的專用于檢索Usenet信息,有的針對(duì)商業(yè)需要設(shè)計(jì),使用時(shí)確認(rèn)所選引擎是否能夠滿足檢索需要。 3、其他相關(guān)說(shuō)明。在幫助信息中查找本引擎的操作方法,使用規(guī)則及算符說(shuō)明和它的特色服務(wù)。這
3、些信息是用戶進(jìn)行網(wǎng)絡(luò)信息資源查詢所必須具備的知識(shí)。國(guó)外搜索引擎:搜索目標(biāo)(英文)搜索引擎/目錄索引一般資料Google資料涉及非常冷僻的領(lǐng)域AllTheWeb特殊資料InfoSeek/WebCRawler等產(chǎn)品或服務(wù)Yahoo/Overture國(guó)內(nèi)搜索引擎搜索目標(biāo)(中文)搜索引擎/目錄索引一般資料Google古漢語(yǔ)(詩(shī)詞)資料百度(有獨(dú)到之處)產(chǎn)品或服務(wù)搜狐、新浪(質(zhì)量高)、網(wǎng)易(較全)檢索提問(wèn)式的構(gòu)造 一是檢索詞的選擇 二是檢索詞的組配連接一、關(guān)鍵詞的選擇搜索引擎檢索的靈魂要有足夠多的檢索詞,借鑒方法:5W1H(what who where when why how) 檢索策略信息檢索策略
4、-聯(lián)機(jī)檢索策略積木型:把用戶的檢索請(qǐng)求剖析成若干個(gè)不同的概念面,先分別對(duì)這幾個(gè)概念面進(jìn)行檢索,并在每個(gè)概念面中盡可能全和多的列舉相關(guān)詞、同義詞、近義詞,并用布爾算符“OR”連接成子檢索式;然后再用適當(dāng)?shù)牟紶査惴阉凶訖z索提問(wèn)式連接起來(lái),構(gòu)成一個(gè)總檢索式。引文珠形增長(zhǎng):從已知的關(guān)于檢索問(wèn)題的少數(shù)幾個(gè)專指詞開(kāi)始檢索,以便至少檢出一篇命中文獻(xiàn)或一條相關(guān)信息,然后審閱這批文獻(xiàn)或信息條目,從中選出一些新的相關(guān)檢索詞,補(bǔ)充到檢索提問(wèn)式中去。 逐次分餾:先確定一個(gè)相當(dāng)大的范圍廣的檢索初始對(duì)象集合,然后一步步提高檢索提問(wèn)式的專指度,縮小命中結(jié)果集合,得到數(shù)量適宜滿意的結(jié)果。最專指面優(yōu)先:用戶在檢索時(shí),首先選
5、擇從檢索課題中最專指的概念面入手,瀏覽結(jié)果后如發(fā)現(xiàn)檢出的文獻(xiàn)相當(dāng)少,通常就不再把其他概念面加入。選擇檢索詞注意事項(xiàng):同義詞(縮寫、全稱、簡(jiǎn)稱、學(xué)名、俗名、簡(jiǎn)繁體、不同語(yǔ)言說(shuō)法、不同地區(qū)說(shuō)法、不同時(shí)代說(shuō)法、別稱、大小寫、通假字)注意選擇檢索課題的核心概念,排除無(wú)關(guān)概念,合并重復(fù)概念,以簡(jiǎn)化檢索式。避免使用冷僻詞匯注意閱讀搜索引擎的規(guī)則,了解引擎的停用詞和常用詞,等。二、檢索詞的連接組配1、使用布爾檢索 布爾算符主要有 “AND”:連接的兩個(gè)關(guān)鍵詞都必須出現(xiàn)在檢索結(jié)果中。某些檢索工具用符號(hào)“+”代替AND。例如,輸入“computer and book”,它要求查詢結(jié)果中必須同時(shí)包含compute
6、r和book。 “OR”:連接的兩個(gè)關(guān)鍵詞必須有一個(gè)出現(xiàn)在檢索結(jié)果中,百度用“”代替。例如,輸入“computer or book”,就要求查詢結(jié)果中可以只有computer,或只有book,或同時(shí)包含computer和book。 “NOT”:緊跟在“NOT”后的關(guān)鍵詞不出現(xiàn)在結(jié)果中。某些檢索工具用“AND NOT”或者“”代替。例如輸入“automobile not car”,就要求查詢的結(jié)果中包含automobile(汽車),但同時(shí)不能包含car(小汽車)。 在實(shí)際的使用過(guò)程中,你可以將各種邏輯關(guān)系綜合運(yùn)用,靈活搭配,以便進(jìn)行更加復(fù)雜的查詢。當(dāng)兩個(gè)關(guān)鍵詞用另外一種操作符連在一起,而你又想把
7、它們列為一組時(shí),就可以對(duì)這兩個(gè)詞加上圓括號(hào)(),以改變或調(diào)整各項(xiàng)檢索項(xiàng)的運(yùn)算優(yōu)先次序。2、使用雙引號(hào)用( )給要查詢的關(guān)鍵詞加上雙引號(hào)(英文狀態(tài)),可以實(shí)現(xiàn)精確的查詢。例如在搜索引擎的文字框中輸入“電傳”,它就會(huì)返回網(wǎng)頁(yè)中有“電傳”這個(gè)關(guān)鍵字的網(wǎng)址,而不會(huì)返回諸如“電話傳真”之類網(wǎng)頁(yè)。 3、使用截詞符 截詞符的作用是對(duì)單元檢索詞進(jìn)行加工修飾,使其功能更完善。例如,使用截詞符可以解決一個(gè)檢索詞的單復(fù)數(shù)問(wèn)題,詞干相同而詞尾不同的問(wèn)題,以及英美單詞拼寫差異的問(wèn)題等。截詞符在不同系統(tǒng)中有不同的規(guī)定符號(hào)。也并不是所有的搜索引擎都支持截詞檢索。 4、位置算符 表示連接的各個(gè)單元檢索詞詞間位置關(guān)系的符號(hào),例
8、如,使用位置算符可以限制兩個(gè)檢索詞在文獻(xiàn)中出現(xiàn)的先后順序、間隔的距離等。如“W/N/S/F/L/C” 5、使用元詞檢索(高級(jí)檢索中的一些特殊功能)大多數(shù)搜索引擎都支持“元詞”(metawords)功能,依據(jù)這類功能用戶把元詞放在關(guān)鍵詞的前面,這樣就可以告訴搜索引擎你想要檢索的內(nèi)容具有哪些明確的特征。例如,你在搜索引擎中輸入“title:清華大學(xué)”,就可以查到網(wǎng)頁(yè)標(biāo)題中帶有清華大學(xué)的網(wǎng)頁(yè)。在鍵入的關(guān)鍵詞后加上“domain:org”,就可以查到所有以org為后綴的網(wǎng)站。其他元詞還包括:image:用于檢索圖片,link:用于檢索鏈接到某個(gè)選定網(wǎng)站的頁(yè)面,URL:用于檢索地址中帶有某個(gè)關(guān)鍵詞的網(wǎng)頁(yè)
9、,filetype:文件格式。 6、區(qū)分大小寫這是檢索英文信息時(shí)要注意的一個(gè)問(wèn)題,許多英文搜索引擎可以讓用戶選擇是否要求區(qū)分關(guān)鍵詞的大小寫,這一功能對(duì)查詢專有名詞有很大的幫助,例如:Web專指萬(wàn)維網(wǎng)或環(huán)球網(wǎng),而web則表示蜘蛛網(wǎng)。檢索過(guò)程中遇到的問(wèn)題1:錯(cuò)別字 經(jīng)常發(fā)生的一種錯(cuò)誤是,你輸入的關(guān)鍵詞含有錯(cuò)別字。筆者所做的統(tǒng)計(jì)表明,常有大量的錯(cuò)誤搜索,光一個(gè)謝霆鋒就有“謝霆鋒”、“謝庭鋒”、“謝霆峰”、“謝廷鋒”、“謝庭峰”、“謝廷峰”6種查法,還有什么“星際爭(zhēng)吧”、“以德制國(guó)”之類的,這樣的關(guān)鍵詞能搜索到什么有用資料嗎?所以每當(dāng)你覺(jué)得某種內(nèi)容網(wǎng)上應(yīng)該有不少、卻搜索不到結(jié)果時(shí),你應(yīng)該先查一下是否有
10、錯(cuò)別字2:關(guān)鍵詞太常見(jiàn) 搜索引擎對(duì)常見(jiàn)詞的搜索存在缺陷,因?yàn)檫@些詞曝光率太高了,以至于出現(xiàn)在成百萬(wàn)網(wǎng)頁(yè)中,使得它們事實(shí)上不能被用來(lái)幫你找到什么有用的內(nèi)容。比如,搜索“電話”,有無(wú)數(shù)網(wǎng)站提供跟“電話”相關(guān)的信息,從網(wǎng)上黃頁(yè)到電話零售商到個(gè)人電話號(hào)碼都有。所以當(dāng)搜索結(jié)果太多太亂的時(shí)候,你應(yīng)該嘗試使用更多的關(guān)鍵詞或者減號(hào)來(lái)搜索,不使用過(guò)于通用的詞匯來(lái)搜索,設(shè)計(jì)一個(gè)類似“上海常用電話”這樣特殊的搜索關(guān)鍵詞,會(huì)給你真正有用的結(jié)果。當(dāng)然,如果你想找的是一串汽車網(wǎng)站或一串MP3網(wǎng)站,那么用“汽車”、“MP3”搜索就是正確的 3:多義詞 要小心使用多義詞,比如搜索“Java”,你要找的信息究竟是太平洋上的一個(gè)
11、島、一種著名的咖啡、還是一種計(jì)算機(jī)語(yǔ)言?搜索引擎是不能理解辨別多義詞的。最好的解決辦法是,在搜索之前先問(wèn)自己這個(gè)問(wèn)題,然后用短語(yǔ)、用多個(gè)關(guān)鍵詞或者用其他的詞語(yǔ)來(lái)代替多義詞作為搜索關(guān)鍵詞。比如用“爪哇印尼”、“爪哇咖啡”、“Java語(yǔ)言”分別搜索可以滿足不同的需求 4:不會(huì)輸關(guān)鍵詞,想要什么輸什么 搜索失敗的另一個(gè)常見(jiàn)原因是類似這樣的搜索:“現(xiàn)代愛(ài)情故事歌詞”、“信息早報(bào)在濟(jì)南發(fā)行情況”、“鈴羊車的各種圖案”、“上海到成都列車時(shí)刻表”。網(wǎng)友錯(cuò)把搜索引擎當(dāng)成是聽(tīng)話的服務(wù)員了,其實(shí)搜索引擎是很機(jī)械的,當(dāng)你用關(guān)鍵詞搜索的時(shí)候,它只會(huì)把含有這個(gè)關(guān)鍵詞的網(wǎng)頁(yè)找出來(lái),根本不管網(wǎng)頁(yè)上的內(nèi)容是什么。而問(wèn)題在于,
12、沒(méi)有一個(gè)網(wǎng)頁(yè)上會(huì)含有“現(xiàn)代愛(ài)情故事歌詞”和“上海到成都列車時(shí)刻表”這樣的關(guān)鍵詞,所以搜索引擎也找不到這樣的網(wǎng)頁(yè)。但是真正含有你想找的內(nèi)容的網(wǎng)頁(yè),應(yīng)該含有的關(guān)鍵詞是“現(xiàn)代愛(ài)情故事”、“歌詞”,“上海”、“成都”、“列車”、“時(shí)刻表”,所以你應(yīng)該這樣搜索:“現(xiàn)代愛(ài)情故事歌詞”、“信息早報(bào)濟(jì)南發(fā)行”、“鈴羊車圖案”“上海成都列車時(shí)刻表”。5:在錯(cuò)誤的地方搜索搜索引擎從抓取網(wǎng)頁(yè)、解析、索引到提供檢索是有一個(gè)周期的,各搜索引擎的信息滯后周期從一周到一月不等,所以找最新內(nèi)容應(yīng)該去看新聞,用搜索引擎是找不到最新內(nèi)容,只能找到一個(gè)星期或一個(gè)月以前的內(nèi)容。另外,搜索引擎對(duì)動(dòng)態(tài)內(nèi)容,如:論壇、數(shù)據(jù)庫(kù)內(nèi)容,以及帶f
13、rame結(jié)構(gòu)的網(wǎng)頁(yè)檢索能力較弱,所以這類信息也不適合用搜索引擎搜索,而是應(yīng)該去相關(guān)的網(wǎng)站尋找,當(dāng)然,尋找相關(guān)網(wǎng)站的任務(wù)搜索引擎是當(dāng)仁不讓的。 當(dāng)用戶對(duì)檢索結(jié)果不滿意時(shí),可以適當(dāng)調(diào)節(jié)檢索式中的泛指詞、專指詞、和相關(guān)詞之間的數(shù)量比例及邏輯組配關(guān)系來(lái)改善檢索效果。例如,對(duì)需要較高查全率的檢索項(xiàng)目,可從擴(kuò)檢入手。方法如下:1、降低檢索詞的專指度,詞的上位概念和下位概念要充分應(yīng)用,詞的近義詞及相關(guān)詞補(bǔ)充到檢索式中,用“OR”連接。2、減少邏輯“與”的運(yùn)算,丟掉一些次要的或者太專指的詞。3、去掉某些條件限制,如文獻(xiàn)格式,語(yǔ)言,時(shí)間等。4、調(diào)整位置算符,(W)(F)5、進(jìn)行截詞檢索,具體采用后截?cái)唷⑶敖財(cái)嗟?/p>
14、不同方式。對(duì)于需要較高查準(zhǔn)率的檢索項(xiàng)目,一般在查全率的基礎(chǔ)上在進(jìn)行縮檢。方法如下:1、減少同義詞和同族相關(guān)詞的使用。2、提高詞的專指度,增加或換用下位詞或?qū)V付雀叩淖杂稍~或直接使用短語(yǔ)進(jìn)行檢索。3、增加限制概念,采用邏輯“與”連接檢索詞。4、增加條件限制,將檢索詞限定在某個(gè)或某些字段,或運(yùn)用位置算符限定詞間順序。或規(guī)定文獻(xiàn)格式、語(yǔ)言等。5、使用邏輯“非”算符,排除無(wú)關(guān)概念。6、進(jìn)行第二次檢索,或?qū)z索結(jié)果進(jìn)行后處理,例如聚類、挖掘。 另外,還需要對(duì)檢索項(xiàng)目和引擎進(jìn)行綜合分析,才能靈活運(yùn)用。在搜索引擎的使用過(guò)程中,需要注意和強(qiáng)調(diào)的問(wèn)題: 1、由于網(wǎng)絡(luò)資源的動(dòng)態(tài)增長(zhǎng)和海量規(guī)模,當(dāng)前任何一個(gè)搜索引擎的數(shù)據(jù)庫(kù)收錄的范圍都非常有限。為此,進(jìn)行信息查詢時(shí),一個(gè)搜索引擎不能得到很滿意的結(jié)果,應(yīng)換用其他的搜索引擎,或考慮使用元搜索引擎,以擴(kuò)大查詢范圍,提高
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 設(shè)備中大修管理制度
- 設(shè)備拆除后管理制度
- 設(shè)計(jì)院薪酬管理制度
- 診所自帶藥管理制度
- 話務(wù)員培訓(xùn)管理制度
- 運(yùn)輸防泄漏管理制度
- 優(yōu)炫java面試題及答案
- 歷年物理高考試題及答案
- java泛型高頻面試題及答案
- 膠州招聘面試題及答案
- 2025年上海市研發(fā)公共服務(wù)平臺(tái)管理中心招聘題庫(kù)帶答案分析
- 初級(jí)消控員測(cè)試題及答案
- 宣講政策課件
- 居民組織法試題及答案
- 國(guó)家行業(yè)領(lǐng)域重大事故隱患判定標(biāo)準(zhǔn)(2025年5月)解讀培訓(xùn)
- 綠化草皮種植合同協(xié)議書
- 學(xué)校基本設(shè)施管理制度
- 工程測(cè)試技術(shù)試題及答案
- 無(wú)痛胃鏡操作急救知識(shí)要點(diǎn)
- 2025年下半年湖南永州藍(lán)山縣事業(yè)單位招聘工作人員38人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年小學(xué)一年級(jí)數(shù)學(xué)下冊(cè)奧數(shù)競(jìng)賽測(cè)試考試卷(含答案解析)
評(píng)論
0/150
提交評(píng)論