第7章-網絡信息資源檢索與利用_第1頁
第7章-網絡信息資源檢索與利用_第2頁
第7章-網絡信息資源檢索與利用_第3頁
第7章-網絡信息資源檢索與利用_第4頁
第7章-網絡信息資源檢索與利用_第5頁
已閱讀5頁,還剩28頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第7章

網絡信息資源檢索與利用

搜索引擎搜索引擎(searchengine),1995年開始

搜索引擎指自動從因特網搜集信息,經過一定整理以后,提供給用戶進行查詢的系統。因特網上的信息浩瀚萬千,而且毫無秩序,所有的信息象汪洋上的一個個小島,網頁鏈接是這些小島之間縱橫交錯的橋梁,而搜索引擎,則為用戶繪制一幅一目了然的信息地圖,供用戶隨時查閱。搜索引擎站---“網絡門戶”1、搜索引擎的工作原理

信息的收集處理信息的檢索輸出2、搜索引擎的分類

目錄式搜索引擎:以人工方式或半自動方式搜集信息,由編輯員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中。信息大多面向網站,提供目錄瀏覽服務和直接檢索服務。該類搜索引擎因為加入了人的智能,所以信息準確、導航質量高,缺點是需要人工介入、維護量大、信息量少、信息更新不及時。這類搜索引擎的代表是:yahoo!、Galaxy、OpenDirectory……

Shou(搜狐)、Sina(新浪)….目錄式搜索引擎機器人搜索引擎由一個稱為蜘蛛(Spider)的機器人程序以某種策略自動地在互聯網中搜集和發現信息,由索引器為搜集到的信息建立索引,由檢索器根據用戶的查詢輸入檢索索引庫,并將查詢結果返回給用戶。服務方式是面向網頁的全文檢索服務。該類搜索引擎的優點是信息量大、更新及時、毋需人工干預,缺點是返回信息過多,有很多無關信息,用戶必須從結果中進行篩選。這類搜索引擎的代表是:AltaVista、NorthernLight、Excite、Infoseek、Inktomi、FAST、Lycos、Google;國內代表為:"天網"、悠游、OpenFind等。

元搜索引擎元搜索引擎:這類搜索引擎沒有自己的數據,而是將用戶的查詢請求同時向多個搜索引擎遞交,將返回的結果進行重復排除、重新排序等處理后,作為自己的結果返回給用戶。服務方式為面向網頁的全文檢索。這類搜索引擎的優點是返回結果的信息量更大、更全,缺點是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。這類搜索引擎的代表是WebCrawler、InfoMarket等。

常用的一些搜索引擎網址(一)http://雅虎是中國最著名的目錄索引,是搜索引擎開山鼻祖之一。它收錄了全球資訊網上數以萬計的中文網站,不論你要找的網站是用國標碼簡體字、大五碼繁體字還是圖形中文,都可以在這里找到。1999年9月檢索途徑:通過分類目錄、關鍵詞檢索檢索方法與技巧:支持布爾邏輯檢索(不支持“OR”)、可以使用引號,強調“+”、“-”、指定關鍵字出現的段落(加t:、加u:)

英語不好也可以輕松瀏覽英文網頁

檢索結果:根據關聯程度排序同時列出“相關……”其它:與Google合作常用的一些搜索引擎網址(二)

http://1998年創立,搜狐“分類與搜索”已收錄網站四十多萬,已形成龐大的中文網站數據庫。搜狐的目錄導航式搜索引擎完全是由人工加工而成,相比機器人加工的搜索引擎來講具有很高的精確性、系統性和科學性。

檢索途徑:通過分類目錄、關鍵詞檢索

檢索方法與技巧:支持布爾邏輯檢索、“-”、“&”、“/”、“()”、空格檢索結果:根據關聯程度排序;返回五種分類結果其它:直通車;搜狐黃頁常用的一些搜索引擎網址(三)http://

1997年,(簡體中文)提供有類目檢索和網站檢索兩種方式。支持AND和“-”等條件查詢。以搜索精度高、速度快成為最受歡迎的搜索引索,是目前搜索的領軍人物。檢索方法與技巧:模塊分類、關鍵詞檢索;支持布爾邏輯檢索(自動添加AND),支持“OR”,“-”前面加空格;忽略常見詞;對通配符支持有限檢索特色:網頁快照、手氣不錯;相似網頁、查詢電話號碼、查找PDF文件、股票報價、查找字典釋意、用Google查找地圖、工具條服務、網頁翻譯、單詞糾錯、繁簡轉換;使用偏好常用的一些搜索引擎網址(四)

中國提供搜索引擎的主要網站中,超過80%由百度提供。1999年底,百度成立于美國硅谷,2000年百度回中國發展。是國內唯一商業化的全文搜索引擎,提供搜狐、新浪、263、TOM等站點的搜索服務。檢索方法與技巧:模塊分類、關鍵詞檢索;要求“一字不差”,支持布爾邏輯檢索(可以用空格代替AND/+);可以使用檢索語法檢索特色:

百度快照、自動糾錯、百度搜霸;使用偏好;百度與google比較搜索英文不必說用google,搜索中文呢?很多人并不了解它們更新的情況,google發展早,因而它貯存了大量舊的信息,百度發展遲,信息較新。更新速度:對中文google一般半月至一月一更新,而且僅搜索到三級鏈接,三級以下便不在搜索,那么我如何看到最新的google搜索的結果呢?這個站點:/,可見google采用不同服務器逐步更新的。百度的更新較快,半月一次,最快一周。百度和google語法的應用找特定文件名的文件,尤其是PDF、ZIP、swf、DOC、TXT、RAR、EXE、RM、Mp3,MOV,PPT這些文件名都是網友想找的重點,至于各是什么類型文件,請上網查一下便知道了,這里不多說了。尤其老板讓你做個powerpoint,找不到圖怎么辦?用google去搜索。基本搜索語法——查找文件方法是利用語法filetype:后綴名。如找PDF文件,在正常關鍵詞后面加filetype:PDF即可,搜索結果全是PDF文件。找特定題目的網頁語法intitle:網站查找友情鏈接:

"link:"(英文單字link后加冒號)用于搜索鏈接到某個URL地址的網頁??梢粤私庥心男┚W頁把鏈接指向您的網頁。基本搜索語法——查找站點查找特定站點:

site:www.*.com如金庸古龍site:

但不可加入http://或/這類,否則是錯的。查找美國教育網上的宇宙大爆炸jpg圖片搜索:“BIGBANGfiletype:jpg

site:edu”結果:搜索有關BIGBANGfiletype:jpg

site:edu

的圖片Site可將搜索定位于某一個域名上,有利于縮小搜索范圍,提高搜索效率。如keywordssite:edu,效果很好!可以方便地搜索到各大學內有用的資源。site:tw,site:edu.tw,site:.......

這是定位于國家或地區,將搜索局限于某些國家或地區,或加上edu,則是這些國家或地區的大學,效果自然更好。特殊語法:inurl

“inurl”語法返回的網頁鏈接中包含第一個關鍵字,后面的關鍵字則出現在鏈接中或者網頁文檔中。有很多網站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網頁名稱中,比如“MP3”、“GALLARY”等,于是,就可以用INURL語法找到這些相關資源鏈接,然后,用第二個關鍵詞確定是否有某項具體資料。INURL語法和基本搜索語法的最大區別在于,前者通常能提供非常精確的專題資料。

示例:查找MIDI曲“滄海一聲笑”

搜索:inurl:midi

滄海一聲笑結果:已搜索有關inurl:midi

滄海一聲笑的中文(簡體)網頁。

注意:“inurl:”后面不能有空格,GOOGLE也不對URL符號如“/”進行搜索。例如,GOOGLE會把“cgi-bin/phf”中的“/”當成空格處理。google其它功能—查縮略詞的全稱利用google查縮略詞的全稱,如果寫作時突然忘了某個縮略詞的全稱,當時手頭若有金山詞霸等軟件則是易事,若無可考慮使用google,將其中文名與其縮略名作為關鍵詞搜索,效果很好.google其它功能——查英文單詞的中文名稱google是最全的英中詞典,你找到一個英文詞,卻不知中文怎么辦?google其它功能——搜索電話如果想知道某個公司的電話,往往許多人喜歡這樣選關鍵詞:公司名稱tel,結果得到的根本不是你需要的。如果你知道這個公司的性質或屬于什么地方的,則可以這樣搜索:區號公司名,這比上述關鍵詞要有效得多,這也涉及到搜索效率的問題。常用的一些搜索引擎網址(五)元搜索引擎,1995年,Washington大學開發,2000年被Infospace收購。檢索方法與技巧:模塊分類、關鍵詞檢索;支持布爾邏輯檢索;可以使用檢索語法;搜索引擎的查詢技巧

分析研究對象,選用搜索引擎

確定搜索途徑,使用不同方式

正確選用搜索引擎的搜索選項

正確選用搜索引擎的各項搜索功能

根據反饋,修改檢索

縮小搜索范圍:利用二次搜索(重新查詢、在結果中再查、在結果中去除)、使用檢索語法構造恰當的檢索表達式、選用正確的關鍵詞。擴大搜索范圍:使用同義詞或近義詞、使用檢索語法or和截詞檢索、使用多個搜索引擎和元搜索引擎如何提高查全率?選擇上位詞和相關詞;如:查找關于孫中山的文獻,先用孫中山查,再用孫文、國父查找。調節檢索式的網羅度,刪除不必要的組面,如and(并且);進行族性檢索(分類檢索或用or

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論