




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、獲取網(wǎng)絡(luò)信息的策略與技巧獲取網(wǎng)絡(luò)信息的策略與技巧 1.網(wǎng)絡(luò)信息檢索的方法網(wǎng)絡(luò)信息檢索的方法什么是搜索引擎?什么是搜索引擎?l搜索引擎搜索引擎(search engine)是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序搜集互聯(lián)網(wǎng)上的信息,在對信息進(jìn)行組織和處理后,并將處理后的信息顯示給用戶,是為用戶提供檢索服務(wù)的系統(tǒng)。l搜索引擎工作原理:搜索引擎工作原理:l1、抓取網(wǎng)頁(Spider程序順著網(wǎng)頁中的超鏈接,連續(xù)地抓取網(wǎng)頁,被抓取的網(wǎng)頁被稱之為網(wǎng)頁快照。)l2、處理網(wǎng)頁(對抓取的網(wǎng)頁提取關(guān)鍵詞,建立索引文件,去除重復(fù)網(wǎng)頁、分詞(中文)、判斷網(wǎng)頁類型、分析超鏈接等處理工作。) l3、提供檢索服務(wù)l搜索引擎
2、的分類搜索引擎的分類: l1、全文索引(如谷歌,百度)l按關(guān)鍵詞檢索。全文搜索引擎將不斷收集到的網(wǎng)上網(wǎng)頁及網(wǎng)址信息以數(shù)據(jù)庫的形式組織存貯。查詢時用戶向其提問框中輸入關(guān)鍵詞,搜索引擎便會從數(shù)據(jù)庫中檢索與之向匹配的相關(guān)記錄,按一定的排列順序返回給用戶。 l2、目錄索引(如雅虎,新浪)l按目錄檢索。目錄式搜索引擎不斷收集網(wǎng)上信息并進(jìn)行整理,以分類目錄的形式鏈接起來,供用戶檢索。用戶通過逐級層層點(diǎn)擊瀏覽這些類目尋找自己所需的信息。l3、元搜索引擎l元搜索引擎(META Search Engine)一般都沒有自己網(wǎng)絡(luò)機(jī)器人及數(shù)據(jù)庫,它們的搜索結(jié)果是通過調(diào)用、控制和優(yōu)化其它多個獨(dú)立搜索引擎的搜索結(jié)果并以統(tǒng)
3、一的格式在同一界面集中顯示。例如:百度狗(http:/ ) l4、垂直搜索引擎 (例如:機(jī)票搜索、旅游搜索等) 常用搜索引擎常用搜索引擎l(1)Google簡體中文http:/.hk/l(2)百度 http:/ l(3)雅虎搜索 http:/ http:/ l(5)搜狗搜索 http:/ l(6)SOSO搜搜 http:/ 一些搜索語法技巧參考:l1、對搜索的網(wǎng)站進(jìn)行限制、對搜索的網(wǎng)站進(jìn)行限制 “site”表示搜索結(jié)果局限于某個具體網(wǎng)站或者網(wǎng)站頻道,如“”、“”,或者是某個域名,如“”、“com”等等。如果是要排除某網(wǎng)站或者域名范圍內(nèi)的頁面,只需用“-網(wǎng)站/域名”。 示例:搜索中文教育科研網(wǎng)站
4、()上關(guān)于搜索引擎技巧的頁面。 搜索:“搜索引擎 技巧 site:” 示例:搜索新浪科技頻道中關(guān)于搜索引擎技巧的信息。 搜索:“搜索引擎 技巧 site:” 注意:site后的冒號為英文字符,而且,冒號后不能有空格,否則,“site:”將被作為一個搜索的關(guān)鍵字。此外,網(wǎng)站域名不能有“http:/”前綴,也不能有任何“/”的目錄后綴;網(wǎng)站頻道則只局限于“頻道名.域名”方式,而不能是“域名/頻道名”方式。 l2、在某一類文件中查找信息、在某一類文件中查找信息l “filetype:”是Google開發(fā)的非常強(qiáng)大實(shí)用的一個搜索語法。也就是說,Google不僅能搜索一般的文字頁面,還能對某些二進(jìn)制文檔
5、進(jìn)行檢索。目前,Google已經(jīng)能檢索微軟的Office文檔如.xls,.ppt,.doc,.rtf,Adobe的.pdf文檔,ShockWave的.swf文檔(Flash動畫)等。示例:搜索關(guān)于計(jì)算機(jī)原理的Office文檔。 搜索:“計(jì)算機(jī)原理 filetype:doc OR filetype:ppt” 或是“filetype:doc 計(jì)算機(jī)原理”l3、搜索的關(guān)鍵字包含在、搜索的關(guān)鍵字包含在URL鏈接中鏈接中 l“inurl”語法返回的網(wǎng)頁鏈接中包含第一個關(guān)鍵字,后面的關(guān)鍵字則出現(xiàn)在鏈接中或者網(wǎng)頁文檔中。有很多網(wǎng)站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網(wǎng)頁名稱中,比如“MP3”、“GALLARY”等,于是,就可以用INURL語法找到這些相關(guān)資源鏈接,然后,用第二個關(guān)鍵詞確定是否有某項(xiàng)具體資料。INURL語法和基本搜索語法的最大區(qū)別在于,前者通常能提供非常精確的專題資料。 示例:查找MIDI曲“滄海一聲笑”。 搜索:“inurl:midi “滄海一聲笑” 注意:“inurl:”后面不能有空格,Google也不對URL符號如“/”進(jìn)行搜索。l4、搜索的關(guān)鍵字包含在網(wǎng)頁標(biāo)題中、搜索的關(guān)鍵字包含在網(wǎng)頁標(biāo)題中 “intitle”和“allintitle”的用法類似于上面的inurl和allinurl,只是后者對URL進(jìn)行查詢,而前者對網(wǎng)頁的標(biāo)題欄進(jìn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 稅務(wù)部門合同管理制度
- 居樂苑早教管理制度
- 租賃施工設(shè)備管理制度
- dsa科室管理制度
- 網(wǎng)絡(luò)銷售配送管理制度
- 舞蹈培訓(xùn)上課管理制度
- 藥廠設(shè)備潤滑管理制度
- 礦山開采人員管理制度
- 社區(qū)消防樓道管理制度
- 電廠環(huán)境監(jiān)測管理制度
- 社工社會考試試題及答案
- 跨文化交際知識體系及其前沿動態(tài)
- 2025浙江中考:歷史必背知識點(diǎn)
- 衛(wèi)星遙感圖像傳輸質(zhì)量評估-全面剖析
- 2025-2030中國跨境支付行業(yè)市場發(fā)展現(xiàn)狀及競爭格局與投資前景研究報告
- 2025年果品購銷合同簡易模板
- 胰島素皮下注射團(tuán)體標(biāo)準(zhǔn)解讀 2
- 《眼科手術(shù)新技術(shù)》課件
- 《SLT631-2025水利水電工程單元工程施工質(zhì)量驗(yàn)收標(biāo)準(zhǔn)》知識培訓(xùn)
- 2025氮?dú)狻鍤夤?yīng)合同
- 2024年貴州省普通高校招生信息表(普通類本科提前批C段-物理組合)
評論
0/150
提交評論