搜索引擎優(yōu)化信息檢索技術_第1頁
搜索引擎優(yōu)化信息檢索技術_第2頁
搜索引擎優(yōu)化信息檢索技術_第3頁
搜索引擎優(yōu)化信息檢索技術_第4頁
搜索引擎優(yōu)化信息檢索技術_第5頁
已閱讀5頁,還剩104頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

信息檢索技術、方法

及搜索引擎徐淑慧xushuhui@哈爾濱工程大學圖書館信息服務部82519545第一節(jié)::信息檢檢索技術術數字資源源的檢索索技術布爾邏輯檢索技術1截詞檢索技術2鄰近檢索技術3字段檢索技術4布爾邏輯輯檢索是是指通過過標準的的布爾邏邏輯關系系算符來來表達檢檢索詞與與檢索詞詞間的邏邏輯關系系的檢索索方法。。主要的布布爾邏輯輯關系詞詞有:邏邏輯與((AND)、邏邏輯或((OR))、邏輯輯非(NOT))1布爾邏輯輯檢索技技術邏輯與邏輯乘::“and””或“**”表示示組配方式式:A**B或者者AandB表表示示兩個概概念的交交叉和限限定關系系,只有有同時含含有這兩兩個概念念的記錄錄才算命命中信息息作用:增增加限制制條件,,即增加加檢索的的專指性性,以縮縮小提問問范圍,,減少文文獻輸出出量,提提高查準準率。邏輯或又稱邏輯輯和:“or””、“++”組配方式式:AORB或者者A+B,表示示檢索含含有A詞詞,或含含有B詞詞,或同同時包含含A、B兩詞的的文章。。作用:放放寬提問問范圍,,增加檢檢索結果果,起擴擴檢作用用,提高高查全率率。邏輯非又稱邏輯輯差:““not”““-”組配方式式:A--B,表表示檢索索出含有有A詞而而不含有有B詞詞的文章章。作用:邏邏輯非用用于排除除不希望望出現的的檢索詞詞,它和和“*””的作用用相似,,能夠縮縮小命中中文獻范范圍,增增強檢索索的準確確性。例如檢索索:“打打印機驅驅動程序序”查詢關鍵鍵詞:打打印機、、驅動程程序檢索表達達式:打打印機AND驅動程序序例如檢索索:“微微型計算算機”方方面的有有關信息息查詢關鍵鍵詞:微微型計算算機、微微機檢索表達達式:微型計算算機OR微機布爾邏輯輯檢索舉舉例布爾運算算符優(yōu)先先級比較較有括號時時:括號號內的先先執(zhí)行;;無括號時時:NOT>>AND>>OR例:檢索索“唐宋宋詩歌””的有關關信息。。關鍵詞::唐、宋宋、詩歌歌;檢索表達達式:(唐OR宋宋)AND詩歌;唐AND詩詩歌OR宋AND詩詩歌;錯誤表達達式:唐OR宋AND詩詩歌;唐AND宋宋AND詩歌;;唐OR宋OR詩歌歌;唐AND宋OR詩歌歌;布爾邏輯輯運算符符優(yōu)先級級請注意在不同的的數據庫庫中,所所使用的的邏輯符符號可能能是不同同的,有有的用““and、or、not”有有的用用“*、、+、--”。一些檢索索工具會會完全省省略任何何符號和和關系,,直接把把布爾邏邏輯關系系隱含在在菜單中中。一些網絡絡檢索工工具如搜搜索引擎擎甚至用用“︺、、,、--”(即即空格、、逗號、、減號))來表示示。主要應用用于西文文數字資資源的檢檢索定義:是是指在檢檢索式中中用專門門的符號號(截詞詞符號))表示檢檢索詞的的某一部部分允許許有一定定的詞形形變化。。作用:主主要是提提高查全全率截詞符一一般用““?”或或“*””表示2截詞詞檢索技技術截詞位置置按截詞位位置可分分為前截截詞、后后截詞、、前后截截詞和中中間截詞詞;按截斷字字符數的的不同,,可分為為有限截截斷和無無限截斷斷。右截詞,,又稱后后截詞、、前方一一致。允允許檢索索詞尾有有若干變變化。例例如comput*將將檢索出出computer、、computing、computerised、、computerized、computerization等結結果。中間截詞詞,又稱稱前后方方一致。。允許檢檢索詞中中間有若若干變化化。例如如wom*n,,檢索到到woman、、women的的結果。。英美的的不同拼拼法,defen*e可同時時檢出defence和defense的的結果。。左截詞,,又稱前前截詞、、后方一一致,允允許檢索索詞前有有若干變變化,例例如*physics就可檢檢索到physics、astrophysics、biophysics、chemophysics、geophysics等詞的的結果。。前后截詞詞:詞干干的前后后各有一一個截詞詞符,允允許檢索索詞的前前端和尾尾部各有有若干變變化形式式。如??computer??可檢索索computer、、computers、computerize、computerized、computerization、、minicomputer、minicomputers、、microcomputer、microcomputers等結結果。請注意意在不同的的數據庫庫和聯機機檢索系系統(tǒng)中,,所使用用的截詞詞符號沒沒有統(tǒng)一一的標準準,有的的用“??”,有有的用““*”,,有的用用“#””,用的的用“$$”等。。即便常用用的“??”和““*”在在不同的的數據庫庫中其用用法也是是不一定定相同的的。在允許截截詞的檢檢索工具具中,一一般是指指右截詞詞,部分分支持中中間截詞詞,左截截詞比較較少見。。我們將要要使用的的一些數數據庫,,一般用用“*””代表一一個字符符串,用用“?””代表任任意一個個字符。。鄰近檢索索又稱位置檢索索,主要是是通過檢檢索式中中的專門門符號來來規(guī)定檢檢索詞在在結果中中的相對對位置。。例如檢索索“生物物防治””的文獻獻,若用用檢索式式“biological**control”檢檢索,則則會將““抑制生生物”((controlbiological)的文文獻也查查出來,,這顯然然不是所所需文獻獻。主要有相相鄰位置置算符((W)、、(nW)、((N),,(nN),句句子位置置算符((S),,字段算算符(F)。3鄰近檢索索技術(W)算算符(W)是是with(word)的縮縮寫,表表示此算算符兩側側的檢索索詞必須須按此前前后順序序相鄰排排列,詞詞序不可可變,且且兩詞之之間不許許有其他他的詞或或字母,,但允許許有一空空格或標標點符號號。如biological((W)control相當當于檢索索biologicalcontrolCD((W)ROM相當于于檢索CDROM或或CD--ROM。(nW))算算符(nW))是nwords的的縮寫,,表示此此算符兩兩側的檢檢索詞之之間允許許插入最最多n個個詞,且且詞序不不可變。。如wear((1W))material相當于于檢索wearmaterials、wearofmaterials等。。(N)算符(N)是是near的縮縮寫,表表示此算算符兩側側的檢索索詞必須須緊密相相連,詞詞序可變,詞間不不允許插插入其他他詞或字字母,但但允許有有一空格格或標點點符號。。information(N)retrieval可檢出::informationretrievalretrievalinformation(nN)算符(nN))表示兩兩詞間可可插入最最多n個個詞,詞詞序可變變。如檢索式式environment((2N)protection就可可檢索出出包含““environmentprotection”、、“environmentoftheprotection”、、“environmentofwaterprotection””、“protectionofforestenvironment”(S)、(F)算符(S)是sentence的縮寫,,表示兩兩個檢索索詞須同同時出現現在文獻獻記錄的的同一子子字段中中,兩詞詞的詞序序不限,,兩詞間間插入詞詞的數量量不限。。

(F)算算符:在聯機檢索索中還有對對同字段段進行檢檢索的((F)算算符。((F)表表示此算算符兩側側的檢索索詞必須須同時出出現在信信息記錄錄的同一一個字段段內,兩兩詞的詞詞序不限限,兩詞詞間插入入詞的數數量不限限。用此此算符時時須指定定所要查查找的字字段,如如題名字字段、文文摘字段段、敘詞詞字段等等。例如如digital((F)computer//TI表表示在題題名字段段(TI)中同同時出現現這兩個個檢索詞詞的才算算命中信信息。字段檢索索是限定定檢索詞詞在記錄錄中出現現的字段段范圍,,檢索時時,計算算機只對對限定字字段進行行查找。。3字段檢索索技術TI(題題名)、、AB((摘要))、DE(主題題詞)、、ID((標識詞詞)、SU(主主題詞))、KW(關鍵鍵詞)AU(著著者)、、BN((國際標標準書號號)、SN(國國際標準準刊號))、CC(分類類類目))、CS(機構構)、DT(文文獻類型型)或PT(出出版物類類型)、、JN((刊名))或JA(刊號號)、LA(語語種)、、PY((出版年年)、SO(來來源出版版物)注意:不同的數數據庫其其字段代代碼可能能不同。數據庫中中的字段段包括舉例在EBSCO數數據庫檢檢索中,,某一用用戶需檢檢索有關關“數字字圖書館館與信息息檢索、、參考咨咨詢”方方面的文文獻信息息,檢索索要求::題名或或文摘中中包含數數字圖書書館digitallibrary,數數字圖書書館要求求考慮單單復數,,主題為為信息檢檢索informationretrieval或參參考咨詢詢reference,請編編制其檢檢索策略略(檢索索式)。。(ti::digitallibrar**orab:digitallibrar*)andsu:((referenceorinformationn2retrieval)第二節(jié)::信息檢檢索方法法信息需求求分析選擇信息息資源選定檢索索詞構造檢索索表達式式確定檢索索途徑對檢索策策略進行行調整實施并輸輸出檢索索結果1信息需求求分析分析信息息檢索目目的,制制定檢索索目標。。分析所需需信息涉涉及的學學科,確確定檢索索的學科科范圍。。分析所需需信息的的類型、、年代,,確定檢檢索的信信息類型型和年代代范圍。。2選擇信息息資源((數據庫庫的選擇擇)數據庫的的類型學科范圍圍時間范圍圍3選定檢索索詞分析主題題,找出出課題所所包含的的顯性概概念和隱隱含概念念。找出核心心概念,,排除無無關概念念和重復復概念。。從待檢數數據庫和和檢索工工具的詞詞表中選選取規(guī)范范化的詞詞或詞組組。選用上位位詞、近近義詞或或下位詞詞作為檢檢索詞。。4構造檢索索表達式式分析檢索索提問式式是數字字資源檢檢索中用用來表達達用戶檢檢索提問問的邏輯輯表達式式。找出在編編制檢索索提問式式時,準準確、合合理地運運用位置置邏輯算算符、截截詞符、、字段符符等技術術是編制制檢索式式的基本本要求。。5確定檢索索途徑第一類是是表示主主題概念念的檢索索詞----主題題詞,包包括標題題詞、單單元詞、、敘詞、、關鍵詞詞。第二類是是表示學學科分類類的檢索索詞,如如分類號號。第三類是是表示作作者的檢檢索詞,,如作者者姓名、、機構名名稱等。。第四類是是表示特特殊意義義的檢索索詞,如如專利號號、國際際標準書書號、分分子式等等舉例一個研究究生在做做論文題題:“數數字圖書書館中的的元數據據體系與與互操作作研究””,這是是一個計計算機科科學、信信息科學學方面的的課題,,請你幫幫助他在在維普數數據庫中中找到最最新的參參考文獻獻。第三節(jié)::搜索引引擎SearchEngine搜索引擎擎的概念念和作用用搜索引擎擎的工作作原理搜索引擎擎的分類類搜索引擎擎的一般般檢索技技術搜索引擎擎利用技技巧主要搜索索引擎目錄搜索引擎擎是一個個用來搜搜索世界界各地Internet網絡絡資源的的WEB服務器器。它像像一本書書的目錄錄,Internet各個站站點的網網址就像像是頁碼碼,可以以通過關關鍵詞或或主題分分類的方方式來查查找感興興趣的信信息所在在的WEB頁面面。搜索引擎擎提供的的導航服服務(搜搜索引擎擎就是網網絡的指指南針))已經成成為互聯聯網上非非常重要要的網絡絡服務,,成為和和電子郵郵件并列列的最重重要的互互聯網應應用。搜索引擎擎的概念念和作用用(1)信息搜搜集(2)信息索索引(3)信息查查詢(4)檢索結結果的相相關性處處理搜索引擎擎的工作作原理(1)信信息搜集集

各個搜索索引擎都都派出綽綽號為蜘蜘蛛(Spider))或機器器人(Robots))的“網網頁搜索索軟件””,在互互聯網中中漫游,,發(fā)現和和搜集信信息。

訪問網絡絡中公開開區(qū)域的的每一個個站點并并記錄其其網址,,將它們們帶回搜搜索引擎擎,要盡盡可能多多、盡可可能快地地搜集各各種類型型的新信信息。因為互聯聯網上的的信息更更新很快快,所以以還要定定期更新新已經搜搜集過的的舊信息息,以避避免死鏈鏈接和無無效鏈接接。(2)信信息索引引

將“網頁頁搜索軟軟件”帶帶回的信信息進行行分類整整理,建建立搜索索引擎數數據庫,,并定時時更新數數據庫內內容。有的搜索索引擎把把“網頁頁搜索軟軟件”發(fā)發(fā)往每一一個站點點,記錄錄下每一一頁的所所有文本本內容,,并收入入到數據據庫中從從而形成成全文搜索索引擎;而另一一些搜索索引擎只只記錄網網頁的地地址、篇篇名、特特點的段段落和重重要的詞詞。(3)信信息查詢詢

根據用戶戶的查詢詢需求在在索引庫庫中快速速檢出相相關網頁頁,并反反饋檢索索結果。。一般包括括分類目目錄及關關鍵詞兩兩種信息息查詢方方式。(4)檢索結果果排序

概率法是根據關關鍵詞在在文中出出現的頻頻率來判判定的,,出現的的次數越越多,認認定其與與查詢的的相關程程度越高高;位置法是根據關關鍵詞在在文中出出現的位位置來判判定,位位置越靠靠前,文文件的相相關程度度越高;;分類或聚聚類方法法是指搜索索引擎采采用分類類或聚類類技術,,自動把把查詢結結果歸入入到不同同的類別別中。(1)關鍵詞詞搜索引引擎(2)主題分分類搜索索引擎(3)綜合搜搜索引擎擎搜索引擎擎的分類類(1)關關鍵詞搜搜索引擎擎

界面提供供輸入框框,用戶戶通過輸輸入框提提交查詢詢請求((關鍵詞詞),搜搜索引擎擎將檢索索結果反反饋給用用戶。適用于查查找目的的明確,,并具備備一定檢檢索知識識的用戶戶。(2)主主題分類類搜索引引擎

依據某種種分類方方式(如如學科分分類),,建立主主題樹狀狀層瀏覽覽體系;;搜索程程序搜索索來的信信息被標標引后放放入瀏覽覽體系的的個大類類或子類類下面,,呈現錯錯落有致致的上下下位關系系。查準率高高,但查查全率低低。(3)綜綜合搜索索引擎

此類搜索索引擎既既可以搜搜索網站站也可搜搜索全文文,用戶戶輸入關關鍵詞后后,可以以選擇是是搜索網網站還是是網頁,,不同的的選擇返返回不同同的結果果,國內內的搜狐狐(Sohu))就是此此類搜索索引擎查全率高高,但查查準率低低。主要搜索索引擎李彥宏徐勇百度,2000年1月月創(chuàng)立于于北京中中關村,,是全球球最大的的中文搜搜索引擎擎。2000年1月月1日,,公司創(chuàng)創(chuàng)始人李李彥宏、、徐勇攜攜120萬美元元風險投投資,從從美國硅硅谷回國國,創(chuàng)建建了百度度公司。。2000年5月月,百度度首次為為門戶網網站———硅谷動動力提供供搜索技技術服務務,之后后迅速占占領中國國搜索引引擎市場場,成為為最主要要的搜索索技術提提供商。。2001年8月月,發(fā)布布B搜索引引擎Beta版版,從后后臺服務務轉向獨獨立提供供搜索服服務,并并且在中中國首創(chuàng)創(chuàng)了競價價排名商商業(yè)模式式,2001年年10月月22日日正式發(fā)發(fā)布Baidu搜索引引擎。2005年8月月5日,,百度在在美國納納斯達克克上市。。概況“百度””二字取取自辛棄棄疾的《《青玉案案》““眾里尋尋她千百百度”。。現在百度度已成為為世界上上最大的的中文搜搜索引擎擎,用戶戶能夠訪訪問超過過10億億的中文文網頁..特點網頁搜索索功能百度快照照相關搜索索拼音提示示錯別字提提示英漢互譯譯詞典計算器和和度量衡衡轉換專業(yè)文檔檔搜索股票、列列車時刻刻表和飛飛機航班班查詢高級搜索索語法高級搜索索、地區(qū)區(qū)搜索和和個性設設置天氣查詢詢百度快照照每個被收收錄的網網頁,在在百度上上都存有有一個純純文本的的備份,,稱為““百度快快照”。。百度速速度較快快,您可可以通過過“快照照”快速速瀏覽頁頁面內容容。如果無法法打開某某個搜索索結果,,或者打打開速度度特別慢慢,““百度快快照”能能幫您解解決問題題。相關搜索索搜索結果果不佳,,有時候候是因為為選擇的的查詢詞詞不是很很妥當。。您可以通通過參考考別人是是怎么搜搜的,來來獲得一一些啟發(fā)發(fā)。百度度的“相相關搜索索”,就就是和您您的搜索索很相似似的一系系列查詢詢詞。百百度相關關搜索排排布在搜搜索結果果頁的下下方,按按搜索熱熱門度排排序。專業(yè)文檔檔搜索很多有價價值的資資料,在在互聯網網上并非非以普通通的網頁頁形式出出現,而而是以Word、PowerPoint、、PDF等文檔檔格式存存在。百度支持持對Office文檔檔(包括括Word、Excel、PowerPoint)、AdobePDF文文檔、RTF文文檔的全全文搜索索。方法為在在搜索的的關鍵詞詞后面加加一個““filetype::”文檔檔類型限限定。““filetype::”后可可以跟以以下文件件格式::DOC、XLS、PPT、、PDF、RTF、ALL。。其中,,ALL包含所所有文件件類型。。高級搜索索把搜索范范圍限定定在網頁頁標題中中——intitle標題通常常是對網網頁內容容提綱挈挈領式的的歸納。。把查詢詢內容范范圍限定定在網頁頁標題中中,有時時能獲得得良好的的效果。。高級搜索索把搜索范范圍限定定在特定定站點中中——site有時候,,您如果果知道某某個站點點中有自自己需要要找的東東西,就就可以把把搜索范范圍限定定在這個個站點中中,提高高查詢效效率。使使用的方方式,是是在查詢詢內容的的后面,,加上““site:站站點域名名”。高級搜索索把搜索范范圍限定定在url鏈接接中———inurl網頁url中的的某些信信息,常常常有某某種有價價值的含含義。于于是,您您如果對對搜索結結果的url做做某種限限定,就就可以獲獲得良好好的效果果。實現現的方式式,是用用“inurl:”,,后跟需需要在url中中出現的的關鍵詞詞高級搜索索精確匹配配——雙雙引號和和書名號號如果輸入入的查詢詢詞很長長,百度度給出的的搜索結結果中的的查詢詞詞可能是是拆分的的。如果果給查詢詢詞加上上雙引號號,就可可以精確確檢索。。被書名號號擴起來來的內容容,也不不會被拆拆分,,比如,,查電影影“手機”,如果果不加書書名號,,很多情情況下出出來的是是通訊工工具———手機,,而加上上書名號號后,《手機》》結果就都都是關于于電影方方面的了了。高級搜索索要求搜索索結果中中不含特特定查詢詢詞———減號號-如果您發(fā)發(fā)現搜索索結果中中,有某某一類網網頁是您您不希望望看見的的,那么么用減號號語法,,就可以以去除所所有這些些含有特特定關鍵鍵詞的網網頁。注意,前前一個關關鍵詞,,和減號號之間必必須有空空格,否否則,減減號會被被當成連連字符處處理,而而失去減減號語法法功能。。SergeyBrinLarryPageGoogle搜搜索引擎擎誕生于于斯坦福福大學的的一個學學生宿舍舍里,然然后迅速速傳播到到全球的的信息搜搜索者。。Google目目前被被公認為為萬維網網上最大大的搜索索引擎,,它提供供了簡單單易用的的免費服服務,使使用戶能能夠訪問問一個包包含超過過80億個個網址的的索引。。“Google”來自自于數學學名詞““Googol”,Googol表示一一個1后面面跟著100個零零。這一一術語體體現了公公司整合合網上海海量信息息的遠大大目標。。概況Google技技術Google使使用一一組獨特特的高級級硬件和和軟件,,核心軟軟件稱為為PageRank(TM)。

作為組織織管理工工具,網網頁級別別利用了了互聯網網獨特的的民主特性性及其巨大大的鏈接結構構。從網頁頁A鏈鏈接到到網頁B時時,Google就就認為““網頁A投投了網頁頁B一一票””。Google根根據網頁頁的得票票數評定定其重要要性。除除了考慮慮網頁得得票數((即鏈接接)的純純數量之之外,Google還還要分分析投票票的網頁頁,“重重要”的的網頁所所投出的的票就會會有更高高的權重重。與大多數數其它搜搜索引擎擎的區(qū)別別在于::Google只顯顯示相關關的網頁頁,其正正文或指指向它的的鏈接包包含您所所輸入的的所有關鍵鍵詞,而無須須再受其其它無關關結果的的煩擾。。Google的的特殊功能能Flash文件件查找Flash文件,,只需搜搜索“關關鍵詞filetype::swf”。Google已已經可以以支持13種非非HTML文件件的搜索索。除了了PDF文檔,,Google現在還還可以搜搜索MicrosoftOffice((doc,ppt,xls,,rtf)、、ShockwaveFlash((swf)、PostScript(ps)和和其它類類型文檔檔。新的的文檔類類型只要要與用戶戶的搜索索相關,,就會自自動顯示示在搜索索結果中中。點擊選中中的鏈接接手氣不錯錯錯別字改改正Google的的錯別別字改正正軟件系系統(tǒng)會對對輸入的的關鍵詞詞進行自自動掃描描,檢檢查有沒沒有錯別別字。如如果發(fā)現現用其他他字詞搜搜索可能能會有更更好的結結果,它它能提供供相應提提示來幫幫助糾正正可能有有的錯別別字。例如,搜搜索“互互連網””,Google會會自動提提示““您是不不是要找找:互聯聯網”。。如果您您點擊““互聯聯網”,,Google將以以“互聯聯網”作作為關鍵鍵詞進行行搜索。。手機號碼碼用Google查詢詢手機電電話號碼碼歸屬地地,您只只需直接接輸入要要查的號號碼即可可(不需需要任何何關鍵詞詞)。Google能能自動動識別以以13開開頭的11位數數字為手手機號碼碼而返回回相關的的網站鏈鏈接,讓讓您即刻刻便知道道答案。。定義要查看字字詞或詞詞組的定定義,只只需鍵入入“define”,,接著鍵鍵入一個個空格,,然后鍵鍵入您需需要其定定義的詞詞。如果Google在在網絡絡上找到到了該字字詞或詞詞組的定定義,則則會檢索索該信息息并在搜搜索結果果的頂部部顯示它它們。Yahoo!是是在網上上最早出出現的檢檢索工具具,一直直是一種種功能較較強的搜搜索引擎擎。Yahoo!屬屬于目錄錄索引類類搜索引引擎,可可以通過過兩種方方式在上上面查找找信息,,一是通通常的關關鍵詞搜搜索,一一是按分分類目錄錄逐層查查找。以以關鍵詞詞搜索時時,網站站排列基基于分類類目錄及及網站信信息與關關鍵字串串的相關關程度。。包含關關鍵詞的的目錄及及該目錄錄下的匹匹配網站站排在最最前面。。以目錄錄檢索時時,網站站排列則則按字母母順序。。Yahoo于于2004年2月推出出了自己己的全文文搜索引引擎,并并將默認認搜索設設置為網網頁搜索索。2005年11月9日日阿里里巴巴公公司在完完成對雅雅虎中國國的收購購與整合合之后,,重新發(fā)發(fā)布了進進入中國國市場7年之久久的雅虎虎網站,,未來來雅虎在在中國的的業(yè)務重重點方向向將全面面轉向搜搜索領域域,這也也是自8月11日阿里里巴巴宣宣布收購購雅虎中中國時就就從沒改改變的方方向。阿阿里巴巴巴CEO馬云表表示:阿阿里巴巴巴在搜搜索領域域既有決決心更有有信心,,在中國國,雅虎虎就是搜搜索,搜搜索就是是雅虎。。中國搜索索(原慧聰聰搜索))是國內內領先的的搜索引引擎公司司。自2002年正式式進入中中文搜索索引擎市市場以來來,中國國搜索((原慧聰聰搜索))取得了了一系列列令人矚矚目的成成績。在在一年多多的時間間里,發(fā)發(fā)展成為為全球領領先的中中文搜索索引擎公公司,先先后為新新浪、搜搜狐、網網易、TOM等等知名門門戶網站站以及中中國搜索索聯盟上上千家各各地區(qū)、、各行業(yè)業(yè)的優(yōu)秀秀中文網網站提供搜索索引擎技技術。目前,,每天有有數千萬萬次的中中文搜索索請求是是通過中中國搜索索實現的的,中國國搜索也也被公認認為第三代智智能搜索索引擎的的代表。搜狗是搜搜狐公司司于2004年年8月3日推出出的完全全自主技技術開發(fā)發(fā)的全球球首個第第三代互互動式中中文搜索索引擎,,是一個個具有獨獨立域名名的專業(yè)業(yè)搜索網網站---“搜狗狗”()。以以一種人人工智能能的新算算法,分分析和理理解用戶戶可能的的查詢意意圖,給給予多個個主題的的“搜索索提示””,在用用戶查詢詢和搜索索引擎返返回結果果的人機機交互過過程中,,引導用用戶更快快速準確確定位自自己所關關注的內內容,幫幫助用戶戶快速找找到相關關搜索結結果,并并可在用用戶搜索索沖浪時時,給與與用戶未未曾意識識到的主主題提示示。“愛問””搜索引引擎產品品由全球球最大的的中文網網絡門戶戶新浪匯匯集技術術精英、、耗時時一年多多完全自自主研發(fā)發(fā)完成,,為首款款中文智智慧型互互動搜索索引擎,,新浪

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論