8本小組開題報告_第1頁
8本小組開題報告_第2頁
8本小組開題報告_第3頁
8本小組開題報告_第4頁
免費預覽已結束,剩余9頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

lucene學院 專業 學 學號 近年來我國電子商務發展迅猛不僅創造了新的消費需求, 了新的投資熱潮如今 類發展很迅猛,人們喜歡在網上購物lucene學院 專業 學 學號 近年來我國電子商務發展迅猛不僅創造了新的消費需求, 了新的投資熱潮如今 類發展很迅猛,人們喜歡在網上購物,可以足不出戶,瀏覽大量商品.而且電子商務正加速發展,成為經濟發展新的原動力。 品與文章評測 目前在市場上是一個空缺,效仿”今日頭條”,從網上抓取評測 的一個重要環節用戶在龐大的類目下,往往會束手無策,如何能讓用戶快速找到自己最想要的內容,這就是搜索引擎的目的與目標了.同時,如何能讓用戶高質量的找到自己所想要的文章與商品信息呢?這就需要一個優秀的搜索引擎了.比如用戶一個很簡單的需求,想要看某件商品的相關評測類文章和這個商品的網上較的價格,完整的,這樣他可以一邊去查看由真實的用戶寫的評測文章去更深入的了解這款商品,一邊去類 類與評測 的發展現 章,經 的處理,并使的基礎商 以優化,形成一個龐大的商品今日頭條:它誕生時狐、網 客戶端的用戶規模更是已經接近4000萬用戶,但是今日頭條卻從對手那里搶下了一塊不小的地盤.今日頭條擁有強大 引擎,隨著用戶的增長和用時增長,這 正愈發的精準.同今日頭條:它誕生時狐、網 客戶端的用戶規模更是已經接近4000萬用戶,但是今日頭條卻從對手那里搶下了一塊不小的地盤.今日頭條擁有強大 引擎,隨著用戶的增長和用時增長,這 正愈發的精準.同時,它也有強大的搜索功能,為用戶提供了良好的的的類三.項目與實習的關我在公司的內容,之前是對抓取到的文章進行轉碼處理,使用jsoup,分類等接口.做這些分類接口時候使用的是springbootjavawebsvnmaven三.項目與實習的關我在公司的內容,之前是對抓取到的文章進行轉碼處理,使用jsoup,分類等接口.做這些分類接口時候使用的是springbootjavawebsvnmavenlucene4.0svnmaven四.項目開發的內公司一個商品文章評測web。基本數據然后緩存本地,定時更新。redis五.項目的難點與特1.難點研(1)對項目架構基礎研究,java+servlethttpweb(2)五.項目的難點與特1.難點研(1)對項目架構基礎研究,java+servlethttpweb(2)redis,提(3)索引創建問題:Index(4)Luccene4.0用戶最想看到的信息,TokenStream,CharTermAttribute(6)svn,mavenlinux2.linux2.特色介結合海量的商品庫與文章庫精確內容匹配e數據的高速,緩存使用讓響應時間更快;redis要求的price信息.其他信息本地緩存起來.通過BackgroundUpdater,自定義的DaemonThread守護進程,定時更新數據.Lucene4.0)索引的選擇與創建,空間與時間消耗的衡量;索引創建時候Field,StringField等的選擇,Store.NO或Yes的選擇,用于處理是索引不.luceneComplexyzer搜索結果排序與,讓用戶更大概率的看到自己想要看到的內容.優化yzerQuery,如 類發展很迅猛,人們喜歡在網上購物,可以足不出戶,瀏覽大量商品.而且電,購物相 太多.所網單的需求,想要看某如 類發展很迅猛,人們喜歡在網上購物,可以足不出戶,瀏覽大量商品.而且電,購物相 太多.所網單的需求,想要看某件商品的相關評測類文章和這個商品的網上 的價格,完整 邊 上查看該商品的具體信息的今日頭條:它誕生時4000缺,效仿”今日頭條”,從網上抓取評測文章,經 的處理,并使那里搶下了一塊不小的地盤.今日頭條擁有強大 引擎,隨著用戶的增長和用時增長,這 正愈發的精準.同時,它也有強大的搜索功能,為用戶提供了良好的那里搶下了一塊不小的地盤.今日頭條擁有強大 引擎,隨著用戶的增長和用時增長,這 正愈發的精準.同時,它也有強大的搜索功能,為用戶提供了良好的的 的相似之. 數據后使用本地緩存,BackgroundUpdater(1) 更 數據(3)Index索引創建問題 的 Field,Store的選擇與使得想要搜索的內容,提高用戶體驗。使用 yzer加載本地分詞庫(5)搜索部分 yzerQuery的擴展與使用,獲取TokenStream,注入CharTermAttribute屬性,結果通過 e方法組合(6)使用 項目,并使用maven管理jar包,部署項目.項目部署在(7)java+servletweb(8)java.1(1)ContextServletcontextInitialized.priceredisGoods,Article,DatadataManager.init();ownManager,viewManager,commentManager,categoryManager,favoriteManager.BackgroundUpdater, 數據(8)java.1(1)ContextServletcontextInitialized.priceredisGoods,Article,DatadataManager.init();ownManager,viewManager,commentManager,categoryManager,favoriteManager.BackgroundUpdater, 數據article,goodsindex,index()Field四Query yzer,brands,s,series,catesyzeryzerdictyzeryzerTokenStream,Query yzer,brands,s,series,catesyzeryzerdictyzeryzerTokenStream,CharTermAttributeTokenStreameyzerQuery些cid2Score,(6)mavenjarLinux,redis緩存數,redis緩存數索引創建,分詞系統數據緩存系定時更新數據域索引Web搜索接口的提用返回搜素結發送請求數2.系統運行2.系統運行的軟硬件環 環境:java環境, (2)硬件環境:linux服務器3.系統的部(1)linuxhttpweb四.預期成標準,能穩 上實現高穩定性,高吞吐量。項目的完成同時需要做好監測,實五.主要參考文獻胡鵬飛, Lucene與中文分詞技術的研究及應用 Lucene,符滔滔 編著開發自己的搜索引擎:Lucene+Heritrix 清JavaWeb胡鵬飛, Lucene與中文分詞技術的研究及應用 Lucene,符滔滔 編著開發自己的搜索引擎:Lucene+Heritrix 清JavaWeb,張利國JavaWeb著Redis設計與實 JosiahL.Carlson著 Redis實 Ajax+Lucene編 搜索引擎技術實 Lucene&Java精華 ,Lucene搜索引擎開發進階實 ,沈家立Lucene分析與應 薛軍超等 網絡數據庫

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論