口碑權重計算應用舉例_第1頁
口碑權重計算應用舉例_第2頁
口碑權重計算應用舉例_第3頁
口碑權重計算應用舉例_第4頁
口碑權重計算應用舉例_第5頁
已閱讀5頁,還剩7頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

口碑情感分析

口碑權重計算應用舉例導語口碑權重計算應用舉例導語/01導語以“好大夫在線”為案例,做口碑權重計算應用。本案例需要計算口碑發布者的在線口碑文本記錄和決策用戶的咨詢文本記錄的相似性。由此相似性計算涉及的文本對象主要為短文本,本案例推薦采用基于詞的相似性的文本相似性計算方法。在計算短文本相似性時,逐對計算詞匯之間的相似性,并對相似性結果進行加權求和。

口碑權重計算應用舉例/02口碑權重計算應用舉例在基于詞匯的文本建模方法中,需要知道文檔中可能出現的每一個詞匯的向量表示。在分析用戶就醫需求背景時,一般主要關注和醫療主題相關的詞匯。這些詞匯在文本的分詞階段可以基于《醫療主題詞表》進行篩選。當前對中文語料來說,沒有標準的《醫療主題詞表》可供使用。本案例將基于搜狗輸入法的若干醫療主題詞庫作為基礎詞典,對其進行人工篩選構造??诒畽嘀赜嬎銘门e例對詞典中所有詞匯的向量化結果采用Java語言的Word2Vec模塊進行計算。Word2Vec模塊的核心為基于深度學習的詞嵌入語言模型,該語言模型為分布式的語言模型??诒畽嘀赜嬎銘门e例醫療主題詞向量的相似度表示如下頁表所示。在詞匯測試中,規定向量的維度為100。下表的相似項的反饋與實際情況比較一致,這間接地驗證了詞匯模型在結果上的準確性??诒畽嘀赜嬎銘门e例表:醫療主題詞向量的相似度表示???/p>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論