基于知識的搜索與推薦技術_第1頁
基于知識的搜索與推薦技術_第2頁
基于知識的搜索與推薦技術_第3頁
基于知識的搜索與推薦技術_第4頁
基于知識的搜索與推薦技術_第5頁
已閱讀5頁,還剩26頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于知識的搜索與推薦技術背景知識理解技術需求理解技術資涌理解技術用戶理解技術知識化搜索與推薦應用案例搜索:智能問答推薦:興趣點推薦目 錄背景- AI 時代用戶對信息獲取的新需求更加口語化的需求表達更直觀的結果背景- AI 時代用戶對信息獲取的新需求人找信息 信息找人統一結果 干人干面背景 知識是智能化搜索與推薦的重要依賴人 物女演 員演 員名 人用戶-解資涌-解需求-解知識圖譜背景 什么p知識圖譜知識圖譜7K-o3ledge G0aph)p一ar向圖,圖中M括節點、屬性及語義關系等要素節點包括:實例7e-1i1y):客觀世y存在的對象,如“李彥宏7百度公司K始人)”概d7co-cep1):如“

2、科h”、“文化”、“vg”等事件7e2e-1):如“九一H事變”、“馬航MH370事件”主題71opic):如“科h咨詢”、“o座文化”、“no街i”等屬性、關系:如下圖所示中文名 l間道導演 劉偉強、麥G輝國家 中國類型 劇e、犯罪、警匪主演 劉c華、t朝偉制片地區 香w上映時間 2002年12月20日屬性關系知識圖譜具-豐富的實體、概念、屬性、關系等信息,使基于知識的理解、解釋、推理成為可能基于知識圖譜的理解技術即建立從數據到知識圖譜中實體、概念、關系、屬性的映射,基于這層映 射機器直接可計算、推理背景 基于知識圖譜的理解技術認知需要知識Query= 大頭皮鞋作者搜索Query= 想喝點,

3、哪有青島賣對話背景知識理解技術需求理解技術資涌理解技術用戶理解技術知識化搜索與推薦應用案例搜索:智能問答推薦:興趣點推薦目 錄知識理解技術 需求理解目標:將用戶Query映射至知識圖Q子圖(subgraph),-不同層次對文本語義進行刻畫。主要內容實體標注:實體與知識軍鏈接概念化:實體的概念泛化知識理解技術 需求理解:問題與挑戰概念化開放域,且對知識數據強依賴概念數據稀疏問題短文本信息不豐富實體標注基千知識庫的Kn&wledge Embedding基千上下文的語義預E概念泛化知識特征網K構建基千自啟動隨機游走概念預E的泛化模型核心創新核心創新實體標注上下文信息不豐富(平110字符),語義建模

4、要求高多歧義問題-?。醒?楊洋、女楊洋)口語化開放域標注知識理解技術 需求理解:實體層技術框架知識理解技術 需求理解:基于知識圖譜的knowledge embedding不足無監督對實體文本語義、關系語義無法綜合刻畫訓練效率低創新有監督,大規模樣本自動構建同時刻畫實體文本語義、關系語義實體獨立訓練,簡便高效針對性優化文本與實體的相-度量場景傳 統 方 案本 文 方 案知識理解技術 需求理解-基于知識庫的knowledge embedding結合知識庫數據、Querylog共現挖掘,生成海量樣本,有監督訓練每個實體獨立訓練迭代,針對場景優化同時刻畫知識文本語義、結構語義,解決多義實體的歧義 刻

5、畫問題知識理解技術 需求理解:基于上下文的語義預測利用知識庫挖掘關鍵信號詞,自動構建信號詞,實體類型訓練集Querylog中Bootstrapping語境搭配樣本挖掘利用NN技術更好對短上下文現,通過iSA關系(-(Cl,C2), 變Q成Cl-C2現詞匯網絡:全網Query日志詞性,依存分布,統計(信號詞-e)語義網絡:embedding對文本語義向量化,對實體向量化知識理解技術 需求理解:基千自啟動隨機游走概念預測的泛化模型基千短文本上下文語義預測,根據實體上下文預測&概念類型,解決實體概念數據稀疏問題基千知識特征網絡初始化游走模型基千自啟動的隨機游走模型,綜合利用節點多類關系, 解決短文本

6、場景下的最優子-搜索問題知識理解技術 資源理解:文本分類對資源(-:網頁、文本段落等)進D語義知識角度的分析,從不同維度對篇章語義信息進D刻畫M基于DSSM網絡的層次化文本分類知識理解技術- 資源理解:核心實體識別m)nt,on識別C征構建Xg(oo2t分E實體標注C征建設:T)xt-1an-Ent,t5-t)xt-1an-Oth)12 。5戛夭戛克 立2加拿 大Text-rank 示意圖Co2(ml,m2)爸爸爸爸去去 mmLL知識理解技術用戶理解:興趣表示體系目標:完成用戶到表示體系的關聯計算,研發基千知識圖譜的用戶理解技術,利用subgraph來表示用戶基千用戶行為的統計歸納提權清況舉-

7、:主動搜索,推薦后h點擊 等降權清況舉-:推薦后短無點擊,熱點文章新動作權重增大,老動作權重衰減click, weight=!#$_()#(*_ display,weight=!#$_+#,_content model,weight=!#$_-.(_!#$%&!%$, ()%*= -./12345 7%.8*:;52 7%.8*=3 .!A-)B12345 7%.8:;52 7%.8*C3DE=;F 11知識理解技術 用戶理解:興趣表示體系概念關注點體音足球籃球賽車田徑足球球隊足球明星足球賽事阿森納博格巴桑切斯厄齊爾西甲英超曼聯領域實體轉會受傷助攻實體關注點曼城曼徹斯特德比足球明星 轉會足球明

8、星 助攻概念背景知識理解技術需求理解技術資涌理解技術用戶理解技術知識化搜索與推薦應用案例搜索:智能問答推薦:興趣點推薦知識化搜索與推薦應用案例 基于圖檢索結構的精準問答Q = 周杰倫的妻子S-epl:Quer/實4標注 S-ep2: 候選知識拉取:S-ep3:Query/ SP 同義匹配計算S-ep4 : 輸出 top1 答案 or NIL周杰倫(Oldn2_yp0:妻子 1 昆8熱度lO母4 1 :惠美熱度8女兒 1 Hathaway熱度4兒子 1 Romeo熱度2父4 1 周耀中熱度lRRRR知識圖譜周杰倫(Oldn2_yp0周杰倫H妻子匹配PL實4標注子=拉:昆8NIL決策昆 8知識化搜

9、索與推薦應用案例 基于圖檢索結構的精準問答知識化搜索與推薦應用案例 基于para動態計算的答案提取電影 片尾曲 音樂作品知識化搜索與推薦應用案例 基于動態函數與規則推理的答案滿足用戶行為知識圖譜資諒數據基礎 數據概念識別結構化韶析通用挖掘關聯計笢質量控制消歧歸特征計笢表示 體系概念泛化關聯消歧關鍵詞匹配來諒識別實體標注權值計笢知識 認知垃圾過濾候選召回基礎排序重復控制召回 排序權值計笢用戶模型更新用戶 建模知識化搜索與推薦應用案例 基千興趣的資源推薦對比千協同算法,很好的解決了冷啟-的問題可以滿足更多的產品對資源分類的需 求,如頻道頁等支持更加人性化、智能化的推薦策 略,如場景化推薦可以更好的刻畫用戶的興趣,為用戶 提供更加豐富的服務推薦喜歡瑯哪榜知識化搜索與推薦應用案例 基于知識體系的興趣探索制作商:山東0視3述性標簽:優質古裝劇主演:胡歌獲-:第

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論