




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
淺談知識圖譜摘要:隨著人工智能技術(shù)的發(fā)展,知識圖譜作為大數(shù)據(jù)時(shí)代的知識工程的產(chǎn)物,是實(shí)現(xiàn)人工智能的基礎(chǔ)。它具有強(qiáng)大的語義表達(dá)能力、存儲能力以及推理能力,其關(guān)鍵技術(shù)得到國內(nèi)外研究學(xué)者的廣泛關(guān)注。本文從知識圖譜的概念出發(fā),分析其理論架構(gòu),以及對其關(guān)鍵技術(shù)進(jìn)行相關(guān)概述。引言隨著人工智能的發(fā)展和應(yīng)用,知識圖譜逐漸成為關(guān)鍵技術(shù)之一。知識圖譜以其強(qiáng)大的語義處理能力和開放組織能力,為人工智能的智能化奠定了基礎(chǔ),廣泛應(yīng)用于智能搜索、智能問答、個(gè)性化推薦、推理等領(lǐng)域。知識圖譜的概念知識圖譜的提出是為了提高搜索引擎的效率。是實(shí)體之間關(guān)系的語義網(wǎng)絡(luò),可以將實(shí)體對象和他們之間的關(guān)系進(jìn)行圖形化的表達(dá),知識圖譜的表示形式是三抽取其中的概念、實(shí)體和關(guān)系,是事物關(guān)系的可計(jì)算模型。知識圖譜按照知識的覆蓋范圍和不同的領(lǐng)域,整體可以劃分為通用性知識圖譜和領(lǐng)域性知識圖譜]隨著科技的不斷發(fā)展,知識圖譜在自然語言處理領(lǐng)域應(yīng)用廣泛,如語義搜索、智能問答、輔助決策等領(lǐng)域,知識圖譜已經(jīng)成為了人工智能發(fā)展的重要動力和核心領(lǐng)域。知識圖譜是一種基于圖的數(shù)據(jù)結(jié)構(gòu),由節(jié)點(diǎn)和邊組成,每個(gè)節(jié)點(diǎn)表示一個(gè)“實(shí)體”,每條邊為實(shí)體與實(shí)體之間的“關(guān)系”,知識圖譜本質(zhì)上是語義網(wǎng)絡(luò)。實(shí)體指的可以是現(xiàn)實(shí)世界中的事物,比如人、地名、公司、電話、動物等;關(guān)系則用來表達(dá)不同實(shí)體之間的某種聯(lián)系。知識圖譜就是把所有不同種類的信息連接在一起而得到的一個(gè)關(guān)系網(wǎng)絡(luò),因此知識圖譜提供了從“關(guān)系”的角度去分析問題的能力。知識圖譜的理論架構(gòu)知識圖譜的理論架構(gòu)分為三個(gè)部分,第一部分是源數(shù)據(jù)的獲取。第二部分是知識融合,用來關(guān)聯(lián)多數(shù)據(jù)源知識,擴(kuò)大知識的范圍。第三部分是知識的計(jì)算與應(yīng)用,知識計(jì)算是知識圖譜能力輸出主要方式,而知識應(yīng)用是知識圖譜與特定領(lǐng)域或者業(yè)務(wù)相結(jié)合,提高業(yè)務(wù)效率[2]。大規(guī)模知識庫的構(gòu)建與應(yīng)用需要多種智能信息處理技術(shù)的支持。通過知識抽取技術(shù),可以從一些公開的半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)中提取出實(shí)體、關(guān)系、屬性等知識要素。通過知識融合,可消除實(shí)體、關(guān)系、屬性等指稱項(xiàng)與事實(shí)對象之間的歧義,形成高質(zhì)量的知識庫。知識推理則是在已有的知識庫基礎(chǔ)上進(jìn)一步挖掘隱含的知識,從而豐富、擴(kuò)展知識庫[3]。分布式的知識表示形成的綜合向量對知識庫的構(gòu)建、推理、融合以及應(yīng)用均具有重要的意義。關(guān)鍵技術(shù)知識圖譜的構(gòu)建過程包括:知識抽取、知識融合、知識推理。知識抽取知識抽取就是把數(shù)據(jù)從不同的數(shù)據(jù)源中抽取出來,然后按一定的規(guī)則加入到知識圖譜中,這個(gè)過程我們稱為知識抽取。知識抽取是從多種數(shù)據(jù)源中提取知識并存入知識圖譜,是構(gòu)建大規(guī)模知識圖譜的基礎(chǔ)。知識抽取主要是面向開放的鏈接數(shù)據(jù),通過自動化的技術(shù)抽取出可用的知識3知識抽取包括三個(gè)主要工作,分別是命名實(shí)體抽取、關(guān)系抽取、屬性抽取[4]:實(shí)體抽?。河址Q為實(shí)體識別,指的是從原始語料中自動識別出命名實(shí)體。由于實(shí)體是知識圖譜中的最基本元素,其抽取的完整性、準(zhǔn)確、召回率等將直接影響到知識庫的質(zhì)量。因此,實(shí)體抽取是知識抽取中最為基礎(chǔ)與關(guān)鍵的一步。關(guān)系抽?。耗繕?biāo)是解決實(shí)體間語義鏈接的問題,早期的關(guān)系抽取主要是通過人工構(gòu)造語義規(guī)則以及模板的方法識別實(shí)體關(guān)系。隨后,實(shí)體間的關(guān)系模型逐漸替代了人工預(yù)定義的語法與規(guī)則。屬性抽取:屬性抽取主要是針對實(shí)體而言的,通過屬性可形成對實(shí)體的完整勾畫。由于實(shí)體的屬性可以看成是實(shí)體與屬性值之間的一種名稱性關(guān)系,因此可以將實(shí)體屬性的抽取問題轉(zhuǎn)換為關(guān)系抽取問題。知識抽取在技術(shù)方面,目前集中于機(jī)器學(xué)習(xí)和自然語言處理,并且隨著人工2007年研究了自然語言處理的知識抽取模式和方法,經(jīng)過分詞、詞性標(biāo)注、句法分析等過程從文段中抽取知識,然后再轉(zhuǎn)換成計(jì)算機(jī)可理解的形式。洪娜等人對基于Ontology4OBIE,OBIEOBIEOntology知識融合知識融合可以解決不同知識圖譜的異構(gòu)問題,通過知識融合,可以使得不同數(shù)據(jù)源的異構(gòu)知識圖譜相互溝通、相互操作,提高知識圖譜的質(zhì)量。由于知識圖譜中的知識來源廣泛,存在知識質(zhì)量良莠不齊、來自不同數(shù)據(jù)源的知識重復(fù)、知識間的關(guān)聯(lián)不夠明確等問題,所以必須要進(jìn)行知識的融合。知識融合是高層次的知識組織,使來自不同知識源的知識在同一框架規(guī)范下進(jìn)行異構(gòu)數(shù)據(jù)整合、消歧、加工、推理驗(yàn)證、更新等步驟,達(dá)到數(shù)據(jù)、信息、方法、經(jīng)驗(yàn)以及人的思想的融合,形成高質(zhì)量的知識庫。其中,知識更新是一個(gè)重要的部分。人類的認(rèn)知能力、知識儲備以及業(yè)務(wù)需求都會隨時(shí)間而不斷遞增。因此,知識圖譜的內(nèi)容也需要與時(shí)俱進(jìn),不論是通用知識圖譜,還是行業(yè)知識圖譜,它們都需要不斷地迭代更新,擴(kuò)展現(xiàn)有的知識,增加新的知識。知識融合環(huán)節(jié)兩個(gè)關(guān)鍵的任務(wù)是:實(shí)體對齊,它是指對于現(xiàn)實(shí)中的同一個(gè)實(shí)針對不易識別的實(shí)體進(jìn)行人工標(biāo)注、基于貪心算法對大規(guī)模數(shù)據(jù)進(jìn)行處理、匹配模糊字符串,對單詞進(jìn)行分類模型等方法,另外基于知識圖譜的嵌入方法也是非TransEIEAJKESEEAJAPE利用深度學(xué)習(xí)方法從不同粒度來學(xué)習(xí)實(shí)體的特征]知識推理深度學(xué)習(xí)的推理。結(jié)論作為一門新興的學(xué)科技術(shù),知識圖譜已經(jīng)成為人工智能發(fā)展的核心領(lǐng)域。本文討論了知識圖譜的概念,以及知識圖譜的核心構(gòu)建過程。從研究來看知識的抽取和融合是研究的基礎(chǔ),知識的推理是研究的重要應(yīng)用,未來在知識抽取和知識融合技術(shù)比較成熟的基礎(chǔ)上,研究者應(yīng)該把研究的重心逐步傾向于知識的推理,進(jìn)而豐富知識圖譜的應(yīng)用。參考文獻(xiàn)1.王萌,王昊奮,李博涵,趙翔,王鑫.新一代知識圖譜關(guān)鍵技術(shù)綜述[J/OL].計(jì)算機(jī)研究與發(fā)展:1-18[2022-03-17].2.張吉祥,張祥森,武長旭,趙增順.知識圖譜構(gòu)建技術(shù)綜述[J].計(jì)算機(jī)工程,2022,48(03):23-37.DOI:10.19678/j.issn.1000-3428.0061803.3.姚萍,李坤偉,張一帆.知識圖譜構(gòu)建技術(shù)綜述[J].信息系統(tǒng)工程,2020(05):121+123.4.于瀏洋,郭志剛,陳剛,席耀一.面向知識圖譜構(gòu)建的知
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 擺地?cái)偨虒W(xué)合同協(xié)議書
- 競業(yè)合同協(xié)議書模板
- 家政代理合同協(xié)議書模板
- 運(yùn)營和老板合作合同協(xié)議書
- 2025年中國納米水滑石項(xiàng)目創(chuàng)業(yè)計(jì)劃書
- 中國3,3-二甲基-1-丁酸項(xiàng)目創(chuàng)業(yè)計(jì)劃書
- 中國境外油田服務(wù)項(xiàng)目創(chuàng)業(yè)計(jì)劃書
- 直播游戲運(yùn)營方案
- 常熟POCT試劑項(xiàng)目商業(yè)計(jì)劃書
- 病人陪護(hù)合同協(xié)議書范本
- SL631水利水電工程單元工程施工質(zhì)量驗(yàn)收標(biāo)準(zhǔn)第1部分:土石方工程
- 2025年湖南出版中南傳媒招聘筆試參考題庫含答案解析
- 廣東省2024年中考數(shù)學(xué)試卷【附真題答案】
- (高清版)TDT 1075-2023 光伏發(fā)電站工程項(xiàng)目用地控制指標(biāo)
- 監(jiān)控立桿基礎(chǔ)國家標(biāo)準(zhǔn)
- 場地平整土方開挖專項(xiàng)施工方案
- 預(yù)制梁場建設(shè)驗(yàn)收標(biāo)準(zhǔn)
- 德魯克的績效觀
- 那洛巴尊者傳
- 包材產(chǎn)品HACCP計(jì)劃
- JX820D型便攜式吸引器使用說明書
評論
0/150
提交評論