在瀏覽和檢索界面設(shè)計(jì)中利用知識(shí)組織系統(tǒng)_第1頁(yè)
在瀏覽和檢索界面設(shè)計(jì)中利用知識(shí)組織系統(tǒng)_第2頁(yè)
在瀏覽和檢索界面設(shè)計(jì)中利用知識(shí)組織系統(tǒng)_第3頁(yè)
在瀏覽和檢索界面設(shè)計(jì)中利用知識(shí)組織系統(tǒng)_第4頁(yè)
在瀏覽和檢索界面設(shè)計(jì)中利用知識(shí)組織系統(tǒng)_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余33頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

在瀏覽和檢索界面設(shè)計(jì)中

利用知識(shí)組織系統(tǒng)(KOS)曾蕾2006年數(shù)字圖書(shū)館前沿問(wèn)題高級(jí)研討班清華大學(xué),北京

一.從第一代到第四代界面二.在實(shí)際工作中利用KOS原理和方法“知識(shí)組織系統(tǒng)”(knowledgeorganizationsystems,簡(jiǎn)稱(chēng)KOS)是我們用來(lái)定義并組織表述真實(shí)世界物體的術(shù)語(yǔ)和符號(hào)的系統(tǒng),在具體應(yīng)用中我們往往將它們泛指為語(yǔ)義工具。大型數(shù)據(jù)庫(kù)中使用的眾多的敘詞表檢索引擎內(nèi)部使用的分類(lèi)表、自動(dòng)擴(kuò)檢詞表網(wǎng)站導(dǎo)航瀏覽用的等級(jí)體系結(jié)構(gòu)新一代萬(wàn)維網(wǎng)—語(yǔ)義網(wǎng)的實(shí)用分類(lèi)系統(tǒng)(又稱(chēng)本體)。。。什么是知識(shí)組織系統(tǒng)知識(shí)組織系統(tǒng)(KOS)一覽Strongly-structured

強(qiáng)結(jié)構(gòu)詞單

termlistsSynonymRings同義詞環(huán)

AuthorityFiles權(quán)威文檔Glossaries/Dictionaries詞匯/字典Gazetteers地名表Naturallanguage自然語(yǔ)言Controlledlanguage受控語(yǔ)言Weakly-structured

弱結(jié)構(gòu)分類(lèi)與大致歸類(lèi)

Classification&

Categorization:SubjectHeadings標(biāo)題表

Classificationschemes(圖書(shū))分類(lèi)法

Taxonomies知識(shí)分類(lèi)表

Categorizationschemes大致歸類(lèi)類(lèi)表關(guān)聯(lián)組織

RelationshipGroups

Ontologies實(shí)用分類(lèi)法

Semanticnetworks語(yǔ)義網(wǎng)絡(luò)Conceptmaps概念地圖

Thesauri敘詞表Picklists可選詞單KOS的基本原理和方法不論KOS是以什么形式出現(xiàn),其基本方法都是相同的,不同的是采用這些方法的程度和范圍詞義消歧即對(duì)同形異義、一詞多義、詞義含糊的詞的控制對(duì)同義詞和近義詞的控制對(duì)概念之間關(guān)系進(jìn)行顯示等級(jí)關(guān)系+其他相關(guān)關(guān)系表達(dá)概念之間關(guān)系以及概念的屬性特征第一代檢索界面:查尋1996年AltaVista網(wǎng)站1997年12月NorthernLight一.從第一代到第四代界面第二代:查尋+瀏覽1996年10月的雅虎最早采用分類(lèi)的方法提供瀏覽服務(wù)1997年1月Yahoo!1998年12月AltaVista到98年幾乎所有檢索網(wǎng)站都加上了分類(lèi)瀏覽很多由圖書(shū)館建立的主題指南和虛擬圖書(shū)館都采用分類(lèi)瀏覽的方式2006年7月訪問(wèn)1)分面的思路物體、部件、過(guò)程、時(shí)間、空間、體裁、載體…2)多維的檢索、瀏覽、開(kāi)拓同時(shí)提供多種瀏覽和開(kāi)拓的可能途徑,隨機(jī)應(yīng)用,不是給用戶(hù)只有一個(gè)框架、一條道路3)以作品、物件為核心讓部門(mén)劃分、體裁劃分、語(yǔ)種劃分退居二線,不要打擾讀者,F(xiàn)RBR的原則的體現(xiàn) 4)顯示信息,而不是顯示數(shù)據(jù)結(jié)構(gòu)不要將圖書(shū)館內(nèi)部工作中使用的數(shù)據(jù)格式和字段強(qiáng)加給用戶(hù)結(jié)構(gòu)化的數(shù)據(jù)是在后臺(tái)支持檢索用的,應(yīng)讓他們?cè)谟脩?hù)面前消失第三代:分面、多維

ViewFinder,imageresourceforEngland'shistory例1:英國(guó)文化遺產(chǎn)數(shù)字圖書(shū)館的圖像資源查找物體組成部分時(shí)間空間大類(lèi)多種途徑充分利用元數(shù)據(jù)記錄中的內(nèi)容例2:紐約公共圖書(shū)館數(shù)字畫(huà)廊時(shí)間主題大類(lèi)有關(guān)此物件的基本信息在有限的第一空間內(nèi),從多種角度充分展示典藏的內(nèi)容例3:史密森尼博物院“有線歷史”HistoryWired:Afewofourfavoritethings.”例4:Perseus人文科學(xué)數(shù)字圖書(shū)館9millionpages/monthADigitalLibraryfortheHumanities文獻(xiàn)類(lèi)型電子館藏包括:經(jīng)典·古代寫(xiě)在紙莎草紙上的文稿·文藝復(fù)新·倫敦·加州·上中西部·莎士比亞·波義耳作品·Tufts歷史語(yǔ)言統(tǒng)計(jì)地點(diǎn)年代從元數(shù)據(jù)中挖掘信息,一條數(shù)據(jù)多種讀法,多種探索開(kāi)發(fā)的方向第4代:加入屬性特征事物、概念不僅有分類(lèi),還有屬性特征概念類(lèi)型概念關(guān)系類(lèi)型概念的屬性特征例1:文化遺產(chǎn)術(shù)語(yǔ)的分面查找途徑FACET

語(yǔ)義提問(wèn)擴(kuò)充和匹配FACET-FacetedAccesstoCulturalhEritageTerminology不同顏色代表不同類(lèi)型的概念:物體、

材料、

屬性、

時(shí)間、

空間

等等二.在實(shí)際工作中

利用KOS原理和方法在分面結(jié)構(gòu)中采用可選詞單(picklist)從分眾分類(lèi)法(folksonomy)中采集詞匯在檢索引擎中引進(jìn)同義詞環(huán)(synonymrings)方法等級(jí)結(jié)構(gòu)大有用武之地用詞表(thesaurus)幫助用戶(hù)建立檢索提問(wèn)、控制檢索范圍概念地圖(conceptmap)的使用實(shí)用分類(lèi)系統(tǒng)(ontology)與實(shí)際知識(shí)信息庫(kù)的有機(jī)結(jié)合多種KOS原理和方法的綜合利用可選詞單(picklist)1.在分面結(jié)構(gòu)中采用可選詞單(picklist)2.從分眾分類(lèi)法(folksonomy)中采集詞匯分眾分類(lèi)法(Folksonomy)是由Folks和Taxonomy組合而來(lái),指“群眾”自發(fā)性定義的平面非等級(jí)標(biāo)簽分類(lèi)。有“分眾分類(lèi)法”,“通俗分類(lèi)法”,“大眾分類(lèi)法”,

“民眾分類(lèi)法”等不同翻譯特點(diǎn):這種分類(lèi)法是由個(gè)人自發(fā)性定義。標(biāo)簽分類(lèi)是公開(kāi)共享的,可以被所有人看到。這種分類(lèi)法是由用戶(hù)群體定義的頻率來(lái)決定。Source:維基百科Source:BearmanandTrant,2005del.icio.us/書(shū)簽分享網(wǎng)站益處:收集到相關(guān)性很高的詞,從這些詞入口可以找到更多的相關(guān)網(wǎng)站問(wèn)題:同義詞、近義詞、詞形規(guī)范等,例如globalwarming和global-warming兩者帶出的內(nèi)容不一樣,只用一個(gè)詞,可能漏掉一些好的內(nèi)容。

賓西法尼亞大學(xué)圖書(shū)館PennTags書(shū)簽活動(dòng)3.在檢索引擎中引進(jìn)同義詞環(huán)(synonymrings)方法通常與檢索引擎一起使用,幫助擴(kuò)充檢索式用戶(hù)只要使用了同義詞環(huán)中的任何一個(gè)詞,就可以找到這一類(lèi)的資源。打“電話“--“電話”、”手機(jī)”、“傳呼”、“大哥大”、“小靈通”喝“咖啡”--“滴濾咖啡”、“美式咖啡”、“濃縮咖啡”、“拿鐵咖啡”、“卡布奇諾”、“摩卡咖啡”等看“星星”--“恒星”、“行星”、“星座”、“星云”、“銀河”等交叉概念,如“醫(yī)藥”和“藥品”,“樹(shù)林”和“森林還有很多簡(jiǎn)寫(xiě)詞,外語(yǔ)名稱(chēng),專(zhuān)用詞等從原理上講,同義詞環(huán)中所包含的

語(yǔ)詞是從檢索目的來(lái)看等價(jià)

的詞.astronautspacemancosmonautspationaut

taikonaut

同義詞環(huán)與眾不同之處不強(qiáng)行要求環(huán)中某一個(gè)詞被當(dāng)作“正式詞”,在同義詞環(huán)中每一個(gè)詞都可以是正式詞。同義詞環(huán)可以一組一組詞逐步建立,可以只給整個(gè)詞匯中的10%或20%的詞建立同義詞環(huán),視需要而定,量力而行,分期行動(dòng)。可隨著檢索環(huán)境的變化和網(wǎng)站內(nèi)容的變化而隨時(shí)增加新的同義詞環(huán)。投資小、效益高、實(shí)用性強(qiáng)。層層分類(lèi)的等級(jí)體系,每個(gè)圖像帶有元數(shù)據(jù)等級(jí)結(jié)構(gòu)與生動(dòng)的表現(xiàn)形式的結(jié)合4.等級(jí)結(jié)構(gòu)大有用武之地

Renardus采用杜威分類(lèi)法的體系結(jié)構(gòu)將北歐各大主題導(dǎo)航站聯(lián)結(jié)起來(lái)采用KOS分類(lèi)體系以聯(lián)合使用分散的主題導(dǎo)航站匹配結(jié)果可能有不同程度,完全匹配、下位類(lèi)匹配、小部分匹配,等等

Source:ADLIBEnglishHeritageIllustratedThesaurus5.用詞表(thesaurus)幫助用戶(hù)建立檢索提問(wèn)、控制檢索范圍英國(guó)文化遺產(chǎn)圖示敘詞表亞歷山大數(shù)字圖書(shū)館電子地名辭典–在查詢(xún)界面提供敘詞表以便控制檢索范圍人機(jī)認(rèn)知研究所的軟件下載網(wǎng)頁(yè)6.概念地圖的使用概念及其關(guān)系2006年第2屆概念地圖國(guó)際會(huì)議的網(wǎng)頁(yè)UMLSSemanticNetwork135SemanticTypes(link)and54SemanticRelationTypes(link)TheGeneOntology--基因?qū)嵱梅诸?lèi)法TheGeneOntology種類(lèi)7.實(shí)用分類(lèi)系統(tǒng)(ontology)與實(shí)際知識(shí)信息庫(kù)的有機(jī)結(jié)合8.多種KOS原理和方法的綜合利用實(shí)例一維二維三維+TermLists

詞單ClassificationCategorization

分類(lèi)、歸類(lèi)Thesauri敘詞表

conceptmaps概念地圖

semanticnetworks

語(yǔ)義網(wǎng)絡(luò)

ontologies

實(shí)用分類(lèi)法RelationshipGroups相關(guān)組織KOS結(jié)構(gòu)化模型譜KOS--〉NKOS--〉SemanticTools

向強(qiáng)結(jié)構(gòu)的語(yǔ)義系統(tǒng)發(fā)展網(wǎng)絡(luò)下的KOS(NKOS)和新一代的語(yǔ)義工具的特點(diǎn):吸取不同知識(shí)組織系統(tǒng)的特長(zhǎng),集中起來(lái)優(yōu)化使用等級(jí)結(jié)構(gòu)與元數(shù)據(jù)式的“特征”的結(jié)合Taxonomy+metadata(orattribute-valuepairs)OntologyforknowledgebasedsystemsKOS、元數(shù)據(jù)與專(zhuān)用置標(biāo)語(yǔ)言(domain-specificmarkuplanguages)的結(jié)合使用多個(gè)知識(shí)組織系統(tǒng)結(jié)構(gòu)在學(xué)習(xí)科學(xué)概念中的結(jié)合使用(e.g.,ADEPTKB)對(duì)計(jì)算機(jī)可理解性的強(qiáng)調(diào)–-多種編碼(encoding)系

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論