




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、知識(shí)要點(diǎn)第一章緒論1、什么是信息組織?(理解)信息組織:對(duì)信息資源對(duì)象進(jìn)行收集、加工、整合、存儲(chǔ)使之有序化、系統(tǒng)化的過程。2、信息組織的發(fā)展階段一一按組織對(duì)象 劃分(理解)按組織對(duì)象劃分信息組織經(jīng)歷了三個(gè)階段:文獻(xiàn)組織階段、信息組織階段、知識(shí)組織階段 文獻(xiàn)組織階段一一組織對(duì)象:傳統(tǒng)文獻(xiàn)實(shí)體,不涉及文獻(xiàn)內(nèi)容本身。信息組織階段一一組織對(duì)象: 從廣度上,以紙質(zhì)信息為中心轉(zhuǎn)向以電子媒介信息為中心; 從深度上,除了對(duì)文獻(xiàn)實(shí)體進(jìn)行組織,還要深入信息內(nèi)容。知識(shí)組織階段一一組織對(duì)象:從顯性知識(shí)擴(kuò)展到隱性知識(shí)。知識(shí)組織直接給用戶提供直 觀的、可操作的系統(tǒng)化知識(shí)。不再局限于利用片面的信息來滿足用戶 的需求,而是對(duì)
2、用戶的需求系統(tǒng)分析,向用戶提供全面、完善的解決 方木。按職能劃分信息組織經(jīng)歷了三個(gè)階段(補(bǔ)充):清冊(cè)職能時(shí)期 查檢職能時(shí)期 組織職能時(shí)期3、網(wǎng)絡(luò)信息組織的基本方法(掌握)網(wǎng)絡(luò)信息組織方法文件方式一次信息二次信息搜 索 引 擎 方 式指 引 庫 方 式? 一般用于局域網(wǎng)內(nèi)的非結(jié)構(gòu)化信息組織。? 優(yōu)點(diǎn):通過FTP協(xié)議進(jìn)行傳輸,簡單方便? 缺點(diǎn):以文件為單位共享和傳輸信息會(huì)使網(wǎng)絡(luò)負(fù)載越來越大自由文本方式? 主要用于全文數(shù)據(jù)庫的組織? 對(duì)非結(jié)構(gòu)化的文本信息進(jìn)行組織和處理的方式? 能夠完整地反映出一次文獻(xiàn)的全貌? 通過計(jì)算機(jī)自動(dòng)進(jìn)行文獻(xiàn)信息的處理和組織,支持全文檢索。數(shù)據(jù)庫方式? 一般用于結(jié)構(gòu)化/規(guī)范化
3、信息組織。? 優(yōu)點(diǎn):最小存取單位是字段,從而大大降低網(wǎng)絡(luò)數(shù)據(jù)傳輸?shù)呢?fù)載。? 缺點(diǎn):對(duì)非結(jié)構(gòu)化信息處理難度大? 數(shù)據(jù)庫方式是當(dāng)前普遍使用的網(wǎng)絡(luò)信息資源的組織方式。主頁方式? 網(wǎng)頁一般通過 HTML語言規(guī)則將文本、圖像、聲音、視頻等各種類型的信息集合在 一起。超文本方式結(jié)點(diǎn)主題樹方式? 主題樹方式 是一種可供檢索和查詢的等級(jí)式主題目錄。它以人工方式或半自動(dòng)方式 搜集信息,然后將信息資源按照某種事先確定的概念體系結(jié)構(gòu),分門別類地逐層加 以組織。? 主題樹方式不太適合大型的綜合性的網(wǎng)絡(luò)信息資源系統(tǒng),而較適合專題指引庫的建 立。00搜索引擎方式Q。? ri d 彳 0*FW k, n * IH w(I
4、ifP ( M e.Gotigk一 m 二 _ 普指引庫方式? 指引庫,也稱導(dǎo)航庫。它并不存儲(chǔ)各種實(shí)際的信息資源,只存放有關(guān)主題的 數(shù)據(jù)庫或服務(wù)器的地址等信息,可指引用戶到特定的地址獲取所需的信息。5、信息的外表特征、內(nèi)容特征分別包括哪些?(理解)外表特征:與信息內(nèi)容無關(guān)的特征,如題目、作者、出處、作者工作單位、專利號(hào)等內(nèi)容特征:信息所涉及的中心事物和學(xué)科屬性,如分類號(hào)、主題詞、關(guān)鍵詞、摘要等。6、什么是標(biāo)引語言?什么是自然語言?什 么是受控語言?自然語言區(qū)別于受控語 言的特點(diǎn)有哪些?(理解)標(biāo)引語言:是表達(dá)文獻(xiàn)主題概念和文獻(xiàn)需求主題概念的簡明性、單義性和關(guān)聯(lián)性概念標(biāo)識(shí)系統(tǒng),是根據(jù)標(biāo) 引和檢索
5、需要而編制的人工語言。? 也叫 情報(bào)語言”、索引語言”、檢索語言”? 揭示信息的中心主題和內(nèi)容特征? 信息標(biāo)引的依據(jù)? 用于將檢索用語和標(biāo)引用語進(jìn)行匹配? 對(duì)自然語言進(jìn)行規(guī)范化處理后的人工語言標(biāo)引語言實(shí)際上是檢索者與組織者之間的一種 約定”自然語言:文獻(xiàn)作者所使用的書面語言受控語言:詞匯及語法都受到各種控制的人工語言。7、標(biāo)引包括哪些類型?自然語言標(biāo)引包括哪些方法?(理解)幾個(gè)重要概念(補(bǔ))?自然語言標(biāo)引: 自然語言標(biāo)引的方法:采用自然語言作為信息記錄主題內(nèi)容檢索標(biāo)識(shí)的標(biāo)引。1 .關(guān)鍵詞法2 .文本檢索3 .自由標(biāo)引4 .自然語言入口詞檢索索取號(hào)及其構(gòu)成(掌握)索取號(hào):是信息服務(wù)機(jī)構(gòu)賦予每一種
6、信息資源的唯一號(hào)碼。它反映每種信息資源的具體存放位置。索取號(hào)由兩部分組成:分類號(hào)和書次號(hào)(書次號(hào)通常采用種次號(hào)”或著者號(hào)”)種次號(hào)”是依照同類信息資源到信息服務(wù)機(jī)構(gòu)的先后次序編制的順序號(hào)或流水號(hào);著者號(hào)”是依照著者姓名的音、形等特征編制的號(hào)碼。9、信息存儲(chǔ)介質(zhì)(理解)存儲(chǔ)介質(zhì)一紙張、磁盤、磁帶、縮微膠片、光盤等10、信息存取系統(tǒng)的類型(理解)信息檢索系統(tǒng)的類型?按照信息源類型劃分:文獻(xiàn)型、事實(shí)型、數(shù)值型、圖像型?按照工作方式和存取介質(zhì): 手工、單機(jī)、聯(lián)機(jī)、光盤、網(wǎng)絡(luò) 信息檢索系統(tǒng)的結(jié)構(gòu)信息檢索系統(tǒng)一般包括五個(gè)子系統(tǒng):?選擇子系統(tǒng)?標(biāo)引子系統(tǒng)? 詞表子系統(tǒng)? 檢索子系統(tǒng)? 交互子系統(tǒng)11、衡量檢
7、索效率的指標(biāo)(理解)衡量檢索效率的指標(biāo)主要有:? 查全率(漏檢率)? 查準(zhǔn)率(誤檢率)第二章分類法(重點(diǎn))1、什么是分類法?包括哪些類型(即構(gòu)成 原理)?(理解)分類組織法:根據(jù)概念的劃分與概括原理,按照事先規(guī)定好的學(xué)科專業(yè)體系或事物范疇,根據(jù)某一特性將信息分門別類的組織成系統(tǒng),以便于用戶按照學(xué)科專業(yè)或事物范疇途徑查詢特定信息的信息組織法。? 分類法使用分類號(hào)來標(biāo)識(shí)類目,分類號(hào)可反映類目在分類體系中的位置和排列次序。分類語言的構(gòu)成原理:1)等級(jí)體系分類法2)分面組配分類法3)等級(jí)體系一分面組配分類法(也即混合 分類法)2、什么是體系分類法?其主要代表有哪些?(理解)含義:類目按等級(jí)層層展開,并
8、詳盡列舉的文獻(xiàn)分類法特點(diǎn)? 將表達(dá)事物的概念(類目)按照知識(shí)分類與邏輯關(guān)系進(jìn)行縱向從屬、橫向并列的方 式編排成概念等級(jí)體系;? 是一種先組式定組型標(biāo)引語言,其類目與類號(hào)標(biāo)識(shí)都是在編制分類表時(shí)事先確定或 大部分確定好的;? 按照學(xué)科專業(yè)和事物范疇區(qū)分和集中文獻(xiàn);? 標(biāo)識(shí)符號(hào)既可以用于組織分類目錄與索引,也可用于排書上架;? 采用數(shù)字和字母作為標(biāo)識(shí),便于國際標(biāo)準(zhǔn)化。種類? 中國圖書館分類法(簡稱中圖法)? 中國科學(xué)院圖書館分類法 (簡稱科圖法)? 杜威十進(jìn)分類法 (簡稱DDC)? 國際十進(jìn)分類法(簡稱UDC)? 美國國會(huì)圖書館圖書分類法 (簡稱LDC)局限性(補(bǔ)充)? 列舉類目與無限增長的科學(xué)知識(shí)
9、不相適應(yīng);? 類目體系的單向線性結(jié)構(gòu)與概念多向成族的網(wǎng)狀結(jié)構(gòu)不相適應(yīng);? 分類標(biāo)識(shí)的概括性與信息源主題的專指性不相適應(yīng);? 號(hào)碼標(biāo)識(shí)的有限性與知識(shí)單元的無限性不相適應(yīng);?文獻(xiàn)單元標(biāo)引與知識(shí)單元檢索不相適應(yīng)。3、什么是組配式分類法?其主要代表有 哪些?(掌握)分面:一組性質(zhì)相同的概念因素分面組配分類法含義:依據(jù)概念的分析與綜合原理,將概括信息內(nèi)容與事物的主題概念分成若干個(gè)分面”,通過各分面內(nèi)類目之間的組配來表達(dá)信息內(nèi)容的分類法,也叫分面分類法、范疇分類法。即一個(gè)復(fù)雜主題概念可以用若干個(gè)簡單概念標(biāo)識(shí)的組配來表達(dá)構(gòu)成:包括分面分析、分面引用次序和分面標(biāo)記制度三大關(guān)鍵理論和技術(shù)。種類:冒號(hào)分類法(簡稱
10、CC)布利斯書目分類法(簡稱BC)缺點(diǎn):類表結(jié)構(gòu)和標(biāo)記方法復(fù)雜,類目體系欠直觀4、什么是體系-組配式分類法?其主要 代表有哪些?(理解)含義:是一種在體系分類法的基礎(chǔ)上,引入分面分析和組配技術(shù)而形成的分類法結(jié)構(gòu)模式, 亦稱半分面分類法。背景:全分面組配分類法很少被使用,分面分析和組配技術(shù)更多的是被體系分類法 吸收,用來改善體系分類法的性能。特點(diǎn):1)按照學(xué)科專業(yè)或事物范疇設(shè)置基本大類;2)通過設(shè)置各種分面輔助復(fù)分表提供分面組配技術(shù)與概念標(biāo)識(shí)。種類:? 國際十進(jìn)分類法(簡稱UDC)? 俄國圖書館書目分類法5、分類法中基本標(biāo)記符號(hào)包括哪些類 型?(掌握)分類法的標(biāo)記符號(hào)也稱分類號(hào)、類號(hào),是類目的代
11、號(hào)基本符號(hào):單純數(shù)字 單純字母 數(shù)字、字母混合輔助符號(hào)(根據(jù)分類法的功能而定)6、常用標(biāo)記制度包括哪些?(掌握)結(jié)構(gòu)型標(biāo)記制層累標(biāo)記制混合標(biāo)記制分面標(biāo)記制非結(jié)構(gòu)型標(biāo)記制順序標(biāo)記制層累標(biāo)記制? 又稱等級(jí)標(biāo)記制,是一種類號(hào)的位數(shù)與類目等級(jí)相適應(yīng)的層次分明的標(biāo)記制度。它常用一位號(hào)碼 表示一個(gè)大類,再加一位號(hào)碼表示其下位類 (),以號(hào)碼的層層累加表示類目的層層劃分。? 中圖法基本采用層累標(biāo)記制混合標(biāo)記制? 一種結(jié)合采用順序制和層累制的標(biāo)記方式。包括層累-順序制和順序一層累制? 科圖法采用的是順序一層累制。分類號(hào)的前兩位數(shù)字采用順序制,用于標(biāo)識(shí)基本大類和二級(jí)、 三級(jí)類目;兩位數(shù)字后,用小圓點(diǎn)隔開,其后基
12、本使用層累標(biāo)記制。分面標(biāo)記制又稱分段標(biāo)記制,是用若干節(jié)段符號(hào)的組合來表達(dá)主題概念的標(biāo)記制度。它能顯示類目的組配關(guān)系。例如:20世紀(jì)90年代中國兒童圖書館圖書分類工作 ”的類號(hào)為2 , 61; 43 : 51 .41, N9。順序標(biāo)記制按照類目在分類體系中的次序,順序配以號(hào)碼,號(hào)碼只表示類目的次序,不顯示類目的 等級(jí)或其他關(guān)系 。7、 中圖法、科圖法、DDC、UDC 分別采用什么標(biāo)記符號(hào)和標(biāo)記制度?(掌 握)中圖法采用拉丁字母與阿拉伯?dāng)?shù)字相結(jié)合的混合號(hào)碼制作為標(biāo)記符號(hào),基本采用層累標(biāo)記制。科圖法采用單純數(shù)字號(hào)碼作為標(biāo)記符號(hào),號(hào)碼分為兩部分:第一部分采用整數(shù)順序制,第二部分基本 上采用小數(shù)層累制,
13、簡而言之,采用混合標(biāo)記制。杜威十進(jìn)分類法(DDC): DDC是以阿拉伯?dāng)?shù)字作為基本的分類標(biāo)記符號(hào)的,并采用層累制。國際十進(jìn)分類法(UDC): UDC與DDC 一樣,采用單純阿拉伯?dāng)?shù)字作為標(biāo)記符號(hào)。基本采用層累制,第三章主題法(重點(diǎn))1、什么是主題法?(理解)主題法是指用語詞作為概念標(biāo)識(shí),將概念標(biāo)識(shí)進(jìn)行字順排列,并用參照系統(tǒng)等方法間接顯示概念之間相互 關(guān)系的信息組織方法。2、主題法有什么特點(diǎn)?(掌握)1 .以主題為中心集中信息2 .直接用自然語詞(主題詞)作為存取標(biāo)識(shí)3 .主要按字順排列4 .用參照系統(tǒng)顯示主題詞之間的關(guān)系3、主題法包括哪些類型?(掌握)標(biāo)題法:用規(guī)范化語詞一標(biāo)題詞來表達(dá)主題概念
14、元詞法 (單元詞法):用規(guī)范化語詞一單元詞的字面組配來表達(dá)主題概念 敘詞法(主題詞法):用規(guī)范化語詞一敘詞的概念組配來表達(dá)主題概念關(guān)鍵詞法:直接以文獻(xiàn)中的自然語詞 一關(guān)鍵詞來表達(dá)主題概念2主題法的誕生與發(fā)展類型松-柝疆法兩冊(cè)范任例來上達(dá)切疆含元詞法雌元詞法,班雙范化司一隼后臂主血組盤條點(diǎn)送至是能去后餐雪4、主題法參照系統(tǒng)的構(gòu)成(理解)Y用項(xiàng)符號(hào):表示該主題是正式主題詞D代項(xiàng)符號(hào):表示該主題是非正式主題詞F分項(xiàng)符號(hào):表示該主題是 顯像管”的下位主題詞S屬項(xiàng)符號(hào):表示該主題是 顯像管”的上位主題詞C參項(xiàng)符號(hào):表示該主題是 顯像管”的相關(guān)主題詞5、幾種代表性主題法中哪些是自然語言, 哪些是人工語言?
15、(理解)標(biāo)題法、元詞法、敘詞法為人工語言;而關(guān)鍵詞法則為自然語言6、主題法和分類法的比較(掌握)揭示對(duì)象不同主題法揭示文獻(xiàn)論述的主題事物(是什么”);分類法揭示的是文獻(xiàn)內(nèi)容的學(xué)科屬性 (屬什么”)。使用標(biāo)識(shí)不同主題法直接用詞語表示文獻(xiàn)主題;分類法則以抽象的 分類號(hào)”表示文獻(xiàn)主題。排列方式不同主題法按詞語字順排列,如同詞典,易學(xué)易查;分類法按分類號(hào)排列,系統(tǒng)性較強(qiáng),但不熟悉有關(guān)分類表則難以有效地利用。用途不同主題法較適合于對(duì)單篇文獻(xiàn)的組織和檢索,且更適于計(jì)算機(jī)組織和檢索;分類法則比較適合于圖書或文集的組織和檢索。7、什么是范疇索引、詞族索引?(理解) 范疇索引,又稱分類索引,是將敘詞和非正式敘詞
16、按所屬學(xué)科或范疇編制的詞匯分類索引。 詞族索引,也稱等級(jí)索引,是將字順表中具有等級(jí)關(guān)系的敘詞按屬分等級(jí)構(gòu)成詞族,并按各詞族 的族首詞字順排列的詞匯索引。什么是后控制,對(duì)網(wǎng)絡(luò)信息資源組織的作用?(掌握)后控制主要是通過后控詞表來實(shí)現(xiàn)的。后控制詞表是利用受控語言的基本原理和方法編制的自然語言檢索用詞表。它主要是對(duì)自然語言中大量存在的等同關(guān)系、等級(jí)關(guān)系和大部分相關(guān)關(guān)系進(jìn)行控制和揭示,用戶在檢索時(shí)通過瀏覽詞表選用檢索詞,或 者由系統(tǒng)自動(dòng)調(diào)整檢索式(擴(kuò)檢或縮檢)。所以,后控詞表是一種擴(kuò)檢或縮檢工具,一種羅列自然語言檢索 標(biāo)識(shí)供選擇的工具。?后控制模式:標(biāo)引不控制+檢索控制”模式。即在標(biāo)引階段使用自然語言
17、,不對(duì)標(biāo)引進(jìn)行嚴(yán)格控制, 而在檢索階段才對(duì)檢索詞進(jìn)行控制的自然語言檢索優(yōu)化技術(shù)。?后控制技術(shù)是人工語言與自然語言相結(jié)合的典范。9、網(wǎng)絡(luò)信息資源組織中的主題法(掌握)標(biāo)題詞法和敘詞法的應(yīng)用?標(biāo)題詞表和敘詞表用于網(wǎng)絡(luò)信息組織主要作為后控詞表使用,分為兩種情況:?第一,檢索前使用:用來規(guī)范用戶的檢索表達(dá)式;?第二,檢索后使用:在給出用戶檢索表達(dá)式及檢索結(jié)果的同時(shí),提供相似詞以便用戶進(jìn)一步擴(kuò)檢或縮檢。關(guān)鍵詞法的應(yīng)用?關(guān)鍵詞法在網(wǎng)絡(luò)中的應(yīng)用相當(dāng)廣泛,目前,大部分搜索引擎幾乎都采用關(guān)鍵詞法進(jìn)行信息組織。?關(guān)鍵詞法的原理直接從文獻(xiàn)的題目、正文、摘要中抽取出具有實(shí)際意義的語詞作為文獻(xiàn)標(biāo)識(shí),對(duì)標(biāo)識(shí)不加規(guī)范化 或
18、只作少量規(guī)范化處理。不編制受控詞表,不顯示詞間關(guān)系,只編制禁用詞表來控制抽詞每個(gè)關(guān)鍵詞都是平等的,輪流排至檢索位置,提供多途徑的主題字順檢索。關(guān)鍵詞標(biāo)引?自由標(biāo)引?自動(dòng)標(biāo)引? 全文索引10 、什么是自由標(biāo)引、全文檢索?(掌握)? 自由標(biāo)引即人工關(guān)鍵詞標(biāo)引。即人工從文獻(xiàn)中提取自然語言作為主題標(biāo)識(shí)。? 全文檢索不對(duì)文獻(xiàn)進(jìn)行任何標(biāo)引,直接通過計(jì)算機(jī)將自然語言檢索詞與文獻(xiàn)中的語詞進(jìn)行匹配。全文檢索進(jìn)行匹配的對(duì)象,可以是整個(gè)出版的文本,包括文章、報(bào)告甚整本圖書,也可以是它的 部分,如文摘、摘錄或只是文獻(xiàn)的題名。第四章 置標(biāo)語言工具1、 什么是 SGML ?(理解)其基本思想、特點(diǎn)是什么?(掌握)SGML
19、( 標(biāo)準(zhǔn)通用標(biāo)記語言) 一種通用的描述各種電子文件的結(jié)構(gòu)和內(nèi)容的國際標(biāo)準(zhǔn)。為創(chuàng)建結(jié)構(gòu)化、可交換的電子文件提供了依據(jù)。SGML 的基本思想是把文檔的內(nèi)容與樣式分開SGML 的主要特點(diǎn)是它的通用性與獨(dú)立性:所謂通用性是指SGML 可支持無數(shù)的文檔結(jié)構(gòu)類型,例如布告、技術(shù)手冊(cè)、章節(jié)目錄、設(shè)計(jì)規(guī)范、各種報(bào)告、信函和備忘錄等。所謂獨(dú)立性是指它與硬件、軟件獨(dú)立。 SGML 可以創(chuàng)建與特定的軟硬件無關(guān)的文檔,因此很容易與使用不同計(jì)算機(jī)系統(tǒng)的用戶交換文檔。2、 文檔三要素包括哪些?(掌握)文檔的三要素:文檔=文檔內(nèi)容十文檔結(jié)構(gòu)十文檔樣式3、 HTML 標(biāo)簽的主要作用?與 SGML 是什么關(guān)系?(理解)含義:
20、HTML 是一種表現(xiàn)語言,用來定義 WEB 上文字、圖像以及聲音等的顯示及格式。主要作用: HTML 的主要作用是指示瀏覽器按照相應(yīng)格式顯示信息。與 SGML 關(guān)系: HTML 是標(biāo)準(zhǔn)通用標(biāo)記語言( SGML ) 所創(chuàng)建的許多標(biāo)記語言之一,或者說是它的一個(gè)很小的子集。HTML 是使用固定標(biāo)簽集的一種 SGML 文檔。主要在 Web 上使用。4、 什么是 XML ?具有哪些特性和優(yōu)勢?(掌握)XML extensible Markup Language(可擴(kuò)展標(biāo)記語言),是一種定義標(biāo)記語言的元標(biāo)記語言,是一套定義語 義標(biāo)記的規(guī)則。特點(diǎn): 可擴(kuò)展性一一可自定義標(biāo)簽,元標(biāo)記語言;數(shù)據(jù)與顯示相分離一一
21、同一數(shù)據(jù)可多視; 自我描述性一一標(biāo)簽具有語義,支持智能檢索;高度結(jié)構(gòu)化采用樹形結(jié)構(gòu)。簡明性一一SGML的子集,20%復(fù)雜、80%功能;優(yōu)勢:結(jié)構(gòu)支持:HTMLt乏對(duì)復(fù)雜結(jié)構(gòu)的支持內(nèi)容提取:HTML勺標(biāo)記缺乏語義國際化:HTMLM特殊字符和國際字符集的支持還很不夠,在不同平臺(tái)上的實(shí)現(xiàn)很不一致 數(shù)據(jù)交換:HTML隹以實(shí)現(xiàn)自動(dòng)的數(shù)據(jù)交換 信息重用:HTM壞易重復(fù)使用已有的信息 動(dòng)態(tài)更新:用HTML創(chuàng)建的主頁不允許使用者改變頁面的外觀屬性,除非使用者載入新的頁面,或者使用Java小程序。但是,任何存儲(chǔ)在 Java中的數(shù)據(jù)都不能被搜索引擎發(fā)現(xiàn)。5、 XML 和HTML 比較(掌握);匕較內(nèi)容HTMLXM
22、L可擴(kuò)展性不具備擴(kuò)展性元標(biāo)記語言,可用于定義新的標(biāo)記語言則重舌側(cè)重于如何表現(xiàn)信息側(cè)重于如何結(jié)構(gòu)化的描述信息吾法要求不要求標(biāo)記的嵌套嚴(yán)格要求嵌套配對(duì)、呈樹形結(jié)構(gòu)“讀性及可維護(hù)性一難于閱讀、維護(hù)結(jié)構(gòu)清晰、便于閱讀、維護(hù)敦?fù)?jù)和顯示的關(guān)系內(nèi)容描述和顯示方式整合一體內(nèi)容描述與顯示方式相分離6、XML中用來描述信息的結(jié)構(gòu)、內(nèi)容、樣式的語言規(guī)范分別是什么?(理解)結(jié)構(gòu):文檔結(jié)構(gòu)定義文件一一 .DTD (或.XSD)內(nèi)容:文檔數(shù)據(jù)文件一一.XML我的第一個(gè)XML文檔樣式:樣式單文件一一.XML(或.CSS)第五章元數(shù)據(jù)1、什么是元數(shù)據(jù)?(理解)元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)(data about data),同時(shí)也是
23、結(jié)構(gòu)化的數(shù)據(jù)。它對(duì)信息資源進(jìn)行描述和解釋, 促進(jìn)信息資源的檢索、管理和利用。元數(shù)據(jù)可以為各種形態(tài)的信息資源提供規(guī)范的描述方案和檢索工具,為分布的、由多種信息資源組成的信息系統(tǒng)(如數(shù)字圖書館)提供整合的工具和紐帶。? 關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)? 用于描述數(shù)據(jù)的內(nèi)容、覆蓋范圍、質(zhì)量、管理方式、數(shù)據(jù)的所有者、數(shù)據(jù)的提供方式等信息的數(shù)據(jù),是數(shù)據(jù)與數(shù)據(jù)用戶之間的橋梁? 資源的信息? 編目信息? 管理、控制信息? 是一組獨(dú)立的關(guān)于資源的說明? 定義和描述其它數(shù)據(jù)的數(shù)據(jù)3、什么是 MARC、MARC 元數(shù)據(jù)?(掌握)MARC ( Machine Readable Catalog ),機(jī)器可讀目錄(簡稱機(jī)讀目錄)
24、,是用于在計(jì)算機(jī)條件下描述、 存儲(chǔ)、交換、控制和檢索著錄數(shù)據(jù)的標(biāo)準(zhǔn),已成為世界上流行最廣的書目元數(shù)據(jù)標(biāo)準(zhǔn)。MARC數(shù)據(jù),以代碼形式和特定格式結(jié)構(gòu)記錄在計(jì)算機(jī)存貯載體上、可由計(jì)算機(jī)進(jìn)行控制、處理和編 輯輸出的目錄。其實(shí)質(zhì)是一種元數(shù)據(jù)。? MARC數(shù)據(jù)的交換和共享通過 Z39.50協(xié)議實(shí)現(xiàn)。4、MARC 中56字段的用途(理解)856字段是專門用于記載電子信息資源定位與存取信息的字段,是在為網(wǎng)絡(luò)信息資源編目時(shí)才特有的字段。它包含定位與存取電子資源所需要的信息,第1指示符標(biāo)識(shí)存取方式;第 2指示符標(biāo)識(shí)資源關(guān)系5、什么是DC? DC包括幾個(gè)核心元素?(掌握)? DC是都柏林核心(Dubin Core)
25、的簡稱,全稱是都柏林核心元素集( Dubin Core Element Set) 核心DC指的是DC的15個(gè)核心元素:題名、主題、描述、來源、語種、關(guān)聯(lián)、覆蓋范圍、創(chuàng)建者、出版者、其他責(zé)任者、權(quán)限、日期、類型、格式、標(biāo)記等。第八章搜索引擎(重點(diǎn))1、搜索引擎的分類(掌握)根據(jù)檢索方式分類:分類目錄、關(guān)鍵詞搜索引擎、混合搜索引擎根據(jù)信息覆蓋范圍及適用用戶群分類:綜合搜索引擎、專用搜索引擎(垂直搜索引擎)根據(jù)搜索范圍分類:獨(dú)立搜索引擎、集成搜索引擎(元搜索引擎)2、什么是元搜索引擎(掌握)元搜索引擎又稱集合式搜索引擎。即將多個(gè)搜索引擎集成在一起,并提供一個(gè)統(tǒng)一的檢索界面。3、搜素引擎的發(fā)展趨勢(掌
26、握)個(gè)性化;智能化;整合化;垂直化;移動(dòng)化;開放化;4、搜索引擎的體系結(jié)構(gòu)(掌握)? 一個(gè)搜索引擎由以下五個(gè)部分組成:搜索器索引器索引數(shù)據(jù)庫-檢索器用戶接口5、搜索器的功能、工作原理及網(wǎng)頁選取策略(理解)含義:搜索器(Spider)俗稱蜘蛛、網(wǎng)絡(luò)機(jī)器人、爬蟲,是一個(gè)自動(dòng)收集網(wǎng)頁的系統(tǒng)程序。功能:搜索器的功能是日夜不停地在互聯(lián)網(wǎng)中漫游,搜集信息。不光搜集各種類型的新信息,還要定期更新已經(jīng)搜集過的舊信息,以避免出現(xiàn)死鏈。工作原理:搜索器首先將文檔格式過濾掉,變成純文本文件信息送回,然后將其放到網(wǎng)頁數(shù)據(jù)庫”中。該庫里還記錄了這些網(wǎng)頁的 URL,整個(gè)網(wǎng)頁的HTML代碼,網(wǎng)頁標(biāo)題等等信息。網(wǎng)頁選取策略?
27、 廣度優(yōu)先:是指網(wǎng)絡(luò)蜘蛛會(huì)先抓取起始網(wǎng)頁中鏈接的所有網(wǎng)頁,然后再選擇其中的一個(gè)鏈接網(wǎng)頁,繼續(xù)抓取在此網(wǎng)頁中鏈接的所有網(wǎng)頁。? 深度優(yōu)先:是指網(wǎng)絡(luò)蜘蛛會(huì)從起始頁開始,一個(gè)鏈接一個(gè)鏈接跟蹤下去,處理完這條線路之后再 轉(zhuǎn)入下一個(gè)起始頁,繼續(xù)跟蹤鏈接。? 高權(quán)重優(yōu)先:是指對(duì)搜索到的文檔集合進(jìn)行評(píng)級(jí),利用計(jì)算得到的結(jié)果從中挑選評(píng)級(jí)最高的鏈接 作為下一個(gè)搜索的對(duì)象。6、索引器的功能、具體工作步驟(理解)索引器的功能是理解搜索器所搜索的純文本信息,從中抽取出索引項(xiàng)(屬性),生成倒排索引文件,進(jìn)而建立索引數(shù)據(jù)庫。具體步驟:分析網(wǎng)頁:提取正文信息并進(jìn)行分詞;統(tǒng)計(jì)詞出現(xiàn)的頻率及位置;提取其它相關(guān)信息,如被其他 網(wǎng)
28、頁鏈接次數(shù)等;建立倒排索引:形成由文檔號(hào)到索引詞的正向索引;重組正向索引,建立從關(guān)鍵詞到文檔號(hào)集合 的倒排索引;相關(guān)度及重要性計(jì)算:通過關(guān)鍵詞頻率、位置、表面特征及超鏈分析等因素來決定某一個(gè)網(wǎng)頁針 對(duì)某一個(gè)關(guān)鍵詞的重要性。7、檢索器的功能、工作內(nèi)容(理解)檢索器的功能是根據(jù)用戶的查詢?cè)谒饕龓熘锌焖贆z出文檔,進(jìn)行文檔與查詢的相關(guān)度評(píng)價(jià),對(duì)將要輸出的 結(jié)果進(jìn)行排序。檢索器的工作包括查詢匹配、結(jié)果排序和文檔摘要三個(gè)部分。、搜索引擎對(duì)搜索結(jié)果進(jìn)行排序的依據(jù)及主要排序算法(掌握)依據(jù):內(nèi)容相關(guān)度一基于相關(guān)度算法(搜索引擎怎么評(píng)價(jià))網(wǎng)站或網(wǎng)頁權(quán)威度 一基于鏈接分析(即其它網(wǎng)站怎么評(píng)價(jià)) 網(wǎng)站或網(wǎng)頁的實(shí)用度
29、一基于用戶訪問模式(即用戶怎么評(píng)價(jià)) 排序算法:? PageRank (網(wǎng)頁等級(jí))算法? HillTop 算法? Hits算法9、用戶接口的功能(理解)用戶接口的作用是輸入用戶查詢、顯示查詢結(jié)果、提供用戶相關(guān)性反饋機(jī)制。專題多媒體信息標(biāo)引幾種主要多媒體數(shù)據(jù)標(biāo)引方法的基本原理外在特征標(biāo)引方法的典型代表標(biāo)簽法基本原理:? 將多媒體信息的外在特征作為標(biāo)識(shí)。以內(nèi)容分析為主的標(biāo)引方法編碼系統(tǒng)法 基本原理:? 采用某種特定的編碼系統(tǒng)標(biāo)識(shí)多媒體信息中分析出來的各個(gè)獨(dú)立對(duì)象,并根據(jù)對(duì)象間存在的聯(lián)系 進(jìn)行相應(yīng)的代碼拼接、組合,以完成多媒體信息的整體標(biāo)引。自由文本法基本原理:? 先將多媒體信息的內(nèi)容用文字進(jìn)行確切
30、的描述,形成描述性的自由文本,然后通過對(duì)文本內(nèi)容的 概念標(biāo)引,間接地完成對(duì)多媒體信息記錄內(nèi)容的標(biāo)引。特征描述法一一基本原理:? 從圖像、聲音等多媒體信息中捕獲人們感覺最明顯的特征,如圖像的形狀、顏色,音樂的基調(diào)、 序曲等主要特征,直接建立相應(yīng)的相似圖像”索引與 相似聲音”索引。全方位語義分析法一一基本原理:? 強(qiáng)調(diào)內(nèi)容特征與外在特征相結(jié)合,從整體到局部,從各個(gè)角度為各個(gè)對(duì)象建立全面的特征標(biāo)引; 并利用語義分析的方法,將各個(gè)部分、各個(gè)對(duì)象間豐富的語義聯(lián)系描繪成語義圖的形式,一起存 儲(chǔ)于數(shù)據(jù)庫中。專題自動(dòng)標(biāo)引(重點(diǎn))1、自動(dòng)標(biāo)引方法體系圖(掌握)動(dòng)類AH動(dòng)類自民漢語自動(dòng)分詞2、什么是標(biāo)引詞檢索、全
31、文檢索(掌握)標(biāo)引詞檢索:將用戶輸入的檢索詞與文獻(xiàn)的標(biāo)引詞進(jìn)行匹配。全文檢索(文本檢索):全文檢索不對(duì)文獻(xiàn)進(jìn)行任何標(biāo)引,直接通過計(jì)算機(jī)將自然語言檢索詞與文獻(xiàn)中的語 詞進(jìn)行匹配。3、什么是自動(dòng)抽詞?影響標(biāo)引詞選擇的因素有哪些?涉及的主要技術(shù)有哪些?自動(dòng)抽詞的方法有哪些 (重點(diǎn)是統(tǒng)計(jì)法) ?(掌握)含義:自動(dòng)抽詞標(biāo)引即由計(jì)算機(jī)自動(dòng)從文本中抽取詞或短語來表達(dá)信息資源的主題內(nèi)容。影響標(biāo)引詞選擇的因素:?詞語出現(xiàn)的頻率?出現(xiàn)的位置(如出現(xiàn)在標(biāo)題、文摘、圖表解說詞中等)?詞性?詞的價(jià)值?詞語的語言環(huán)境等。自動(dòng)抽詞涉及的主要技術(shù):?文本分詞技術(shù)?詞頻分析技術(shù)?權(quán)重評(píng)價(jià)技術(shù)自動(dòng)抽詞方法統(tǒng)計(jì)法?詞頻統(tǒng)計(jì)標(biāo)引法?加權(quán)統(tǒng)計(jì)標(biāo)引法?機(jī)器學(xué)習(xí)標(biāo)引法(統(tǒng)計(jì)學(xué)習(xí)標(biāo)引法)語言法?句法分析法?語義分析法人工智能法4、什么是自動(dòng)賦詞?(掌握)?所謂賦詞標(biāo)引就是從某種形式的受控詞表中選取詞語來表達(dá)文獻(xiàn)主題內(nèi)容。?自動(dòng)賦詞標(biāo)引則是指由計(jì)算機(jī)來自動(dòng)完成這一標(biāo)引過程。它與自動(dòng)抽詞標(biāo)引的最大區(qū)別就是,所使用的標(biāo)引詞來自于某一受控詞表,而不是來自文獻(xiàn)本身。包括:?(1 )基于關(guān)聯(lián)詞表的自動(dòng)賦詞標(biāo)引?(2 )基于中介詞典的自動(dòng)賦詞標(biāo)引5、什么是自動(dòng)歸類?基于詞的自動(dòng)歸類方法的主要思想?(掌握)?自動(dòng)歸類是指先分析待分類對(duì)象中的特征,將其與各種類別中對(duì)象具有的共同特征進(jìn)行比較,再將待分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 花圃養(yǎng)護(hù)及管理制度
- 茶企業(yè)設(shè)備管理制度
- 藥品室安全管理制度
- 大學(xué)生就業(yè)與創(chuàng)業(yè)教育-第十四單元抓住機(jī)遇-離成功更近一步
- 財(cái)務(wù)會(huì)計(jì)與長期股權(quán)投資管理知識(shí)分析
- 財(cái)經(jīng)基本技能(第3版)教學(xué)指南+課后習(xí)題答案
- 財(cái)務(wù)基礎(chǔ)會(huì)計(jì)學(xué)知識(shí)(一)
- 2025年春季學(xué)期國家開放大學(xué)《毛澤東思想和中國特色社會(huì)主義理論體系概論》終考任務(wù)二:大作業(yè)試卷1參考作答
- 幼兒小班我愛中國教案設(shè)計(jì)意圖
- 大班各領(lǐng)域目標(biāo)解讀與教學(xué)實(shí)踐研究
- 九師聯(lián)盟2024-2025學(xué)年高二下學(xué)期6月摸底聯(lián)考語文試題(含答案)
- 非遺文化掐絲琺瑯景泰藍(lán)
- 電動(dòng)葫蘆考試題及答案
- 2025廣東省勞動(dòng)合同樣本
- 2025年甘肅電投集團(tuán)公司招聘筆試參考題庫含答案解析
- 國家開放大學(xué)《Web開發(fā)基礎(chǔ)》形考任務(wù)實(shí)驗(yàn)1-5參考答案
- 中外美術(shù)評(píng)析與欣賞智慧樹知到期末考試答案章節(jié)答案2024年湖南大學(xué)
- 固體火箭發(fā)動(dòng)機(jī)制造工藝
- 浮選柱對(duì)有色金屬礦泥的浮選
- 脈沖震蕩檢測原理及意義
- 預(yù)應(yīng)力錨索專項(xiàng)施工方案
評(píng)論
0/150
提交評(píng)論