信息組織知識點匯總_第1頁
信息組織知識點匯總_第2頁
信息組織知識點匯總_第3頁
信息組織知識點匯總_第4頁
信息組織知識點匯總_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、.知識點匯總第一章1、信息組織的定義以用戶需求為導向,依照信息體自己的屬性特點,信息工作者或用戶依照必定的原則、方法和技術,將凌亂無章的信息整理成為有序的信息會合的活動和過程。2、信息組織的原理基根源理:假如有若干自然狀態(tài)的無序信息資料,將這些信息資料依照某種屬性特點擺列成一個序列,并且需要使用信息資料的用戶能將自己的需求變換成相應的信息資料屬性特點,并在排列后的信息資料序列中找到自己所需要的信息資料。信息組織由信息著錄標引(信息描繪揭露)和信息序化兩個工作環(huán)節(jié)構成。3、信息組織的容一般而言,信息組織包含四項容。1.信息挑選(甄別實用信息,剔除無用信息)2.信息剖析(對信息的外面特點進行細化、

2、發(fā)掘、加工整理并歸類)3.信息描繪與揭露(對信息資源的部分主題容、形式特點及物質(zhì)形態(tài)等描繪維度進行剖析、選擇、記錄的過程)4.信息整序與儲存(依照必定的格式溫次序儲存在特定的載體中)4、信息組織的種類按信息的認識層次區(qū)分,信息組織有三種種類1.語法信息組織(研究語言符號之間的形式疇的結構規(guī)則,如:字順法、代碼法、地序法、時序法)2.語義信息組織(研究信息的容特點的組織方法,如:分類法、主題法)3.語用信息組織(研究環(huán)境與使用者的不一樣而不停變化的信息群,如:權重值信息組織法、概率組織法)信息組織的作用控制整序提高質(zhì)量流傳利用節(jié)儉成本第二章1、熵(entropy)Word文檔.最早是熱力學上的一

3、個符號,是一種丈量在動力學方面不可以做功的能量綜述。熵指的是雜亂的程度,負熵是物質(zhì)系統(tǒng)有序化、組織化、復雜化狀態(tài)的一種量度。香農(nóng)第一次將“熵”引入到信息論中,在信息論中,“熵”能夠用作某件事不確立度的量度。信息量越大,系統(tǒng)結構越規(guī)則,功能越完美,熵就越小。利用熵的看法,能夠從理論上研究信息的計量、傳達、變換、儲存等活動。學術界當前廣泛接受的看法是“信息即負熵”。2、邏輯學原理在信息組織中的應用看法之間的關系(圖略):相容關系同一關系:是指有同樣外延的兩個看法之間的關系。包含關系(屬種關系):是指這樣兩個看法,此中一個看法完好被包含在另一個看法的外延里,是另一個看法外延的一部分。包含另一個看法的

4、看法(外延廣的看法)對被它包含的看法(外延窄的看法)來說是上位看法或屬看法,被包含的看法對包含它的看法來說是下位看法或種看法。交錯關系:是指有一部格外延重合的兩個看法之間的關系。不相容關系并列關系:是指同一個上位看法(屬看法)之下的幾個不存在共有外延的下位看法(種看法)之間的關系。矛盾關系:這是看法并列關系的一種特別形式,是指外延總和等于其上位看法所有外延的兩個并列看法之間的關系,非此即彼,沒有第三種狀況。對峙關系(反對關系):也是看法并列關系的一種特別形式,是指外延總和小于其上位看法所有外延的兩個并列并且是互相對峙的看法之間的關系。第三章1、規(guī)語言定義:規(guī)語言從自然語言出發(fā),依據(jù)信息描繪與信

5、息檢索的需要,從自然語言中挑選出特定的詞匯來搜羅和指示看法,并依照必定的規(guī)則對自然語言進行預先規(guī)而形成的人工語言,是符號化的看法表示系統(tǒng)。規(guī)語言也稱為受控語言、人工語言。規(guī)語言是人工控制的語言系統(tǒng),詞匯控制和句法控制是核心所在。規(guī)語言的詞匯控制1)詞匯的選擇:優(yōu)選、壓縮,保存擁有檢索意義的詞匯,盡可能地控制詞匯規(guī)模。2)詞形的控制:實現(xiàn)詞義和詞形的獨一性。3)詞義的控制:采納加限制詞或加說明的方法讓詞匯與看法一一對應。4)詞間關系的控制:采納索引、圖示系統(tǒng)或參照系統(tǒng)來揭露字典中語詞間關系。規(guī)語言的句法控制1)引用序次/組配序次:明顯性引用序次、疇職能引用序次、上下文附屬引用序次(2)控制符號:

6、聯(lián)號、職號、關系符號、加權例:537+621.3(3)句式變換:檢索詞輪排轉變。(機檢時代已經(jīng)變得不足輕重)Word文檔.2、規(guī)語言的種類:依照結構原理分分類語言:等級系統(tǒng)式、分面組配式、等級-組配式主題語言:標題法、單元詞法、敘詞法代碼語言:化合物分子式、檔案號、專利號按其表記的組合使用法分先組式語言:語詞表記在編表時就固定組配好后組式語言:檢索時進行暫時組配3、自然語言(重點詞、自由詞和出此刻文章題名、綱要、正文和參照文件中的擁有實質(zhì)意義的語詞)自然語言的中興“以用戶為中心”自然語言的應用:自然語言辦理、自然語言標引、自然語言檢索。自然語言的不足:(1)看法與語詞不是一一對應的關系。2)看

7、法之間的關系擁有隱含性,缺少對詞間關系的揭露與描繪。3)檢索效率真接與用戶的認知水平有關。后控制詞表填補自然語言的不足“后控制模式”=“標引不控制”+“檢索后控制”自然語言系統(tǒng)中的三種后控制詞表方式:(1)用戶檢索前經(jīng)過閱讀后空詞表選擇適合的檢索詞結構檢索式/檢索負擔較重;2)由系統(tǒng)自動履行調(diào)整檢索式/受限于自然語言辦理技術;3)系統(tǒng)依據(jù)用戶輸入的自然語言檢索式從后控制詞表中給出有關詞,供用戶選擇來調(diào)整檢索式/交互式,是當前最常用的一種后控方式。4、分類法的種類1)等級列舉式分類法:依照傳統(tǒng)的知識分類系統(tǒng)編制,也稱為系統(tǒng)分類法規(guī):杜威十進分類法DDC美國國會圖書室分類法LCC中國圖書室分類法2

8、)分面組配式:依照看法的剖析與綜合原理,構成“分面-亞面-類目”的結構系統(tǒng)例:冒號分類法(ColonClassification)3)列舉組配式:在等級列舉式的詳細類表的基礎上,采納組配方式的分類法規(guī):國際十進分類法UDC5、分類法的結構系統(tǒng)Word文檔.復分表作用:(1)減小類表的篇幅;(2)增強類表的靈巧性;(3)增強類表的規(guī)律性。復分表分通用復分表(標準復分表、地域復分表、時代復分表)和專類復分表7、分類法的標志系統(tǒng)標志符號往常能夠分為純真和混淆兩種。幾種特別的標志方法(認識其含義和原理):八分法、雙位制、借號法、預留空號法、雙位加點法8、外國常用分類法:中國圖書室分類法杜威十進分類法D

9、DC美國國會圖書室分類法LCC國際十進分類法UDC冒號分類法(ColonClassification,CC)重點:名稱、大概概略、基本類目、標志符號制度等。比如:中圖法有五個基本部類,22個基本大類,混淆制標志符號,8個通用復分表9、主題法(原理)主題法是直接以表達主題容的詞語作主題表記、以字順為主要檢索門路,以主題為中心集息資源,并經(jīng)過詳細的參照系統(tǒng)等方法揭露詞間關系的標引和檢索方法。主題法的種類依照選詞方法區(qū)分:標題法元詞法敘詞法重點詞法10、敘詞看法組配式敘詞法最基本的原理敘詞之間的關系等同關系(正式敘詞非正式敘詞)參照符號YD等級關系(上位看法主題辭下位看法主題辭)參照符號FS有關關系

10、(類緣關系,語義有關)參照符號CWord文檔.、外國常用主題辭表美國國會圖書室標題表(LCSH),世界上使用最寬泛、最具影響的標題辭表漢語主題辭表中國分類主題辭表、漢語主題辭表款目樣例:第四章1、幾個看法:著錄是指在編制文件目錄時,對文件容和形式特點進行剖析、選擇和記錄的過程。款目是指依照必定的規(guī)則和方法,對文件特點與編目業(yè)務信息所做的記錄,包含描繪項目、檢索點、編目業(yè)務注記三部分信息。記錄是指表述事物的特點,擁有完好的含義,冷靜和使用的角度能被作為一個整體來識其余一組有關數(shù)據(jù)項的組合。2、著錄信息源著錄信息源(sourceofinformation)是指款目或記錄中著錄信息的根源。明確著錄信

11、息源是正確、一致地進行文件著錄的保障。主要信息源優(yōu)先選作著錄信息根源,一般是文件信息自己。如圖書的題名頁、頁、封面、書脊、附錄;正文、目次、序跋文字和容概要等。參照信息源文件殘破、特點不詳或有誤的情況下選擇文件信息自己以外的工具文件或參照文件來填補主要信息源不足的問題。規(guī)定信息源著錄項目的特定根源,依照規(guī)定信息源對頂?shù)娜菁跋群笮虼蝸磉x擇使用信息源。3、外國主要的幾個著錄規(guī)則Word文檔.國際標準書目著錄(ISBD):國際標準書目著錄是為了實現(xiàn)文件著錄的一致和規(guī)而擬訂的一套供各種類文件著錄取的國際標準。ISBD的發(fā)展和保護工作由國際圖聯(lián)書目控制部的編目組負責擔當。在文件著錄規(guī)則的編制體例上,IS

12、BD采納了總則與分則相聯(lián)合的方式,形成了一整套完好的文件著錄規(guī)則。AACR2(英美編目條例(第2版))中國文件著錄標準文件著錄總則(p158著錄格式)4、MARC機器可讀目錄Machine-ReadableCatalogue,簡稱MARC,是以代碼形式結構和特定結構記錄在計算機儲存載體上的,可用計算機辨別與閱讀的目錄。MARC的記錄格式結構由記錄頭標區(qū)、地點目次區(qū)、數(shù)據(jù)字段區(qū)3個部分構成5、元數(shù)據(jù)元數(shù)據(jù):(對于數(shù)據(jù)的數(shù)據(jù))供給對于信息資源或數(shù)據(jù)的一種結構化的數(shù)據(jù),是對信息資源的結構化的描繪。元數(shù)據(jù)的作用(功能)1)描繪:依據(jù)元數(shù)據(jù)的定義,它最基本的功能就在于對信息對象的容和地點進行描繪,從而為

13、信息對象的存取與利用確立必需的基礎。都柏林核心元素集所供給的,是信息對象的辨別而言最為基本的描繪信息;而機讀目錄格式,則為信息對象供給詳細級其余描繪。2)定位:元數(shù)據(jù)包含有關網(wǎng)絡信息資源地點方面的信息,因此可確立資源的地點所在,促進了網(wǎng)絡環(huán)境息對象的發(fā)現(xiàn)和檢索。3)找尋/檢索:辨別資源的價值,發(fā)現(xiàn)其真實需要的資源。4)選擇:對信息對象的棄取,選擇合合用戶使用的資源5)評估:價值評估,作為存取與利用的參照。6)管理:權限管理、電子署名、使用管理等管理方面的信息。7)保存:包含詳細的格式信息、制作信息、保護條件、變換方式、保存責任等容,進而支持對資源的保護和長久保存。元數(shù)據(jù)種類依照元數(shù)據(jù)的功能:管

14、理型元數(shù)據(jù)(保護和管理信息資源的元數(shù)據(jù),包含信息資源的版本信息、使用權限、獲得條件和方式、數(shù)字署名、歷史保存信息等)描繪型元數(shù)據(jù)(描繪和辨別信息資源特點的元數(shù)據(jù),包含題名、作者、第一版日期、主題辭、分類號及資源之間關系等)結構型元數(shù)據(jù)(文件的結構或標志、數(shù)據(jù)集和其余被描繪的信息體,包含軟/硬件文檔、技術性信息等)6、都柏林核心元數(shù)據(jù)集(DC)認識其背景及有關,元素及其含義簡單都柏林核心集包含15個元素,分為3個種類:容、知識產(chǎn)權和實例化(1)有七個元素用于描繪容:Coverage、Description、Type、Relation、Source、Subject&Title(2)描繪知識產(chǎn)權的元

15、素共四個:Contributor、Creator、Publisher&Rights(3)實例化元素共四個:Date、Format、Identifier&LanguageDC的修飾詞Word文檔.7、元數(shù)據(jù)描繪框架RDF基本的RDF數(shù)據(jù)模型由3類對象構成:資源(resource)屬性(properties)述(statements)使用以資源為節(jié)點的有向圖方式顯示,此中資源和屬性值都是一節(jié)點表示的,屬性以有向弧表示。(p187RDF圖示法)第五章1、分類標引法step1:類目辨析;step2:配置幾個看法:仿分復分2、主題標引方式:整體標引全面標引對口標引綜合標引剖析標引3、主題標引程序:1查找利用已有的標引成就;2主題剖析;3主題看法的變換;4主題標引記錄;5審查4、主題結構剖析主題結構剖析是指剖析信息資源的各要素及它們之間的互相關系,國主要采納湘生的主題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論