




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、一一. .布拉德福定律布拉德福定律二二. .齊普夫定律齊普夫定律三三. .洛特卡定律洛特卡定律四四. .布布- -洛洛- -齊分布系齊分布系文獻信息中的離散分布規律一、布拉德福定律 布拉德福定律的產生背景布拉德福定律的形成布拉德福定律的基本原理布拉德福定律的理論發展1.布拉德福定律 的產生背景l布拉德福Samuel Clement Bradford ,1878-1948著名的文獻學家和化學家創立了布拉德福文獻分散經驗法則,是文獻計量學的主要奠基人多產作家,著有大量關于分類理論與實踐,編目理論的著作1948年,完成巨作文獻學文獻分散規律的系統概述1.布拉德福定律 的產生背景l文獻分散是普遍的客觀
2、現象一門學科的論文分散在其他學科的期刊雜志上屢見不鮮。如何找出其分散的規律性是關鍵所在。l科學統一性原則每一門學科都或多或少與其他任何一門學科相關聯對一個專家有用的論文,不僅出現在這個專家所在學科的專業期刊上,也可以出現在“其他學科”的期刊上。1.布拉德福定律 的產生背景現象:300種文摘和索引期刊每年摘登的750000篇文章,由于漏摘、漏標和同時存在的無意義重復,致使僅載有250000篇不同的文章,而兩倍于此數量的500000篇文章則全部漏摘、漏標而與讀者絕緣。猜測:專業文獻除密集地登載于相應的專業期刊(約1/3),還登載于大量的專業邊緣(相關的)期刊(約1/3)和更一般化的期刊(約1/3)
3、 ,后兩者過于分散而難以查找等原因導致文獻大量丟失。假設:任何一學科的絕大部分專業文獻都集中于少數的相應專業期刊內,但是同時也散布于其它的相關期刊之中,其散布的態勢則與該學科研究范圍的大小有關。2.布拉德福定律 的形成1933年,科學博物館樣本:期刊應用地球物理學潤滑學領域2.布拉德福定律 的形成右表為科技期刊按其載文量遞減順序排列的表格統計結果A為期刊數量B為相應期刊所載的論文 數量C為A項的累積和AD為B項的累積和BE為期刊累積量的對數 即lgC=lgA。3.布拉德福定律 的基本原理布拉德福的兩種處理方法:區域表示法(文字表述法)圖形表示法(經驗法)3.布拉德福定律 的基本原理區域表示法(
4、文字表述法)布拉德福根據專業論文載于三類不同期刊的設想將表中的數據經加和后按載文累積量劃分為a、b、c大致相等的三個區域,即每一區域所包含的相關論文數量相等。兩個領域的期刊分區表兩個領域的期刊分區表分區期刊載文數數量(篇/年)應用地球物理學潤滑作用期刊數量論文數量期刊數量論文數量a94298110b5949929133c2584041271524N14NN13.布拉德福定律 的基本原理發現相應期刊的累積量(C) 之比近似構成等比數列;即: 第一區(核心區):數量不多但效率最高的 種期刊第二區(相關區):數量較大、效率中等的 種期刊第三區(邊緣區):數量最大而效率最低的 種期刊三個區域中的期刊數
5、量關系 a為布氏系數 1p2p3p2321:1:aannn(潤滑作用)應用地球物理學224:4:1127:29:8)(5:5:1258:59:93.布拉德福定律 的基本原理布氏定律的表示發現:各區的期刊數,逐區上升每種期刊的載文量逐區下降核心區信息密度最高,每種期刊平均刊載27.5篇論文相關區次之,每種期刊平均載文5.5篇論文邊緣區最低,每種期刊平均刊載1篇論文分區分區期刊數期刊數論文量論文量1(核心區)82202(相關區)40=8 52203(邊緣區)2202582003.布拉德福定律 的基本原理布氏定律的文字描述如果將科技期刊按其刊載某專業論文數量多少,以遞減順序排列,則可分出一個核心區和
6、相繼的幾個領域,每區刊載的論文量相等,此時核心期刊和相繼區域期刊數量呈 的關系.:12nn)(:1:2321為公比nnnnnn3.布拉德福定律 的基本原理圖形表示法取期刊累積量的對數為橫坐標,以相應論文的積累量為縱坐標,得到了圖中的AB兩條曲線。通過觀察,布拉德福認為這兩條曲線除下彎部分外,上半部分可以認為是一條直線。3.布拉德福定律 的基本原理設P1為該曲線的直線部分與曲線部分的分界點; 且令 則, 因為橫軸為對數坐標,所以有:rOXOYYYYY111223,SXXXX2312)(102lg)(10lg)(10lg2rrr的累積期刊數為第一、第二、第三區或刊數為第一、第二區累積期或為第一區的
7、期刊數或)()(sssrsrr)(:110:10:10:A102)2()(s為公比,得令AAAsrsrr3.布拉德福定律 的基本原理結論如果將某專業刊載文獻按載文量的遞減順序排列,并將其劃分為三個載文量相等的區域,則相應的期刊累積數量呈等比關系。顯然第一區,即P1以下的下彎部分,其載文密度最大,布拉德福將其稱為核心區域。)(:1:2為公比AAA3.布拉德福定律 的基本原理布拉德福認為造成這種文獻離散分布勢態的根本原因在于:科學的整體性原則科學是在時間上先后相繼、各個專業間內容相聯的整體。作為科學知識載體的各專業文獻之間也必然會存在這樣的聯系,文獻的增長與老化是前者的體現,而專業文獻散布于相關專
8、業期刊中的事實卻是后者的反映學科專業之間聯系的緊密程度不一整體性原則還認為科學中各個學科專業之間聯系的緊密程度不一。此在文獻中的表現就是刊載文獻在相應期刊中的不均勻分布3.布拉德福定律 的基本原理格魯斯下垂:格魯斯(Q.V.Groos)認為布氏定律的圖形應該為三個部分。上升的曲線部分直線部分彎曲下垂部分下垂部分稱為布魯斯下垂加拿大的波普(Adrew Pope)進行統計分析也證明了圖形由三部分組成反映理論值與實際值的差異期刊數和文獻量統計不足,未能代表全部文獻3.布拉德福定律 的基本原理區域描述與圖形描述的比較經過數學證明布氏定律的兩種形式存在著不能統一的矛盾從數學和實際觀察來看,圖像描述更接近
9、于文獻的實際分布情況就文獻計量學的規律說明,不論是區域描述還是圖像描述,都只能近似的揭示文獻分布的規律,無法精確的符合統計數據4.布拉德福定律的理論發展l創立階段1934年,布拉德福的論文特定主題的信息源(Sources of Information on Specific Subject)1934-1948年,無人問津1948年,文獻學的出版,使其理論開始傳播l理論研究階段(60年代)“布拉德福熱”:相關研究空前活躍形成兩個學派:區域派和圖像派l全面發展階段(60年代以后)由純粹的理論研究向應用領域滲透理論與應用并列的全面發展情形4.布拉德福定律的理論發展l維克立的兩個推論布氏定律不只局限于
10、劃分三個區域,其證明可將等級排列的期刊劃分為任意多個區域圖像表達式的推論(維氏公式) 為第一區到第k區的期刊累積數量 m為劃分的區域數 v為分散系數布氏公式的推廣形式(布氏公式) 12131211.:1.:mmVVVnnnn),.3,2(1mknk12321.:1.:mmaaannnn4.布拉德福定律的理論發展l萊姆庫勒對布氏定律的描述發展了區域描述方法從布氏定律的文字描述(區域描述)出發,推導出按等級排列的期刊中論文分布的規范式公式萊姆庫勒累積分布函數的推導 F(x)表示在x的比例下,期刊論文數與期刊論文總數的比例。p例如,如果要得到比例為80%的論文,將F(x)=0.8和相應的 的值代入,
11、反求出x,即所需期刊的最少數量 ,a是布拉德福系數, =b-1x表示用來定義全部期刊中含有某一指定數量相關論文的最少期刊與期刊總數之比 )1ln()1ln()(xxF11)(bbfXf2ab 4.布拉德福定律的理論發展l布魯克斯對布氏定律的描述1969年,英國著名情報學家布魯克斯利用數學公式描述了布氏定律R(n):對應于n的相關論文累積數n:期刊等級排列的序號a:第一級期刊中相關論文數R(1)c:核心區的期刊數N:等級排列的期刊總數k:參數,分散曲線中直線部分的斜率, 當n足夠大時,k=Ns:參數,其數值等于圖形直線部分反 向延長線與橫軸交叉點的n值4.布拉德福定律的理論發展l例子右表為所收集
12、的有關維生素學論文 在相應在期刊中分布的統計數據和 以布魯克斯公式為數學模型的計算 值。表中n為按載文量遞減順序排列 的期刊序號,R(n)為前n種期刊的論 文累積量。預期的預期的全檢數全檢數量量4.布拉德福定律的理論發展驗證實際統計數據是否符合布拉德福定律: 由布魯克斯公式可得:查表知R(5)=269,若滿足布拉德福定律,則查表可知R(25)=537,R(52) R(25)因此可初步認定上述數據符合布拉德福定律。)(2ln2ln)(22nRsnksnknR5382692)5(2)5(2 RR4.布拉德福定律的理論發展驗證查驗該項統計的完整性: 經統計已知,有關維生素論文在相應期刊中分布的s值為
13、1,在表中, 選 n=25為參考點,則有: R(25)=Nln25/1=537 所以 N=537/ln25=167(種) 則有論文的理論值總量為: R(167)=167ln167/1=853(篇) 與表中的實際查到值比較,實際查到期刊總量為146種,實際查到文獻 總量為730篇,則統計結果的完整性是值懷疑的。 4.布拉德福定律的理論發展l布氏分布理論的發展趨勢主要的研究工作進行具體分析,驗證布氏經驗法則,并實際應用尋求普遍而精確的經驗分布公式和理論解釋,并取得了較大的發展當前研究方向和有待解決的問題運用大量的統計數據、嚴密的數學方法,確立或尋求更為精確的規范化的數學模型深入研究布氏分布的機制,
14、尋求科學統一的理論解釋努力結合實際,開展應用研究,提高圖書情報服務的效率 二、文獻信息詞頻分布規律齊普夫定律l齊氏定律形成的基礎頻率詞典(詞表)每一個詞在一定長度的文件中出現的頻率兩個最基本的數量指標(詞的出現頻率、詞的序號)艾斯杜(J. Estoup,速記員)1916發現較長的文章中,詞頻分布的定量化形式Nrr=C(常數)詞的序號:1,2,r,D (1:絕對頻率最大的詞,D:絕對頻率最小的詞)詞的絕對頻率:n1,n2,nr,nD 二、文獻信息詞頻分布規律齊普夫定律l齊氏定律的內容齊普夫定律fr r=c fr:頻次,r:等級序號齊普夫定律的“最省力法則”的解釋任何語言中,凡是使用頻率最高的詞,
15、功能總是不會太大;因為其本身在這個場合中價值小,因而傳遞它們所需要的“力”就不大。 二、文獻信息詞頻分布規律齊普夫定律l齊氏定律的圖像描述 橫坐標:等級序號r縱坐標:相應的頻率f等級r與頻率f均取對數虛線:lnr+lnf=lnc實線:blnr+lnf=lnc斜率為b二、文獻信息詞頻分布規律齊普夫定律l齊氏定律的應用文獻標引和詞表編制信息檢索在圖書情報管理中的應用 三、文獻信息作者分布規律洛特卡定律l洛特卡定律概述誕生1926年,洛特卡最先研究了科學文獻數量與著作數量之間的關系,并創造性地提出“科學生產率”的概念,即指在一定時間內科學工作者在科學上所表現出的能力和工作效果,通常用其生產的科學文獻
16、數量來衡量。 在提出科學生產率概念的同時,洛特卡就圍繞它進行了統計研究。選用化學文摘與物理學史一覽表來研究科學家的著述數量,以此經過數據統計、歸納分析及運用數學工具的推算得出洛特卡定律,即寫有x篇論文的作者頻率與x的平方呈反比。 頻數頻數頻率頻率三、文獻信息作者分布規律洛特卡定律l洛特卡定律公式表述設f(x)為寫x篇論文的作者數占作者總數的比例,c為某主題領域的特性常數,洛特卡統計的指數a大約為2,對于倒冪法則的這個特例式變為這就是科學生產率的“平方反比定律”的表達式 axcxf/)(2/)(xcxf三、文獻信息作者分布規律洛特卡定律l洛特卡定律理論意義1926年洛特卡(Darka)定律創立至
17、今已整整80年,是文獻計量學中創立最早的一個定律,洛特卡定律也是文獻信息計量學的經典定律之一。為文獻計量學的誕生奠定了一定的基礎,其創立是值得紀念的。l洛特卡定律的命運由于多種原因,洛特卡定律沉睡了30多年,后來由于普賴斯等人的發掘,自60年代起引起人們的重視。今天,洛特卡定律仍然經常被科學學家、情報學家等引證和研究。 引自科學的計量研究 三、文獻信息作者分布規律洛特卡定律l洛特卡定律的基本應用反映科技勞動成果狀況可從統計或估算著者數量來預測文獻數量的增長速度和文獻流向科學估計勞動規模預測科學家數量的增長和科學家發展的規模及趨勢掌握科學論文的作者隊伍研究科學家的活動規律,研究人才的著述特征,合
18、理編制著者索引,規劃檢索刊物體系 四.布-洛-齊分布系l布拉德福定律、齊普夫定律和洛特卡定律是三個最基本的定律, 被人們喻之為文獻計量學的“三巨頭”,多年來一直受到圖書情報工作者的高度重視。值得指出的是, 這三個定律之間有很多相似之處, 存在著一定的聯系。研究對象期刊上刊載的論文文章中每個詞的出現頻次科學工作者的著述分析單元期刊數 單詞量 著者群計量方法都是通過對文獻的調查和統計,取得數據并進行分析歸納來定量地認識文獻情報流。四.布-洛-齊分布系數學表達式同一類型布拉德福定律:R(n)= klog(n/s)齊普夫定律f(x)= k/r 及其修正式f= k/rn洛特卡定律f(x)= k/x2如果
19、把數學式中的主體看作箱, 把某一特定量看作投入箱中的球, 那么對于布拉德福分布、齊普夫分布、洛特卡分布來說, 箱好比雜志、詞匯、著者; 球好比相關論文、單詞、著者所寫的論文。四.布-洛-齊分布系布拉德福分布是積累分布,R(n)表示n以前的累積數對R(n)= klog(n/s)微分dR(n)/dn= k/n與齊普夫公式一致,齊普夫修正式f= k/rn 作變換r=(k/f)1/a微分得dr/df =(k1/a /a) f-(1+1/a)取絕對值若a=1,即狹義的齊普夫形式與洛特卡定律一致。因此,這種類型的分布可統一用下式來表示: f(n) = k/nn 式中k,a為常數,一般來說,1a2; f(n)為含有n個具體事項的主體來源數的分布密度。由此可知, 布拉德福分布、齊普夫分布、洛特卡分布的一致性是顯而易見的 四.布-洛-齊分布系情報分布模型相似:由上述三定律的數學表達式可以看出,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 豆類食品加工企業生產計劃與調度考核試卷
- 肉類加工過程中的質量監控技術考核試卷
- 新生兒喂養指導要點
- 院前急救與護理要點解析
- 誼安呼吸機510臨床操作與產品解析
- Guamecycline-生命科學試劑-MCE
- 單站閃電定位儀在哪些場景應用
- 新疆棉紡織產業發展現狀與趨勢調研報告
- 2025年下半年保險行業策略報告:新增負債成本顯著下降板塊兼具基本面及資金面催化
- 新能源汽車在城市公共交通中的應用與城市能源結構轉型報告
- 夏季駕駛員安全培訓
- 《納稅籌劃(第7版)》課件 第7章 其他稅種的納稅籌劃
- 四川省南充市高坪區五年級下學期期末綜合試題
- 兒童被忽視量表(CNS)
- 回購商鋪方案
- 美制螺紋對照表
- B站營銷生態與效果向營銷資源組合【嗶哩嗶哩】【通案】【互聯網】【社交媒體營銷】
- 01-BUFR格式應用指南(試用版)
- 固定式升降機安全操作規程
- 輔酶Q10的基本生理作用課件
- 西方音樂史課后習題答案
評論
0/150
提交評論