信息資源管理實驗報告_第1頁
信息資源管理實驗報告_第2頁
信息資源管理實驗報告_第3頁
信息資源管理實驗報告_第4頁
信息資源管理實驗報告_第5頁
已閱讀5頁,還剩15頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

信息資源管理實驗報告-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN信息資源管理

實驗報告11目錄1、實驗目的錯誤!未定義書簽。2、實驗準備錯誤!未定義書簽。3、布拉德福定律的驗證錯誤!未定義書簽。布拉德福定律簡介錯誤!未定義書簽。云計算期刊列表錯誤!未定義書簽。分區錯誤!未定義書簽。結果驗證錯誤!未定義書簽。結果解釋錯誤!未定義書簽。4、洛特卡定律的驗證錯誤!未定義書簽。洛特卡定律簡介錯誤!未定義書簽。洛特卡分布曲線的繪制錯誤!未定義書簽。5、普賴斯定律的驗證錯誤!未定義書簽。5.1普賴斯定律簡介錯誤!未定義書簽。5.2驗證過程錯誤!未定義書簽。6、文獻資源的時間分布特征錯誤!未定義書簽。.指數增長律錯誤!未定義書簽。普萊斯曲線7生長曲線8.逐漸過時規律錯誤!未定義書簽。7、齊夫定律的驗證錯誤!未定義書簽。7.1齊夫定律簡介錯誤!未定義書簽。.齊夫定律內容錯誤!未定義書簽。驗證手段錯誤!未定義書簽。#111、實驗目的1、檢驗布拉德福定律,分別采用區域、圖形表示法表示,并結合主題進行解釋;2、統計作者、作者單位,獲取核心或高產作者以及核心機構,檢驗洛特卡定律和普賴斯定律;3、繪制年度發文量曲線,獲取文獻資源的時間分布特征;4、選擇論文,通過分詞軟件進行分詞,再畫出詞頻分布曲線,驗證zipf定律或zipf修正定律,檢驗論文關鍵詞是否為高頻詞,并進行解釋。2、實驗準備2、實驗準備選擇主題:云計算選擇數據庫:CNKI中國知網3、布拉德福定律的驗證布拉德福定律簡介20世紀30年代,英國著名文獻信息學家布拉德福提出了有名的“布拉德福分散定律"(Bradford'slawofseattering),簡稱布拉德福定律或布氏定律。該定律描述了文獻分散和集中的經驗定律,其主要內容是:如果將科學期刊按其刊載某個學科主題的論文數量以遞減順序排列起來,就可以在所有這些期刊中區分出載文率最高的“核心"部分和包含著與核心部分同等數量論文的隨后幾區,這時核心區和后繼各區中所含的期刊數成1:a:a2的關系(a>1)。云計算期刊列表云計算序號期刊名稱文獻量1LECTURENOTESINCOMPUTERSCIENCE21872電腦知識與技術968

3PROCEEDINGSOFTHESPIETHEINTERNATIONALSOCIETYFOROPTICALENGINEERING9524PROCEEDINGSOFSPIE8365通信世界8176APPLIEDMECHANICSANDMATERIALS8157ARXIV7188通訊世界6929FUTUREGENERATIONCOMPUTERSYSTEMSTHEINTERNATIONALJOURNALOFESCIENCE59710FUTUREGENERATIONCOMPUTERSYSTEMS59611中國新通信58212ASTRONOMYASTROPHYSICS57813中國信息化57114PROCEDIACOMPUTERSCIENCE55415INTERNATIONALCONFERENCEONCLOUDCOMPUTINGTECHNOLOGYANDSCIENCE55016COMMUNICATIONSINCOMPUTERANDINFORMATIONSCIENCE54517ASTROPHYSICALJOURNAL54218JOURNALOFGEOPHYSICALRESEARCHATMOSPHERES51819計算機光盤軟件與應用50220網絡安全技術與應用49521IEEEINTERNATIONALCONFERENCEONCLOUDCOMPUTING48422IEEEACCESS46523ADVANCEDMATERIALSRESEARCH43324信息與電腦431

25數字技術與應用41526IEEEINTERNATIONALSYMPOSIUMONGEOSCIENCEANDREMOTESENSINGIGARSS40527信息通信39828無線互聯科技38829信息系統工程38730數字通信世界37831JOURNALOFPHYSICSCONFERENCESERIES37432PROCEEDINGSOFTHESPIE36633計算機與網絡35634ADVANCESININTELLIGENTSYSTEMSANDCOMPUTING34935計算機科學34836Informationweek:Themagazineforinformationsystemsmanagement34537CONCURRENCYANDCOMPUTATIONPRACTICEEXPERIENCE34338電腦迷33539電子世界33540MONTHLYNOTICESOFTHEROYALASTRONOMICALSOCIETY33241CONCURRENCYANDCOMPUTATIONPRACTICEANDEXPERIENCE32242IEEETRANSACTIONSONPARALLELANDDISTRIBUTEDSYSTEMS31743JOURNALOFSUPERCOMPUTING31544信息安全與通信保密309表1期刊列表

分區將選取的論文按其總數23545除以3,得到平均數23545一3=7848,計算得出核心區的期刊數為7種,論文數約為7293篇;相關區期刊數為15種,論文數約為8271篇;外圍區期刊數為22種,論文數約為7981篇(詳見表3)。其中核心區的期刊列表如下表所示:序號期刊名稱文獻量1LECTURENOTESINCOMPUTERSCIENCE21872電腦知識與技術9683PROCEEDINGSOFTHESPIETHEINTERNATIONALSOCIETYFOROPTICALENGINEERING9524PROCEEDINGSOFSPIE8365通信世界8176APPLIEDMECHANICSANDMATERIALS8157ARXIV718合計7293表2核心區期刊列表結果驗證1)區域表示法分區云計算期刊數量論文數量a(核心區)77293b(相關區)158271c(外圍區)227981表3“云計算”主題論文的布拉德福分布根據期刊論文列表以及分區列表可得,三個區中的期刊數量有以下比例關系nl:n2:n3=7:15:22~l:2:4(2)圖形表示法:布拉德福分散曲線結果解釋各學科專業文獻除了密集地登載于本學科的專業期刊,即“核心期刊”外,還登載于大量本專業的邊緣期刊,即“相關期刊”,以及更一般化的其他學科的期刊上。由于后兩者期刊的分散,難以查找特定專業的論文。此外,二次文獻在摘錄某一專業論文的時候,往往注重學科影響較大的“核心類”期刊,而忽視了非核心類的相關期刊,造成大量論文的重復摘錄,因此,任何學科的絕大多數專業文獻都集中于少數的本專業期刊內,但同時也散布于其他的相關期刊中,這是文獻離散性的體現。而文獻的集中性主要是由于“馬太效應”,或者說是成功產生成功的原則:一種期刊的文獻量越大、質量越高,作者就越愿意將自己的文章刊登在這些期刊上,形成了一種堆加效應。但是由于核心期刊發表文章的難度較大、各期刊文章數目眾多,所以核心區、相關區、外圍區的期刊數量才會在統計上呈現布拉德福所闡述的那種規律4、洛特卡定律的驗證洛特卡定律簡介洛特卡定律是由美國學者.洛特卡在20世紀20年代率先提出的描述科學生產率的經驗規律,它描述的是科學工作者人數與其所著論文之間的關系:寫兩篇論文的作者數量約為寫一篇論文的作者數量的1/4;寫三篇論文的作者數量約為寫一篇論文作者數量的1/9;寫N篇論文的作者數量約為寫一篇論文作者數量的1/n2……,而寫一篇論文作者的數量約占所有作者數量的%。該平方反比定律可表示為:如Y扮(C為常數,約為%)洛特卡分布曲線的繪制

10001)10001)以“云計算”為主題的論文數和作者數對應關系:65432>篇{數文論123456789101112131416212231作者數logYx(個)具體數據如下表(表4)所示:論文數作者數15692267312846451069核心高產作者748592102111121131141161211221311表4論文作者對應關系(2)以論文數x的對數為橫軸,以作者數Yx的對數為縱軸作圖,我們可以得到洛特卡分布曲線如下圖所示:32.521.510.50:存洛特卡分布曲線3)用最小二乘法計算擬合直線的斜率:xylogx1569022673128464510690.740.85921021111121131141161211221311平均值logylogx*logy(logx)200110000000000000000通過計算我們可以得出:斜率k值二,接近于洛特卡定律-2的斜率值,由此我們驗證了洛特卡定律與事實具有很好的吻合度。核心作者篇數核心機構篇數陳臣31北京郵電大學374馬曉亭22南京郵電大學191張云勇21電子科技大學164龔強16西安電子科技大學148龔強14武漢大學123于炯13華南理工大學113房秉毅12華中科技大學100馬建峰11吉林大學99陳俊10上海交通大學97王鵬10華北電力大學97陳清金9南京大學91王鳳領9國防科技大學84葛世倫8北京交通大學82王汝傳8北京工業大學82張少茹8東北大學78胡新平8哈爾濱工業大學77戰非8武漢理工大學76楊庚7湖南大學76趙莉7清華大學74高能7重慶郵電大學74EuiinChoi7重慶大學73彭志平6合肥工業大學71李陶深6東南大學65鄧仲華6中國科學技術大學60張云勇6胡志剛6吳吉義6馬錫坤6潘郁6馬洪江6表5核心作者及機構的分布5、普賴斯定律的驗證5.1普賴斯定律簡介普萊斯(Price)是著名的科學家與科學史學家,他在其代表名著《小科學,大科學》一書中曾有如下的論述:“在同一主題中,半數的論文為一群高生產能力作者所撰,這一作者集合的數量上約等于全部作者總數的平方根”。因此普賴斯定律也被俗稱為核心生產者分布的“平方根定律”。5.2驗證過程由以“云計算”為主題的論文數和作者數的對應關系圖表,我們可以得到以下信息:作者數量統計全部作者數高產作者數106830由于1068的平方根約等于,與30很接近,所以普萊斯定律得到驗證。6、文獻資源的時間分布特征.指數增長律普萊斯曲線普萊斯曲線的描述普賴斯曲線(Place'scurve)是指揭示科學文獻指數增長規律的曲線,是美國科技史學家普賴斯綜合、分析了大量的統計資料,以科學文獻量為縱軸,以歷史年代為橫軸,把各不同年代的科學文獻量在坐標系中逐點描繪出來,通過平滑方法所得出的一條曲線。它近似地表征了科學文獻隨時間增長的規律,即科學文獻量的增長與時間成指數函數關系(在普通直角坐標中呈指數曲線,在單對數坐標系中呈一直線),其數學公式表示為:F(t)=aebtF(t)表示t時刻的文獻量,a為統計初始時刻的文獻量,b是時間常數。驗證手段第一步:統計2007至2011年文獻發表量,繪制散點圖。第二步:利用表格工具選擇指數趨勢擬合,得到對應擬合的普萊斯函數F(t)=6.3556e1.5232t普賴斯曲線擬合圖生長曲線生長曲線描述文獻信息量的增長更趨近于生物的生長曲線,最開始時信息增長速度很快,符合指數增長規律;當文獻信息量增至最大值一半時,增長速率開始變慢;隨著時間推移,增長速度越來越慢,最終增長的極限為k值。數學方程為:F(t)=k/(I+ae-kbt)、其中,F(t)為文獻量,是時間t的函數,k表示文獻增長的最大值。驗證手段第一步:收集相關文獻信息,統計2007至今年度發文量并繪制年度發文量曲線。第二步:比對生長曲線和繪制的年度發文量曲線。一般情況下,學科文獻在不同時期的增長態勢有所不同。學科處于起步階段時,文獻量呈指數增長,這個時期的文獻壽命較短,如圖中起點至紅色數據點之間所示;在學科相對成熟階段,文獻指數增長率逐漸變小,曲線漸變平緩,這個時期的文獻壽命相對變長,如圖中紅色數據點所示,當文獻數量增加到約k/2(8901/2)時,曲線開始變緩,增長速率放慢;最終學科文獻將會進入一個穩定時期,如圖中紅色數據點至終點之間所示,當文獻數量增加到最大值k(8901)時,不再增長,甚至在之后的幾年內有所下降。年度發文量曲線附:年度發文量數據圖表(單位:篇).逐漸過時規律文獻老化的描述科技文獻隨著其"年齡"的增長,其內容日益變得陳舊過時,失去了作為科學情報源的價值,以及因此越來越少被科學工作者和專家們利用的過程。科學文獻老化既是一種客觀的社會現象,又是一個復雜的動態過程。文獻老化速度一般用半衰期進行衡量,"引用(引文)半衰期"被定義為"某期刊或學科現時引用的全部文獻(即參考文獻)中,較新的一半是在多長時間內發表的”。驗證手段為研究驗證文件老化規律,我們選取了2009年發表的《云計算:系統實例與研究現狀》,被引用次數2609次,知網被引用記錄1211條。第一步:以文獻現在正被引用次數為縱軸,以文獻出版年齡為橫軸,繪制曲線。第二步:對照文獻信息老化曲線分析所繪曲線。已知文獻信息老化曲線方程:C(t)二kew其中,k是常數,隨學科的不同而不同;a為老化率,C(t)表示發表了t年的文獻的被引次數。顯然,文獻自2014年以后的走勢符合文獻信息老化曲線。具體數據和根據每年引用次數繪制的折線圖如下圖所示:算是云計算正式在中國落腳的第一年,所以2010和2011年被引用頻次上升較快但起點不高。7、齊夫定律的驗證7.1齊夫定律簡介齊夫定律是美國哈佛大學教授齊夫()在1935年對文獻詞頻規律的研究得出的,他認為把一篇較長的文章中每個詞出現的頻次按遞減的順序排列,其數量關系特征呈雙曲線分布。該定律是計量學的基本定律,廣泛應用于情報檢索用詞表的編制和情報檢索系統中文檔結構的設計。.齊夫定律內容將一篇5000字以上的文章中按每個詞出現的頻次按逐漸遞減的順序排列起來,用自然數依次給這些詞編號,出現頻次最高的為1級,其次2級,再次3級依次下去直到D級,用r表示詞等級序號,f表示某詞在文章中出現的頻次,則有:fr=C(C為常數)驗證手段第一步:尋找莫言的《紅樹林》和云計算英文論文《ABerkeleyViewofCloudComputing》,利用jieba包用python進行分詞得出詞頻表。第二步:利用已得到的詞頻表繪制散點圖。第三步:利用表格工具對散點進行曲線擬合,驗證論文關鍵詞是否是高頻詞匯,并用python制作詞云。對《紅樹林》的分析《紅樹林》詞頻分析珠虎叔么們己爸說道是人后到面么像子是長虎動嵐樣個上珍大馬什你自爸地

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論