自學-從0開始學CiteSpace_第1頁
自學-從0開始學CiteSpace_第2頁
自學-從0開始學CiteSpace_第3頁
自學-從0開始學CiteSpace_第4頁
自學-從0開始學CiteSpace_第5頁
已閱讀5頁,還剩11頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

自學——從0開始學CiteSpace研一時,有門課的課程作業之一是介紹一種方法論,這里把當時的課程作業分享出來,教你如何從0開始一步一步操作CiteSpace。CiteSpace作為文獻計量法的文獻處理工具,入門還是比較簡單的。使用工具最難的一步就在于快速入門,盡管這篇文章和這些圖的質量遠遠沒有達到發表論文的水平,不過還是有價值的。希望對想要了解CiteSpace、有使用需求的人有幫助。明天會再更新一篇利用CiteSpace分析的較為完整的課程論文。目錄一、CiteSpace——基于文獻計量法設計的數據可視化軟件(一)研究方法——文獻計量法(二)CiteSpace是什么(三)如何下載CiteSpace二、以CNKI為例進行案例分析(一)數據處理1.

獲取數據

2.

轉換數據(二)建立項目/設置參數(三)可視化結果1.關鍵詞共現圖譜的方法論基礎、含義及分析2.聚類的功能三、教師駐校培養模式研究的計量學分析結果(一)教師駐校培養模式研究文獻年度分布(二)作者分布四、教師駐校培養模式研究熱點分析(一)研究熱點主題分析(二)研究領域分析五、教師駐校培養模式研究的演進路徑教師駐校培養模式研究發展及熱點演進的文獻計量學分析——基于CitesSpace的可視化分析本文旨在通過借助工具CiteSpace(可視化文獻分析軟件),來歸納和展望國內外對于教師駐校培養模式研究的發展歷程、宏觀趨勢以及研究熱點變化,達到論述文獻計量法這一方法的目的。一、CiteSpace——基于文獻計量法設計的數據可視化軟件(一)研究方法——文獻計量法文獻計量法是以文獻體系和文獻計量特征為研究對象,采用數學、統計學等計量研究方法,研究文獻情報的分布結構、數量關系、變化規律和定量管理,進而探討科學技術的某些結構、特征和規律的一門學科。CiteSpace作為文獻計量法中的一項文獻處理工具,能幫助我們快速分析文獻。(二)CiteSpace是什么CiteSpace(可視化文獻分析軟件)是由美國雷德賽爾大學信息科學與技術學院的陳超美博士與大連理工大學的WISE實驗室聯合開發的科學文獻分析工具,該軟件將文獻計量法、信息可視化法以及數據挖掘法結合起來,通過繪制知識圖譜以探尋不同學科領域研究熱點與趨勢演化的關鍵路徑及知識轉折點。利用CiteSpace可以對文章作者、機構和關鍵詞進行分析。例如,在CiteSpace中使用關鍵詞共現來探究該領域的研究熱點,關鍵詞突現預知研究前沿,關鍵詞時區了解研究趨勢、發文機構分析和發文作者的分析.CiteSpace的設計理念分為哲學角度和概念模型兩個方面。從哲學角度來看,該軟件首先參照了波普爾的三個世界理論,即整個世界被劃分為物理世界(世界Ⅰ)、精神世界(世界Ⅱ)、客觀知識世界(世界Ⅲ)。世界Ⅰ是外在接觸到的具體世界;世界Ⅱ是人類腦中的精神世界,存在隱形知識;世界Ⅲ是人類創造的知識體系。傳統看世界的方式是人類通過世界Ⅱ來感知世界Ⅰ,形成世界Ⅲ。CiteSpace是通過將世界Ⅲ中的知識內容進行知識圖譜可視化來認識世界Ⅰ,即借助世界Ⅱ通過世界Ⅲ來認識世界。其次是托馬斯·庫恩的科學革命的結構。庫恩認為,科學的推進是建立在科學革命上的一個往復無窮的過程。這個過程中會出現一個又一個的科學革命,人們的認識通過科學革命而接納新的觀點,而新觀點的重要性在于對我們所觀察的對象能否作出更另人信服的解釋。庫恩的科學革命是新舊科學范式的交替和興衰??茖W認識中會出現危機,而危機所帶來的新舊范式的轉換都將在學術文獻里留下印記。庫恩的理論給我們提供了一個具有指導意義的框架,如果科學進程真像庫恩所洞察的那樣,那我們就應該能從科學文獻中找出范式興衰的足跡。第三,普賴斯科學前沿理論:“論文會因為引證關系而形成網絡,人們可以借助于圖論和矩陣的方法來加以研究…論文一定會聚集成一團,而形成幾乎繪制成地圖的'陸地’和'國家’”?;谄召囁沟恼摂?,才形成了CiteSpace的概念模型。第四,博特的結構洞理論,即社交網絡中不是每個人和所有其他人都有直接聯系,如果如此,便有了結構洞,即結構上的不完備。這種情況下,信息在網絡中的流動受到其結構上的約束。每個人在網絡中所能接觸到的信息內容不再相同,傳遞和接受的時間也會出現差別。Burt發現位于結構洞周圍的人往往具有更大的優勢。CiteSpace也是基于此理論來識別關鍵節點和關鍵位置第五,信息覓食理論,該理論用來解釋模擬人們在網絡環境中的信息搜尋行為,對獲取信息的效率進行運算,以最小搜索成本獲取最大利益。該理論用于CiteSpace網絡結構探測,開發出探求知識演變路徑的方法和技術。CiteSpace的概念模型認為,“如果把某一領域的研究前沿定義為一個研究領域的發展狀況,那么研究前沿的引文就形成了相應的知識基礎。”在CiteSpace中研究前沿和知識基礎被定義如下:研究前沿是指某個科學領域中的施引文獻群組。從兩個方面體現研究前沿的特征:1.施引文獻群組本身的內容;

2.施引文獻群組引用的參考文獻。

具體可以體現為:1.施引文獻群組使用的關鍵詞;

2.施引文獻群組引用的參考文獻。

知識基礎是指某個學科領域中相對于研究前沿文獻集的所有前期文獻集合。具體表現為文獻共被引聚類。在此基礎上,理論和技術的發展為CiteSpace提供了基礎——理論基礎:引文分析;技術基礎:信息可視化。目前CiteSpace支持以下數據庫導出的文獻題錄及參考文獻數據:圖1.CiteSpace支持數據庫導出的文獻題錄及參考文獻數據

當前研究中研究英文文獻主要采用webofscience數據庫,中文數據主要采用CNKI和CSSCI數據庫。研究者可根據自身的需求選擇數據來源,并注意其所要求的格式和文件名。需注意的是:所有手動下載的數據文件的文件名必須以download開頭,如download2020.txt。若需要對被引文獻進行分析,必須選擇具有參考文獻的數據庫,否則共被引部分的功能將無法實現。(三)如何下載CiteSpace1、下載網址:/~cchen/citespace/download/2、進入網站,點擊download彈出保存后點擊保存。3、解壓安裝包,雙擊“StartCiteSpace_Windows.bat”文件,進行CiteSpace的安裝。由于軟件運行需要java環境,驗證java版本地址為:https:///zh_CN/download/installed8.jsp.安裝適配電腦的java地址為:https:///en/download/.選擇適合自己的語言環境輸入相應的數字后點擊回車。之后根據其提示,一直點擊“下一步”安裝即可。安裝完成之后,再雙擊“CiteSpaceV.jar”文件,等待一會兒,本文使用5.7.R2(64-bit)版本,操作界面如下:圖2.StartCiteSpace界面在問號后輸入2選擇中文語言跳轉進入軟件,在是否同意在文章中引用CiteSpace相關的文獻中點擊“Agree”,即可成功打開CiteSpace進入以下界面(圖3.CiteSpace主界面),界面主要分為上方的菜單欄、左側上方的工程區、左側下方的運行進度區和右側的功能選擇區。圖3.CiteSpace主界面菜單欄是CiteSpace的功能與參數區,包括File(文件)、Projects(項目)、Data(數據)

Network(網絡)、Visualization(可視化)、Geographical(地理化)、OverlayMaps(疊加分析)

Analytics(文獻網絡分析報告)、Text(文本)、Preferences(偏好設置)、Tutorials(教程)、Resources(資源)、Community(社區)、Help(幫助)、Donate(捐獻)。工程區又叫操作區,該區域主要用于新建項目,點擊New即可進入新工程的設置界面。運行進度區可以展示CiteSpace在運行過程中的數據操作。功能選擇區包括1、Timeslicing時間切片區,可以選擇待分析文獻的起止時間;2、TextProcessing文本處理區(包括Termsource選擇聚類詞來源和Termtype聚類詞類型);

3、Nodetypes網絡配置功能區,這部分可以選擇節點類型,選擇將直接決定會生成什么樣的圖譜(在其中,不同顏色的選項代表不同的含義:藍色部分關于合作網絡分析,對象可以是作者、機構或國家,如可以分析哪些作者、機構或文章的發文量比較多,哪些作者之間的合作比較多;綠色區是共性分析,其對象可以是主題、關鍵詞、來源或WOS的分類,其中主題和關鍵詞回答的問題是:哪些主題詞或關鍵詞出現的次數比較多,以及哪些詞常常在同一篇文章中出現,反映了研究領域的熱點詞;紅色部分是共被引分析,對象可以是參考文獻、文獻作者和期刊,回答的問題是哪些文獻、作者和期刊被引用的次數最多,哪些常常被一起引用,這樣的問題則反映了內容的相關性;灰色部分則是耦合分析);4、Links連接強度計算(·Strength分析對象數據之間的連接強度·Scope范圍);

5、Selectcriteria閾值選擇標準;

6、Pruning剪枝方式選擇(優化結果);

7、Visualization可視化模式。二、以CNKI為例進行案例分析本文以中國知網(CNKI)為例,以“教師駐校模式”為檢索關鍵詞用CiteSpace進行數據分析。分析過程包括以下幾個部分:數據處理、建立項目/設置參數、可視化結果、結合圖譜結果進行初步解讀、分析結果并完成撰寫報告。本文著重對前三個過程展開論述。(一)數據處理1.獲取數據

(1)在桌面建立一個名為“data

for

citepace”(可任意命名)的數據庫,用來專門存放citespace的數據。在其下以自己的研究主題再命名一個子文件夾(如圖4,本文命名為“教師教育”),在子文件夾下新建四個文件夾:“input”、“output”、“project”和“data”。圖4.新建“data

for

citespace”的數據庫(2)進入中國知網(舊版)進行數據下載,在高級檢索中限定主題或者關鍵詞(本文在高級檢索中輸入“教師駐校模式”的關鍵詞,選擇中文文獻)。(3)點擊“全選”之后有35篇文獻,篩選并剔除無直接相關的文獻兩篇,分析剩余33份與研究主題直接相關的。若要導出大批量數據,可以在“每頁顯示”中選擇50,再根據研究需要,如剔除報告、會議等相關文獻。進入下一步,在“導出/參考文獻”跳轉的頁面“請點擊這里”中進行篩選。圖5.選擇數據(4)點擊“導出/參考文獻”選項,點擊“文獻導出格式”-“Refworks”-“導出”,將這份下載的txt文本格式的文件命名為download1,并放入“input”的文件夾中。圖6.文獻輸出圖7.

命名導出的參考文獻2.轉換數據(1)打開5.7.R2(64-bit),等待片刻后進入主界面(圖3),點擊Data(Import/Export)選擇CNKI——————————————————————————(2)Data→Import→download1(3)Inputdirectory選擇“input”文件夾,Outputdirectory選擇“output”文件夾點擊CNKIFormatConversion2.0,完成轉換。可點擊output文件夾檢查數據轉換與否。(4)把output里的數據復制到“data”文件夾下(二)建立項目/設置參數1、新建項目?;氐街鹘缑?,在控制面板菜單欄中點擊File建立新項目,在“Title”中命名英文格式的項目,本文命名為Teacher

Residency。2、功能選擇區進行參數選擇。時間切片區From2001JANTo2020DEC,NodeTypes選擇Keyword,Pruning在循進中選擇Pruningslicednetworks。點擊”GO!”出現圖8選項。3、點擊可視化操作”Visualize”圖8.可視化選項(三)可視化結果圖9.菜單欄的工具功能簡介1.關鍵詞共現圖譜的方法論基礎、含義及分析共現分析的方法論基礎是心理學的鄰近聯系法則和知識結構及映射原則。鄰近聯系法則是指曾經在一起感受過的對象往往在想象中也聯系在一起,以致于想起它們中的某一個的時候,其他的對象也會以曾經同時出現時的順序想起。關鍵詞共現、作者共現、機構共現、國家共現、論文共現、期刊共現都是共現分析的一種。其中,作者共現分為作者合作網絡分析、作者共被引分析[作者同被引];機構共現分為機構合作網絡分析;國家共現又分為國家合作網絡分析;論文共現分為文獻共被引分析[文獻同被引]和文獻耦合。參數中可以看見網絡的節點數、邊數和網絡密度。圖中所示標注的點即節點,一個節點代表一個關鍵詞。邊數是關鍵詞之間的連線數,關鍵詞之間的連線是指關鍵詞在同一篇文獻中出現過,因此二者會有一根連線。圖中圓圈大小代表關鍵詞,頻數越大圓圈越大。線條代表關鍵詞之間的聯系,線條顏色與圖中上方的年份相對應,用于標志每年都有哪些關鍵詞。關鍵詞是對一篇文獻的核心概況,分析關鍵詞可以對文章主題進行窺探。一篇文獻中的多個關鍵詞必然存在著某種聯系,那么這種聯系可以用共現的頻次來表示。一般認為,詞匯對同一篇文獻中出現的次數越多,則代表這兩個主題之間的聯系越緊密。頻次是關鍵詞出現的次數,年份代表某個關鍵詞最早出現的年份是什么時候。其中閾值越小,顯示的數量越多;閾值越大顯示的關鍵詞越少。綜上所述,共詞分析法,即利用文獻集中詞匯或者名詞短語共同出現的情況,來確定這篇文獻集所代表學科中各主題之間的關系。統計一組文獻的主題詞兩兩間在同一篇文獻出現的頻率,便可形成一個由這些詞對關聯所組成的共詞網絡。2.聚類的功能共詞分析法的原理是通過利用文獻集中詞匯對或名詞短語共同出現的情況,來確定該文獻集所代表學科中各主題之間的關系。掌握以上原理,是為了獲得學科之間各主題之間的關系,由于主題通過使用關鍵詞所表示,它的本質便是關鍵詞之間的聯系。同時,聯系越緊密的關鍵詞會形成一個小團體,進而能把小團體之間的關鍵詞進行歸納總結,然后總結出一個主題,再對主題進行詳細論述。以上操作步驟的本質是做聚類分析。點擊”K”查看聚類,這一功能是當看不清或看不懂圖譜時可以利用的方法。圖10.關鍵詞顯示(聚類之間的間距可以在面板中調整)需要補充的是,上圖并沒有顯示全部聚類,原因是CiteSpace默認當關鍵詞<10時,不顯示一部分聚類??梢栽凇盕ilters”里取消”ShowtheLargestConnectedComponetOnly”這個選項,再重新聚類。也可以根據自己的需求設置確定數量的聚類,此時操作”Clusters”-”ShowtheLargestKClusters”后輸入自己需要的所含關鍵詞最多的前幾個聚類數;或者用序號來表示聚類。圖11.部分聚類顯示圖12.全部聚類顯示三、教師駐校培養模式研究的計量學分析結果(一)教師駐校培養模式研究文獻年度分布文獻發表數量的變化能夠在一定程度上反映某一研究領域的發展狀況。研究對近二十年來我國教師駐校模式研究文獻的年度分布情況進行統計,詳見下圖。(二)作者分布對文獻作者情況進行計量學分析,不僅可以找出教師駐校培養模式研究領域的核心作者,也可以看出該領域學者之間的交流、合作情況。運行CitesSpace,設置時間跨度為“2000-2020年”,時間切片為1,節點類型中選擇“作者”,閾值為Top=50,關鍵詞引文數(C),關鍵詞被引數(CC)、關鍵詞共被引數(CCV)均設置為0、1、20,最終得到網絡節點為42,連線數為14,密度為0.0163的作者共現知識圖譜,詳見下圖。四、教師駐校培養模式研究熱點分析(一)研究熱點主題分析關鍵詞是一篇文章核心內容的凝練,且能反映這一領域的研究熱點。[2]本文采用CitesSpace對教師駐校培養模式研究文獻中出現的關鍵詞進行分析,以了解近二十年來我國教師駐校培養模式的研究熱點,繪制關鍵詞知識圖譜,詳見圖10。由圖可以看出熱點的詞匯有“教師教育”“教師培養”“駐校培養”“薄弱學校”“城市教師駐校模式”,且這些熱點詞匯之間的聯系也較為緊密。為進一步明確我國特殊教育教師研究熱點主題,將主題詞中介中心性及頻次導出并制作成表格,詳見表1。表1高頻關鍵詞頻次、中心性關鍵詞排序序號關鍵詞頻次序號關鍵詞中心性1教師教育131教師教育0.512美國122美國0.383城市教師駐校模式53培養模式0.254培養模式44城市教師駐校模式0.155駐校模式45薄弱學校0.156教師培養46駐校教師0.157城市教師37教師培養模式0.118模式38教師培養0.099城市校區39教育碩士0.0910薄弱學校310全日制教育碩士0.08中介中心性代表著以該關鍵詞為主題的研究對網絡圖譜中其他關鍵詞的中介效果,中介中心性越高,其影響越顯著。[3]因此,該研究將頻次與中介中心性共同作為研究熱點的判斷依據。頻次排名較高且中介性大于0.1的關鍵詞包括“教師教育”“美國”“培養模式”“城市教師駐校模式”“薄弱學?!薄敖處熍囵B模式”等。這些關鍵詞基本反應我國近二十年來教師駐校模式研究的熱點及核心主題。(二)研究領域分析關鍵詞聚類可將共現知識圖譜中復雜的連線關系進行分析,以形成當前教師駐校模式主要研究領域。在調節關鍵詞共現知識圖譜的基礎上,標識每個聚類,詳見圖11。第一個聚類為“城區教師駐校模式”。第二個聚類為“培養模式”。第三個聚類為“教師培養”。第四個聚類為“模式探析”。第五個聚類為“教師”。第六個聚類為“全日制教育碩士”

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論