范例基于學術動態的科研熱點檢索_第1頁
范例基于學術動態的科研熱點檢索_第2頁
范例基于學術動態的科研熱點檢索_第3頁
范例基于學術動態的科研熱點檢索_第4頁
范例基于學術動態的科研熱點檢索_第5頁
已閱讀5頁,還剩7頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

深圳大學研究生課程論文題目基于學術動態的科研熱點檢索成績專業軟件工程課程名稱、代碼信息檢索1312011081210年級2012姓名黃瑞娟學號2121230204時間2013年7月任課教師賈森

目錄1信息檢索概述 21.1 信息檢索目的和意義 21.2 信息檢索的工具和比較 21.3 信息檢索的方法 32實驗檢索說明 32.1檢索方法和流程 32.2關鍵字介紹 43.關鍵字引導檢索 43.1檢索說明 43.2檢索結果比較 44.刊物引導檢索 54.1檢索說明 54.2檢索結果比較 65.檢索結果的分析和實驗方向的確定 65.1結果的比較分析 65.2檢索實驗方向的確定 66.DifferentialEvolution相關檢索 76.1檢索基本情況 76.2分析檢索結果 76.3引文報告 97.實驗總結 11

基于學術動態的科研熱點檢索黃瑞娟2121230204軟件工程(秋)1信息檢索概述信息檢索目的和意義信息在有了語言和文字的交流之后開始累計,歷史、創作、革命等使得信息量大大增加,而互聯網時代使得信息的交互速度和交互數量更為劇烈:2010年全球產生的數字化信息總量超過1W億的吉比特。信息量大,增長快,形式多樣包括視頻、音頻和文字等,傳播的速度因微博等社交應用而更快更廣,同時又有各國文化對信息的再改造,又存在信息老化的加速這么個影響,重復的、無用的信息干擾等。如何在日益呈爆炸式增長的信息里頭找到自己所需要的資訊也催生了信息檢索這一學問。信息包括多個領域,如人類政治、經濟、自然科學、生命科學、系統科學等幾乎所有科學領域,與物質、能量、相互作用等許多重要的基本概念密切相關,也與認識層次的思維、智能等相關,通過圖書、期刊、報告、互聯網等作為載體進行傳播,在這里我們將就如何在學術科研里利用信息檢索進行討論。信息檢索的合理利用可以幫助我們與時俱進,跟蹤學術最新動態,除了出席會議和閱讀期刊外通過互聯網獲取學術最新動態更為方便,同時還有統計信息。足夠豐富和精確的信息檢索使得科研時間大大的降低,站在巨人的肩膀上吸取經驗從而提高工作效率。全面的檢索可以幫助我們了解研究的領域深度和廣度,降低重復研究已經存在的科研的可能性,節省經費精力。有了對所有統一領域的科研了解,才能找到創新的突破口,在未被涉及和完善的領域上有所作為。如果能夠檢索到市場的起伏原因信息,還可以幫助指定高明的市場謀略,這些檢索到的信息將為決策提供科學依據。通過檢索信息獲取有效知識,篩選評價后對有價值的信息進行分析管理,再合理利用。信息檢索的工具和比較網絡的學術資源有搜索引擎,學科門戶網站和學術資源導航,圖書館聯機公共目錄,科研報告,政府出版物等。不同的科研領域有不同的搜索資源,大分類的有綜合性信息源(CNKI,萬方,Elsevier),自然科學信息源(nature,science,SCIE),人文科學信息源(SSCI,CSSCI,CNKI社科),和專門學科類信息源(RSC,ACS,REAXYS,SCIFINDER,MRS)。根據需求到相關的信息源進行搜索將得到最為實時全面的領域信息?,F有眾多會議和期刊,評判一個會議或者期刊的優與缺可以從影響因子、引文數目進行分析。一個信息源所能夠收錄的目錄是有限的,與會議和期刊的評判標準不同,信息源的評判標準從覆蓋率、統計能力和易用性進行分析。通常有價值高可用性的都是收費的,通過注冊會員或者按篇進行收費。而檢索效果也有可以進行評價,從檢全率(檢出相關文獻與系統相關文獻的百分比)、檢準率(檢出相關文獻量與檢出文獻總量的百分比)漏檢率(漏檢相關文獻量與系統相關文獻總量的百分比)和誤檢率(誤檢文獻量與檢出文獻總量的百分比),這些與信息源的系統易用性和用戶對檢索關鍵字的敏感以及系統的使用熟練程度相關下面將主流的信息源進行比較,包括綜合的、開放的、中文的和計算機領域的信息源,如表1所示。表1主流信息源的比較信息源收錄情況說明GOOGLE幾乎所有文獻涵蓋幾乎所有領域的所有文獻,包括會議、期刊、專利等。是一個全面綜合性的搜索工具,如果用戶擁有該期刊文獻的訪問權限,可以直接點擊進入全文閱覽頁面。如果已經知道搜索的關鍵字,GOOGLE是很好的工具。A47W預印本文獻涉及物理、數學、計算機等學科的預印本信息,幫助科研人員跟蹤學科最新的研究進展,避免研究工作重復,每日更新內容。OpenJ-Gate8529種期刊超過5716種學術期刊通過同行評議,目前最大的開放獲取期刊門戶,提供開放獲取期刊的免費檢索和全文鏈接,包括學校、科研機構、生物醫學等。CNKI幾乎所有中文文獻中文文獻覆蓋率幾乎所有,也有14W的外文文獻。如需查找中文文獻,這個是很全面的網站,但同時也是收費的。WOK集成平臺為科研人員研究工作流整合的創新研究平臺,包括開題檢索、查新、跟蹤、尋找未來學習和工作機會等提供幫助,是一個完整的科研工作流平臺CiteSeer50W篇論文涉及的內容為計算機與信息科學領域,查看引用情況和相關文獻以及時間分布,并且可以瀏覽下載全文。信息檢索的方法信息檢索的方法有兩種,一種是以關鍵字引導檢索,另一種是以期刊引導的檢索。標題引導檢索是指直接使用若干關鍵字包括標題,作者等進行檢索的方法,前提是已經了解某個領域的知識并且知道這個領域可能存在的關鍵字有哪些,或者是這個領域的前沿科研人員的信息。通過關鍵字直接檢索,獲得復合關鍵字的信息條目。而以期刊引導的檢索,則是直接輸入期刊的名字,以查看某個期刊所發布的文獻條目,根據該期刊的所發布的內容找到自己感興趣的文獻,前提是了解各個期刊的名稱以及所涵蓋的領域內容。前者對于領域知識的要求比較高,好的關鍵字的組合可以搜索到與檢索目的要求復合的文獻,也就是檢索結果的質量因關鍵字而參差不齊。而后者需要對各期刊的背景了解更多,如領域內容,影響因子,引文數目和自引數目等,到備受好評的期刊上查找到的文獻通常質量會更好。2實驗檢索說明2.1檢索方法和流程 本次實驗將就兩種檢索方法對計算機技術與軟件的內容進行檢索,找到最近較為熱門的科研領域后再針對該領域進行更為完整的檢索和認知。 關鍵字引導的檢索,從最近幾年學院為學生所準備的學術會議以及上課所傳授的熱點內容進行檢索,在WOK里檢索每項關鍵字,查看從2004年至2013年工10年見的文獻數量以及引用次數,得到該類科研內容是個朝陽科研領域還是夕陽科研領域。過程如圖1所示。圖1關鍵字檢索過程 刊物引導檢索,從JCR最近公布的影響因子排序列表找到最近影響較為大的刊物,進入各刊物查看發布的文獻以及內容,找到較多被涉及的關鍵字,并查看今年被引用的次數和發布文獻的數量,以此找到推斷該科研內容是朝陽科研領域還是夕陽科研領域,過程如圖2所示。圖2期刊引導檢索2.2關鍵字介紹 近期學院為學生準備的學術會議內容包括云計算(Cloudcomputing),物聯網(Internetofthings),大數據(Bigdata),數據挖掘(Datamining),涉及的算法有聚類算法K-means(clustering),分類算法SVM(classifiers),同時本人較為感興趣移動開發技術Android和IOS,數據挖掘算法貝葉斯網絡(Bayesnet)。為了確保檢準率,同一個領域的知識用多個檢索關鍵字。關鍵字列表如下表2所示。表2領域及關鍵字領域關鍵字云計算Cloudcomputing,cloudgambit,cloud-based,物聯網Internetofthings,physicalinternet,web-connectedthings大數據Bigdata數據挖掘Datamining聚類算法k-means,kmeans分類算法SVM,supportvectormachines貝葉斯網絡Bayesnet,Bayesiannetwork,beliefnetwork移動開發Android,ios,Objective-C3.關鍵字引導檢索3.1檢索說明 關鍵字引導的檢索根據前面表2的領域和關鍵字進行搜索,在WOK的WebofScience那里進行檢索,檢索范圍選擇“主題”,以限制強關聯,使得搜索得到的結果更為復合內容。限制里面的時間跨度選擇“從2004年至2013年”共10年的跨度,使得關注較為新的更新。3.2檢索結果比較 檢索的結果以四個角度進行比較:關鍵字領域,檢索的結果數目,主要來源的國家,每年發表的文獻數目柱狀圖。根據表2的關鍵字,得到檢索的結果對比如表3所示。表3檢索結果一云計算物聯網大數據數據挖掘40519613035671中國(23.48%)中國(53.29%)美國(40.92%)中國(23.38%)表4檢索結果二聚類算法k-means分類算法SVM貝葉斯網絡bayesnet移動開發6913718341801915中國(22.15%)中國(43.28%)美國(23.80%)美國(27.89%) 從表3和表4可以看出,云計算和物聯網最近興起的話題,在近4年才開始有更多的研究,在中國研究的更多。大數據在美國是一邊倒研究的也是興起的領域,而數據挖掘開始慢慢回落,但是數據挖掘的聚類算法K-means和分類算法Bayesiannetwork仍然還是較多人研究的,SVM因研究已到了一個無法突破的境地而回落。移動開發在最近兩年呈現爆炸式的研究,這個是與前面學術性質的研究不一樣,這個是應用方面的研究。4.刊物引導檢索4.1檢索說明 刊物引導檢索需要到JCR,通過兩個領域獲取影響因子前十的刊物,再根據刊物的內容選擇其中兩個刊物查看近年的影響因子情況,再到WOK以刊物搜索獲得較多引用且新的文章的關鍵字,以此確定主題。所選擇的刊物領域softwareengineering和Theoryandmethod,與本人的軟件工程較為相關,如圖3和圖4所示。圖3softwareengineering的刊物影響因子排序圖4Theoryandmethod的刊物影響因子排序4.2檢索結果比較 通過從2012的影響因子,近年影響因子起伏狀態,以及該領域被引用較多的文獻的共同關鍵字來進行比較,如表5所示。表5各大期刊影響因子及關鍵字IEEETSOFTWAREENGJACMIEEETEVOLUTCOMPUTACMCOMPUTSURV2.5882.3704.8103.543codeanddesignsmellsPrincipalcomponentsDifferentialEvolutionAnomalydetection 根據找到的關鍵字再次以關鍵詞引導檢索,獲得近年研究的情況,如表6所示。表6期刊引導的關鍵字檢索結果代碼與設計主成分分析差分進化算法異態檢測68702942112934加拿大(16.18%)中國(27.42%)中國(25.10%)美國(34.63%) 根據期刊引導關鍵字檢索的結果可以看出,codeanddesignsmells雖然在柱狀圖上看是一個照樣科研領域,但是研究的人數較少;而主成分分析Principalcomponents的研究較為穩定,但是在近兩年的數目也相對較少了;差分進化算法DifferentialEvolution的研究是比較穩步上升的,異態檢測Anomalydetection的研究跟主成份分析比較相像,也是較為穩定的但是相對來說高峰期在前兩年。5.檢索結果的分析和實驗方向的確定5.1結果的比較分析 綜合關鍵字引導檢索和期刊引導檢索,可以看出某些研究領域在某些地區呈現一邊倒的研究現象,也就是某個領域在一個國家可能會出現過度重視的現象,這樣的學科可能受到的政府推動作用比較大,如物聯網在中國是收到推動作用的研究領域,又或者是真的在一個國家里面會有更好的基礎和學術氛圍催生整個領域的發展在這個國家有更好的前景,如SVM。關鍵字引導的檢索受到的外圍影響會比較大,因為是人為地選擇熱點,而期刊引導的檢索會更加的客觀,雖然在關鍵字的選擇上會有所影響,但是可以從多引用的文獻得出受關注的程度,從而得到關鍵字在進行檢索。 5.2檢索實驗方向的確定 從期刊的影響因子來看,IEEETEVOLUTCOMPUT的4.810是最高的,而且近年的影響因子也比較穩定,ACMCOMPUTSURV的影響因子則呈現從9下降至3.5,每況愈下。而結合期刊得到的關鍵字DifferentialEvolution的趨勢,可以看到是穩步上升的,是個照樣科研領域,因此從上面的搜索對比可以得到本次實驗最后需要進行的詳細檢索的關鍵詞是DifferentialEvolution。6.DifferentialEvolution相關檢索6.1檢索基本情況 通過“主題”包含關鍵字“DifferentialEvolution”的檢索按照相關性的排序如下圖5所示,從2004年到2013年共10年間有4211篇文獻,相關研究的領域有動態差分進化算法在某些領域的應用,基于差分進化的最近原型分類,給予隨機定位的差分進化算法,優化的差分進化算法等,總結起來就是通過優化差分進化算法結合其他理念使得在某個問題或者某個領域有更好的表現。圖5檢索基本信息6.2分析檢索結果 點擊wok的“分析檢索結果”進入檢索結果分類分析的頁面,接下來將比較重要的類別進行分析。圖6為按作者進行排序,知道DASS和SuganthanPN在這個領域的研究比較多。圖6按作者排序 通過選擇作者的到這兩個作者被引用最多并且感興趣的的4篇文章,添加到WOK的endnoteWeb如圖7。圖7添加到endnoteWeb 研究最多的國家是中國,前五的其次國家是印度,美國,愛爾蘭,臺灣。如圖8所示。圖8研究國家排序 從基金贊助機構可以看出,中國對與這個領域的贊助是很多的,因為中國的大力支持而使得在這個領域中國的研究人員比其他國家更多,資金贊助可以影響到研究國家排序。圖9資金贊助排序 按照來源出版物排序,可以看到從我們一開始就找到的期刊IEEETEVOLUTCOMPUT是排在21位,更多的是在IEEECEVOLUTCOMPUT在各個會議上發布的收集,通過谷歌搜索與其相關的會議時間和官網進行更多的了解。圖10發布機構排序6.3引文報告 點擊右方的“引文報告”,進入引文相關信息頁面,選擇時間段為2009-2013年,可以看到近3,4年的研究文獻數目為3024篇,被引用最多的前面6篇,期貨總第1,3,5篇已經被放在endnoteweb里面,可以說明在按照作者排序的時候,通常發表較多的作者他們在這個領域的造詣也是相對更高的。圖10引文數目與發布作者排序是相關的 選擇上面被

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論