文學術不端行為檢測系統介紹與演示_第1頁
文學術不端行為檢測系統介紹與演示_第2頁
文學術不端行為檢測系統介紹與演示_第3頁
文學術不端行為檢測系統介紹與演示_第4頁
文學術不端行為檢測系統介紹與演示_第5頁
已閱讀5頁,還剩101頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、學位論文學術不端行為檢測系統介紹與演示同方知網(北京)技術有限公司科研誠信管理系統研究中心2022-5-3大 綱一引入學術不端行為檢測的必要性與緊迫性二實施學術不端檢測的可行性:原理與方法介紹三TMLC系統主要功能演示介紹四應用推廣情況介紹與用戶反饋意見分析五TMLC系統服務模式介紹六下一步工作計劃大 綱一引入學術不端行為檢測的必要性與緊迫性二實施學術不端檢測的可行性:原理與方法介紹三TMLC系統主要功能演示介紹四應用推廣情況介紹與用戶反饋意見分析五TMLC系統服務模式介紹六下一步工作計劃政策的必要性引入學術不端檢測的必要性培養良好的科研誠信對于研究生的一生至關重要如果不能從研究生培養環節遏制

2、學術不端行為,帶有不端治學態度的研究生畢業后,不斷涌入各級研究機構,不端行為就將形成“長江之水,滔滔不絕”,就不能從根本上扭轉不端行為不斷惡化的事態。大 綱一引入學術不端行為檢測的必要性與緊迫性二實施學術不端檢測的可行性:原理與方法介紹三TMLC系統主要功能演示介紹四應用推廣情況介紹與用戶反饋意見分析五TMLC系統服務模式介紹六下一步工作計劃可行性分析資源可行性以中國學術文獻網絡出版總庫為比對資源總庫收錄了期刊、學位論文、會議論文、報紙、年鑒、工具書、專利、外文文獻、學術文獻引文等與科學研究、學習相關的主要資源。擁有學術期刊7000余種,期刊全文文獻2480萬篇,72萬篇優秀碩士學位論文,9.

3、6萬篇博士學位論文;重要會議論文106萬篇;報紙500多萬篇;國家標準、專利、SPRINGER數據庫可行性分析(2)技術可行性CNKI自適應多階指紋分析技術(AMLFP)TPI文本數據庫加工技術KBase全文數據庫管理系統SmartTextMiner知識挖掘技術NLPE中文自然語言處理技術CNKI自適應多階指紋分析技術()工作原理海量比對資源庫檢測文獻檢測文獻基于基于AMLFP的的文獻快速比對文獻快速比對檢測結果檢測結果工作原理(2)待檢測文檔指紋XXX-YYY-CCC-DDDD-KKK-FFFF在千萬量級全文比對數據中,單篇文獻檢測速度達到毫秒級響應檢測系統框架檢測系統框架文章特征庫待檢測論

4、文重復內容比對文章比對庫期刊會議學位論文專利報紙圖書工具書注冊文章抄襲偽造篡改專家復合審查事實數據庫學者規范數據科研規范機構科研成果引文統計YesNo檢測指標設計設計原則針對學位論文是超長文獻的特殊性,設計了一套總指標與子指標相結合的檢測評估體系。總檢測指標學位論文一般篇幅較長,檢測系統會自動按章節切分(無章節信息則按字數切分)。總檢測指標指對論文全貌的檢測描述。子檢測指標對于學位論文每一章節,檢測系統對每一章節均生成一套指標系數。詳細描述每一章節的檢測情況。總檢測指標總重合字數(CCA)總文字復制比(TTR)總文字數(TCA)疑似章節數(QCA)總章節數(TCA)首部重合文字數(HCCA)尾

5、部重合文字數(ECCA)段落最大重復字數(MAXA)段落最小重復字數(MINA)總重合字數學位論文一般篇幅大,少則35萬字,多則十幾萬字,若以文字復制比來衡量一篇論文的文字重合情況,不太合適。因為對于一篇十幾萬字的博士論文來說,10%就已達到1萬字,文字復制情況已經非常嚴重。對于博碩士論文檢測,檢測系統使用絕對字數即總重合字數作為檢測結果的核心指標。總文字復制比、總文字數總文字復制比總文字復制比則是指學位論文中總的重合字數在總的論文字數中所占的比例。通過該指標,我們可以直觀了解到重合字數在該檢測學位論文中所占的比例情況。總文字數指該檢測論文所有包含的字數,文字復制比與總文字數的乘積即為重合字數

6、。疑似章節數、總章節數疑似章節數是則檢測論文疑似存在學術不端行為的章節的數量。總章節數則是指學位論文總的章節數(對于不按章節顯示,而是按照固定長度切分的論文,每一切分段落為一章節)。首部重合文字數、尾部重合文字數首部重合文字數指學位論文前1萬字中重合的文字數量。尾部重合文字數是指除去前1萬字,剩下的部分中重合的文字數量。對于學位論文,一般開頭部分均是綜述性的報告介紹,其重要性遠低于論文尾部。段落最大重復字數、段落最小重復字數論文所有段落中,每一段落最大的段文字數比較,最大的為段落最大重復字數論文所有段落中,每一段落最大的段文字數比較,最小的為段落最小重復字數反應每一切分段落是否都有較嚴重的文字

7、復制情況。子檢測指標文字復制比(TR)重合字數(CNW)最大段長(LPL)平均段長(APL)段落數(PN)段文字比(PR)首部復制比(HR)尾部復制比(ER)文字復制比(TR)文字復制比是指論文的每一章節與比對文獻重合文字在該章節中所占的比例。比例越高,反映該章節越多的文字來自于其他已發表文獻。文字復制比(TR)反映該章節“抄襲”總文字數量比例。一般來說,文字復制比越高,存在學術不端行為的可能性越大。重合字數(CNW)論文每一章節與比對文獻重合的總字數。不管文字復制比如何,重合字數越多,存在學術不端行為的可能性越大。最大段長(LPL)論文每一章節中,當連續文字超過一定比例時,稱之為段段,與比對

8、文獻重合的最大段長度即為最大段長。反映成段抄襲特征。一般連續200以上文字為抄襲段。連續的文字越長,抄襲的可能性越大。平均段長(APL)論文每一章節中,所有段的長度的平均值即為平均段長。段落數(PN)每一章節中,所有段的數量為段落數。平均段長和段落數反映了重合文字在文獻中的分布情況,一般來說,指標參數越高,存在學術不端行為的可能性越大。段文字比(PR)所有段的字數之和在論文每一章節中的比例為段文字比。反映抄襲連續特征。一般來說,連續文字出現的越多,比文字分散出現的情況更可能存在學術不端行為。首部復制比(HR)論文每一章節的前20稱之為首部,首部的文字復制比為首部復制比。就中文文獻來說,一般每一

9、章節開頭部分出現的是綜述性語言。就重要性來說,相對偏低。尾部復制比(ER)論文每一章節的后80稱之為尾部,尾部的文字復制比為尾部復制比。就重要性來說,比前部文字要高。子檢測指標(續)我們仔細查閱比較上面兩部分內容,首部文獻是綜述他人工作,而尾部則是闡述自己的研究工作的目的和意義,這部分應是作者個人工作的體現,在這部分直接抄襲他文,性質要嚴重得多。檢測類型劃分與檢測實例分析三種主要學術不端類型抄襲篡改偽造抄襲按文字復制比例分輕度句子抄襲句子抄襲句子抄襲輕度段落抄襲輕度段落抄襲段落抄襲段落抄襲整體抄襲抄襲(續)按來源分單源重合文字全部來自于一篇文獻多源重合文字來源于兩篇及以上文獻重合文字來源列表重

10、合文字來源列表篡改(1)篡改指:按照期望值隨意篡改或取舍數據,以符合自己的研究結論,一般有主觀取舍數據和篡改原始數據等形式。篡改(2)篡改(3)通過以上檢索,我們有理由對檢測文獻中的分詞準確率產生懷疑。類型及實例(續)學位論文的定性比期刊要復雜作者以前發表的文獻復制同一導師的學生論文引用共同的工作前人工作的綜述類型及實例(續)學位論文的前面一至兩章一般綜述前人工作、介紹原理及方法。各項指標偏高,也在合理范圍之內。每章小結部分又應是個人心得,若抄襲,則又較前面抄襲要嚴重。博士論文至少應有兩章(核心章節)指標較低,我們認為低于20%為低指標。碩士論文至少應有一章(核心章節)指標較低,我們認為低于2

11、0%為低指標。大 綱一引入學術不端行為檢測的必要性與緊迫性二實施學術不端檢測的可行性:原理與方法介紹三TMLC系統主要功能演示介紹四應用推廣情況介紹與用戶反饋意見分析五TMLC系統服務模式介紹六下一步工作計劃系統功能定位輔助人的工作,提供一臺高性能“儀器”,生成一套檢測指標,為審查人員判斷學位論文的性質提供相關依據和線索。 用戶3用戶1Server1監測服務Server2監測服務Server3監測服務學位論文期刊學術文獻用戶2用戶4用戶5會議論文用戶自有資源報紙文獻Server1監測結果Server2監測結果Server3監測結果專利全文系統工作流程示意圖系統主要功能已發表論文檢測論文檢測問題

12、庫查詢自建比對庫管理其他功能已發表論文檢測各單位注冊用戶可在權限范圍內查看本學校已畢業且被CNKI收錄學位論文的檢測結果。選擇年份選擇年份選擇文獻選擇文獻瀏覽檢測結果瀏覽檢測結果放入問題庫放入問題庫查看原版文獻查看原版文獻生成系統報告單生成系統報告單重合文字來源文獻列表原版比對論文檢測(1)用戶上傳待檢測學位論文,系統自動處理各種文檔格式以及壓縮文件。選擇文件夾上傳論文系統檢測瀏覽檢測結果查看原版比對生成報告單放入問題庫放入個人比對庫論文提交(1)多手段論文提交方式單篇論文在線提交;手工錄入方式,可以在線錄入一段文字進行檢測;批量論文處理,可以將需要檢測的多篇論文壓縮為一個zip格式或rar格

13、式的壓縮文件,系統將自動處理壓縮文件,自動檢測。論文提交(2)多格式文檔提交方式,支持以下格式文件處理:MS WORDPDFTXTCAJKDHNH比對系數設置豐富的比對資源期刊論文、博碩士學位論文、會議論文、報紙、專利等可以任意選擇一種或多種比對資源比對。便捷的比對時間選擇,用戶可隨意控制比對文獻的時間范圍。便捷的比對專業選擇,用戶可以任意選擇比對文獻的專業范圍。完全自主的控制模式自己創建文件夾,便于管理與記憶用戶提交的所有文獻,用戶擁有完全的處置權利,可以隨時進行刪除。不僅可以刪除某一篇文獻,還可以刪除整個文件夾。直觀的檢測結果顯示顯示檢測結果中的文字復制字數、比例顯示總的復制字數、比例顯示

14、每一章節的復制比例采用通用預警標識顯示文字復制嚴重程度越嚴重越嚴重論文檢測(2)文本復制檢測報告單整體報告單章節檢測報告單整體報告單整體報告單包括:整體檢測指標信息每一章節的檢測指標信息每一章節的檢測結果主要重合文字索引整體報告單是在各章節終審報告單的基礎上生成的。上傳論文信息上傳論文信息整體檢測結果信息整體檢測結果信息各章或各段檢測結果信息各章或各段檢測結果信息章節報告單檢測論文篇名、作者、字數等信息重合文字來源文獻的篇名、作者、發表時間、發表刊物、字數等信息重合比例、重合文字索引(即每段重合文字開始的前20字符)等信息用戶可自己添加類型和審查意見問題庫查詢(1)將確認有問題的論文放入問題庫

15、,問題庫是檔案庫。已發表論文中的問題論文也可以放入問題庫。便于集中管理確認有問題的論文,提供快速檢索功能。問題庫查詢(2)檢測論文問題庫已發表論文問題庫自建比對庫管理用戶可以將個人文獻或文獻庫上傳到服務器,或者把某篇檢測論文放入到個人比對庫。以后上傳的論文,用戶可以選擇與個人比對庫中的文獻進行比對。該個人庫完全屬于用戶個人,其他用戶無權使用。其他功能-引文核對在“其他”項,我們將陸續提供其他各類實用功能。引文核對迅速確定參考文獻各項信息是否屬實。比較參考文獻與比對庫中的作者信息、刊物信息等鏈接到知網節鏈接到知網節其他功能-兩兩比對兩兩比對快速確定兩篇文獻的相同之處。快速確定兩篇文獻的不同之處。

16、選擇文獻上傳不同之處大 綱一引入學術不端行為檢測的必要性與緊迫性二實施學術不端檢測的可行性:原理與方法介紹三TMLC系統主要功能演示介紹四應用推廣情況介紹與用戶反饋意見分析五TMLC系統服務模式介紹六下一步工作計劃應用推廣情況2008.12.23正式推出,分別面向期刊編輯部和研究生院陸續舉辦了四期培訓班,參會總人數達到了1000余人,截止目前,實際用戶已達2000余家單位,其中編輯部1800家,研究生院220家。西安交通大學華中科技大學高校用戶期刊編輯部用戶用戶使用情況科技期刊檢測系統已檢測10多萬篇科技文獻,文字復制比超過30%超過1萬篇;學位論文檢測系統3月12號正式使用以來,已檢測近50

17、00篇學位論文,重合字數超過1萬字的論文約有1000篇。用戶主要反饋意見賬號管理問題賬號分級制度:學位辦有管理員權限,可以根據需要設置一定數量的子賬號,可以監督所有子賬號的行為,并對檢測結果進行統計分析。賬號綁定制度:每個子賬號檢測權限下放到院系或導師,實施自糾自查,自我管理。對賬號實行嚴格權限認證,如用戶口令 + IP綁定,防止濫用。涉密論文或涉密單位論文的檢測安全問題用戶主要反饋意見(2)集成到學校信息管理系統,在嚴格身份認證的前提下,各院系導師甚至學生可以預檢或自我檢測。大批量學位論文集中檢測效率問題上傳速度問題,能否為學校提供大批量數據處理接口,直接返回統計數據,類似于已發表文獻檢測功

18、能。檢測速度問題大 綱一引入學術不端檢測的必要性與緊迫性二實施學術不端檢測的可行性:原理與方法介紹三TMLC系統主要功能演示介紹四應用推廣情況介紹與用戶反饋意見分析五TMLC系統三種服務模式介紹六下一步工作計劃三種服務模式學位論文學術不端行為檢測系統學位論文學術不端行為檢測系統(VIP版)學位論文學術不端行為檢測系統(鏡像版)包庫使用模式學位論文學術不端行為檢測系統包含所有主要功能,但上傳文件大小、數量受限免費使用一年學位論文學術不端行為檢測系統(VIP版)增加賬號分級管理和多策略身份認證功能上傳文件大小數量不受限制提供增值服務:按學科專業定期出檢測統計分析報告給學位辦支持與學校信息管理系統集成:根據實際情況單獨計費享受更好的服務優點:前期投入小,零維護工作量鏡像服務模式學位論文學術不端行為檢測系統(鏡像版)包括所有包庫版功能,比對數據放在本地并提供定期更新。可以集成本地各種中外文資源,擴大檢測范圍可以方便的與學校各種信息管理業務系統集成優點:效率高,安全性高 大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論