學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)的技術(shù)元素及應(yīng)用_第1頁(yè)
學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)的技術(shù)元素及應(yīng)用_第2頁(yè)
學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)的技術(shù)元素及應(yīng)用_第3頁(yè)
學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)的技術(shù)元素及應(yīng)用_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)的技術(shù)元素及應(yīng)用

隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,“復(fù)制”變得非常簡(jiǎn)單。只需下載網(wǎng)站,然后輕松單擊特洛伊木馬并復(fù)制和復(fù)制。這給編輯的評(píng)論和編輯帶來(lái)了極大的不便。如果沒(méi)有注意到,就會(huì)出現(xiàn)逃避網(wǎng)絡(luò)魚(yú)。有人戲稱(chēng),這對(duì)編輯的身心都是巨大的考驗(yàn)。毫無(wú)疑問(wèn),學(xué)術(shù)不端檢測(cè)系統(tǒng)的出現(xiàn),這給編輯工作節(jié)省了大量的時(shí)間,轉(zhuǎn)變了在浩瀚“網(wǎng)海”以關(guān)鍵詞搜索的盲目性,大大提高了工作效率,使稿件能盡快進(jìn)入下一個(gè)流程。自中國(guó)知網(wǎng)學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)正式發(fā)布以來(lái),已迅速在6000多家教育、科研、出版及相關(guān)管理機(jī)構(gòu)中廣泛使用,在防治學(xué)術(shù)不端行為的工作中發(fā)揮了重要作用。繼而,萬(wàn)方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)也推出了論文相似性檢測(cè)服務(wù),為編輯提供了更多的便利。為了敘述方便,本文統(tǒng)稱(chēng)此類(lèi)系統(tǒng)為學(xué)術(shù)不端檢測(cè)系統(tǒng)。筆者使用該系統(tǒng)3年多來(lái),深切感到該系統(tǒng)簡(jiǎn)潔方便、操作性強(qiáng)的優(yōu)勢(shì),但也發(fā)現(xiàn)其使用中存在一定的盲區(qū),下面舉例簡(jiǎn)述。一、技術(shù)領(lǐng)域筆者將因技術(shù)手段的局限而產(chǎn)生的盲區(qū)稱(chēng)為技術(shù)盲區(qū),通過(guò)下面幾個(gè)實(shí)驗(yàn)說(shuō)明。(一)文章的變音與檢測(cè)將3篇已在期刊上發(fā)表過(guò)的文章A、B、C,分別在甲檢測(cè)系統(tǒng)檢測(cè)相似度,結(jié)果為79.1%、86.2%,97.8%。若將此3篇文章分別轉(zhuǎn)為圖片格式,內(nèi)容不變,系統(tǒng)則顯示:“內(nèi)容過(guò)短,無(wú)法檢測(cè)”。同樣,將此3篇文章在乙檢測(cè)系統(tǒng)檢測(cè),結(jié)果分別為81.5%、93.48%、84.38%。轉(zhuǎn)成圖片格式后,無(wú)法粘貼至檢測(cè)界面,故而無(wú)法檢測(cè)。若將圖片后面粘貼同樣數(shù)量的文字,則可以檢測(cè),打開(kāi)詳情報(bào)告,可以看出,在檢測(cè)區(qū)域,只顯示出文字,而不見(jiàn)圖片——甲、乙兩個(gè)檢測(cè)系統(tǒng)情況相同。(二)實(shí)驗(yàn)2將A、B、C3篇文章中的表格提取出來(lái),單另做一Word文件,分別在甲乙兩個(gè)系統(tǒng)檢測(cè),檢測(cè)結(jié)果均為0。(三)甲系統(tǒng)檢測(cè)結(jié)果找3篇已經(jīng)優(yōu)先數(shù)字出版但是還未在期刊上刊發(fā)的文章D、E、F,在甲系統(tǒng)檢測(cè)結(jié)果分別為0、6.7%、0;在乙系統(tǒng)檢測(cè)結(jié)果分別為4%、4.55%、0。(四)檢測(cè)結(jié)果分析(1)將如下一段話G粘貼在Word文件中,為了防止因文章過(guò)短而無(wú)法檢測(cè),將此段話復(fù)制3遍,進(jìn)行檢測(cè)。檢測(cè)結(jié)果:甲系統(tǒng)為89.7%,乙系統(tǒng)為87.5%。隔距塊的作用原理是:上銷(xiāo)中上羅拉和下羅拉、長(zhǎng)短膠圈和彈性上銷(xiāo)組成了彈性鉗口,在這個(gè)作用過(guò)程中羅拉組成的固定鉗口和膠圈組成的彈性鉗口,前者主要是握持纖維,彈性鉗口主要是為輸出纖維。固定鉗口至鉗口前緣中心距33mm,距下羅拉中心距31mm,控制區(qū)要求強(qiáng)控制,輸出區(qū)要求穩(wěn)定保證快速纖維的變速運(yùn)動(dòng),隔距塊在其中調(diào)節(jié)隔距達(dá)到穩(wěn)定和順利抽出的作用。(2)將此段話的前后順序調(diào)整如下(忽略句子的邏輯順序及句意),內(nèi)容不變,同樣復(fù)制3次,甲乙系統(tǒng)的檢測(cè)結(jié)果分別為40%、87.5%。控制區(qū)要求強(qiáng)控制,輸出區(qū)要求穩(wěn)定保證快速纖維的變速運(yùn)動(dòng),隔距塊在其中調(diào)節(jié)隔距達(dá)到穩(wěn)定和順利抽出的作用。固定鉗口至鉗口前緣中心距33mm,距下羅拉中心距31mm。隔距塊的作用原理是:在這個(gè)作用過(guò)程中羅拉組成的固定鉗口和膠圈組成的彈性鉗口,上銷(xiāo)中上羅拉和下羅拉、長(zhǎng)短膠圈和彈性上銷(xiāo)組成了彈性鉗口,前者主要是握持纖維,彈性鉗口主要是為輸出纖維。(3)將此段話的順序不變,分別將每句話的結(jié)構(gòu)略微調(diào)整,長(zhǎng)句變短句,短句變長(zhǎng)句,加連接詞、標(biāo)點(diǎn)符號(hào)等等,如下所示,檢測(cè)結(jié)果變化極大,甲乙兩系統(tǒng)均為0。上銷(xiāo)中上羅拉分別與下羅拉、長(zhǎng)短膠圈及彈性上銷(xiāo)一起,組成了彈性鉗口,在此作用過(guò)程中,羅拉組成的固定鉗口主要是握持纖維,膠圈組成的彈性鉗口主要是為輸出纖維。固定鉗口距離鉗口前緣中心為33㎜,與下羅拉中心距為31㎜,控制區(qū)要求強(qiáng)控制,相反,輸出區(qū)要求穩(wěn)定,并需要保證快速纖維的變速運(yùn)動(dòng),隔距塊的作用,就是調(diào)節(jié)隔距、穩(wěn)定并順利地抽出——這就是隔距塊的作用原理。(五)檢測(cè)結(jié)果分析以上各實(shí)驗(yàn),總結(jié)如表1。實(shí)驗(yàn)結(jié)果可以看出:(1)檢測(cè)系統(tǒng)對(duì)圖片無(wú)法檢測(cè)。在實(shí)驗(yàn)一中,文字的相似度很高,但是一旦轉(zhuǎn)換為圖片,就檢測(cè)不出;粘貼部分文字后,僅能檢測(cè)文字部分的相似度。(2)檢測(cè)系統(tǒng)對(duì)表格無(wú)法檢測(cè)。在實(shí)驗(yàn)二中,兩個(gè)系統(tǒng)對(duì)表格的檢測(cè)雖然不至于像圖片一樣無(wú)法識(shí)別,但是檢測(cè)結(jié)果卻為0。事實(shí)上,檢測(cè)表格是從已發(fā)表的文章中提取出來(lái)的,相似度應(yīng)該很高才對(duì)。(3)檢測(cè)系統(tǒng)對(duì)已經(jīng)優(yōu)先數(shù)字出版但未在紙質(zhì)期刊發(fā)表的文章檢測(cè)結(jié)果不可信。猶記知網(wǎng)推出優(yōu)先數(shù)字出版時(shí)曾說(shuō)過(guò),在此優(yōu)先數(shù)字出版系統(tǒng)上發(fā)表的文章,為“正式發(fā)表”,最有說(shuō)服力的是,“評(píng)職稱(chēng)時(shí)也是認(rèn)可的”(優(yōu)先數(shù)字出版培訓(xùn)時(shí),培訓(xùn)老師語(yǔ))。但是很顯然,檢測(cè)系統(tǒng)未將此類(lèi)文章納入檢測(cè)范圍。(4)調(diào)整句序、改變句子結(jié)構(gòu)對(duì)檢測(cè)結(jié)果均有影響,尤以后者為甚。實(shí)驗(yàn)四中,調(diào)整句序,檢測(cè)結(jié)果改變;改變句子結(jié)構(gòu),雖然句意完全沒(méi)有改變,但是檢測(cè)結(jié)果卻一下由接近90%變?yōu)?。(5)不同檢測(cè)系統(tǒng)的檢測(cè)結(jié)果并不完全相同。如上所述,筆者在甲乙兩系統(tǒng)檢測(cè)的文章為同篇文章,然而檢測(cè)結(jié)果卻不完全相同,時(shí)高時(shí)低,相別最大的,是調(diào)整句序后的檢測(cè)結(jié)果,一為40%,一為87.5%,相差一倍多。二、期刊管理。在美國(guó),我國(guó)當(dāng)前的期刊時(shí)間盲區(qū),即因?yàn)闀r(shí)間前后差異產(chǎn)生的“盲區(qū)”。目前,各大數(shù)據(jù)庫(kù)收集期刊文章,基本的方法有兩種:一是等樣書(shū)出來(lái),郵寄至數(shù)據(jù)庫(kù)辦公地點(diǎn),由數(shù)據(jù)庫(kù)的工作人員用掃描等技術(shù)手段將期刊內(nèi)容放在庫(kù)中,顯示在互聯(lián)網(wǎng)上;二是雜志社的當(dāng)期刊物定版后,由雜志社的工作人員將本期期刊的電子版發(fā)給數(shù)據(jù)庫(kù)工作人員,再由他們經(jīng)過(guò)處理上傳。無(wú)論哪一種方法,在實(shí)際操作中總會(huì)有一段時(shí)間差,即滯后期,一般為2周到4周,甚至更長(zhǎng)。試想,一篇文章先發(fā)給甲雜志社,決定錄用后,再發(fā)給乙雜志社,而在乙社檢測(cè)該文時(shí),由于此文還未正式刊發(fā),未能進(jìn)入檢測(cè)系統(tǒng),所以檢測(cè)相似度必然很低。而實(shí)際上,如果推遲1~2個(gè)月再進(jìn)行檢測(cè),那么就會(huì)發(fā)現(xiàn)問(wèn)題,只是,這時(shí)再撤稿,已經(jīng)付出的勞動(dòng),又該由誰(shuí)來(lái)買(mǎi)單呢?三、直接引用較多的新觀點(diǎn)這通指那些檢測(cè)出來(lái)相似度很高,但實(shí)際上并未“抄襲”的情況,比如:(1)學(xué)位論文、會(huì)議論文集收錄文章的再次發(fā)表;(2)刊登在低級(jí)別刊物上的論文在高級(jí)別刊物上的再次發(fā)表;(3)基本原理、基本理論的直接引用;(4)由舊方法、舊理論得出的新結(jié)論、新觀點(diǎn);等等。此中,前2種情況,筆者認(rèn)為,都不算真正意義上的公開(kāi)發(fā)表,只能算作“內(nèi)部交流”,但數(shù)據(jù)庫(kù)在查重時(shí),也將其納入檢索范圍,所以相似度很高。后2種情況,直接引用基本原理和理論,查重時(shí)相似度必然很高,而建立在舊方法、舊理論的基礎(chǔ)上,得出的新觀點(diǎn)、新結(jié)論,相似度也不會(huì)低,有可能大部分都是一樣的,但恰是那一小部分是創(chuàng)新,并且是十分重要的,如果僅從系統(tǒng)得出的檢測(cè)結(jié)果來(lái)判別其為“抄襲之作”,也許就此錯(cuò)過(guò)一篇佳作。四、是提供數(shù)據(jù)參考學(xué)術(shù)不端檢測(cè)系統(tǒng)畢竟不是“人腦

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論