




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
最常用近紅外光譜預解決技術綜述smundRinnan,FransvandenBerg,S0renBallingEngelsen摘要:預解決在近紅外(NIR)光譜數據解決化學il?量學建模中已經成為不可分割一某些。預解決目是消除光譜中物理現象在為了提高后續多元回歸、分類模型或摸索性分析。最廣泛使用預解決技術可以分為兩類:散射校正辦法和光譜間隔辦法。綜述和比較了算法基本理論和當前預解決辦法以及泄性和定量后果應用程序。其目是提供更好NIR最后模型建立,在此咱們通過對光譜預解決基本知識進行梳理。核心詞:乘法散射校正:近紅外光譜法:原則化:諾里斯威廉姆斯推導;預解決:Savitzky-Golay平滑:散射校正;光譜導數;原則正態變疑;綜述1.引言當前為止,沒有可以優化數據來進行代替,但是通過恰當數據收集和解決將會起到優化效果,對光譜數據進行預解決是最重要一步(例如最優化之前疊層建模),慣用辦法有主成分分析(PCA)和偏最小二乘法(PLS)。在大量文獻中,多變量光譜應用食品、飼料和醫藥分析,比較不同預解決成果研究模型預測成果是不可分割構成某些。近紅外反射/透射率(NIR/NIT)光譜光譜技術,到當前為止最多被使用和最大多樣性在預解決技術,重要是由于入非線性光散射光譜可以引起明顯影響。由于類似規模波長電磁輻射和粒子大小近紅外光譜在生物樣品,近紅外光譜技術是一種不被廣泛使用是由于存在散射效應(涉及基線轉變和非線性),這將會影響樣品光譜成果記錄。然而,通過應用適當預解決,可以很大限度上消除這些影響。在應用研究中,比較了幾乎完全不同泄標模型(N量描述符和相應關系)。幾乎沒有浮現評估差別和相似性報道。代替技術即修正含義(例如,譜描述符數據)在研究中很少被討論。本文旨在討論建立了預解決辦法對近紅外光譜和模型之間關系,更詳細地說,這些技術都是相應獨立響應變呈:,因此咱們只討論辦法,不需要一種響應值。咱們同步關注預解決工藝理論方而和實際效果,這種辦法合用于近紅外光譜/NIT光譜。對固體樣品,千擾系統差別重要是由于光散射不同和有效途徑長度不同。這些不受歡迎變化經常構成了樣本集總變異重要某些,可以觀測到得轉變基線(乘法效應)和其她現象稱為非線性。普通來說,近紅外光譜反射率測量一種示例將測量普及性反映和鏡而反射輻射(鏡而反射)。鏡而反射普通由儀表設計和幾何采樣最小化,由于它們不含任何化學信息。這個diffusively反射光,這反映在廣泛方向,是信息重要來源在近紅外光譜。然而,diffusively反射光將包括信息化學成分不但示例(吸取)并且構造(散射)。重要形式光散射(不涉及能量轉移與樣品)瑞利和洛倫茲米氏。兩者都是過程中電磁輻射是分散(例如,通過小粒子,泡沫,表而粗糙度,水滴,晶體缺陷,microorgancllcs、細胞、纖維和密度波動)。當粒子尺寸不不大于波長,由于普通狀況下,NIR光譜,是重要洛侖茲米氏散射。相比之下,瑞利散射,是各向異性,洛倫茲米氏散射依賴形狀散射粒子和不強烈波長依賴性。對生物樣品,散射特性是過于復雜,因此軟或自適應補償,光譜預解決技術,正如咱們近紅外光譜在本文中進行討論,規左刪除散射從純粹、抱負吸取光譜。顯然,預解決不能糾正鏡而反射率(直接散射),自譜不包括任何精細構造。光譜重要由鏡面反射率應肖總是被移除之前為離群值多元數拯分析,由于她們仍將是局外人,甚至在預解決。圖1顯示了一組13好蔗糖和樣品不同粒徑加一壞蔗糖例子展示如何(極端)鏡而反射率體現比正常光譜。圖1還演示了總體布局大多數數據在本文中。上部圖,一種條形圖顯示了主成分得分值第一主成分(PC)后樣本集數據意味著左心[1]。下而某些顯示預解決效果數據集(或者,在這種狀況下,任何預解決)。有關系數r平方值之間酒吧和一種選定參照變量包括(在本例中,已知平均粒徑13蔗糖樣本)。蔗糖數據集,這種關系應當是低,例如,當假設散射是一種阻礙粒子始發;盡量小信息粒度應當保持在對的預解決。Increasingparticlesize Increasingparticlesize >1.2PC1=0975gueqjosqv6
o.1200 1400 1600 1800 2000 2200 2400Wavelength(nm)1.2PC1=0975gueqjosqv6
o.1200 1400 1600 1800 2000 2200 2400Wavelength(nm)0.40.20圖1近紅外光譜13蔗糖和樣品不同粒徑(最小粒子在底部,最大頂部;粒子尺寸范疇在20-540Im。黑色光譜顯示了一種鏡面反射率蔗糖樣本。酒吧是分數值第一主成分13個蔗糖樣品主成分分析模型在完整光譜。一種示例數據預解決蔗糖中可以看到圖2,其中也包括一種其實一種示例數據預解決蔗糖中可以看到圖2,其中也包括一種其實從當前起,在這篇文章中,咱們將演示效果不同預解決技術在小果膠數據集只包括7個樣品有不同限度酯化(%徳;范疇在0-93%)[2]0這些樣品測定近紅外光譜反射率模式在光譜范疇1100-2500海里(收集每2海里區間;圖3)。咱們提供相應第一因素PCA樣本得分后作為一種條形圖意味著沱心,連同集中吸光度值在波長2244納米。咱們選取這個峰值,由于它在理論上應當描述%DE完美。對于本文,咱們假設信息在光譜相聯系果膠粒子大小和形狀應當被預解決技術,條形圖應當顯示一種線性行為與%徳。為了闡明預解決影響在量化,咱們使用數據取自克里斯騰森ctalo[3]o她們研究了一組32杏仁蛋白軟糖混合物,基于不同食譜,九個不同數據都在互聯網上可用(www。模型生活kudk)0所有杏仁蛋白軟糖樣品測左了六種不同近紅外光譜儀器和化學參照分析了水分和糖含量。在構建一種左呈:回歸模型,重要是要打掃預測數據從非系統性散射變化,由于她們可以產生重大影響預測模型性能和模型復雜性或吝嗇。在本文中,咱們使用請預測這種定量響應信息[4]°2.預解決辦法PC1=0834321o0oaoueqjosqv1200 140024001200 140024001600180020002200Wavelength(nm)987654321aoueqjosqejoUOQe>apEepuels12001400160018002000Wavelength(nm)22002400圖2上圖:數據被一種二階蔗糖乘法散射校正;底:相應原則差每個波長,虛線是原始/未加工數據(見圖1),固體是預解決數據。最廣泛使用預解決技術在近紅外光譜法(在兩個反射和透射模式)可以分為兩類:scattcrcorrection辦法和光譜衍生品。第一群散射校正預解決辦法涉及乘法散射校正(MSC),逆MSC,擴展MSC(EMSC),擴展逆MSC,de趨勢,原則正態變量(SNV)和原則化。…丨HIIII丨—口1200 1400 1600 1800 2000 2200 2400Wavelength(nm)圖3生/未加工光譜,7果膠樣本。藍線是一種示例有0%限度果膠酯化(DE),紅色線是一種樣本93%德。打開條批示主成分分析(PCA)評分值在第一種PC為完整光譜,意味著定心,關閉了酒吧后光譜值在波長2244納米。光譜推導集團是為代表兩種技術在本文中:諾里斯威廉姆斯(NW)衍生品和Savitzky-Golay(SG)多項式導數過濾器。這兩種辦法都使用一種平滑光譜導數計算之前,以減少有害影響,老式信噪比有限差分衍生品會。預解決環節目的可以三種:1) 提髙后續摸索性分析2) 提高后續疊層校正模型(力數據服從蘭伯特啤酒法律);或者,3) 提高后續分類模型。朗伯比爾左律(方程(1))是經驗對近紅外光譜/NIT和顯示成線性關系,吸取光譜和濃度⑸成分⑸:A.=jogio(T)=%/c⑴其中人作為吸光度,?.依賴波長摩爾吸光系數,/代表光通過容器有效途徑長度,是c成分濃度。朗伯比爾圧律嚴格有效只有純透射系統沒有散射。在反射率測量,方程(1)是重新定義在類比透射率測量為:4=-log10(/?)=8x/c其中,是反射率。選取適當預解決應當總是被以為是相對于持續建模階段。例如,如果數據集興趣不遵守法律,額外因素蘭伯特啤灑或組件在請回歸普通可以彌補這一抱負行為光譜預測[5]。缺陷涉及額外因素是提高模型復雜性,反過來,最有也許減少對將來預測模型魯棒性。所有預解決技術目的減少變化減少數拯以增強特性謀求在光譜,經常一種線性(簡樸)關系現象(例如,一種成分)興趣。通過使用一種適當預解決技術,這可以實現,但總是有危險應用了錯誤類型或應用太嚴重預解決,將移除有價值信息。對的選取預解決是很難評估模型驗證之前,但是,普通來說,執行幾種預解決環修是不可取,作為最低規泄,預解決應保持或減少復雜性有效模型。060606060 01 02 03 0.4 0.5 0 01 02 03 0.4 0.5 06 07ReferencespectrumP8POU00eq£eJJOss圖4樣品光譜(藍色點)密謀反抗一種選定參照光譜。標雖修正條款發現隨巷攔截和邊坡黑色線條,就是發現從最小二乘回歸適合通過所有點。3.散射校正依照散射校正辦法,咱們考慮三個預解決槪念:研究生,SNV和原則化。這些技術是為了減少(物理)可變性樣本之間由于散射。所有三個也調節基線樣本之間變化。3」MSC乘法散射(或者,在普通狀況下,信號)校正(MSC)也許是最廣泛使用預解決技術對近紅外光譜(緊隨其后SNV和派生)。MSC其基本形式是由Martens初次引入等人1983年[6],并進一步闡述了通過Geladi等人1985年⑺。MSC背后概念是,工件或缺陷(如,不良散射效應)將被刪除數據矩陣之前,數據建模。MSC包括兩個環巧:1)預汁校正系數(加法和乘法貢獻。X陀=b^brefCXref+e (2)2)校正記錄光譜x—X。咚%=x+c⑶%」 ^ref.l其中:代表近紅外光譜儀器對一種原樣品進行光譜測量,X町代表參照光譜用于預解決整個數據集,£是減少一某些x”「Xg”代表了修正后光譜,其中b0和都是標量參數,這在每個樣品中具備不同代表含義,這個在圖4中進行闡明,對每個標量參數進行理解釋。在大多數應用中,平均頻譜校準設立用作參照光譜。然而,一種通用參照光譜也可以應用。在最初論文Martensetal。[6],這是建議只使用那些某些光譜軸,不涉及有關信息(基線)。而這使得好光譜意義上說,很難擬立這些地區在實踐中,特別是在近紅外光譜測量,信號從不同化學成分是強烈重疊和有關,很少或主線沒有真正基線是發現。這是為什么,在大多數狀況下,整個頻譜用于查找標量校正參數在MSCo圖5演示了應用程序原則MSC對果膠數據。光譜特性果膠粉是守恒,而背景偏移和斜坡基本上是刪除(與圖3)。線性關系光譜和%徳是不錯,但它并不完美。1200 1400 1600 1800 2000 2200 2400Wavelength(nm)1200 1400 1600 1800 2000 2200 2400Wavelength(nm)圖5數據預解決乘法散射校正用一階校正對平均頻譜。基本形式MSC已經擴展成更復雜擴展(8-12)普通被稱為EMSC.這個擴展涉及二階多項式擬合參照光譜,擬合一種基線波長軸,和運用先驗知識從光譜興趣或光譜干擾物。在本文中,所有這些代替品被稱為MSC為簡樸起見,由于她們可以總結為一種單一方程:X叱=[以叩之/入2之歸小*叭心??4+£⑷其中,九代表依賴波長軸修正向量,X如譏|包括先驗知識涉及了想要/不必要光譜信息(例如一種已知光譜下擾物種)。方程(4)可以容易地擴大到涉及任何其她任何具備恰當意義修正。“代表了一組標量(校正系數)給出了方程(5)。b=[仇,b=[仇,^refA'b呵2'E??l'儀?2、饑例仏1'紜穴仏2?-?]w/r.2(5)其中:%偏差校正brefA是依照嚴修正l\A改正對我是對卅校正訂單波長軸依賴,bknownA是糾正第i已知信息嗎相比喻程(2),它可以觀測到方程(4)只是一種高階擴張之一想法。在本文中將不再做進一步討論,由于,在諸多實際狀況,參照光譜對想要和不必要成分并沒有現成可用。參照校正是最慣用辦法只有一種一階多項式。雖然沒有數學限制擴大到髙階增長,有普通沒有光譜參數這樣做(除了也許如果重要瑞利散射是岀當前短波長區域。圖6顯示了成果一種二階多項式校正果膠數拯。修正條款用于二階多項式參照校正只是發現了擬合二階(二次)多項式點在圖4。只有邊際改進獲得了比一階修正在圖5。波長軸依賴是最常涉及作為一種二階多項式擬合波長軸光譜。當沒有參照校正涉及在內,這個簡樸波長配件也爼義光譜de趨勢[13],它可以被視為一種基線校正。重要是要注意,涉及波長依賴性在完整校正方程(4)而不是讓它作為一種單獨環節會導致一種較小矯正效果。這是由于一種矩陣求逆操作同步執行所有校正參數在MSC,不同修正會互相影響最小二乘法擬合準則。當一種波長依賴是獨立決左只有波長軸(而不是參照光譜)影響校正,這將導致一種趨平加工譜。這個效果可以看出通過比較無花果。7和8。正如前面提到,更加復雜修正(例如,高階多項式或其她轉換波長依賴性)可以很容易地納入MSC。Thcnnadil和馬丁[12]建議使用對數值波長,由于這是更多聲音來判斷光譜。然而,區別使用對數變換波長與使用一種一階多項式校正是最小,使這兩個辦法相似所有實用目。彼得森指岀,etal。[9],這是一種相稱簡樸過程,應用逆版本MSC,稱為逆信號校正(ISC)[14]°預計校正參數,b系數,發現以類似方式來左期MSC:Xref=_1,X。理,X”:入入2, ,xfamn2..._b+e(6)請注意,xorg和xref已經互換了地方比喻程(4)。一種運用(擴展)ISC(EISC)是簡樸修正方程:Xgrr=_1九農,“腫,九,九2,心如.“],”忖仏2二方(7)
圖6乘法散射校正光譜使用二階參照校正對平均頻譜。在ISC和EISC,無論是預計校正系數和校正自身中執行可以被描述為一種邁進方式,使它能以便涉及附加條款和/或參照信號[9]。前面提到矩陣求逆操作所需參數預計在MSC可以很容易地成為數字壞脾氣如果它涉及高階多項式參照改正。這是一種論點支持ISC。然而,假設,ISC最小二乘法擬合,誤差在記錄光譜(糾正)不大于誤差為參照光譜。在大多數實際應用,參照是平均譜計算樣本數據集從n(例如,校準設立)。預期噪音水平數量級這個引用是不大于個人光譜(忽視了偏見由于散射差別集)。這是一種反對ISC,由于一種小錯誤在光譜預解決將會影響到更大限度比最初MSC.
1200 1400 1600 1800 2000 2200 2400Wavelength(nm)圖8乘法散射校正(MSC)與一種一階多項式參照校正對平均頻譜,另一方面是一種單獨MSC與二階多項式波長校正(去趨勢)。重要挑戰是左義一種適當MSC參照光譜。正如前面提到過,這是最經常設立為普通校準光譜。加拉格爾等人(⑸提供了一種天然變化來MSC通過包括一種加權方案在預解決環節。提岀了兩個選取:1) 使用一種預左義權向雖:波長軸向2) 迭代搜索最優權重向量迭代解決方案是通過給低體重發現變量或波長與高殘留差別原始數據和修正解決方案。權重計算將繼續,直到區別兩個后續迭代修正光譜不大于假左數據中噪聲水平。不幸是,這個相稱簡樸直接辦法并不總是適合近紅外光譜數據,自蔓延在更髙波長范疇普通表白更分散,應當改正而不是權重小。圖9顯示了權重。用于最后修正給強調到shortwavelength地區,而長波長區域并不有助于校正在所有。另一種建議尋找參照校正在MSC都暗示了Windigetal。一一所謂糊涂MSC[16]O這種辦法發現平均頻譜從msc修正數據集。接下來,MSC是多次重復更新參照光譜平均數據集糾正在每次迭代中環節。圖10顯示了成果糊涂MSC應用到果膠數據集一一在這種狀況下體現非常類似于呆頭呆腦MSC單純MSCO在呆頭呆腦MSC,可以遵循增長模型記錄信息,然后停止在收斂(兩個迭代環節普通是足夠)。疊加在圖10變化參照光譜從原始光譜平均值。3.2原則正態變量(SNV)SNV預解決也許是第二個最散射校正應用辦法NIR/NIT數據[13]。在本文中,規范化(也稱為對象明智原則化)光譜將檢査在同一種小節由于明顯相似性兩個原則°SNV基本格式和正常化修正與老式MSC:圖9加權乘法散射校正,基于迭代重雖決心。綠線顯示了最后權向雖(任意規模貢獻)。X窗=3^⑻4對于SNV,aO是平均值樣品光譜需要修正同步,為原則化,aO設立等于零。對于SNV,al是原則偏差樣品光譜。圖11演示了SNV校正果膠數據集。對于正常化,不同向量規范可以用于比例因子al,最常用是總金額絕對值元素向量(都市街區或出租車規范)或平方根之和平方元素(歐幾里得規范)。英她選項,有時也用正最大吸光度變量和正常化向著單一選泄波長。這兩個最后選項應當小心使用,由于她們可以有不良影響后續分析在例噌雜數據。圖12顯示了效果。歐幾里得正常化,迄今為止最慣用正常化,果膠數拯集。這個信號校正背后槪念SNV和原則化是相似MSC除了常用參照信號不是必須。相反,每個觀測自己解決,孤立于剩余設立。缺少需要一種共同參照也許是一種實際優勢。由于SNV和歸一化不涉及一種最小二乘方擬合在她們參數預計,她們可以敏感噌雜條目譜。相反,使用平均值和原則偏差作為校正參數,有人也許會考慮使用更健壯等價物這些記錄時刻。郭etalo[17]建議使用中檔或意味著內部四分位范疇和原則偏差內部四分位數預計為aO,al,分別命名為''辦法”健壯正常變量”。這將是特別適當狀況下光譜很模糊(如。在超快在線近紅外光譜應用程序,在強勁辦法將會更受散射噪聲(例如,波長選取性反射顆粒液體流)]。魯棒預訃影響她們演示郭ctal。[17]對于模仿和實際數據。正如已經討論了Dhanoactal。[18],有一種明顯相似性SNV和MSC。這種關系可以通過如下簡樸近似提出:QXsm,-sx+X(9)其中:穆普通原則偏差光譜,〒大意味著在所有光譜,都發現了從原始/未修正光譜(參見圖13)。圖10呆頭呆腦乘法散射校正與一種一階參照校正。綠線顯示了最后,差別開始參照光譜(任意規模貢獻)。1200 1400 1600 1800 2000 2200 2400Wavelength(nm)圖11原則正態變雖修正光譜1200 1400 16001800200022002400Wavelength(nm)圖12歐幾里得規范歸一化光譜勺勺—八smgih.i-的p Asmoothj Asnuwthj+^ap (13)0.6-01 - 1 1 1 」 」 丄 」 i ?0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1圖13原則正態變雖之間關系和乘法散射校正。藍色和紅色線條代表趨勢線預計在圖4。作為方程⑼表白,MSCandSNV相似到簡樸旋轉和抵消校正。對于本文中使用果膠數據,有關SNV預解決數據(圖11)和基本MSC修正數據(圖5)是0.9995后意味著中心。換句話說,MSC和SNV是相似對于大多數實際應用。4.導數光譜衍生品有能力淸除兩個添加劑和乘法效應在光譜和已經被用于分析光譜學了幾十年。這個概念表白在無花果。14對于一種簡樸髙斯鄴添加了基線和基線加上乘法效應。第一種衍生品只刪除基線;二階導數刪除兩個基線和線性趨勢。在本文中,咱們將討論兩種不同辦法:SG和西北。兩個派生技術使用平滑為了不減少信噪比修正光譜太多。最基本辦法,推導是有限差別:一階導數是預計為區別兩個后續光譜測量分;二階導數是然后預計通過計算持續兩個點之間區別一階導數光譜:xi,=xi~xi-}(1°)兀"=兀兀"=兀g'=也一2?兀+兀+】(11)4.1諾里斯威廉姆斯推導西北推導是一種基本辦法,以避免噪音通脹開發在有限差別。這種技術是在1983年提出諾里斯[19]和闡述了通過諾里斯和威廉姆斯在1984年[20]作為一種辦法來訃算導數近紅外/NIT光譜。西北派生包括兩個環節(見圖15):1.平滑光譜,平均在一種給左點數量是執行:rs/nwuhAymrs/nwuhAym厶丄./■一〃12m+1(12)其中,加中點數平滑窗口環繞電流測量點,2?對于一階求導,以區別兩個平滑值與一種給泄她們之間缺口大小(不不大于零);對二階求導,采用兩倍平滑值點我和平滑值在一種間隙距離兩邊:Q>C5>」QPlf_e>£ppucxl導,采用兩倍平滑值點我和平滑值在一種間隙距離兩邊:Q>C5>」QPlf_e>£ppucxl圖14派生影響在添加劑(綠色)和添加劑加上乘法(紅色)影響。藍色光譜是光譜沒有任何補償,黑色虛線是零線°可以看到從方程(⑶,實際推導模仿一種有限差分(方程(10)秋11))。通過應用一種平滑之前計算,通過引入一種缺口大小問題,減少信噪比減少。在文學、NW推導往往是緊隨其后正常化修正光譜。諾里斯和威廉姆斯[20]提出了規范化光譜強度相稱于在一種選左波長,但更復雜歸一化辦法可以使用。使用一種缺口很難捍衛在近紅外光譜。這個概念經常使用一種缺口,如果有一種(固泄)頻率分量在數拯,大小地方缺口將相應于兩峰之間距離值信號。然而,在光譜學,有普通沒有這樣背景頻率貢獻。西北衍生作品由于高度co變異和平滑近紅外光譜和不一上由于光譜推理(見圖16)0一種有趣注旨在西北存在推導幾種設立(組合差距和平滑窗口),給相似預計導數。再會。數,三分差距有五個平滑等于一種四點平滑與一種缺口大小三個;類似地,一種threepoint平滑有缺口七是同樣sixpoint平滑與一種缺口大小三個。這可以推廣到m點平滑與一種缺口大小k等于一種k1點平滑和一種缺口大小m。4.2Savitzky-Golay推導Savtizky和戈利(SG)[21]推廣一種辦法推導數值一種向量,涉及一種平滑一步。為了找到導數在中心點我,一種多項式擬合在一種對稱窗口原始數據(參見圖17)。當參數對于這個多項式計算,任何順序導數這個函數可以很容易地發現分析,這個值隨后被用作導數估算出這個中心點(參閱圖。18)。這個操作是應用于所有分光譜順序。點數目用來計算多項式(窗口大小)和限度擬合多項式都決左要做,。最髙衍生物,可以擬定取決于學位多項式擬合過程中使用(即一種三階多項式可用于預訃三階導數)。oo咱們注意到有一種內在冗余層次構造SG推導。對于每個派生,隨后兩多項式適合將給相似預計系數。第一導數,一種一級多項式和二級多項式將給出同樣答案(如將第三和第四度)。對二階導數,第二和第三級別多項式將給出同樣答案(如將第四和第五度),等。當這個辦法是一方面引入了Savitzky和戈利[21],它依然是計算繁瑣計算參數估算導數。出于這個因素,作者報道一組表列值幾種不同類型衍生品和多項式組合。然而,錯誤在她們第一篇文章簡介了,SteinieretaL[2刀刊登一種修正和擴展版本原始表。這些餐桌是日后甚至進一步擴大,發狂[23]。然而,隨著當代計算機,不再有任何真正需要為這些表。原始形式NW,SG推導使用對稱窗口平滑,規左數據點數疑在每一邊中心點是相似。因而,忽視某些點技術在每一端在預解決。為NW推導,點數目失去了數等于分用于平滑加上差距大小減去一種。對于SG推導,點數目失去了數等于分用于平滑減一。因而吸取更多點NW推導比SG推導。如果譜向量是長(即超過500點),這個問題不重要,但是,對于較短光譜(例如,二極管陣列儀器),這個損失波長也許是重要。每天p和舍伍徳在1980年[24]和[25]天呀在1990年提岀一種解決方案,涉及使用一種基于非對稱多項式擬合終端窗口。在實踐中,這意味著米第一種得分譜預訃從2m+1第一分光譜,和一種類似預計去年米點。然而,這樣解決方案將簡介,顯然工件精度衍生品隨距離中心點(m+1)。此外,預訃端點并不擁有內在冗余提到:沒有兩個后續SG多項式秩序配件將給相似預計。此外,預計潛孔導數相等所有端點如果譜是平滑潛孔秩序多項式。NW推導類似于有限差別,但引入了平滑和缺口大小為counteractions在預計衍生物光譜保持信號-噪音比例。這兩個環節在NW派生或多或少是獨立。然而,SG推導使用更多常用過濾技術來估算導數光譜,而不是使用有限差分辦法,適合一種多項式通過一系列點來維持一種可接受信噪比。普通來說,NW,SG派生不給相似預計。唯一一雙設立,讓相似成果是三個平滑分兩,SG使用一階多項式配合,在西北氣隙大小等于1。然而,更復雜(和現實)設立為SG和/或NW自動導致(稍微)不同推導成果。
1200 1400 1600 1800 2000 2200 2400Wavelength(nm)圖16諾里斯威廉姆斯二階導數使用9點平滑和一種缺口大小3。5.間隔和聯合版本提到預解決技術迄今為止,只有預汁衍生品是由一種移動窗操作,只有一種本地某些(窗口)光譜用于任何時間預計校正。然而,所有其她辦法同樣可以在一種窗口明智方式執行。伊薩克松和科瓦爾斯基[26]建議這詳盡分析,并將貝命劃為分段MSC(PMSC)oAndcrsson[27]預解決辦法相比代替兩個版本PMSC:移動窗或本地預解決伐U提成幾某些波長軸和執行預解決在每一種某些分別)。這個移動窗版本預解決技術獲得了某些利益,從近紅外光譜社區,也許是由于對的選取窗口大小是至關重要,它是遠離瑣碎要對的做到這點。過小窗口會導致引進大型工件在糾正光譜和減少信噪比。然而,更大窗口大小,較小完整和移動窗之間區別預處
OoOoO0oveoO劇W。oDeravRoo1685 1690 1695 1700 1705 1710 1715Wavelength(nm)圖17預計,Savitzky-Golay-階導數。支持率窗戶,一種二階多項式是用來平滑理(見圖19)。本地窗口預解決是有用,特別是在記錄狀況下測量光譜從視覺范疇或短波近紅外光譜中期紅外范疇。在這個寬光譜區,幾種不同散射問題并存,和光譜應當相應分割,執行單獨散射糾正在不同某些。然而,由于這不是本質上不同于在區域劃分光譜預解決辦法,應用獨立,咱們不討論它進一步。使用預解決辦法組合是豐富文學,原則上,任何序列預解決是也許。然而,如下簡樸規則可以作為最初指引方針。1) 散射校正(除了原則化)應當被執行之前,分化。這些技術都是設計用于修正原始光譜,從未被以為是修正一種分化或基線糾正譜。2) 可以使用規范化兩端校正,盡管它是容易評估正常化影響如果是任何苴他操作之前執行。3)SNV之間基本差別與隨后消除趨勢和MSC與參照和基線校正是,在MSC,同步應用兩
個修正,而不是持續?因而,普通會給一種較小MSC基線校正比SNV加徳趨勢。4)另一方而是SNV執行de趨勢并不推薦BarnesetaL[13],基于以上因素,不推薦進行消除趨勢第一。6.一種左量例子1200 1400 1600 1800 2000 2200 2400Wavelength(nm)圖18Savitzky-Golay預計二階導數使用9分和一種二階多項式平滑。當前咱們將應用所有預解決辦法討論到一種圧量分光任務涉及32杏仁蛋白軟糖樣品測量六非常不同光譜分析儀作為預測變量兩種不同響應變量:水分和糖含量。這些數據來自一項由克里斯騰森etalo[3]o圖20顯示了一種,光譜集。對于一種總結數據,見表1。在這里,咱們展示了pls回歸模型,建立所有六個近紅外光譜儀器,和響應分別(所謂PLS1模型⑸)。杏仁糖近紅外光譜數據集是不同預解決技術解決本文中描述。除了設立用于理論某些,某些更極端參數設立進行估算,以顯示分段MSC使用合理選取重要性。沒有樣本被當作是例外,由于所有樣本體現不錯在最初摸索性分析。引導錯誤預計[28]被用作驗證辦法。共有1000引導圖紙進行每種組合數據集、引用和預解決。同一套圖紙是用于所有數據集,除了儀器1,只有十五32樣品進行了測量。0.632引導預計預測誤差進行了計算見方程(14),按照WehrensetaL[28]RMSEf=0.368-RMSEf+0.632-RMSEPf(14)其中RMSEf預測誤差預計并且和RMSEP’普通校準(樣本每一種引導得出選取)和預測(不是每一種樣本選取引導畫)錯誤在所有引導圖紙。最優數量因素,f,是決泄基于0.632引導預汁,選取第一種最低或地方RMSEf曲線作為函數因素變得平緩(RMSEf曲線斜率是常數)。111111II 11200 1400 1600 1800 2000 2200 2400Wavelength(nm)圖19移動窗口原則正態變雖使用129nm移動窗口(65測雖分)。通過應用所有預解決技術相似樣本集記錄六個不同工具和/或光學測量幾何圖形(分散,干涉儀,反射、透射和光纖探針)使用兩個不同響應(水分和糖),某些普通性性能差別是顯示(見Tables2和3)。作為一種非常一方而觀測,它是安慰,幾乎所有預解決模型是簡樸或更簡約(例如,使用更少請因素)比全球模型、獨立光譜儀建立和獨立響應變量。第二個普通觀測,過濾器儀器1在反射模式不是競爭在測量杏仁糖樣品(RMSEmoisture=0.75、4潛變疑(lv)和RMSEsugar=2.30,3lv;但咱們需要記住,只有1532樣品測量)和預解決沒有協助,讓它回落到其他樂器水平。過濾器工具并不是真正兼容光譜派生技術,但英她預解決技術也未能達到預期性能。第三個普通評論可以在全息信息內容近紅外光譜,在這種信息(泛音)會重復浮現多次。小光譜范疇850-1050海里(覆蓋著儀器6),它包括第二泛音o-h和nh伸展和第三泛音從
完全競爭延伸與更精密儀器覆蓋完整或老式近紅外光譜區域。此外,很有趣一點是,創立模型從光譜從傳播基本儀器6普通是最簡樸,甚至在預解決。顯然,從密度波動散射測量樣品傳播方式不太苛求比反射散射測量反射模式。當談到預解決,這是令人驚訝,與所有其她樂器,歐幾里得規范工作得非常好,提供了最佳成果對儀表6(RMSEmoisture=0.38,3lv,RMSEsugar=1.39,5lv)。因素也許是,這小NIR區域包括所有氫鍵覆蓋從示例和一種規范化辦法從而相應于整合所有質子信號并設立質子密度樣本之間平等。除了原則化辦法,這似乎是一種較好預解決,衍生品方略對于這種類型數據,由于她們可以始終簡化模型,特別明顯對于糖預測。1200140022002400o>oueq」osq<1200140022002400o>oueq」osq<Wavelength(nm)圖表1032杏仁蛋白軟糖樣品測雖儀器2,在間隔1100-2500海里。(Table1?Overviewoftheinstrumentsus?iforthemeasurementsof32marzipansamples[引InstrumentOpticalprincipleSpectralrangeSpedralintervalSampleunit1*Filterinstrurr^nt19wavelengths^*-Routingsamplecup,refectionrDispesivescanning1100-2500nm2nmSamplecup,reflection3Dispesivescanning1100-2100nm2rmFiberprobe,reflection4lnlPri&mrYM>fAr(FT)fULKOOnm11.Arm"1Jmpbcup,曲kwficn5Interferometer(FT)1000-2222nm12cm-1Fiferprobe,reflection6Dispesivescanning850-1050nm2nmSamplecup,transmission"Only15marzipansamples\\eremeasuredfoethisinstrument.bThefiltersarecenteredat:1110,1128,1138,11S4,1188,1200,1212,1238,12S4,1262,127&1320,1670,1680,1940,2100,2180,2230and2310nm.?Sameinstrumerrandset-upasusedformeasuringthepecinsamplesinthisarticle.對于剩余全地區近紅外光譜儀器2-5,咱們發現某些有趣和強大差別取決于響應變量,大概是由于含水率是一種低辨別率光譜任務而糖含量是一種高辨別率問題。對于水分模型、色散儀器2和3幾乎總是比模型基于傅里葉變換工具4和5。最佳整體模型為工具PSNVwindow-width發現2129預解決(RMSE=0.30、4lv)和最佳傅里葉變換模型是發現對儀表5用光纖運用MSC和secondordcr參照校正(RMSE=0.37,5lv)。當添加一種光纖探針儀器2(=儀器3),模型復雜性增長(平均3lv)。這個大差別可以分派到更復雜光學幾何后期系統。此外,性能沒有預解決是相似(RMSE=0.42),但預解決性能儀器3是劣質(RMSE=0.37,10個lv使用SNV和MSC)最佳模型儀器2。Table2.Predictionr?ulsforthemdsturecon^ntofthe32rrarzipar?mpl?onsixdifferentNIRirKtrunentswithdiffeientpr^-pn>Table2.Predictionr?ulsforthemdsturecon^ntofthe32rrarzipar?mpl?onsixdifferentNIRirKtrunentswithdiffeientpr^-pn>cessi%givenasftM5fwithnumberoflatentvariablesinbrackets.MoisturecontentrangeInsaument1=7.4-18.6hstrunent24=a8-18.6{w/w%3Table2.Predictionr?ulsforthemdsturecon^ntofthe32rrarzipar?mpl?onsixdifferentNIRirKtrunentswithdiffeientpr^-pn>Table2.Predictionr?ulsforthemdsturecon^ntofthe32rrarzipar?mpl?onsixdifferentNIRirKtrunentswithdiffeientpr^-pn>cessi%givenasftM5fwithnumberoflatentvariablesinbrackets.MoisturecontentrangeInsaument1=7.4-18.6hstrunent24=a8-18.6{w/w%3WthodSettingsInstruawntsNoneMSCMSGMSCSNVrD^reidWMSCLMSCSNVNormNWSGSGFinitedifferenceNWNWSGFinitedifferenceP5NVFMSCFMSCFMSCFMSCFi5t-orderrefereirecorrectionSecondorderreferenceconectionFist-orderreferercecmrection十saondoderwavdeigthcorrectionFist-orderreferercecarectionFisHxderrefererceconectionELclideanWthodSettingsInstruawntsNoneMSCMSGMSCSNVrD^reidWMSCLMSCSNVNormNWSGSGFinitedifferenceNWNWSGFinitedifferenceP5NVFMSCFMSCFMSCFMSCFi5t-orderrefereirecorrectionSecondorderreferenceconectionFist-orderreferercecmrection十saondoderwavdeigthcorrectionFist-orderreferercecarectionFisHxderrefererceconectionELclideanS^ven-pointsmocching,gapsize3,fi旳derivatiseSeven-pointsmocthin&second-crderpolynomial,firstderivatkeIS-pointsmoothin&seccn4ord&polynorrialf伽derivatkeFistderivativeNne-pointsmoothing,gapsize\secondderivativeTb.ree-point$mocrhinggapsize\secondderivativeNne-pointsmoothingsecond-orderpolynomial^secondderixativeSecondderivativeWindowwidth129Windowwidth129Fist-orderreferencecorrectionWindowwidth65Fist-orderreferencecorrectionWindowwidth17Fist-orderreferencecorrectionWindowwidth129Secondorderreferencecorrection0.75(410.64⑶0.62(4)0.61(4!0.61(410.75⑶0.H⑶0.65⑶0.70⑶0.66Hi0.S8⑶3/3(410."<4*0.38糾O.S8(4)0.58(4)0.76(41?(?)-G)-00.643)-(■)0.42⑺036(6}0.41(5)039⑸035⑸039⑸036(5}035(6}035(6}038(5}038(5)0.41(7)034⑸038(5)035(6}034(6}0.72⑷030⑷0.40⑹033⑹5.06⑴038⑷0.42(100.37(10)0.41⑺0.4B!9)0.49(9)0.40(10)0.37(10)0.37(10}0.39(10)0.40(9)0.41⑹0.40(10)0.65⑸0.57⑹0.62⑺<17{1}7.54⑴0.71;4}0?46⑹0.45(4}0.M⑶0.43⑸0.420.420.420.410.4(10.460.S80.390.530.510.88⑸0.AB(4)037⑸0.35⑹3.79(1)0.40⑹4)刀4)4)
flfl/(?0.48(7}035(8)0J76}0.40S)0.410.410.410520.470.49(7)0.73糾031(6)0.71⑹0.67(5)0.91C)0.45(5)0.45(6)3^3(1)052⑷0.W(40.46(40.45(40.50(S0.45(3?0.M(4>0.46S0.46(4J0.如(3\0.45(3?0.46⑶0.490.46⑶0.45⑶0.46⑶0.46R0.42(6-W-H0.47⑷3.26(11)-H對于糖模型,狀況幾乎是逆轉。在這里,干涉儀基本儀器4顯示始終最佳模型,但更復雜,大概是由于更好光譜辨別率儀器。最佳整體模型對儀表與MSClst發現4訂單ref,二階波浪預解決(RMSE=0.92,9lv),遠比最佳色散成果(RMSE=1.30,4lv對儀表2)但也復雜得多。再一次,對于糖模型,添加一種光纖探針儀器2(=儀器3)使得模型劣質和復雜得多(平均兩個lv和增長最佳兩個模型之間RMSE從1.22到1.81對于儀器儀表23)。這個移動窗版本SNV和MSC顯示不同成果。普通來說,移動窗版本給成果類似于或比最佳剩余預解決辦法。然而,頂多10%RMSE是比最佳正常預解決技術,但窗口選取也許很容易成為一種核心參數。相比之下,某些次優移動窗辦法都包括在最后三行表2和3。差別有限差分辦法,推導和更復雜辦法是不明顯預計第一導數某些測量(儀器2、3和6)o這很適合這些系統平穩行為,表白額外平滑是沒有必要。這個干涉儀(儀器4和5)有一種更好光譜辨別率,給上升到一種更高限度稱細構造,導致低信噪比在預計一階導數有限差分法。這最后導致劣質模型。成果,使用有限差分第二衍生品普通是,她們都不如更復雜辦Table3.Sugarpredictionikuiuwthesujarconfentoftte32nur?ipan?mpl?dnsixdift^ntNIRir^trjfwntswithdifferentpr^-proc?;ing,Table3.Sugarpredictionikuiuwthesujarconfentoftte32nur?ipan?mpl?dnsixdift^ntNIRir^trjfwntswithdifferentpr^-proc?;ing,givenasRMSEwithnumteroflatentyariabtesinbrackets.Sugarcontentrange32.2-68.7(w/w^)2 3Table3.Sugarpredictionikuiuwthesujarconfentoftte32nur?ipan?mpl?dnsixdift^ntNIRir^trjfwntswithdifferentpr^-proc?;ing,Table3.Sugarpredictionikuiuwthesujarconfentoftte32nur?ipan?mpl?dnsixdift^ntNIRir^trjfwntswithdifferentpr^-proc?;ing,givenasRMSEwithnumteroflatentyariabtesinbrackets.Sugarcontentrange32.2-68.7(w/w^)2 3法。這表白在信噪比MethodSettingInstrumentsNoneMSCM5CMSCSNW-DetrendWMSCIMCswNormNWSGSGFinitedifferenceNWNWSGFinitediffeencePSNVPMSCPMSCPMSCPMSCFirst-orderrefer閉gcorr?tionSecondoreferreferencecorrectionFirst-or<terreferwwcorrw^ion-swsrddderwavelengthconedionFirst-orderreferencecorrectionFirst-orderreferencecorrectionEuclideanS^v^n-paintsnw^hing.gapsi型3,firstderivativeSeven-pointsmooching,second-orderpolynomial,first15-pointsmoothisecond-orderpolynomial,firstdervatrveFirstderivativeNine-pointsmoothing,japsize3,seccndderivativeThree-pointsmoothinggapsize3,secondderivativeNine-pointsmoothingsecond-orderpdynomid,M&iwtiveSecondderiYatireWindowwidth129Windowwidth129First-orderreferencecorrectionWindowwidth65First-orderreferencecorrectionWindowwidth17First-orderreferencecorrectionWindowwidth129Secondoreferreferencecorrection230B)2.11Q1id1.95MethodSettingInstrumentsNoneMSCM5CMSCSNW-DetrendWMSCIMCswNormNWSGSGFinitedifferenceNWNWSGFinitediffeencePSNVPMSCPMSCPMSCPMSCFirst-orderrefer閉gcorr?tionSecondoreferreferencecorrectionFirst-or<terreferwwcorrw^ion-swsrddderwavelengthconedionFirst-orderreferencecorrectionFirst-orderreferencecorrectionEuclideanS^v^n-paintsnw^hing.gapsi型3,firstderivativeSeven-pointsmooching,second-orderpolynomial,first15-pointsmoothisecond-orderpolynomial,firstdervatrveFirstderivativeNine-pointsmoothing,japsize3,seccndderivativeThree-pointsmoothinggapsize3,secondderivativeNine-pointsmoothingsecond-orderpdynomid,M&iwtiveSecondderiYatireWindowwidth129Windowwidth129First-orderreferencecorrectionWindowwidth65First-orderreferencecorrectionWindowwidth17First-orderreferencecorrectionWindowwidth129Secondoreferreferencecorrection230B)2.11Q1id1.95(21209⑵2232)2.11⑵2.11⑵2230)2X)7⑵2.070)12.50(>}2.100)2.15(2)2.10Q12Q5(3)2.05Q]?(?)■(■)-(-)2.11(1)1.45⑸131(4)1.400)1.4X6)2.47⑺1.94⑻2.11(811£7⑻i.例⑼0.95⑼0?97⑹0.93⑼i.M⑻LSb1?57⑹1.71⑸皿⑸1.41⑸1.84⑶?)HHSWH伍佝I*1f16F>43沖33455157(6)125⑹1.68⑶122⑹126⑹1.90(5){6)1546)154J4)17.M(1)(5)1用8(8)1.9hfi:1.94⑻3S233⑹1.99(7)1.93(8)2.11⑺1.94⑹(8)13⑻225(4)2?45⑸225⑸250⑹14.63(1)24.11(1)228⑹1.00⑻0.95⑼0.92(10)0.90(10)1.09(10}1.10⑼1.23(8)1.68⑹1.65(4)1.64⑹1.64⑹f.99R1.75⑻1.76(7)1.71⑵1.68⑷朋;1.37⑸1.39⑸1.43(4)1.42(4)1.47⑺1.50⑸1?25(7)1.39⑻131:7)1.冥8:1.23⑹3.72(1)B.97⑴1.45⑹2」0⑹2.35⑸2.04(7)147(6)2.28⑹3.06(4)1.62(7)1.59⑸1.73⑸13.13(1)1.71⑸1.44⑸1.12>1:1.43⑵1.42⑵1.42(2)1.39⑵?(?)1.52⑹12X)1⑹7.總結顯然,咱們立量例子并不能給岀權威回答,例如哪些預解決使用在何種給定狀況下。然而,它的確使用原則化在短波近紅外透射光譜是明智和運用MSC(-階參照校正)或原則SNV對于大多數其她某些狀況。雖然很難找到最佳預解決,這確是可以使用錯誤預解決。這重要是由于不對的參數設立窗口大小和/或平滑函數預計衍生品和移動窗技術。最后,咱們強調任何預解決只是對模型進行一左疑改進,全局建模大概25%在咱們研究中。25%降價,而也許是重要工業應用[29],這是幾乎沒有什么使區別在許多多元可行性研究蓬勃發展,在科學文獻中,咱們可以推薦選取預解決,以實現最佳,最具備闡明模型。參照文獻625. Barnes.J.Near625. Barnes.J.Near625. Barnes.J.Near625. Barnes.J.Near|1|S.Wold.K.Esbensen.P.Geladi,Chemom.Intell.Lab.Syst.2(1987)37.|2]S.B.Engelsen.E.Mikkelsen.L.Munck?Progr.ColloidPolym.Sei.108(1998)166.|3]J.Christensen.L.Nprgaard?H.Heimdal,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鍋爐行業法律法規與合規管理考核試卷
- 生態農業與面源污染控制考核試卷
- 中職幼兒衛生常見疾病
- 急診急救班小講課
- 兒童呼吸道系統概述
- Pyralomicin-2b-生命科學試劑-MCE
- 6-Alkyne-F-araNAD-生命科學試劑-MCE
- 探索2025年成人教育線上學習新模式下的個性化學習體驗報告
- 2025年腫瘤精準醫療臨床實踐研究進展報告
- 【高中語文】高一下學期期末適應性模擬考試語文試題
- 《DTP藥房管理中靜脈注射類創新藥物患者用藥風險識別分析5400字》
- 全國行政區域身份證代碼表(電子表格版)
- 期末復習人教PEP版英語五年級下冊
- 微弱的光亮(2024年山東煙臺中考語文試卷記敘文閱讀試題)
- 渠道安全巡檢注意事項
- 互聯網醫院共建合同
- 婦科重點專科工作匯報
- 紅色大氣簡約傳承紅色基因弘揚革命精神紀念抗美援朝
- 大別山精神完整版本
- 2024年06月常熟農商銀行小微金融總部招聘筆試歷年參考題庫附帶答案詳解
- 充電樁工程施工技術方案
評論
0/150
提交評論