基于改進蟻群算法的棉花異性纖維圖像目標特征選擇_第1頁
基于改進蟻群算法的棉花異性纖維圖像目標特征選擇_第2頁
基于改進蟻群算法的棉花異性纖維圖像目標特征選擇_第3頁
基于改進蟻群算法的棉花異性纖維圖像目標特征選擇_第4頁
基于改進蟻群算法的棉花異性纖維圖像目標特征選擇_第5頁
已閱讀5頁,還剩1頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于改進蟻群算法的棉花異性纖維圖像目標特征選擇

特征選擇技術棉花纖維是指將棉花收獲、收獲、儲存、運輸和加工過程中混合填充棉花的非棉纖維和彩色纖維,嚴重影響棉花及其產品的質量,如毛發、繩索、膜土、糖紙、編織袋絲等。異性纖維雖然含量很少,但危害很大。研究快速檢測皮棉中異性纖維,并減少或消除它,對于提高加工質量和效率是非常必要的。根據皮棉雜質檢測技術的特點,從原理上可分為基于圖像技術的雜質檢測和基于分光技術的雜質檢測。基于圖像技術的機器視覺技術采用CCD攝像機能夠快速無損、準確檢測棉網表面的雜質。利用機器視覺技術進行雜質檢測,在國內外都有相關研究[3~7]。從棉花異性纖維圖像中可以提取出眾多的原始特征用于異性纖維分類,但選用大量的原始特征并不能保證分類的精度,并且還將降低分類的速度。特征選擇是指從一組原始特征中挑選出一些最有效的特征,以達到降低特征空間維數的目的。蟻群算法(antcolonyalgorithm,簡稱ACA)是一種源于生物世界的仿生類隨機搜索算法,因為蟻群算法利用正反饋的原理,可加快進化過程,而且是一種本質并行的算法,不同個體之間不斷進行信息的交流和傳遞,從而能夠相互協作,有利于發現較優解。蟻群算法在解決組合優化問題方面得到了良好的效果[11~12],但算法搜索時間偏長、易局部收斂。本文提出一種基于改進蟻群算法(improvedantcolonyalgorithm,簡稱IACA)的特征選擇方法。1種植物物種的組合棉花異性纖維種類雖多,但主要分為塑料布類、布條類、麻繩類、毛發類、丙綸絲類和羽毛類等6類,單獨使用某種特征幾乎無法對棉花異性纖維進行準確分類,組合使用顏色、形狀和紋理特征,則可以提高異性纖維分類的正確率。1.1特征指標的提取顏色是區分棉花異性纖維類別的一種重要特征。采用不同的彩色空間,可以得到不同的顏色特征表示。本文對棉花異性纖維在RGB、HIS彩色空間進行顏色特征提取,共提取24個顏色特征,其中RGB彩色空間12個特征(RGB均值、R均值、G均值、B均值、RGB方差、R方差、G方差、B方差、RGB三階矩、R三階矩、G三階矩、B三階矩),HIS彩色空間12個特征(HIS均值、H均值、S均值、I均值、HIS方差、H方差、S方差、I方差、HIS三階矩、H三階矩、S三階矩、I三階矩)。1.2各屬性的描述棉層中的不同種類異性纖維呈現不同的形狀,典型的是片狀、絨狀和線狀。異性纖維目標的形狀特征可以由其幾何屬性(如長短、面積、凹凸等)和拓撲屬性(如連通性、歐拉數等)進行描述。對棉花異性纖維的形狀特征,共提取最適合表達其形狀的8個形狀特征:面積和高度比、面積和長度比、面積、歐拉數、充實度、周長、形狀參數、偏心率。1.3結論:及其不同基紋理反映了圖像亮度的空間變化情況,描述紋理的參數包括紋理的強度、密度、方向、粗糙度等。紋理分析方法包括統計紋理分析法和結構紋理分析法,其中統計紋理更適合描述含有異性纖維的棉層紋理。本文提取的紋理特征包括絕大部分的紋理特征,主要有基于灰度共生矩陣、灰度平滑共生矩陣、灰度梯度共生矩陣、差分的紋理特征,其中,灰度共生矩陣特征(距離為1像素4個方向(0°、14°、90°、135°)均值反差、熵、逆差距、能量、集群蔭、集群突出、灰度相關,距離為2像素4個方向(0°、14°、90°、135°)均值反差、熵、逆差距、能量、集群蔭、集群突出、灰度相關)14個,灰度平滑共生矩陣特征(反差、熵、逆差距、能量、集群蔭、集群突出)6個,灰度梯度共生矩陣特征(小梯度優勢、大梯度優勢、灰度分布不均勻性、梯度分布不均勻性、能量、灰度平均、梯度平均、灰度方差、梯度方差、相關、熵、慣性、逆差距、集群蔭、集群突出)15個,差分紋理特征(相距1、2像素距離的對比度、二階矩、熵、平均值)8個,共計43個。1.4樣本特征數據的獲取棉花異性纖維采用75維的特征向量表示,特征向量包含24個顏色特征、43個紋理特征、8個形狀特征。樣本圖像為234幅含有異性纖維的4000像素×500像素的24位真彩色圖像,這些圖像從實時采集的4000幅圖像中選出。對樣本圖像進行分割處理,分割出的小目標按照塑料布類、布條類、麻繩類、毛發類、丙綸絲類和羽毛類共6類進行分類,每類選擇135個小目標,共計810個棉花異性纖維小目標,對小目標進行特征提取,得到810個75維樣本特征數據。樣本特征數據的2/3用作訓練集,其余1/3用作測試集,得到訓練集樣本數據540個,測試集樣本數據270個。為消除由于特征取值范圍不同造成的影響,所有特征數據都進行了歸一化。2基于反饋的棉棉分類模型自然界中螞蟻尋找從巢穴到食物源的最短路徑是通過一種正反饋的機制實現的,螞蟻行為是一種群體行為,簡單的螞蟻個體利用信息素可以相互影響,相互協作,并利用其作為反饋,使得問題的解朝全局最優解的方向不斷進化,最終能有效地獲得相對較優的解。但蟻群算法普遍存在搜索時間長、局部收斂等問題。本文針對棉花異性纖維特征對蟻群算法作了兩方面改進:一是通過初始概率預處理,將各特征的單獨分類能力與其初始選擇概率相聯系,增大分類能力強的特征的選擇機率,減小了冗余特征的影響,減少了搜索時間;二是通過針對棉花異性纖維特征的分段變異運算,確保不漏掉顏色、紋理、形狀3類特征中分類性能高的特征,解決了局部收斂問題,保證所選取的特征具有全局最優性。2.1特征編碼順序分段特征屬性表存放每個特征的選擇概率與信息素,特征屬性表按顏色、紋理、形狀分為3段,圖1為分段特征屬性表結構,pci(i=1,2,…,n1)表示第i個顏色特征的選擇概率,pti(i=1,2,…,n2)表示第i個紋理特征的選擇概率,psi(i=1,2,…,n3)表示第i個形狀特征的選擇概率,τci(i=1,2,…,n1)表示第i個顏色特征的信息素含量,τti(i=1,2,…,n2)表示第i個顏色特征的信息素含量,τsi(i=1,2,…,n3)表示第i個顏色特征的信息素含量,n1、n2、n3之和為特征總數。每只螞蟻攜帶特征集的特征編碼及相應所選特征集的適應度;特征按照0、1進行分段編碼,特征的編碼順序與分段特征屬性表一致,0代表該特征未被選擇,1代表該特征被選擇;圖2是螞蟻結構示意圖,螞蟻Cci(i=1,2,…,n1)表示第i個顏色特征編碼,Cti(i=1,2,…,n2)表示第i個紋理特征編碼,Csi(i=1,2,…,n3)表示第i個形狀特征編碼,s表示該螞蟻所選擇的特征子集的適應度。2.2特點方面的應用特征的單獨選優法是計算各特征單獨使用時的判據值并以遞減排序,選取前d個分類效果最好的特征。利用單個特征的可分性設置蟻群算法的初始選擇概率,分類能力強的特征在算法初始階段選擇機率大,被優先選擇,分類能力弱的特征選擇機率小,特征的選擇范圍也相應地縮小。算法運行初期,所選擇的特征子集以單個特征分類性能強的特征為主,隨著算法的運行,將逐漸得到最優特征組合,為了使每個特征都得到被選擇的機會,在初始選擇概率計算上,單獨特征的分類能力只作為參照。本文改進的初始概率預處理方案為首先計算各特征的最大類間距離與最小類內距離的比值,以此作為特征的初始選擇概率的參照,但并不將其值直接作為初始概率,而是作為基數0.4基礎上的增加量,同時限定最大初始選擇概率為0.7。選擇0.4作為基礎是為了確保個體分類能力低的特征存在被選擇的機率,最大初始選擇概率為0.7是為了確保個體分類能力強的特征存在被舍去的機率。這樣即可以充分利用個體的分類能力,加快算法的搜索,同時,又給予個體分類性能低的特征被選擇的機會,保證搜索范圍不局限于局部。初始選擇概率的計算公式為式中pi——第i個特征的初始選擇概率di——第i個特征的最大類間距離與最小類內距離比值c——樣本的種類總數m——所有樣本的均值向量;樣本向量維數為1,即僅包含所計算特征值xj(i)——第i類樣本中的第j個樣本的特征值2.3分段變異策略蟻群算法作為一種隨機搜索算法,也存在局部收斂停滯現象,為避免算法局部收斂,確保選擇出的特征子集為全局最優解,結合棉花異性纖維采用顏色、紋理、形狀組合特征進行分類的特點,對蟻群算法進行改進,通過特征分段變異策略,保證了最優特征子集的全局性。特征分段變異策略為:特征集按顏色、紋理、形狀特征分3段;變異時,分別對每段特征進行變異;變異原理為特征取反,特征是已選取狀態的,則修改為未選取狀態,如是未選取狀態的,則修改為已選取狀態;變異螞蟻及各段變異特征的數量分別按照螞蟻及總特征數量的一定比例確定;變異螞蟻及各段變異特征的數量隨機確定。螞蟻取優舍劣策略為:變異后螞蟻的特征子集適應度如大于原螞蟻特征子集的適應度則將變異螞蟻替換原螞蟻,否則不替換。變異的具體過程為:所有螞蟻完成一次選擇后,按照變異螞蟻比例隨機確定需變異的螞蟻,對需變異的螞蟻進行分段變異,按照特征變異比例隨機對每段需變異的特征進行變異,完成對每只螞蟻的變異后,計算適應度,并與原螞蟻的適應度進行比較,確定是否替換原螞蟻,完成變異。特征的分段變異策略強制顏色、紋理、形狀參與優化過程,使優化后的特征子集具有全局性。2.4特征的選擇概率特征是每個螞蟻都必須經過的節點,每完成一次循環,每只螞蟻遍歷全部特征。每個特征有一個選擇概率,螞蟻每經過一個特征節點,根據特征的選擇概率,采用輪盤賭法決定特征是否被選擇,螞蟻利用特征的選擇概率,對特征進行選取,特征的選擇概率越大,被選擇的可能性就越大。設特征的選擇概率為Pi(i=1,2,…,n;n表示特征總數),螞蟻每經過一個特征節點,隨機產生一個范圍內的隨機數r,如果r<Pi,則特征i被選擇;否則特征不被選擇。所有螞蟻每完成一次對全部特征的選擇之后,重新對特征的選擇概率進行計算,為保證每個特征的選擇概率不大于1或小于0,當選擇概率大于1時取1,小于0時取0。特征選擇概率的計算公式定義為ε——概率變化系數τ(i,t)——第t次循環時特征i信息素含量2.5內部較優路徑較優解的生存能力提高了求解算法的效率信息素是蟻群算法的重要特征,信息的反饋機制主要通過信息素的變化實現。特征的信息素更新機制有兩類,一類利用局部信息,一類利用整體信息。利用整體信息更新規則會讓短路徑(較優解)上對應的信息量逐漸增大,充分體現了算法中全局范圍內較短路徑(較優解)的生存能力,加強了信息正反饋性能,提高了系統搜索收斂的速度。算法中,信息素利用整體信息更新,每次循環后,每個特征的信息素都將變化,特征被選擇的次數越多,信息素增量越大,相應的選擇概率越大,特征被選擇的次數越少,信息素增量越小,相應的選擇概率越小。信息素計算公式為式中τ(i,t)——第t次循環時第i個特征所帶有的信息素含量Δτ(i,t)——特征i在第t次循環后信息素的改變量α——信息素揮發系數β——信息素變化系數a——螞蟻總數xi——所選擇的特征子集f(xi)——特征選擇函數,如果特征xi被第j只螞蟻所選擇,則f(xi)等于1,如果未被選擇,則f(xi)等于0sj——第j個螞蟻的適應度si——第t次循環后所有螞蟻適應度之和2.6分類正確率函數適應度是衡量所選特征子集優劣的唯一指標,特征選擇的目的是找出分類能力最強的特征子集,因此分類正確率是計算個體適應度時首先要考慮的因素。這樣,個體適應度應是分類正確率的函數,且分類正確率越高則適應度越高;反之,分類正確率越低則適應度越低。式中S(xi)——所選特征子集的適應度J(xi)——利用K均值分類器計算的準確度2.7改進的蟻群算法流程算法終止條件是按最大適應度值連續一定次數不變,輸出最優特征子集。算法流程如圖3所示。3模型運行時間算法利用Matlab7.0編程實現,IACA算法初始概率利用本文前述方法設置,變異螞蟻系數0.1,變異特征系數0.1,ACA算法初始概率采用固定值0.5,其余參數兩種算法采用相同設置:螞蟻數50,信息素揮發系數0.6,信息素變化系數0.35,概率系數0.9,概率變化系數4,最大適應度連續不變次數50,分類器采用最近鄰分類器,距離標準采用歐氏距離。IACA和ACA各運行10次求平均,IACA算法需要螞蟻循環1472s,運行時間5152s;ACA算法需要螞蟻循環1977次,運行時間6326s,IACA比ACA螞蟻循環次數減少25%,運行時間縮短19%,表明根據個體分類性能設置初始概率的IACA算法比ACA算法更容易收斂,進一步提高算法的搜索效率。表1是原始特征集的特征數量與利用本文算法進行特征優化選擇后,顏色、紋理、形狀特征數量的比較。IACA所選最小特征子集特征數為22個,ACA所選最小特征子集特征數為27個,特征減少5個,表明對由顏色、紋理、形狀特征組成的棉花異性纖維特征進行特征選擇時,所選擇出的特征子集更小,更利于分類器的設計。IACA所選出的特征分布更均勻,特征分布在顏色、紋理、形狀范圍內,ACA算法選擇的特征缺少形狀特征,這表明ACA在選擇過程中可能出現局部收斂,而IACA分段策略可以避免算法的局部收斂,確保選擇的特征具有全局性。表2是原始特征集、ACA及IACA所選特征集,利用K均值分類器分類結果的比較。原始特征集的平均分類正確率為84%,ACA所選擇出的特征集平均分類正確率為90%,比原始特征集提高了6%,IACA所選擇出的特征集平均分類正確率為93%,比ACA所選特征集提高了3%,并使特征集數量由75個減至22個。這表明,ACA與IACA所選特征集的分類能力都比原始特征集有了很大提高,對原始特征集應用IACA后,所選的特征更適于用作分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論