基于改進(jìn)蟻群算法的棉花異性纖維圖像目標(biāo)特征選擇_第1頁(yè)
基于改進(jìn)蟻群算法的棉花異性纖維圖像目標(biāo)特征選擇_第2頁(yè)
基于改進(jìn)蟻群算法的棉花異性纖維圖像目標(biāo)特征選擇_第3頁(yè)
基于改進(jìn)蟻群算法的棉花異性纖維圖像目標(biāo)特征選擇_第4頁(yè)
基于改進(jìn)蟻群算法的棉花異性纖維圖像目標(biāo)特征選擇_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于改進(jìn)蟻群算法的棉花異性纖維圖像目標(biāo)特征選擇

特征選擇技術(shù)棉花纖維是指將棉花收獲、收獲、儲(chǔ)存、運(yùn)輸和加工過(guò)程中混合填充棉花的非棉纖維和彩色纖維,嚴(yán)重影響棉花及其產(chǎn)品的質(zhì)量,如毛發(fā)、繩索、膜土、糖紙、編織袋絲等。異性纖維雖然含量很少,但危害很大。研究快速檢測(cè)皮棉中異性纖維,并減少或消除它,對(duì)于提高加工質(zhì)量和效率是非常必要的。根據(jù)皮棉雜質(zhì)檢測(cè)技術(shù)的特點(diǎn),從原理上可分為基于圖像技術(shù)的雜質(zhì)檢測(cè)和基于分光技術(shù)的雜質(zhì)檢測(cè)。基于圖像技術(shù)的機(jī)器視覺(jué)技術(shù)采用CCD攝像機(jī)能夠快速無(wú)損、準(zhǔn)確檢測(cè)棉網(wǎng)表面的雜質(zhì)。利用機(jī)器視覺(jué)技術(shù)進(jìn)行雜質(zhì)檢測(cè),在國(guó)內(nèi)外都有相關(guān)研究[3~7]。從棉花異性纖維圖像中可以提取出眾多的原始特征用于異性纖維分類(lèi),但選用大量的原始特征并不能保證分類(lèi)的精度,并且還將降低分類(lèi)的速度。特征選擇是指從一組原始特征中挑選出一些最有效的特征,以達(dá)到降低特征空間維數(shù)的目的。蟻群算法(antcolonyalgorithm,簡(jiǎn)稱(chēng)ACA)是一種源于生物世界的仿生類(lèi)隨機(jī)搜索算法,因?yàn)橄伻核惴ɡ谜答伒脑?可加快進(jìn)化過(guò)程,而且是一種本質(zhì)并行的算法,不同個(gè)體之間不斷進(jìn)行信息的交流和傳遞,從而能夠相互協(xié)作,有利于發(fā)現(xiàn)較優(yōu)解。蟻群算法在解決組合優(yōu)化問(wèn)題方面得到了良好的效果[11~12],但算法搜索時(shí)間偏長(zhǎng)、易局部收斂。本文提出一種基于改進(jìn)蟻群算法(improvedantcolonyalgorithm,簡(jiǎn)稱(chēng)IACA)的特征選擇方法。1種植物物種的組合棉花異性纖維種類(lèi)雖多,但主要分為塑料布類(lèi)、布條類(lèi)、麻繩類(lèi)、毛發(fā)類(lèi)、丙綸絲類(lèi)和羽毛類(lèi)等6類(lèi),單獨(dú)使用某種特征幾乎無(wú)法對(duì)棉花異性纖維進(jìn)行準(zhǔn)確分類(lèi),組合使用顏色、形狀和紋理特征,則可以提高異性纖維分類(lèi)的正確率。1.1特征指標(biāo)的提取顏色是區(qū)分棉花異性纖維類(lèi)別的一種重要特征。采用不同的彩色空間,可以得到不同的顏色特征表示。本文對(duì)棉花異性纖維在RGB、HIS彩色空間進(jìn)行顏色特征提取,共提取24個(gè)顏色特征,其中RGB彩色空間12個(gè)特征(RGB均值、R均值、G均值、B均值、RGB方差、R方差、G方差、B方差、RGB三階矩、R三階矩、G三階矩、B三階矩),HIS彩色空間12個(gè)特征(HIS均值、H均值、S均值、I均值、HIS方差、H方差、S方差、I方差、HIS三階矩、H三階矩、S三階矩、I三階矩)。1.2各屬性的描述棉層中的不同種類(lèi)異性纖維呈現(xiàn)不同的形狀,典型的是片狀、絨狀和線狀。異性纖維目標(biāo)的形狀特征可以由其幾何屬性(如長(zhǎng)短、面積、凹凸等)和拓?fù)鋵傩?如連通性、歐拉數(shù)等)進(jìn)行描述。對(duì)棉花異性纖維的形狀特征,共提取最適合表達(dá)其形狀的8個(gè)形狀特征:面積和高度比、面積和長(zhǎng)度比、面積、歐拉數(shù)、充實(shí)度、周長(zhǎng)、形狀參數(shù)、偏心率。1.3結(jié)論:及其不同基紋理反映了圖像亮度的空間變化情況,描述紋理的參數(shù)包括紋理的強(qiáng)度、密度、方向、粗糙度等。紋理分析方法包括統(tǒng)計(jì)紋理分析法和結(jié)構(gòu)紋理分析法,其中統(tǒng)計(jì)紋理更適合描述含有異性纖維的棉層紋理。本文提取的紋理特征包括絕大部分的紋理特征,主要有基于灰度共生矩陣、灰度平滑共生矩陣、灰度梯度共生矩陣、差分的紋理特征,其中,灰度共生矩陣特征(距離為1像素4個(gè)方向(0°、14°、90°、135°)均值反差、熵、逆差距、能量、集群蔭、集群突出、灰度相關(guān),距離為2像素4個(gè)方向(0°、14°、90°、135°)均值反差、熵、逆差距、能量、集群蔭、集群突出、灰度相關(guān))14個(gè),灰度平滑共生矩陣特征(反差、熵、逆差距、能量、集群蔭、集群突出)6個(gè),灰度梯度共生矩陣特征(小梯度優(yōu)勢(shì)、大梯度優(yōu)勢(shì)、灰度分布不均勻性、梯度分布不均勻性、能量、灰度平均、梯度平均、灰度方差、梯度方差、相關(guān)、熵、慣性、逆差距、集群蔭、集群突出)15個(gè),差分紋理特征(相距1、2像素距離的對(duì)比度、二階矩、熵、平均值)8個(gè),共計(jì)43個(gè)。1.4樣本特征數(shù)據(jù)的獲取棉花異性纖維采用75維的特征向量表示,特征向量包含24個(gè)顏色特征、43個(gè)紋理特征、8個(gè)形狀特征。樣本圖像為234幅含有異性纖維的4000像素×500像素的24位真彩色圖像,這些圖像從實(shí)時(shí)采集的4000幅圖像中選出。對(duì)樣本圖像進(jìn)行分割處理,分割出的小目標(biāo)按照塑料布類(lèi)、布條類(lèi)、麻繩類(lèi)、毛發(fā)類(lèi)、丙綸絲類(lèi)和羽毛類(lèi)共6類(lèi)進(jìn)行分類(lèi),每類(lèi)選擇135個(gè)小目標(biāo),共計(jì)810個(gè)棉花異性纖維小目標(biāo),對(duì)小目標(biāo)進(jìn)行特征提取,得到810個(gè)75維樣本特征數(shù)據(jù)。樣本特征數(shù)據(jù)的2/3用作訓(xùn)練集,其余1/3用作測(cè)試集,得到訓(xùn)練集樣本數(shù)據(jù)540個(gè),測(cè)試集樣本數(shù)據(jù)270個(gè)。為消除由于特征取值范圍不同造成的影響,所有特征數(shù)據(jù)都進(jìn)行了歸一化。2基于反饋的棉棉分類(lèi)模型自然界中螞蟻尋找從巢穴到食物源的最短路徑是通過(guò)一種正反饋的機(jī)制實(shí)現(xiàn)的,螞蟻行為是一種群體行為,簡(jiǎn)單的螞蟻個(gè)體利用信息素可以相互影響,相互協(xié)作,并利用其作為反饋,使得問(wèn)題的解朝全局最優(yōu)解的方向不斷進(jìn)化,最終能有效地獲得相對(duì)較優(yōu)的解。但蟻群算法普遍存在搜索時(shí)間長(zhǎng)、局部收斂等問(wèn)題。本文針對(duì)棉花異性纖維特征對(duì)蟻群算法作了兩方面改進(jìn):一是通過(guò)初始概率預(yù)處理,將各特征的單獨(dú)分類(lèi)能力與其初始選擇概率相聯(lián)系,增大分類(lèi)能力強(qiáng)的特征的選擇機(jī)率,減小了冗余特征的影響,減少了搜索時(shí)間;二是通過(guò)針對(duì)棉花異性纖維特征的分段變異運(yùn)算,確保不漏掉顏色、紋理、形狀3類(lèi)特征中分類(lèi)性能高的特征,解決了局部收斂問(wèn)題,保證所選取的特征具有全局最優(yōu)性。2.1特征編碼順序分段特征屬性表存放每個(gè)特征的選擇概率與信息素,特征屬性表按顏色、紋理、形狀分為3段,圖1為分段特征屬性表結(jié)構(gòu),pci(i=1,2,…,n1)表示第i個(gè)顏色特征的選擇概率,pti(i=1,2,…,n2)表示第i個(gè)紋理特征的選擇概率,psi(i=1,2,…,n3)表示第i個(gè)形狀特征的選擇概率,τci(i=1,2,…,n1)表示第i個(gè)顏色特征的信息素含量,τti(i=1,2,…,n2)表示第i個(gè)顏色特征的信息素含量,τsi(i=1,2,…,n3)表示第i個(gè)顏色特征的信息素含量,n1、n2、n3之和為特征總數(shù)。每只螞蟻攜帶特征集的特征編碼及相應(yīng)所選特征集的適應(yīng)度;特征按照0、1進(jìn)行分段編碼,特征的編碼順序與分段特征屬性表一致,0代表該特征未被選擇,1代表該特征被選擇;圖2是螞蟻結(jié)構(gòu)示意圖,螞蟻Cci(i=1,2,…,n1)表示第i個(gè)顏色特征編碼,Cti(i=1,2,…,n2)表示第i個(gè)紋理特征編碼,Csi(i=1,2,…,n3)表示第i個(gè)形狀特征編碼,s表示該螞蟻所選擇的特征子集的適應(yīng)度。2.2特點(diǎn)方面的應(yīng)用特征的單獨(dú)選優(yōu)法是計(jì)算各特征單獨(dú)使用時(shí)的判據(jù)值并以遞減排序,選取前d個(gè)分類(lèi)效果最好的特征。利用單個(gè)特征的可分性設(shè)置蟻群算法的初始選擇概率,分類(lèi)能力強(qiáng)的特征在算法初始階段選擇機(jī)率大,被優(yōu)先選擇,分類(lèi)能力弱的特征選擇機(jī)率小,特征的選擇范圍也相應(yīng)地縮小。算法運(yùn)行初期,所選擇的特征子集以單個(gè)特征分類(lèi)性能強(qiáng)的特征為主,隨著算法的運(yùn)行,將逐漸得到最優(yōu)特征組合,為了使每個(gè)特征都得到被選擇的機(jī)會(huì),在初始選擇概率計(jì)算上,單獨(dú)特征的分類(lèi)能力只作為參照。本文改進(jìn)的初始概率預(yù)處理方案為首先計(jì)算各特征的最大類(lèi)間距離與最小類(lèi)內(nèi)距離的比值,以此作為特征的初始選擇概率的參照,但并不將其值直接作為初始概率,而是作為基數(shù)0.4基礎(chǔ)上的增加量,同時(shí)限定最大初始選擇概率為0.7。選擇0.4作為基礎(chǔ)是為了確保個(gè)體分類(lèi)能力低的特征存在被選擇的機(jī)率,最大初始選擇概率為0.7是為了確保個(gè)體分類(lèi)能力強(qiáng)的特征存在被舍去的機(jī)率。這樣即可以充分利用個(gè)體的分類(lèi)能力,加快算法的搜索,同時(shí),又給予個(gè)體分類(lèi)性能低的特征被選擇的機(jī)會(huì),保證搜索范圍不局限于局部。初始選擇概率的計(jì)算公式為式中pi——第i個(gè)特征的初始選擇概率di——第i個(gè)特征的最大類(lèi)間距離與最小類(lèi)內(nèi)距離比值c——樣本的種類(lèi)總數(shù)m——所有樣本的均值向量;樣本向量維數(shù)為1,即僅包含所計(jì)算特征值xj(i)——第i類(lèi)樣本中的第j個(gè)樣本的特征值2.3分段變異策略蟻群算法作為一種隨機(jī)搜索算法,也存在局部收斂停滯現(xiàn)象,為避免算法局部收斂,確保選擇出的特征子集為全局最優(yōu)解,結(jié)合棉花異性纖維采用顏色、紋理、形狀組合特征進(jìn)行分類(lèi)的特點(diǎn),對(duì)蟻群算法進(jìn)行改進(jìn),通過(guò)特征分段變異策略,保證了最優(yōu)特征子集的全局性。特征分段變異策略為:特征集按顏色、紋理、形狀特征分3段;變異時(shí),分別對(duì)每段特征進(jìn)行變異;變異原理為特征取反,特征是已選取狀態(tài)的,則修改為未選取狀態(tài),如是未選取狀態(tài)的,則修改為已選取狀態(tài);變異螞蟻及各段變異特征的數(shù)量分別按照螞蟻及總特征數(shù)量的一定比例確定;變異螞蟻及各段變異特征的數(shù)量隨機(jī)確定。螞蟻取優(yōu)舍劣策略為:變異后螞蟻的特征子集適應(yīng)度如大于原螞蟻特征子集的適應(yīng)度則將變異螞蟻替換原螞蟻,否則不替換。變異的具體過(guò)程為:所有螞蟻完成一次選擇后,按照變異螞蟻比例隨機(jī)確定需變異的螞蟻,對(duì)需變異的螞蟻進(jìn)行分段變異,按照特征變異比例隨機(jī)對(duì)每段需變異的特征進(jìn)行變異,完成對(duì)每只螞蟻的變異后,計(jì)算適應(yīng)度,并與原螞蟻的適應(yīng)度進(jìn)行比較,確定是否替換原螞蟻,完成變異。特征的分段變異策略強(qiáng)制顏色、紋理、形狀參與優(yōu)化過(guò)程,使優(yōu)化后的特征子集具有全局性。2.4特征的選擇概率特征是每個(gè)螞蟻都必須經(jīng)過(guò)的節(jié)點(diǎn),每完成一次循環(huán),每只螞蟻遍歷全部特征。每個(gè)特征有一個(gè)選擇概率,螞蟻每經(jīng)過(guò)一個(gè)特征節(jié)點(diǎn),根據(jù)特征的選擇概率,采用輪盤(pán)賭法決定特征是否被選擇,螞蟻利用特征的選擇概率,對(duì)特征進(jìn)行選取,特征的選擇概率越大,被選擇的可能性就越大。設(shè)特征的選擇概率為Pi(i=1,2,…,n;n表示特征總數(shù)),螞蟻每經(jīng)過(guò)一個(gè)特征節(jié)點(diǎn),隨機(jī)產(chǎn)生一個(gè)范圍內(nèi)的隨機(jī)數(shù)r,如果r<Pi,則特征i被選擇;否則特征不被選擇。所有螞蟻每完成一次對(duì)全部特征的選擇之后,重新對(duì)特征的選擇概率進(jìn)行計(jì)算,為保證每個(gè)特征的選擇概率不大于1或小于0,當(dāng)選擇概率大于1時(shí)取1,小于0時(shí)取0。特征選擇概率的計(jì)算公式定義為ε——概率變化系數(shù)τ(i,t)——第t次循環(huán)時(shí)特征i信息素含量2.5內(nèi)部較優(yōu)路徑較優(yōu)解的生存能力提高了求解算法的效率信息素是蟻群算法的重要特征,信息的反饋機(jī)制主要通過(guò)信息素的變化實(shí)現(xiàn)。特征的信息素更新機(jī)制有兩類(lèi),一類(lèi)利用局部信息,一類(lèi)利用整體信息。利用整體信息更新規(guī)則會(huì)讓短路徑(較優(yōu)解)上對(duì)應(yīng)的信息量逐漸增大,充分體現(xiàn)了算法中全局范圍內(nèi)較短路徑(較優(yōu)解)的生存能力,加強(qiáng)了信息正反饋性能,提高了系統(tǒng)搜索收斂的速度。算法中,信息素利用整體信息更新,每次循環(huán)后,每個(gè)特征的信息素都將變化,特征被選擇的次數(shù)越多,信息素增量越大,相應(yīng)的選擇概率越大,特征被選擇的次數(shù)越少,信息素增量越小,相應(yīng)的選擇概率越小。信息素計(jì)算公式為式中τ(i,t)——第t次循環(huán)時(shí)第i個(gè)特征所帶有的信息素含量Δτ(i,t)——特征i在第t次循環(huán)后信息素的改變量α——信息素?fù)]發(fā)系數(shù)β——信息素變化系數(shù)a——螞蟻總數(shù)xi——所選擇的特征子集f(xi)——特征選擇函數(shù),如果特征xi被第j只螞蟻所選擇,則f(xi)等于1,如果未被選擇,則f(xi)等于0sj——第j個(gè)螞蟻的適應(yīng)度si——第t次循環(huán)后所有螞蟻適應(yīng)度之和2.6分類(lèi)正確率函數(shù)適應(yīng)度是衡量所選特征子集優(yōu)劣的唯一指標(biāo),特征選擇的目的是找出分類(lèi)能力最強(qiáng)的特征子集,因此分類(lèi)正確率是計(jì)算個(gè)體適應(yīng)度時(shí)首先要考慮的因素。這樣,個(gè)體適應(yīng)度應(yīng)是分類(lèi)正確率的函數(shù),且分類(lèi)正確率越高則適應(yīng)度越高;反之,分類(lèi)正確率越低則適應(yīng)度越低。式中S(xi)——所選特征子集的適應(yīng)度J(xi)——利用K均值分類(lèi)器計(jì)算的準(zhǔn)確度2.7改進(jìn)的蟻群算法流程算法終止條件是按最大適應(yīng)度值連續(xù)一定次數(shù)不變,輸出最優(yōu)特征子集。算法流程如圖3所示。3模型運(yùn)行時(shí)間算法利用Matlab7.0編程實(shí)現(xiàn),IACA算法初始概率利用本文前述方法設(shè)置,變異螞蟻系數(shù)0.1,變異特征系數(shù)0.1,ACA算法初始概率采用固定值0.5,其余參數(shù)兩種算法采用相同設(shè)置:螞蟻數(shù)50,信息素?fù)]發(fā)系數(shù)0.6,信息素變化系數(shù)0.35,概率系數(shù)0.9,概率變化系數(shù)4,最大適應(yīng)度連續(xù)不變次數(shù)50,分類(lèi)器采用最近鄰分類(lèi)器,距離標(biāo)準(zhǔn)采用歐氏距離。IACA和ACA各運(yùn)行10次求平均,IACA算法需要螞蟻循環(huán)1472s,運(yùn)行時(shí)間5152s;ACA算法需要螞蟻循環(huán)1977次,運(yùn)行時(shí)間6326s,IACA比ACA螞蟻循環(huán)次數(shù)減少25%,運(yùn)行時(shí)間縮短19%,表明根據(jù)個(gè)體分類(lèi)性能設(shè)置初始概率的IACA算法比ACA算法更容易收斂,進(jìn)一步提高算法的搜索效率。表1是原始特征集的特征數(shù)量與利用本文算法進(jìn)行特征優(yōu)化選擇后,顏色、紋理、形狀特征數(shù)量的比較。IACA所選最小特征子集特征數(shù)為22個(gè),ACA所選最小特征子集特征數(shù)為27個(gè),特征減少5個(gè),表明對(duì)由顏色、紋理、形狀特征組成的棉花異性纖維特征進(jìn)行特征選擇時(shí),所選擇出的特征子集更小,更利于分類(lèi)器的設(shè)計(jì)。IACA所選出的特征分布更均勻,特征分布在顏色、紋理、形狀范圍內(nèi),ACA算法選擇的特征缺少形狀特征,這表明ACA在選擇過(guò)程中可能出現(xiàn)局部收斂,而IACA分段策略可以避免算法的局部收斂,確保選擇的特征具有全局性。表2是原始特征集、ACA及IACA所選特征集,利用K均值分類(lèi)器分類(lèi)結(jié)果的比較。原始特征集的平均分類(lèi)正確率為84%,ACA所選擇出的特征集平均分類(lèi)正確率為90%,比原始特征集提高了6%,IACA所選擇出的特征集平均分類(lèi)正確率為93%,比ACA所選特征集提高了3%,并使特征集數(shù)量由75個(gè)減至22個(gè)。這表明,ACA與IACA所選特征集的分類(lèi)能力都比原始特征集有了很大提高,對(duì)原始特征集應(yīng)用IACA后,所選的特征更適于用作分

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論