以數字圖像為載體的隱寫分析研究進展_第1頁
以數字圖像為載體的隱寫分析研究進展_第2頁
以數字圖像為載體的隱寫分析研究進展_第3頁
以數字圖像為載體的隱寫分析研究進展_第4頁
以數字圖像為載體的隱寫分析研究進展_第5頁
已閱讀5頁,還剩21頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

PAGEPAGE22以數字圖像為載體的隱寫分析研究進展摘要:隱寫和反隱寫的對抗是關系到信息安全的重要課題。本文針對常用隱寫載體之一即數字圖像,回顧反隱寫技術的最新進展。根據隱寫技術快速發展對反隱寫研究提出的挑戰,對近幾年提出的新方法和新思路進行梳理和歸納,給出系統和扼要的評述,供隱寫和反隱寫研究者參考。重點圍繞三方面展開討論:對于克服了統計不對稱性的LSB匹配嵌入法如何進行有效的檢測或嵌入率估計;對于小嵌入率隱寫進行分析的研究中有哪些進展;面對層出不窮的隱寫新方法,如何實現不針對具體嵌入算法的通用隱寫分析。對于反隱寫研究的發展趨勢和面臨的新問題也作了討論。關鍵詞:隱寫,隱寫分析,LSB匹配,隱寫嵌入率,通用隱寫分析1.引言自上世紀90年代初以來,信息隱藏作為信息安全中的重要課題引起了國際學術界的重視。首先是對保護多媒體產品版權的數字水印研究急劇升溫,公開發表的論文呈指數規律逐年上升,不少開發數字水印產品的公司應運而生。目前數字水印技術的發展勢頭有增無已。對信息隱藏另一重要領域即數字隱寫(steganography)的研究也隨之跟上,很早就出現了一些簡單的隱寫方法[1]。到世紀之交開始了對這一領域的廣泛探索。隱寫是以表面上正常的數字載體如圖像、音頻和視頻等作為掩護,在其中嵌入秘密信息,隱藏的數據既不改變載體信號的視聽覺效果,也不改變計算機文件的大小和格式,因而可實現不為人知的隱蔽通信。含密媒體通常與大量正常媒體資料混在一起,通過各種渠道特別是互聯網傳播。不同于傳統密碼通信的是,“正在進行通信”這一事實本身也被隱藏起來了,因而可用于重要消息的安全傳遞。隨著信息隱藏技術的快速發展,大量隱寫方法涌現出來,人們可以方便地獲取和使用多種隱寫工具。然而對這些工具的濫用卻嚴重威脅著網絡信息安全,因此研究反隱寫技術是有關領域研究者面臨的緊迫任務。最重要的反隱寫技術是隱寫分析(stegananalysis),也就是根據載體的統計特性判斷其中是否含有額外的隱蔽信息。隱寫分析也可以包括“定量分析”(quantitativesteganalysis)或“主動分析”(activesteganalysis)[2],即除了檢測秘密信息的存在性,還要估計嵌入的秘密信息量[3]、估計密鑰[4]、識別所用的隱寫工具、截獲隱蔽信息等。隱蔽信息的截獲被認為是隱寫分析的終極目標,但目前關于這方面的研究進展報道非常罕見。以檢測有無可疑嵌入信息、估計嵌入數據量為基本目標的隱寫分析迄今為止仍是最重要的反隱寫措施。實際上對隱寫的有效分析要比隱寫本身更困難,這是因為各類數字載體數量巨大,嵌入方法千變萬化,從中搜尋隱蔽信息猶如大海撈針。隱寫存在性檢測的重要意義在于:一旦數字媒體中含有隱蔽信息的事實受到懷疑,隱寫行為即告失敗。成功的隱寫分析是追蹤信息源頭、切斷敵對隱蔽信道的前提。另外還可以根據檢測結果實施主動攻擊(activeattack),刪除嵌入信息或使之不能被提取,達到阻止隱蔽通信的目的。隱寫和反隱寫的對抗是網絡時代信息戰的重要內容之一[5],在這一相對年輕的研究領域中已涌現了大量的成果。歷年來人們從不同的角度對前期研究情況進行過概括和綜述[6-11],提供了有價值的參考資料。由于相關研究的發展速度很快,有必要對近幾來的最新研究情況進行歸納和梳理,著重討論一些重要的發展方向,供研究者參考。我們根據隱寫技術的新發展對反隱寫研究提出的挑戰,探討隱寫分析中針對若干難題的最新研究動態。可用于隱寫的載體中,以數字圖像的使用最為廣泛。本文主要討論以圖像為載體的隱寫分析問題,其中包括未經壓縮和曾經過JPEG壓縮而又保存為非壓縮格式的情況。對JPEG格式圖像的隱寫分析涉及較少,有關問題將另外單獨考慮。第2節簡要回顧早期隱寫分析方法,第3~5節討論近年來具有代表性的新進展,分別考慮對LSB匹配嵌入的分析技術、對小嵌入量的隱寫分析、不針對具體嵌入方法的通用檢測這三個主要問題。近年來在隱寫技術的改進和實際應用方面還出現了一些新的動向和新的思路,向反隱寫研究者提出了亟待解決的新課題,我們將在第6節對此進行扼要的闡述。第7節是本文小結。2.早期隱寫分析研究概況早期隱寫方法(如簡單LSB替換、EzStego、J-Steg、JPHide&Seek、OutGuess、Jpeg-Jsteg、F5等)大多可保證優良的含密圖像視覺質量,通過視覺無法察覺疑點。但由于對統計特性考慮較少,這些方法很快就被證明在嵌入量足夠大的情況下在統計上是不安全的。簡單LSB替換方法雖然僅對載體圖像進行微小的修改,但仍會在最低位面產生某些異常特性而容易被識別出來。這首先是因為圖像最低位并不總是0和1的均勻隨機分布,在某些區域呈現與內容有關的結構,LSB替換會破壞這種結構。不僅如此,簡單地用隱蔽數據替換LSB還會引入統計上的不對稱性,為分析者提供了可靠檢測的線索。很早就出現了針對LSB嵌入法的有效檢測方法。例如Westfeld等[12]不僅對某些隱寫圖像的最低位面方法進行了視覺檢測,還提出直方圖分析法,利用信息嵌入后每一對象素灰度、顏色指數、變換系數值分布趨于均勻的性質設計2檢驗,對有無隱寫進行判斷,并估計隱蔽數據長度。雖然通過改進設計嵌入方法能保持像素對的值不變從而挫敗這種分析[13],但很快就又被成功地檢測出來[14]。Fridrich等人的RS分析法[15][16]利用圖像空間相關性導出靈敏的雙重統計量。他們指出圖像LSB可在一定程度上由其它位面預測,篡改LSB會削弱這種可預測性,從而導致有效的隱寫分析。研究還表明,在JPEG圖像中進行空域嵌入會改變量化引起的數據統計結構,因而容易被識破[17]。LSB隱寫不僅可直接修改像素本身,也可在變換域實現,因此也適用于JPEG圖像。常用的J-Steg是對JPEG圖像中分塊DCT的某些量化系數值進行LSB嵌入,因此也可用類似的分析方法進行成功的檢測。研究者又指出,在DCT量化系數上進行LSB隱寫會增加塊效應,通過構造參考圖像可估計原始DCT系數直方圖[14]。針對一種經過多次改進的JPEG圖像隱寫方法F5[18],在水平和垂直兩個方向分別剪裁4個像素,用原來的量化表對重新得到的88分塊進行量化,通過與待檢測圖像的比較,判斷DCT量化系數的直方圖是否收縮實現了成功的分析[19]。張濤和平西建于2003年提出基于差分圖像直方圖的檢測方法[20],他們將待測圖像的LSB位面置0,將其差分直方圖與待檢測圖像的差分直方圖相比較,可由某一轉換系數導出用于判斷LSB是否被秘密信息替換過的物理量,而且這個量與嵌入數據量之間存在一定的關系,因而可以估計出隱蔽信息的長度。一種對LSB嵌入法的改進是位面復雜度分割(BPCS),將載體多個位面分成大小相等的塊,用復雜度高的位面小塊承載秘密信息[21]。但含密圖像的位面小塊復雜度直方圖存在兩個明顯的不連續點,據此可實現對BPCS隱寫的分析[22],由復雜度直方圖的不連續性可判斷秘密信息存在性,并確定秘密信息塊的復雜度范圍,測算秘密信息嵌入量。該方法也適用于變換域位面復雜度分割隱寫。調色板圖像也是常用隱寫載體,調整調色板中的顏色可降低隱寫失真,但調色板異常會引起監控者的懷疑[23][24]。另一種方法是不改變調色板,而將顏色進行奇偶分配用以代表秘密數據[25],但通過最低位面混亂度和逆嵌入操作后的奇異顏色像素個數可察覺秘密信息的存在[26]。另外還可用一種稱為PairAnalysis的高階統計量方法對典型的調色板圖像隱寫工具EzStego進行分析并估計信息嵌入量,可檢測的最小信息量為每像素0.1比特,性能優于過去提出的2法和RS法[27]。早期簡單隱寫方法所產生的統計不對稱性、直方圖異常、調色板異常等現象已能被多種方法檢測出來,因此在某種意義上這些方法早已不再安全。但是隨著反隱寫研究的發展,改進的嵌入方法很快地出現,克服了早期技術的明顯缺陷。例如用匹配嵌入的方法消除LSB替換所引入的統計不對稱性就使統計分析更為困難。即使最簡單的LSB替換,當嵌入量很小時,要可靠檢測還是一個難題。解決這一難題仍有現實意義,因為LSB替換極容易實現,有研究者指出只需一條Unix命令而不必求助于任何隱寫工具就可以進行LSB嵌入[28]。另外,嵌入方法層出不窮使得針對具體嵌入技術設計分析方法的反隱寫方捉襟見肘,難以應付。所有這些都促使隱寫分析技術不斷地深入發展。3.針對LSB匹配隱寫的分析LSB替換的主要安全漏洞在于僅存在2i和2i1之間的轉換,而不存在2i和2i1之間的轉換,這就導致了具有成對灰度值的像素數趨于相等的現象。避免這種統計異常性的最簡單方法就是LSB匹配嵌入[29]:當嵌入的比特與像素值最低位相同時,像素值不變;不同時隨機選擇1或1。于是上述兩種轉換以相等的概率出現,統計不對稱現象不再存在,而引起的圖像失真卻不變。嵌入信息的提取和簡單LSB替換時一樣,只要取出最低位面就可以了。LSB匹配嵌入又常被稱為1隱寫。本節著重討論對像素域LSB匹配嵌入的分析,包括圖像是否曾經被JPEG壓縮過兩種情況。Westfeld提出了一種基于統計相鄰顏色數的分析方法[30],可檢測經過JPEG壓縮的彩色圖像中的LSB匹配隱寫。兩個顏色[r1,g1,b1]和[r2,g2,b2],若滿足|r1r2|1,|g1g2|1,|b1b2|1,則稱為相鄰顏色,每種顏色最多有26種相鄰顏色。JPEG載體圖像中相鄰顏色較少,平均為4~5種,通常最多不超過9種。用LSB匹配法嵌入數據會產生大量相鄰顏色,許多顏色甚至會達到26種相鄰色的極限值。計算相鄰顏色的平均數,例如對于載體圖像是2.20,在嵌入量為100%(每一彩色像素嵌入3比特)時上升到5.58。若以最大相鄰顏色數為統計檢驗量[28],則對于任何經JPEG壓縮過的圖像,即使嵌入率低到1%也能可靠檢測。但是對于從未進行過JPEG壓縮的圖像,或者Harmsonetal.[31]將圖像直方圖hC(n)的離散Fourier變換HC(k)稱為直方圖特征函數(histogramcharacteristicfunction,HCF)。他們認為含密圖像可看作載體圖像與加性噪聲之和,因此含密圖像的直方圖hS(n)是hC(n)和噪聲概率分布函數f(n)的卷積。無論是LSB替換還是LSB匹配嵌入,引入的噪聲均具有下列概率分布: (1)其離散Fourier變換F(k)=cos2(k/N)在k=0,1,...,N/2內從1單調下降至0,因此含密圖像的HCF總是小于載體圖像的HCF: (2)下標C表示載體,S表示隱寫。k是“直方圖譜”的自變量,物理意義不直觀。考慮k[0,1,...,N/2]的總效果,定義HCF的質心(centerofmass,COM)如下: (3)可利用下列不等式實現對含密圖像的檢測: (4)直方圖特征函數(HCF)及其質心(COM)的概念建立在加性噪聲模型上,可成為檢測LSB匹配隱寫的基礎。Ker在此基礎上發展了一組有效的方法,以下著重討論Ker的分析技術。Ker在[32]中指出,Harmsen的方法直接用于對灰度圖像LSB匹配隱寫的盲檢測并不成功,這是因為不同載體圖像之間的C[H]差異太大,通常超過載體和含密圖像C[H]之間的差異(見圖1),在沒有原始載體圖像的情況下檢測器是無法知道C[HC]的。圖1嵌入數據前(圓點)后(叉形)圖像的C[H]值變化[32]為此,Ker通過計算22像素塊的平均值將載體圖像和含密圖像分別縮小到原來的1/4。載體圖像縮小后C[HC]總體上沒有變化。對于用LSB匹配嵌入的含密圖像,C[H*S]還是小于C[H*C],只是變小的程度有所下降(上標星號表示亞取樣縮小圖像)。由于C[HC]/C[H*C]對不同載體圖像基本一致,因此用C[H]/C[H*]作隱寫檢測的統計量便實現了對COM的校正,消除了不同載體的影響。由于灰度圖像僅有256種不同的灰度值(遠少于彩色圖像中的顏色種類),因此直方圖十分稀疏,使得基于HCF的方法效果不佳。Ker引入的第二項改進是計算相鄰像素的二維直方圖: (5)相應地用二維DFT定義HCF和COM。經改進,對LSB匹配的檢測性能(receiveoperatingcharacteristic,ROC)如圖2示[32],其中左圖由20,000幅曾經JPEG壓縮的圖像得到,右圖由3,000幅從未壓縮過的圖像得到,嵌入率均為100%。淺色實線為HCFCOM方法,帶圓點的淺色線為經校正的HCFCOM法,深色實線為基于二維直方圖的HCFCOM方法,帶圓點的深色線為經過校正并用二維直方圖的HCFCOM方法。可見在虛警概率小于10%的條件下,校正的二維直方圖HCFCOM性能最佳。由圖2可知,對于曾經JPEG壓縮過的圖像,當LSB匹配嵌入量很大時已能可靠檢測,對從未壓縮過的圖像也能進行檢測,不過性能較差。由于是基于加性噪聲模型的,該方法也可對其他隱寫方法產生的含密圖像進行檢測,但對于小嵌入量無效。圖2隱寫分析性能:橫軸為虛警概率,縱軸為檢測概率[32]在應用HCFCOM檢測彩色圖像中的LSB匹配隱寫時遇到了計算復雜度的困難[30],因為涉及到的顏色數量為2563,DFT的計算時間復雜度為O(N3logN),將這種基本的HCFCOM方法記為C13D。為了降低計算復雜度,Harmsen曾建議分別考慮RGB三色,計算3個一維HCF,由3個COM構成三維統計檢驗向量(記為C31D),時間復雜度下降為O(NlogN);或者將3種顏色兩兩組合成RG、GB、BR,計算3個二維直方圖的DFT,將3個二維COM組合成6維統計檢驗向量(記為C32D),時間復雜度為O(N2logN)[33]。Ker對這幾種不同的HCFCOM實現方法進行了大量測試比較,發現C31D的性能很差,而C32D則接近于基本的C13D,這幾種方法均能有效檢測嵌入量為30%~100%的曾經JPEG壓縮圖像,也能檢測JPEG后又重新采樣的圖像,對從未壓縮過的圖像則只能檢測接近100%嵌入率的圖像。可見這種方法優于Westfeld[30]的早期方法。在[28]中,Ker將對Harmsen方法的改進(COM的載體圖像校正和二維直方圖[32])擴展到彩色圖像。由于計算平均顏色時引入的舍入誤差使得用于黑白圖像的22像素組平均法對于彩色圖像效果不佳,因此改為水平方向的圖像“壓扁”: (6)顯然,在對壓扁的圖像C'計算HCFCOM時,涉及的灰度值范圍會加倍,使DFT的計算量大增。Ker將三個顏色通道相加成為一維信號,因為他認為LSB匹配嵌入使各顏色分量獨立地加入了同樣強度的噪聲。實驗表明,這種檢測器能有效檢測5%的嵌入率,對于JPEG壓縮后又改變尺寸的圖像,可檢測50%的嵌入率,但是對從未壓縮過的圖像檢測效果不佳。對于未經過JPEG壓縮的圖像檢測難度明顯高于經過JPEG的圖像,是此類隱寫分析技術的共性。綜上所述,由于HCF可反映因隱寫嵌入而導致的直方圖變化,所以可用于檢測。從最初的HCFCOM,到通過亞取樣實現對COM的校正,克服了無法設定閾值的困難,進而考慮二維直方圖重新定義HCFCOM,檢測性能逐步得到提高。但是基于校正和二維直方圖的HCFCOM方法計算復雜度過高,為此將顏色分量進行適當的組合,使該方法可有效地用于對彩色圖像的隱寫分析。對于LSB匹配嵌入的另一種分析方法是將LSB匹配嵌入看成兩個集合序列之間的狀態轉移[34]。對于一幅可能含密的待分析圖像,用自適應小波降噪法估計其原始載體,計算待檢測圖像和估計的載體圖像平滑區域的狀態轉移參數,根據Kullback-Leibler距離可估計嵌入率。4.小嵌入量隱寫分析近年來對于LSB匹配嵌入法的檢測已經取得了較大的進展,特別是對曾經過JPEG壓縮的圖像,即使嵌入量較低也能實現有效的檢測。但是與此同時,隱寫嵌入方法也在不斷改進。研究者在LSB匹配隱寫中引入了各種編碼方法,使嵌入相同數據量對載體所作的修改量減小。例如通過不同的編碼技術利用LSB匹配嵌入中的隨機1嵌入額外信息,使每一像素的秘密信息承載量從1比特提高到log23比特[35-39];進一步利用次最低位而不增加嵌入引起的失真可進一步增加嵌入量[40]等。這些新方法的出現進一步提高了分析的難度,研究更為有效的檢測方法是對隱寫分析研究者提出的新課題。實際上,即使是簡單的LSB替換嵌入,對于低嵌入率的隱寫分析仍十分困難。第3節已提到的Westfeld方法具有檢測極低嵌入率的能力,但僅限于對曾經JPEG壓縮而且后來未經縮放等處理的彩色圖像[28][30]。近年對小嵌入率的隱寫分析有了新的進展。在早期RS和2分析等方法之后,陸續提出了一些基于像素對的隱寫分析方法[20][27][41][42],這些方法都利用了LSB嵌入法中像素組合的結構特性,其中最典型的是[41]的樣本對分析法(samplepairanalysis,SPA)和隨后提出的對SPA的改進[42]。SPA作為LSB分析的有效方法明顯優于RS法,引起了研究者的關注。隨后即出現了對SPA的推廣和拓展,這方面的工作以Ker的研究最具代表性。下面以此為線索討論近年來圍繞小嵌入率隱寫分析所取得的進展。Ker將這些基于像素對的方法推廣為以g個像素(樣本)為一組,建立了樣本組分析的一般框架,并且具體討論了g=3的情況[43],將它稱為“三元分析”(triplesanalysis,簡稱Triples)。沿水平方向取三個相鄰像素為一組(包含垂直方向像素的方法給出類似結果),實驗表明這種基于一般框架的三元分析在嵌入率較低時給出了優于SPA的結果。圖3是對3,000幅曾經JPEG壓縮(Q=75)的圖像用Triples和RS、SPA估計嵌入率的結果,在不同嵌入率p下計算估值的標準差,橫軸表示嵌入率p,實驗中p從0到1的取值間隔為0.05。三種方法對p的估計都是無偏的,但在小嵌入率時Triples估值的標準差大大低于RS和SPA。當嵌入率大時Triples的性能不理想。圖3對LSB嵌入率估計的標準差,小嵌入率時Triples具有明顯優勢[43]Ker在此前發表的論文[44]表明,將嵌入率估計器(定量隱寫分析)用于判斷有無嵌入信息(二元隱寫分析)時性能不一定是最佳的,因此需根據應用要求選擇適當的方法,構成檢測器或估計器。將Triples法用于檢測圖像中有無隱蔽信息時,需要消除載體圖像之間差異對檢測的影響。用Triples檢測器對3,000幅曾經JPEG壓縮(Q=75)的圖像在嵌入率為2%時進行檢測,得到的ROC見圖4中帶黑點的曲線。圖中同時給出的是將Triples估計器(光滑曲線)和RS估計器(帶三角的曲線)用于檢測時的ROC,以及另外兩種基于像素對的檢測器[45]性能(帶方塊和星號的曲線)。若以[44]中提出的單一參數即漏檢率為50%時的虛警概率大小來衡量,Triples檢測器相對于其他方法的優勢十分明顯。此時RS估計器的虛警概率高達40%,說明已完全無效。圖4嵌入率為2%時的Triples檢測器ROC,性能最好的帶黑點曲線為Triples檢測器結果[43]進一步擴展到4個像素一組時,盡管檢測性能略有提高,但計算復雜度卻大幅度增加[45]。由于4階方法可提供對載體圖像特性的更好描述,預計采用4階檢測器將可提供最優性能,但繼續向更高階的分析發展則意義不大。用SPA和Triples等方法估計隱寫嵌入率時,估計誤差的起伏往往很大,而且受到載體圖像特性差異的嚴重影響。對這種誤差的深入研究可望給出嵌入率估計置信度,從而有效地改進估計器性能。針對SPA[41]方法的最小二乘(LMS)變種[42],Ker將它用于分析簡單的LSB替換法,導出了對載體圖像的估計結果分布,并由此構建了改進的加權最小二乘估計器。B?hme和Ker對隱寫嵌入率估計誤差進行了實驗研究[46],并針對LMS估計法進行了理論研究[47]。他們將估計誤差分為兩部分:由嵌入數據引起的圖像內誤差和由載體圖像引起的圖像間誤差。關于誤差模型將在第6節討論。對誤差的研究表明,LMS/SPA對嵌入率的估計誤差呈現輕微的負偏差,對不同載體圖像,分布函數有明顯偏高的尾部,說明有較多的估計結果誤差較大。基于LMS的分析方法在理論上導出了載體圖像模型以及嵌入率估計的概率分布,對于改進LMS估計器有重要意義,其成果就是加權的最小二乘估計(WLMS),包括用于像素對的Couples/WLMS,以及推廣到Triples估計器的Triples/WLMS方法[48]。實驗所比較的5種估計器為:1)等價于SPA的Couples方法;2)等價于SPA/LMS的Couples/LMS方法;3)Couples/WLMS;4)Triples/LMS;5)Triples/WLMS。圖5是文獻[48]給出的對兩組各3,000幅圖像的部分實驗結果(對WLMS估計器進行了偏差校正),可見Triples/WLMS估計結果具有最小的標準差,因而性能最優。對黑白圖像得到的結果與此類似。實驗中比較了7種檢測器:1)標準RS檢測器;2)Couples檢測器;3)Couples/LSM;4)無偏差校正的Couples/WLSM;5)標準化Couples/WLSM;6)Triples/LMS;7)Triples/WMLS。對4組各3,000幅圖像進行檢測,表1列出了能被可靠檢測的最小嵌入率,精確到0.001。所謂可靠檢測是指虛警概率5%和漏檢概率50%。同樣可見Triples/WMLS的性能最優。總之,通過將SPA中僅考慮基于像素對(即二元組)的分析,推廣到三元組,對于小嵌入率時隱蔽信息嵌入量估計的質量明顯提高了。進而推廣到四元組,性能略有提高但計算量劇增,因此采用三元組是合適的。隨后的進一步工作涉及對隱寫嵌入率估計的誤差進行研究,同樣驗證了三元組法的優勢。以上所討論的隱寫檢測器或嵌入率估計器都是針對空域LSB方法的,載體圖像是彩色或黑白位圖,它們有可能曾經被JPEG壓縮過,也可能從未被壓縮過。近來Barbier等人提出了一種針對JPEG圖像的隱寫分析方法,可檢測用OutGuess、F5、HideandSeek進行極小嵌入量隱寫所生成的含密圖像[49]。該方法根據JPEG編碼中無損壓縮環節(游程編碼和Huffman編碼)的所謂“雪崩準則”[50]提出新的統計特征,這一統計量與嵌入率無關,而對圖像中是否含有嵌入數據異常敏感,因而可利用隱寫嵌入引起壓縮數據熵的明顯變化來判斷圖像是否含有隱寫嵌入信息。具體的檢測是通過Fisher分類器來實現的,據報道甚至可檢測低到105的隱寫嵌入率。(a)載體為從未壓縮過的3,000幅彩色圖像(b)載體為曾經JPEG壓縮過的3,000幅彩色圖像圖5比較5種估計器:橫軸是嵌入率,左側為不同嵌入率下的估計偏差,右側為估計的標準差[48]表1對7種隱寫檢測器的性能比較從未壓縮過的BMP曾經JPEG壓縮過黑白彩色黑白彩色RS0.0360.0540.0230.283Couples0.0360.0520.0180.220Couples/LMS0.0450.0600.0220.068Couples/WLMS0.0400.0560.0160.063標準化Couples/WLMS0.0600.0370.0800.156Triples/LMS0.0330.0410.0140.026Triples/WLMS0.0280.0350.0110.0255.通用隱寫分析我們可將隱寫分析技術分為兩大類:1)針對特定隱寫工具或某一類嵌入技術,根據隱寫所引起的載體數據統計特性異常來設計檢測器或估計器;2)并不針對某一特定的隱寫方法,而是對未知隱寫工具所產生的含密媒體進行檢測,構建通用檢測器。第二類面向未知隱寫工具的通用分析有時又被稱為“盲檢測”,但這里的“盲”不應與僅根據待檢測載體的Stego-only隱寫分析相混。以上兩節中Harmsen和Ker等人根據隱寫的加性噪聲模型進行的分析實際上并不針對特定嵌入方法,因此也可歸為“通用”檢測一類。但目前大多數通用隱寫分析都是建立在特征提取和設計分類器的基礎上的,本節圍繞此類方法討論近年來提出的一些代表性成果。最早用分類器方法進行通用隱寫檢測的工作是Memonetal.在2001~2003年期間發表的[51-53]。他們同時考慮面對主動攻擊的數字水印和面對被動檢測的隱寫,認為不論用什么方法嵌入的額外信息在載體中均會留下統計異常,使圖像質量受到輕微的損傷。他們用質量測度和多變量回歸分析進行通用隱寫檢測,基于方差分析(analysisofvariance,ANOVA)提取質量參數作為特征集用于區分載體圖像和含密圖像,用對原始圖像的估計進行訓練。選擇適當的距離測度,使得在特征空間里載體與參考圖像之間的距離明顯區別于含密圖像和參考圖像之間的距離。參考圖像由不含密的載體圖像經Gauss低通濾波得到。研究表明該方法對不同的隱寫技術有適應性,在未知嵌入方法的情況下對圖像中是否含有秘密信息具有鑒別能力。表2是[53]給出的實驗結果,可見早期通用檢測方法效果并不理想。表2基于圖像質量測度的通用隱寫分析性能嵌入工具或方法虛警漏檢正確檢測正確率%Digimarc2/102/1016/2080PGS2/101/1017/2085Cox4/102/1014/2070Pooledwatermarking3/103/1014/2070用Gigimarc訓練,用PGS和Cox測試5/102/1013/2065Steganos2/51/57/1070Stools4/101/1015/2075Jsteg3/103/1014/2070Pooledsteganography5/100/1015/2075用Steganos和Stools訓練,用Jsteg測試3/103/1014/2070Pooledwatermarking和steganography5/101/1014/2070用Digimarc,PGS,Steganos,Stools訓練,用Cox和Jsteg測試4/103/1013/2065另一種早期技術由Farid等人提出,他們用類似于小波的正交鏡像濾波器[54](quadraturemirrorfilters,QMF)將圖像分解為多尺度水平、垂直、對角方向和低頻分量,使用最佳線性預測器,計算預測誤差的前4階矩:均值、方差、偏斜、峭度。用Fisher線性分類器(FLD)[55][56]和支持向量機(SVM)[57]進行分類以區分載體和含密圖像,見圖6。用1,800幅大小為640480的載體圖像和1,800幅以各種方法嵌入數據的含密圖像進行訓練。測試圖像不在訓練集內。對JPEG圖像用Jsteg和OutGuess,對GIF圖像用EzStego,對TIFF圖像用LSB進行隱寫,GIF圖像和TIFF圖像由JPEG圖像轉換得到。在使用FLD和線性SVM時均選擇適當的參數使虛警概率保持為1%。檢測結果表明兩種分類器性能相近。用非線性SVM時性能有所改進。檢測結果見圖7,縱軸為檢測概率,(a)-(c)分別為FLD、線性SVM、非線性SVM,虛警為1%時的結果,(d)為非線性SVM虛警為0的結果。橫軸下的數字表示嵌入數據量。可見這種通用檢測器可用于檢測多種隱寫工具產生的含密圖像,但不同情況下性能有較大差異。總的來說,對JPEG圖像的檢測效果較好,非線性SVM的性能優于其他分類器。由于新的隱寫方法不斷出現,通用隱寫分析的重要性日益突出,因此近幾年對這一類方法的研究明顯加強,出現了許多有效的方法。Fridrich提出了一種基于特征的隱寫分析法用來檢測JPEG圖像[58],其目的是檢驗JPEG隱寫算法性能,評價嵌入機制。她的檢測方法用載體和含密圖像訓練線性分類器,由含密圖像的DCT系數邊緣統計特性和聯合統計特性計算一系列特征量(Fridrich稱之為泛函,functional),包括17個一階量(5個DCT低頻系數直方圖,全局DCT直方圖,11個DCT系數對直方圖)、4個二階量(系數方差和由共生矩陣導出的3個量,反映塊間DCT系數的依賴性)、2個分快特征量(空域中沿88塊邊界的跳變量之和)。然后對圖像進行解壓縮、幾個像素的輕微剪裁、再用同一量化矩陣重新壓縮來估計載體圖像的特征量。由兩組統計量之間的差異得到特征量,可根據求得的特征判斷隱寫嵌入對圖像影響的可檢測性。由于JPEG圖像的DCT域對隱寫嵌入最為敏感,該方法可望導致對JPEG圖像進行隱寫分析的良好性能。QMFQMF圖像分解均值、方差偏斜、峭度支持向量機分類器Fisher線性分類器或圖6Farid的通用隱寫檢測器圖7用FLD、線性和非線性SVM的檢測結果[58]應用上述基于DCT的特征,Pevnu和Fridrich又構造了應用Gauss核的非線性SVM分類器,用于對JPEG圖像進行隱寫檢測[59]。測試對象是3,436個不同來源的35,000幅原始圖像,用質量因子75進行JPEG壓縮產生載體圖像。包括兩種情況:1)二元檢測,區分無嵌入數據的載體圖像和以下幾種隱寫算法之一:F5,MB1,OutGuess分別嵌入100%、50%、25%,MB2嵌入率為MB1容量的30%,以及JPHide嵌入圖像尺寸的10%,測試結果見表3;2)用n(n1)/2次二元檢測組合成多元檢測,以判斷含密圖像是哪一種嵌入方法產生的,結果見表4。可見對是否含密的檢測結果令人滿意,對不同嵌入工具具有較好的鑒別能力。對未參與訓練的JPHide,大部分判為F5和MB1,反映它們的嵌入機制具有一定的相似性。測試結果發現基于DCT的方法優于使用72個特征的小波方法[60],這是因為在DCT域提取JPEG圖像特征最為匹配,而小波則適合于更普遍的情況。根據[59]的作者觀察,誤判與圖像噪聲較強有一定的聯系。表3非線性SVM二元分類器性能嵌入算法默認閾值調整閾值使虛警1%判為載體判為含密判為載體判為含密F5100%25325529MB1100%35303530OutGuess100%35315529F550%25327527MB150%25314529OutGuess50%35314530MB230%2750673460F525%54480149385MB125%3849590443OutGuess25%552910524JPHide652810524載體515195277表4非線性SVM多元分類器性能嵌入算法載體F5MB1MB2OutGuessF5100%2531100MB1100%3052613OutGuess100%2000532F550%4500710MB150%37506125OutGuess50%3130527MB230%814174922F525%1746327261MB125%1626411755OutGuess25%471623484JPHide9334158276載體51054150早期通用分析對JPEG圖像頻域隱寫工具的檢測性能較好,但對空域法的分析能力不理想,并嚴重依賴所用的訓練圖像和測試圖像。Holotyak和Fridrich等人[61]于2005年提出用小波域高階統計量進行分類的三步框架:估計隱寫信號,提取特征,分類。將含密圖像看成載體與隱寫信號之和: (7)其中g為嵌入算法,s為嵌入的秘密信息,K為密鑰。將含密圖像的小波變換看成非平穩Gauss載體和隱寫信號的混合。為了用閉合形式來表示,將隱寫信號近似描述為平穩Gauss過程N(0,2)。應用小波變換來估計g(s,K),目的是獲得對隱寫敏感的信號成分而盡量降低載體對檢測的影響。特征提取是關鍵步驟。從隱寫成分g中提取的特征具有對隱寫敏感而對圖像內容不敏感的優點。對載體圖像和含密圖像計算g(s,K)的一級小波分量,其直方圖如圖8。圖中虛線和實線分別對應于載體圖像和由1嵌入產生的隱寫圖像,可見載體和含密圖像在直方圖(概率密度函數PDF)的尾部有明顯差異。將兩個直方圖映射至適當的參數空間可計算其歐氏距離而不必知道PDF的具體形式。研究表明,最低的幾階偶數矩不能區分載體和含密圖像,只有高階矩才能反映PDF尾部的差異。圖8載體圖像(虛線)和1隱寫圖像(實線)的一級小波分解直方圖,縱軸取對數尺度[61]圖9(a)是用FLD進行分類時的正確率與矩的階數之間的關系。可見隨著階數的提高,正確分出載體圖像的概率下降,而檢測含密圖像的概率則增加,直到18階以后這一概率也逐漸下降。圖9(b)是將兩個正確檢測概率相乘(聯合概率),可知獲得最佳檢測效果的最低階數為12。取聯合概率大于0.5(即優于隨機猜測)的所有偶數矩構成33階特征向量,用PCA降至4~5維。圖9階數與檢測精度的關系[61]。(a)載體圖像(實線)和含密圖像(虛線)的正確檢測率;(b)聯合正確概率。由500幅原始圖像用1隱寫和LSB隱寫平均而得,嵌入率12.5%~50%。用LSB匹配法在從未壓縮過的圖像中以不同的嵌入率25%,50%,75%,100%嵌入數據,對它們進行檢測得到圖10所示ROC。其中(a)是對22種不同數字照相機拍攝的2,567幅1百萬像素以上非壓縮照片的測試結果,包括48比特彩色TIFF圖像和24比特彩色BMP圖像,全部轉為8比特黑白。(b)是2,375幅15002100高分辨率掃描圖像,轉為黑白。實驗所用圖像庫與[28][30]相同。掃描中引入的噪聲使隱寫分析性能下降。對于JPEG壓縮過的圖像進行實驗,即使在25%嵌入率時也能完全正確檢測。實驗還表明,單一照相機拍攝的圖像比多來源圖像更容易檢測。上述方法不久又被進一步改進[62],一方面仍從小波域的噪聲分量提取特征以提高信噪比(隱寫信號與殘余載體信號之比),另一方面,不再用很高階的偶次矩,而是計算1到9階的絕對非歸一化矩,稱為小波絕對矩分析法(waveletabsolutemoment,WAM)。其中前4階矩在概念上與Farid的預測誤差[57]一樣,但用不同的小波使預測質量較好,而且采用絕對矩而并不按方差進行歸一化,避免使用很高階的矩。圖11是對KodakDC290相機拍攝的未經壓縮灰度圖像測試結果,其中(a)是用[59]的FLD分類器得到的,(b)是WAM的性能。用隨機1嵌入法進行隱寫,WAM在小嵌入量時有明顯優勢。文獻[60]的作者進而研究先驗邊信息(例如已知相機型號、JPEG質量因子、圖像處理情況等)對提高隱寫分析性能的作用,用22種不同相機拍攝,檢測性能明顯比單一相機差,但WAM仍優于FLD。比較了幾種新的嵌入策略:隨機1與三元嵌入法相結合、局部自適應三元嵌入、在將每種顏色16比特的圖像轉換為8比特灰度圖像時的擾動量化。用WAM確定哪一種方法較為安全,結果發現第三種方法最難被檢測出來,其次是自適應三元嵌入。圖10用FLD分類的ROC[61] (a)FLD (b)WAM圖11WAM與FLD的性能比較,橫軸為虛警率,縱軸為檢測率[62]Farid等人在[55]-[57]的早期工作基礎上,又于2004年將他們的統計模型擴展到彩色圖像,提出了所謂“單類SVM”(OC-SVM)以簡化分類器的訓練過程[63],雖然其性能略遜于“兩類SVM”,卻只需用容易得到的載體圖像進行訓練,具有潛力可將檢測算法推廣到能檢測分類器從未見過的隱寫工具。接著他們又擴展其統計模型,將相位統計特性也包括進來[64]。在[64]中Farid指出,用多尺度和多方向圖像分解得到的幅度及相位的一階和高階統計量,對于大量圖像具有良好的一致性,而對隱寫嵌入的數據靈敏度較高。他們仍用QMF[54]提取幅度統計量,優點是能得到最小的空域混迭,并采用一種局部角度諧波分解(localangularharmonicdecomposition,LAHD)估計局部相位,該方法通過向一組角度Fourier基函數投影得到。然后采用SVM進行分類。實驗中使用40,000幅自然圖像,JPEG壓縮質量因子平均90%,典型尺寸為600400,統一取圖像中部256256區域進行測試,計算432維的幅度和相位統計量。使用了5種隱寫工具生成含密圖像:Jsteg、OutGuess、Steghide、Jphide、F5,用同樣的質量因子以避免二次JPEG壓縮效應。對每一組圖像,32,000幅用于訓練,8,000幅用于測試。圖12是用非線性SVM進行檢測的性能,隱蔽數據嵌入率分別為100%、78%、20%、5%,在橫坐標下標出。圖中白點是用線性SVM得到的結果。可見該方法可對嵌入率較高的隱寫實現通用檢測,而當嵌入率低時性能不佳。另一項近期成果是Wang和Moulin的優化特征提取[65]。他們指出,在既不知道圖像統計特性又不知道隱寫算法的情況下,采用有監督的訓練是實現通用檢測的有效方法。他們從三方面來解決特征提取這一關鍵問題:尋求在區分有無隱寫方面優于常規小波分解的圖像子帶表示;分析兩類概率密度函數(PDF)的特征經驗矩和PDF特征函數的經驗矩,并比較它們各自的優點;討論特征空間的降維。在虛警概率固定為1%的條件下,對含密圖像的檢測率至少超過其它方法15%到50%。他們引入下列了單一性能測度,即ROC曲線下的面積AUC用于評價檢測性能: (8)其中PFA為虛警概率,PD為檢測概率。圖13(a)是用前3階矩共39個特征量的檢測結果,將優化特征與Harmsenetal.[31]、Goljanetal.[62]、Farid[56]比較的結果。用擴譜法[66]進行100%隱寫嵌入,這4種檢測方法的AUC分別為0.9905、0.9875、0.9166、0.5551。圖12用非線性SVM分類器對5種隱寫工具的檢測結果[64]。橫軸標出的是嵌入率百分數,縱軸是正確檢測率,左側的灰色矩形條說明對載體圖像的正確判斷率大于99%(虛警率小于1%)進一步將優化特征結合順序前向浮動選擇(sequentialforwardfloatingselection,SFFS)、優化特征結合閾值選擇與Xuanetal.的方法[67](對Harmsenetal.方法[31]的改進)和Farid方法[56]進行比較,分別用擴譜法、LSB、F5在圖像種嵌入數據。圖13(b)是用LSB嵌入時的性能比較。4種情況下的AUC分別為0.9484、0.9365、0.8901、0.7122。 (a) (b)圖13優化特征法與其他方法性能比較[65]。(a)檢測100%擴譜法嵌入,優化特征(粗實線)與Harmsen(虛線)、Goljian(帶點細線)、擴譜法(細實線)比較;(b)檢測LSB嵌入的性能比較,優化特征和SFFS(虛線)、優化特征和閾值選擇(粗實線)、Xuan(細實線帶方塊)、Farid(細實線帶圓圈)Lieetal.[68]提出基于空域和DCT域的兩個統計特性來實現未知嵌入方法的盲檢測,采用非線性神經分類器。對2,088幅載體圖像和用6種隱寫工具產生的含密圖像組成圖像庫進行廣泛測試,實現90%以上的檢測率,有效性不限于一種特定隱寫方法,可檢測低達每像素0.01比特的嵌入量,并可考慮低通濾波、銳化、JPEG壓縮。在以上所討論的基于特征和分類的通用隱寫分析技術中,從早期根據隱寫造成載體失真的判斷來構成分類器,到利用線性預測誤差的各階矩,以及利用小波變換的高階矩,特征向量的階數有逐漸升高的趨勢。但是近期的研究又表明,階數提高并不一定能給出更好的結果,因此在這一方面還需深入探索。通用分析方法具有適應性強的明顯優點,但是其檢測性能與專用檢測器相比有不小的差距。訓練工作量大,使用不便,也是此類方法在實際應用中的瓶頸。研究僅需載體圖像即可進行訓練的分類法是改善通用隱寫分析法實用性的有效途徑之一。6.隱寫和隱寫分析研究動態近年來針對LSB嵌入仍有一些新方法,如Rochaetal.[69]使待檢測圖像最低位逐步隨機化,得到一系列LSB有差異的圖像,每步得到一幅LSB熵逐漸增加的可能含密圖像,實質上是2和UeliMaurer檢驗[70]的結合,卻克服了2僅能檢測順序嵌入的不足。采用線性分類器和SVM,性能優于早期Westfeld[12]和Provos[13]方法,以及Farid的通用檢測法[56][57]。該方法可望用于被動認證和圖像檢索。Dumitrescuetal.[71]利用高階統計量建立了LSB隱寫檢測新框架,他們利用數字媒體樣本的內在相關性計算存在于LSB中的秘密信息長度的穩健估計。該方法的一個特點是可用于靜止圖像、視頻、音頻等多種數字媒體。深入了解嵌入率估計誤差的統計特性對于提高定量隱寫分析的性能具有重要意義,這是以往被忽視的一個問題。Ker在接連的兩篇論文中對此進行了廣泛的實驗研究[46]和理論研究[47]。B?hme和Ker進行了多達2億次以上的實驗。他們從下載的NRCS圖像庫()的合格TIFF圖像中隨機選出800幅,統一用雙三次重采樣變成640480尺寸,分別取出其亮度成分和紅色分量用于灰度圖像和彩色圖像的實驗。對每一幅圖像采用LSB替換法分別以嵌入率p{0.01,0.05,0.1,0.2,0.4,0.6,0.8,1}嵌入200種不同的隨機序列。使用的隱寫方法包括RS[15]、WS[72]、SPA[41]、SPA/LMS[42]、Triples[43]。對每一幅圖像的亮度分量和紅色分量在未壓縮和Q=80的JPEG壓縮兩種情況下進行測試。最后為了觀察圖像尺寸和縮放的影響,分別采用隨機剪裁和下采樣至原圖像的75%、50%、25%進行測試。他們的研究結論包括由兩種主要來源構成的誤差模型: (9)其中下標i代表載體,j代表嵌入的隱蔽數據,pi,j為隱蔽信息量。隨機變量X表示載體和隱蔽信息之間相關性而引入的估計誤差,即圖像內(within-image)誤差,服從Gauss分布N(i,i);Z表示載體模型不準確引入的估計誤差,即圖像間(between-image)誤差。圖像間誤差服從t分布,參數和也可能受pi,j和載體影響,對給定的圖像集假定它們是固定的。研究表明,以往被忽視的隱蔽信息所引起的嵌入量估值誤差甚至大于載體圖像特性差異的影響,故應在隱寫分析研究中加以注意。不同的隱寫分析方法受圖像內和圖像間兩種因素的影響是不同的,這對于理解為什么某一估計器在某些情況下效果不佳是有所啟發的。估計器性能還受到載體圖像的影響,其因素包括局部方差和飽和度。此項研究提供了計算嵌入率估值置信度的可能性。對于誤差特性的研究首次建立了隱寫分析誤差理論模型,使隱寫分析者能精確計算有無隱蔽信息的二元假設檢驗的嵌入率值。對估計誤差的研究將有利于改進檢測器。直到不久以前,隱寫基本上只限于在一幅圖像中嵌入隱蔽數據,隱寫分析也是對單幅圖像的分析。為了對抗隱寫分析需要降低圖像中的嵌入信息量,因此可將待傳輸的數據分散嵌入到一組圖像中,這就是所謂批量嵌入(batchsteganography)。如果對每一幅圖像進行單獨分析,隱寫的安全性顯然正比于分散的程度。對抗這種分散的批量隱寫可采用組合分析法(pooledsteganalysis)。Ker通過實驗[73]和理論研究[74]發現,將信息分散在多個載體中,安全性并不隨分散程度線性增長。用組合式隱寫分析可使安全性僅以較慢的平方根速度上升。文獻[75]研究了多種隱寫分析方法所得統計特征的融合問題。將隱寫分析中涉及的統計特征歸結為載體數據的“固有特征”和隱寫所產生的“引入特征”,提出基于整體性思想的特征提取及融合方法,經過篩選,對性能較好的多種方法進行適當修正,用得到的特征組成特征集合進行判決,取得的效果良好。隱寫分析的另一項內容是估計隱寫時所用的密鑰。Trivedi和Chandramouli[4]通過檢測含密媒體統計特性的突變,對擴譜法順序隱寫嵌入進行了密鑰估計。考慮到平穩和非平穩載體信號的不同信噪比,導出了低信噪比條件下的局部最強力隱寫分析檢測器。在DCT域中高頻嵌入的情況下,密鑰估計準確性良好,但在低頻分量中嵌入時估計性能較差。過去搜索密鑰均采用窮舉法,在提取的數據中尋找可識別的模式,代價很高。對于許多隱寫方法,Fridrichetal.[76]證明搜索密鑰的復雜度僅與密鑰空間有關,而與加密算法無關,可根據沿嵌入路徑樣本統計性質進行窮盡搜索,正確的密鑰由偏差大的樣本分布(outliersampledistribution)給出。該方法對各種隱寫方法有效,但該文集中研究JPEG圖像。接著又對這一方法進行了擴展,提供了更一般的理論描述,并應用于空域[77]。他們基于2檢驗來判別密鑰,提出一種從多幅圖像中提取密鑰的方法。在空域中利用降噪濾波得到圖像中的噪聲成分可提高密鑰搜索效率。用1嵌入法進行實驗,在很低嵌入量時仍可搜索。密鑰估計對于數字取證具有重要意義。在對LSB隱寫提取密鑰時,可在“已知載體”和“載體被重復使用”條件下得到恢復LSB隱寫術密鑰的計算復雜度[78]。然后在“載體被重復使用”條件下針對空域LSB隱寫得到一種密鑰恢復算法,借鑒密碼分析中的“分別征服攻擊”思想有效降低計算復雜度。另外還可利用嵌入率估計器[74],通過碰撞攻擊實現隱寫密鑰的恢復[79]。理論分析表明這種攻擊的復雜度主要由所需的樣本量決定。用混合Gauss模型給出估計最小樣本量的方法,對HideandSeek進行實驗,嵌入消息長度L未知時,當嵌入率在5.3%至94.5%時能進行成功的攻擊。如果知道L,則能成功進行攻擊的嵌入率范圍擴大到1.1%至98.4%。碰撞攻擊法的計算速度比[77]的2法快,但只適用于LSB替換,而2法還適用于LSB匹配隱寫。以上主要討論了近年來圖像隱寫分析的研究進展,在對抗其他數字媒體的隱寫方面也有許多研究成果。例如在數字音頻隱寫方面提出了基于音頻質量測度并利用分類器的檢測技術[80][81]。對于文本中的信息隱藏近年來也有很多研究,例如Winstein提出了基于詞典的隱寫方法WinsteinK,LexicalsteganographythroughadaptivemWinsteinK,Lexicalsteganographythroughadaptivemodulationofthewordchoicehash,2000IntelScienceTalentSearchTopTenWinners,/~keithw/tlex/lsteg.pdf含有隱寫嵌入信息的數字媒體常通過互聯網傳播,今后對隱寫的檢測和估計應考慮網上信息量巨大的特點,降低計算復雜度,提高分析效率。此外與互聯網應用更緊密結合的隱寫技術也開始出現,例如在利用VoIP的隱寫技術方面已有一些研究[83][84],而對此的分析檢測工作尚未見報道。近期還出現了利用互聯網多媒體共享業務進行秘密信息傳輸的隱藏文件管理系統CovertFS[85]。該系統建立在圖像共享業務之上,對網上分享圖像中的隱藏文件進行管理,可保證文件的機密性,用戶可自由選擇含密圖像的分享范圍,并否認隱蔽文件的存在性。業務提供商也不可能知道這些隱蔽文件的存在。此類技術構成了對安全的威脅,對抗措施亟待跟上。7.結束語隱寫分析在對抗新型隱寫方法的過程中不斷發展,反過來又促使隱寫技術的改進。在隱寫-反隱寫對抗中,反隱寫一方總是處于被動的防御地位,盡管它常被稱為對隱寫的“攻擊”。本文著重討論了近年來在反隱寫幾個難題方面所取得的進展,即對LSB匹配嵌入的檢測、小嵌入率的檢測和估計、不依賴嵌入方法的通用隱寫分析。對于今后隱寫分析研究的進一步發展可考慮以下幾個方面:1)早期隱寫已能被許多方法成功檢測,但是對很小的嵌入率進行可靠檢測仍是難題。根據隱寫分析的難易可將載體圖像分成三類,從易到難是:曾經被JPEG壓縮過、JPEG壓縮后又被縮放處理的、從未被壓縮過。圖像分辨率很高和尺寸很小這兩種極端情況也較難檢測,前者因為數字照相機的普及而成為便于獲取的隱寫載體,后者則因為容易通過防火墻而可能被隱寫者優先考慮。2)新的隱寫方法不斷出現,研究獨立于嵌入方法的通用分析技術十分重要。目前主要方法可歸為兩類,一類是根據加性噪聲模型的分析,如HCF;另一類是“預處理+特征提取+分類”。后一類方法受到較多關注,由于涉及到用巨大的圖像庫進行訓練,如何用于實際尚待進一步研究。3)由于含密圖像總是可以與海量的正常數字媒體共存,要在有限時間里確定可疑對象就必須進行快速檢測,因此降低隱寫分析的計算復雜度是研究者面臨的重要課題。4)隱寫技術的新應用向反隱寫研究者提出了新的課題,例如第6節提到的文本隱寫和網絡應用。需要超越目前面向孤立文件的檢測方式,在系統層面考慮反隱寫的問題。不同來源載體對隱寫分析的影響等問題也應進行研究。5)隱寫分析的目的在于發現隱蔽信息的存在,最終提取隱蔽信息。迄今為止在檢測有無可疑嵌入信息和估計嵌入量方面已進行了大量研究,而在提取嵌入信息方面進展較慢。在實現嵌入信息提取之前,有必要對嵌入算法進行估計[86],在此基礎上如能恢復密鑰,也就相當于獲取了嵌入內容。若提取的信息為密文,還要進一步恢復加密密鑰以破譯密文,這就不屬于隱寫分析的工作了。實現隱蔽信息的正確截獲乃至破譯是一項長期任務。參考文獻:JohnsonNF,JajodiaS,Exploringsteganography:seeingtheunseen,IEEEComputer,1998,31(2),26-3ChandramouliR,Amathematicalframeworkforactivesteganalysis,MultimediaSystems,2003,9(3),303-311TrivediS,andChandramouliR,Activesteganalysisofsequentialsteganography,Proc.SPIE,2003,5020-13,123-130TrivediS,andChandramouliR,Secretkeyestimationinsequentialsteganography,IEEETransactionsonSignalProcessing,2005,53(2),Pt.2,746-757WangH,andWangS,Cyberwarfare:steganographyvs.steganalysis,CommunicationofACM,2004,47(10),76-82ProvosN,andHoneymanP,Hideandseek:anintroductiontosteganography,IEEESecurityandPrivacyMagazine,2003,1(3),32-44KesslerGC,Anoverviewofsteganographyforthecomputerforensicsexaminer,FBIForensicScienceCommunications,2004,6(3),1-29ChandramouliR,andSubbalakshmiKP,Currenttrendsinsteganalysis:acriticalsurvey,Proceedingsof8thControl,Automation,RoboticsandVisionConference(ICARCV2004),Kunming,China,Dec6-9,2004,2LiangX,HeJ,LiJ,andHuangJ,Steganalysisprinciple,actualityandprospect,ActaScientiarumNaturaliumUniversitatisSunyatseni,2004,43(6),93-96(inChinese)梁小萍,何軍輝,李健乾,黃繼武,隱寫分析-原理、現狀與展望,中山大學學報,2004,43(6),93-96KharraziM,SencarHT,andMemonN,Imagesteganography:conceptsandpractice,LectureNoteSeries,InstituteforMathematicalSciences,NationalUniversityofSingapore,Singapore,2004LiuX,andNiuS,Reviewofsteganalysis,JournalofBeijingElectronicScienceandTechnologyInstitute,2005,13(4),90-94(inChinese)劉歆,牛少彰,信息隱藏的檢測算法研究綜述,北京電子科技學院學報,2005,13(4),90-94WestfeldA,andPfitzmannA,Attacksonsteganographicsystems,LectureNotesinComputerScience,1768,61-76,1999ProvosN,Defendingagainststatisticalsteganalysis,inProceedingsofthe10thUSENIXSecuritySymposium,August13–17,2001.Washington,D.C.,USA,Aug.13-17,2001,FridrichJ,GoljanMandDuR,AttackingtheOutGuess,ProceedingsoftheACMWorkshoponMultimediaandSecurity,Juan-les-Pins,France,Dec2002,3-6FridrichJ,GoljanM,andDuR,DetectingLSBsteganographyincolorandgray-scaleImages,IEEEMultimedia,2001,8(4),22-28FridrichJ,andGoljanM,Practicalsteganalysisofdigitalimages–stateoftheart,Proc.SPIE,2002,4675,1-13FridrichJ,GoljanM,andDuR,SteganalysisbasedonJPEGcompatibility,SPIEMultimediaSystemsandApplicationsIV,Denver,CO,USA,August20-24,2001,275-280WestfeldA,F5asteganographicalgorithm,LectureNotesinComputerScience,2001,2137,FridrichJ,GoljanM,andHogeaD,SteganalysisofJPEGimage:breakingtheF5algorithm,in5thInternationalWorkshoponInformationHiding,Noordwijkerhout,Netherlands,2002ZhangT,andPingX,AnewapproachtoreliabledetectionofLSBsteganographyinnaturalimages,SignalProcessing,2003,83(10),2085-2093KawaguchiK,andEasonRO,PrincipleandapplicationofBPCSsteganography,MultimediaSystemsandApplications,ProceedingsofSPIE,1998,3528,Boston,464-472ZhangX,andWangS,StatisticalanalysisagainstspatialBPCSsteganography,JournalofComputerAidedDesignandComputerGraphics,2005,17(7),1625-1629(inChinese)張新鵬,王朔中,對空域BPCS密寫的統計分析,計算機輔助設計與圖形學學報,2005,17(7),1625-1629WuM,HoY,andLeeJ,Aniterativemethodofpalette-basedimagesteganography,PatternRecognitionLetters,2004,25,301-309BrisbaneG,Safavi-NainiR,andOqunbonaP,High-capacitysteganographyusingasharedcolourpalette,IEEProceedings-Vision,ImageandSignalProcessing,2005,152,787-792FridrichJ,andRuiD,Securesteganographicmethodsforpaletteimages,The3rdInformationHidingWorkshop,LectureNotesinComputerScience,2000,1768,47-66ZhangX,andWangS,Analysisofparityassignmentsteganographyinpaletteimages,Knowledge-BasedIntelligentInformationandEngineeringSystems,LectureNotesinArtificialIntelligence,2005,3683,1025-1031FridrichJ,GoljanM,andSoukalD,Higher-orderstatisticalsteganalysisofpaletteimages,inProc.SPIE/IS&T,5020,SecurityandWatermarkingofMultimediaContentsV,SantaClara,CA,USA,2003,178-190KerAD,ResamplingandthedetectionofLSBmatchingincolourbitmaps.ProceedingsoftheSPIE,5681,Security,Steganography,andWatermarkingofMultimediaContentsVII,2005,1-15SharpT,Animplementationofkey-baseddigitalsignalsteganography,Proc.InformationHidingWorkshop,LectureNotesinComputerScience,2001,2137,13-26WestfeldA,Detectinglowembeddingrates,inProc.InformationHidingWorkshop,LectureNotesinComputerScience,2002,2578,324-339HarmsenJ,andPearlmanW,Steganalysisofadditive-noisemodelableinformationhiding,inProc.SPIE,SecurityWatermarkingMultimediaContents,2003,5020,131-142KerAD,SteganalysisofLSBmatchingingrayscaleimages,IEEESignalProcessingLetters,2005,12(6),441-444HarmsenJ,BowersK,andPearlmanW,Fastadditivenoisesteganalysis,Security,Steganography,andWatermarkingofMultimediaContentsVI,ProceedingsoftheSPIE,2004,5306,489-495WongPW,ChenH,andTangZ,Onsteganalysisofplus-minusoneembeddingofcontinuoustoneimage,ProceedingsofSPIE,2005,5681,643-652WillemsF,andDijkM,Capacityandcodesforembeddinginformationingray-scalesignals,”IEEETransactionsonInformationTheory,2005,51(3),1209-1214ZhangX,andWangS,Efficientsteganographicembeddingbyexploitingmodificationdirection,IEEECommunicationsLetters,2006,10(11),781-783MielikainenJ,LSBmatchingrevisited,IEEESignalProcessingLetters,2006,13(5),285-287ZhangX,ZhangWandWangS,Efficientdouble-layeredsteganographicembedding,ElectronicsLetters,43(8),2007,482-483FridrichJ,andLison?kP,Gridcoloringinsteganography,IEEETransactionsonInformationTheory,2007,53(4),1547-1549ZhangW,ZhangX,andWangS,Adoublelayered“plus-minusone”dataembeddingscheme,IEEESignalProcessingLetters,2007,14(11),848-851DumitrescuS,WuX,andWangZ,DetectionofLSBsteganographyviasamplepairanalysis,IEEETransactionsonSignalProcessing,2003,51(7),1995-2007LuP,LuoX,TangQ,an

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論