




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、HOG 代碼 的一些解釋關于計算梯度方向角的:首先用-1,0,1梯度算子對原圖像做卷積運算, 得到 x 方向(水平方向, 以向右為正方向)的梯度分量gradscalx,然后用1,0,-1梯度算子對原圖像做卷積運算, 得到y(tǒng)方向(豎直方向,以向上為正方向)的梯度分量gradscaly。然后當gradscalx=0, gradscaly=0時,說明梯度方向是朝向第一象限的, 當gradscalx=0, gradscaly0時,說明梯度方向是朝向第二象限的,諸如此類,結(jié)合象限信息, 就可以利用反正切函數(shù)atan求出在signed和unsigned各自情況下正確的梯度角 度.關于掃描循環(huán)(四層for循
2、環(huán)有沒有快一點的?有!但是我功力不夠。當時 沒編出來,就只好還是來四層 for):假設檢測窗為 64(列)*128(行)大小, block 為 16*16 大小,每個 block 劃分為 4 個 cell, block 每次滑動 8 個像素(也就是一個 cell 的寬),以及梯度方向劃分為 9個 區(qū)間,在 0180度范圍內(nèi)統(tǒng)計,以下的說明都以上述假設為例 .btly 與 btlx 分別表示 block 所在位置左上角點處的坐標。對于前述假設,一個檢測窗內(nèi)會有105個block存在,因此第一個block左上角的坐標是(1,1),第二個是(9,1)此行最后一個是block的左上角坐標是(49,1)
3、,然后下一個block就需要向下滑動8個像素,并回到最左邊,此時的block左上角坐標為(1,9),接著block重新 開始新的橫向滑動 如此這般,在檢測窗內(nèi)最后一個block的坐標就是(49,113).block每滑動到一個新的位置,就需要停下來計算它內(nèi)部的那四個cell中的梯度方向直方圖.(bj,bi)就是來存儲cell左上角的坐標的(cell的坐標以block左上角為 原點).(j,i)就表示cell中的像素在整個檢測窗(64*128的圖像)中的坐標.另外,我在程序里有個jorbj與iorbi,這在Localinterpolate的情況下(也就是標準的原始 HOG 情況),就是bj與bi
4、.關于 hist3dbig:這是一個三維的矩陣,用來存儲三維直方圖。最常見的一維的直方圖是這個樣子,二維直方圖呢?是這個樣子,一個一個的柱子是一個統(tǒng)計bin,柱子的高低代表統(tǒng)計值的大小二維直方圖5 O(徹晝Me扛於三維直方圖呢?是這個樣子,立體的一個一個的小格子,每個小格子是一個統(tǒng)計 bin,小格子用來裝統(tǒng)計值。以上面的例子,那么對一個 block來說,它的直方圖 是下面這樣的:該Fin塊”在3D直方圖甲的坐標為(bins1. hiny-2, binO-)Oa H q再來說線性插值,線性插值時,一個統(tǒng)計值需被 按一定比例分配”到這個統(tǒng)計點 最鄰近的區(qū)間中去,下面的圖顯示了一維直方圖時,落在虛線
5、標記范圍內(nèi)的統(tǒng)計 點,它最近鄰的區(qū)間就是標有紅色圓點的兩個區(qū)間 若是二維直方圖,那落在如下虛線矩形中的統(tǒng)計點,周圍的這四個統(tǒng)計區(qū)間就是它最近鄰的區(qū)間。這個虛線矩形由四個統(tǒng)計區(qū)間各自的1/4組成三維直方圖,對一個統(tǒng)計點來說,它的最近鄰的區(qū)間有八個,如下圖,可以想象 一下,只有當這個統(tǒng)計點落在由如下八個統(tǒng)計區(qū)間各自的1/8組成的一個立方體內(nèi)內(nèi)時,這八個區(qū)間才是對統(tǒng)計點最近鄰的。統(tǒng)計時如何分配權重呢?以一維直方圖簡單說一下線性插值的意思,對于下面綠色小方點(x)的統(tǒng)計值來說,假設標紅點的兩個 bin的中心位置分別為x1,x2,那么對于x,它的分配權重為左邊 bin: 1-(x-x1)/s,即1-a/
6、s = b/s,右邊bin:1-(x2-x)/s,即 1-b/s = a/s.類似,那么對三維直方圖來說,統(tǒng)計時的累積式(從Dalal的論文里截來的)就是:hgm) hg !“心)+ ( 11 h(心二2) h(.vi, i/i,z2)+ w(1 呵4,可)一呵,畑卻)+譏1 11(X2, 1/1,2) 一 h(A2. 1/11)+ W h(2二2) h(.vb茁(1皿.丫2二 2) h(.V2. 1/1,22)+ W h(X2,!/2,Zl) h(工 2仏二 1)+ W h(工22心)一 h(X222)+ 砂上面,w就是準備被分配的統(tǒng)計值。(x1,y1,z1)共八個點表示八個統(tǒng)計區(qū)間的中 心
7、位置坐標,上式用h(x1,y1,z1)這樣的標記來表示所要累積的統(tǒng)計區(qū)間。我在編程時就使用的這個式子,只不過我用bin的下標號來表示bin塊,就像前面三維直方圖示意中(binx=1,biny=2,bi n 9 =9)不過在程序中B軸是用z軸表示了。binxl = floor(jorbj-1+cellpw/2)/cellpw) + 1;binyl = floor(iorbi-1+cellph/2)/cellph) + 1;binz1 = floor(go+(or*pi/nthet)/2)/(or*pi/nthet) + 1;binx2 = binx1 + 1;biny2 = biny1 + 1;
8、binz2 = binz1 + 1;這幾句,就是用來計算八個統(tǒng)計區(qū)間中心點的坐標的。在計算前面所講的統(tǒng)計區(qū)間的中心坐標, 分配權值之前, 我為了處理邊緣時程序 簡潔點,就給那個 2*2*9 的立體直方圖外邊又包了一層,形成了一個 4*4*11 的 三維直方圖 (示意圖如下 ),原來的 2*2*9 直方圖就是被包在中間的部分。這樣, 在原來直方圖里坐標為(binx=1,biny=2,binz=9)的bin,在新的直方圖里坐標為 (binx=2,biny=3,binz=10)。謹bin塊”在3D直方圖中的坐標為binK=L biny=4 bin0=ll)對上面的4*4*11的直方圖來個與xoy平面
9、平行的剖面圖:粗實線框就是原三維直方圖的剖面,也就是一個block,對于像落在粗實線框與粗虛線框之間的點,其最近鄰區(qū)間是不夠8個的,我為了寫程序時省點腦力就用外擴了的這一圈bin,這樣落在粗實線框與粗虛線框之間的統(tǒng)計點有了8個區(qū)間,用matlab編程時,那個四層for循環(huán)中的部分就只用把那八個累積公式寫 上,也不用判斷是不是在落在像上面粗實線框與粗虛線框之間的那種區(qū)域。在程序中2*2*9的直方圖為hist3d, 4*4*11的直方圖為hist3dbig.當在這個hist3dbig 中計算都結(jié)束后,我把外層這一圈剝?nèi)ィ褪?hist3d 了。有了這些準備,我就可以計算出當前像素點的梯度方向幅值應
10、該往hist3dbig中的哪八個bin塊累積了。binx1 ,biny1 ,binz1在這里就是那個八個bin塊之中離 當 前要統(tǒng)計的像素點在直方圖中對應的位置最接近的bin塊的下標。binx2,biny2,binz2對應就是最遠的bin塊的下標了。x1,y1,z1就是bin塊(binx1,biny1,binz1) 中心點對應的實際像素所在的位置(x1,y1)與梯度方向的角度(z1).我仍然以原 block(即沒擴前的block)左上角處作為x1, y1的原點,因為matlab以1作為圖像 像素索引的開始,我把原點就認為是(1,1),那(1,1)左邊外擴出來的部分,就給以 0,-1,-2,-3
11、這樣的坐標,向上也類似,如下圖所示,(1,1)位置為紅點所示, 藍點處坐標就是(-3,1).擴展出來的綠塊的下標是 (binx=1,biny=1,binz1=1), 由于像素坐標在紅點處為(1,1),而黃塊才是block的第一個cell,對應bin塊的下標(2,2).因為下標設計的 原因,我在求 x1,y1,z1 時減了 1.5而非 0.5.x1 = (binx1-1.5)*cellpw + 0.5;y1 = (biny1-1.5)*cellph + 0.5;z1 = (binz1-1.5)*(or*pi/nthet);上面的式子中 x1, y1 還加了 0.5,因為像素坐標是離散的,而第一個坐標總是從1 開始,這樣對如圖中第一個 cell 的中心(黑點)處應該是 4.5. z1 沒加 0.5,是因 為角度值是從 0 開始的,并且是連續(xù)的。在signed(即梯度方向從0度到360度)情況下,因為實際上角度的投票區(qū)間是首尾相接環(huán)形的, 若統(tǒng)計間隔是 40度,那么 0-40度和 320-360度就是相鄰區(qū)間, 那么在 4*4*11 的直方圖中,投給 binz=11 區(qū)間(相當于 360-380度)的值應該返給binz=2(0-40度),投給binz=1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學年第二學期北師大版數(shù)學八年級下冊期末模擬試題
- 金融服務營銷 教學實施方案
- 工業(yè)園區(qū)規(guī)劃與綠色發(fā)展策略
- 工業(yè)智能化改造及自動化生產(chǎn)研究
- 工業(yè)旅游開發(fā)與推廣策略
- 工業(yè)建筑設計原理及實踐
- 工業(yè)廢水處理后的環(huán)境監(jiān)測評估
- 工業(yè)廢水處理的安全生產(chǎn)流程優(yōu)化
- 工業(yè)機器人技術對勞動力的影響與挑戰(zhàn)
- 工業(yè)污染防治的技術手段與實踐
- 2025年遼寧黑龍江吉林內(nèi)蒙古高考物理試卷真題(含答案詳解)
- 2025高考全國二卷語文真題
- 2025年合作并購協(xié)議范本
- 2025年繼續(xù)教育公需科目試題及答案
- 2025-2030中國環(huán)戊醇行業(yè)市場深度分析及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 高血壓RDN介入治療新進展
- 辦公大樓光儲充建設方案
- 山東建筑大學《模擬電路與數(shù)字電路》2023-2024學年第二學期期末試卷
- 2025寫字樓租賃定金合同的范本
- 19S406建筑排水管道安裝-塑料管道
- CB/T 3766-1996排氣管鋼法蘭及墊片
評論
0/150
提交評論