python神經網絡Densenet模型復現詳解_第1頁
python神經網絡Densenet模型復現詳解_第2頁
python神經網絡Densenet模型復現詳解_第3頁
python神經網絡Densenet模型復現詳解_第4頁
python神經網絡Densenet模型復現詳解_第5頁
已閱讀5頁,還剩6頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第python神經網絡Densenet模型復現詳解目錄什么是DensenetDensenet1、Densenet的整體結構2、DenseBlock3、TransitionLayer網絡實現代碼

什么是Densenet

據說Densenet比Resnet還要厲害,我決定好好學一下。

ResNet模型的出現使得深度學習神經網絡可以變得更深,進而實現了更高的準確度。

ResNet模型的核心是通過建立前面層與后面層之間的短路連接(shortcuts),這有助于訓練過程中梯度的反向傳播,從而能訓練出更深的CNN網絡。

DenseNet模型,它的基本思路與ResNet一致,也是建立前面層與后面層的短路連接,不同的是,但是它建立的是前面所有層與后面層的密集連接。

DenseNet還有一個特點是實現了特征重用。

這些特點讓DenseNet在參數和計算成本更少的情形下實現比ResNet更優的性能。

DenseNet示意圖如下:

代碼下載

Densenet

1、Densenet的整體結構

如圖所示Densenet由DenseBlock和中間的間隔模塊TransitionLayer組成。

1、DenseBlock:DenseBlock指的就是DenseNet特有的模塊,如下圖所示,前面所有層與后面層的具有密集連接,在同一個DenseBlock當中,特征層的高寬不會發生改變,但是通道數會發生改變。

2、TransitionLayer:TransitionLayer是將不同DenseBlock之間進行連接的模塊,主要功能是整合上一個DenseBlock獲得的特征,并且縮小上一個DenseBlock的寬高,在TransitionLayer中,一般會使用一個步長為2的AveragePooling2D縮小特征層的寬高。

2、DenseBlock

DenseBlock的實現示意圖如圖所示:

以前獲得的特征會在保留后不斷的堆疊起來。

以一個簡單例子來表現一下具體的DenseBlock的流程:

假設輸入特征層為X0。

1、對x0進行一次1x1卷積調整通道數到4*32后,再利用3x3卷積獲得一個32通道的特征層,此時會獲得一個shape為(h,w,32)的特征層x1。

2、將獲得的x1和初始的x0堆疊,獲得一個新的特征層,這個特征層會同時保留初始x0的特征也會保留經過卷積處理后的特征。

3、反復經過步驟1、2的處理,原始的特征會一直得到保留,經過卷積處理后的特征也會得到保留。當網絡程度不斷加深,就可以實現前面所有層與后面層的具有密集連接。

實現代碼為:

defdense_block(x,blocks,name):

foriinrange(blocks):

x=conv_block(x,32,name=name+'_block'+str(i+1))

returnx

defconv_block(x,growth_rate,name):

bn_axis=3

x1=layers.BatchNormalization(axis=bn_axis,

epsilon=1.001e-5,

name=name+'_0_bn')(x)

x1=layers.Activation('relu',name=name+'_0_relu')(x1)

x1=layers.Conv2D(4*growth_rate,1,

use_bias=False,

name=name+'_1_conv')(x1)

x1=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,

name=name+'_1_bn')(x1)

x1=layers.Activation('relu',name=name+'_1_relu')(x1)

x1=layers.Conv2D(growth_rate,3,

padding='same',

use_bias=False,

name=name+'_2_conv')(x1)

x=layers.Concatenate(axis=bn_axis,name=name+'_concat')([x,x1])

returnx

3、TransitionLayer

TransitionLayer將不同DenseBlock之間進行連接的模塊,主要功能是整合上一個DenseBlock獲得的特征,并且縮小上一個DenseBlock的寬高,在TransitionLayer中,一般會使用一個步長為2的AveragePooling2D縮小特征層的寬高。

實現代碼為:

deftransition_block(x,reduction,name):

bn_axis=3

x=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,

name=name+'_bn')(x)

x=layers.Activation('relu',name=name+'_relu')(x)

x=layers.Conv2D(int(_shape(x)[bn_axis]*reduction),1,

use_bias=False,

name=name+'_conv')(x)

x=layers.AveragePooling2D(2,strides=2,name=name+'_pool')(x)

returnx

網絡實現代碼

fromkeras.preprocessingimportimage

fromkeras.modelsimportModel

fromkerasimportlayers

fromkeras.applicationsimportimagenet_utils

fromkeras.applications.imagenet_utilsimportdecode_predictions

fromkeras.utils.data_utilsimportget_file

fromkerasimportbackend

importnumpyasnp

BASE_WEIGTHS_PATH=(

'/keras-team/keras-applications/'

'releases/download/densenet/')

DENSENET121_WEIGHT_PATH=(

BASE_WEIGTHS_PATH+

'densenet121_weights_tf_dim_ordering_tf_kernels.h5')

DENSENET169_WEIGHT_PATH=(

BASE_WEIGTHS_PATH+

'densenet169_weights_tf_dim_ordering_tf_kernels.h5')

DENSENET201_WEIGHT_PATH=(

BASE_WEIGTHS_PATH+

'densenet201_weights_tf_dim_ordering_tf_kernels.h5')

defdense_block(x,blocks,name):

foriinrange(blocks):

x=conv_block(x,32,name=name+'_block'+str(i+1))

returnx

defconv_block(x,growth_rate,name):

bn_axis=3

x1=layers.BatchNormalization(axis=bn_axis,

epsilon=1.001e-5,

name=name+'_0_bn')(x)

x1=layers.Activation('relu',name=name+'_0_relu')(x1)

x1=layers.Conv2D(4*growth_rate,1,

use_bias=False,

name=name+'_1_conv')(x1)

x1=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,

name=name+'_1_bn')(x1)

x1=layers.Activation('relu',name=name+'_1_relu')(x1)

x1=layers.Conv2D(growth_rate,3,

padding='same',

use_bias=False,

name=name+'_2_conv')(x1)

x=layers.Concatenate(axis=bn_axis,name=name+'_concat')([x,x1])

returnx

deftransition_block(x,reduction,name):

bn_axis=3

x=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,

name=name+'_bn')(x)

x=layers.Activation('relu',name=name+'_relu')(x)

x=layers.Conv2D(int(_shape(x)[bn_axis]*reduction),1,

use_bias=False,

name=name+'_conv')(x)

x=layers.AveragePooling2D(2,strides=2,name=name+'_pool')(x)

returnx

defDenseNet(blocks,

input_shape=None,

classes=1000,

**kwargs):

img_input=layers.Input(shape=input_shape)

bn_axis=3

#224,224,3-112,112,64

x=layers.ZeroPadding2D(padding=((3,3),(3,3)))(img_input)

x=layers.Conv2D(64,7,strides=2,use_bias=False,name='conv1/conv')(x)

x=layers.BatchNormalization(

axis=bn_axis,epsilon=1.001e-5,name='conv1/bn')(x)

x=layers.Activation('relu',name='conv1/relu')(x)

#112,112,64-56,56,64

x=layers.ZeroPadding2D(padding=((1,1),(1,1)))(x)

x=layers.MaxPooling2D(3,strides=2,name='pool1')(x)

#56,56,64-56,56,64+32*block[0]

#Densenet12156,56,64-56,56,64+32*6==56,56,256

x=dense_block(x,blocks[0],name='conv2')

#56,56,64+32*block[0]-28,28,32+16*block[0]

#Densenet12156,56,256-28,28,32+16*6==28,28,128

x=transition_block(x,0.5,name='pool2')

#28,28,32+16*block[0]-28,28,32+16*block[0]+32*block[1]

#Densenet12128,28,128-28,28,128+32*12==28,28,512

x=dense_block(x,blocks[1],name='conv3')

#Densenet12128,28,512-14,14,256

x=transition_block(x,0.5,name='pool3')

#Densenet12114,14,256-14,14,256+32*block[2]==14,14,1024

x=dense_block(x,blocks[2],name='conv4')

#Densenet12114,14,1024-7,7,512

x=transition_block(x,0.5,name='pool4')

#Densenet1217,7,512-7,7,256+32*block[3]==7,7,1024

x=dense_block(x,blocks[3],name='conv5')

x=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,name='bn')(x)

x=layers.Activation('relu',name='relu')(x)

x=layers.GlobalAveragePooling2D(name='avg_pool')(x)

x=layers.Dense(classes,activation='softmax',name='fc1000')(x)

inputs=img_input

ifblocks==[6,12,24,16]:

model=Model(inputs,x,name='densenet121')

elifblocks==[6,12,32,32]:

model=Model(inputs,x,name='densenet169')

elifblocks==[6,12,48,32]:

model=Model(inputs,x,name='densenet201')

else:

model=Model(inputs,x,name='densenet')

returnmodel

defDenseNet121(input_shape=[224,224,3],

classes=1000,

**kwargs):

returnDenseNet([6,12,24,16],

input_shape,classes,

**kwargs)

defDenseNet169(input_shape=[224,224,3],

classes=1000,

**kwargs):

returnDenseNet([6,12,32,32],

input_shape,classes,

**kwargs)

defDenseNet201(input_shape=[224,224,3],

classes=1000,

**kwargs):

returnDenseNet([6,12,48,32],

input_shape,classes,

**kwargs)

defpreprocess_input(x):

x/=255.

mean=[0.485,0.456,0.406]

std=[0.229,0.224,0.225]

x[...,0]-=mean[0]

x[...,1]-=mean[1]

x[...,2]-=mean[2]

ifstdisnotNone:

x[...,0]/=std[0]

x[...,1]/=std[1]

x[...,2]/=std[2]

returnx

if__name__=='__main__':

#model=DenseNet121()

#weights_path=get_file(

#'densenet121_weights_tf_dim_ordering_tf_kernels.h5',

#DENSENET121_WEIGHT_PATH,

#cache_subdir='models',

#file_hash='9d60b8095a5708f2dcce2bca79d332c7')

model=DenseNet169()

weights_path=get_file

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論