




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第python神經網絡Densenet模型復現詳解目錄什么是DensenetDensenet1、Densenet的整體結構2、DenseBlock3、TransitionLayer網絡實現代碼
什么是Densenet
據說Densenet比Resnet還要厲害,我決定好好學一下。
ResNet模型的出現使得深度學習神經網絡可以變得更深,進而實現了更高的準確度。
ResNet模型的核心是通過建立前面層與后面層之間的短路連接(shortcuts),這有助于訓練過程中梯度的反向傳播,從而能訓練出更深的CNN網絡。
DenseNet模型,它的基本思路與ResNet一致,也是建立前面層與后面層的短路連接,不同的是,但是它建立的是前面所有層與后面層的密集連接。
DenseNet還有一個特點是實現了特征重用。
這些特點讓DenseNet在參數和計算成本更少的情形下實現比ResNet更優的性能。
DenseNet示意圖如下:
代碼下載
Densenet
1、Densenet的整體結構
如圖所示Densenet由DenseBlock和中間的間隔模塊TransitionLayer組成。
1、DenseBlock:DenseBlock指的就是DenseNet特有的模塊,如下圖所示,前面所有層與后面層的具有密集連接,在同一個DenseBlock當中,特征層的高寬不會發生改變,但是通道數會發生改變。
2、TransitionLayer:TransitionLayer是將不同DenseBlock之間進行連接的模塊,主要功能是整合上一個DenseBlock獲得的特征,并且縮小上一個DenseBlock的寬高,在TransitionLayer中,一般會使用一個步長為2的AveragePooling2D縮小特征層的寬高。
2、DenseBlock
DenseBlock的實現示意圖如圖所示:
以前獲得的特征會在保留后不斷的堆疊起來。
以一個簡單例子來表現一下具體的DenseBlock的流程:
假設輸入特征層為X0。
1、對x0進行一次1x1卷積調整通道數到4*32后,再利用3x3卷積獲得一個32通道的特征層,此時會獲得一個shape為(h,w,32)的特征層x1。
2、將獲得的x1和初始的x0堆疊,獲得一個新的特征層,這個特征層會同時保留初始x0的特征也會保留經過卷積處理后的特征。
3、反復經過步驟1、2的處理,原始的特征會一直得到保留,經過卷積處理后的特征也會得到保留。當網絡程度不斷加深,就可以實現前面所有層與后面層的具有密集連接。
實現代碼為:
defdense_block(x,blocks,name):
foriinrange(blocks):
x=conv_block(x,32,name=name+'_block'+str(i+1))
returnx
defconv_block(x,growth_rate,name):
bn_axis=3
x1=layers.BatchNormalization(axis=bn_axis,
epsilon=1.001e-5,
name=name+'_0_bn')(x)
x1=layers.Activation('relu',name=name+'_0_relu')(x1)
x1=layers.Conv2D(4*growth_rate,1,
use_bias=False,
name=name+'_1_conv')(x1)
x1=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,
name=name+'_1_bn')(x1)
x1=layers.Activation('relu',name=name+'_1_relu')(x1)
x1=layers.Conv2D(growth_rate,3,
padding='same',
use_bias=False,
name=name+'_2_conv')(x1)
x=layers.Concatenate(axis=bn_axis,name=name+'_concat')([x,x1])
returnx
3、TransitionLayer
TransitionLayer將不同DenseBlock之間進行連接的模塊,主要功能是整合上一個DenseBlock獲得的特征,并且縮小上一個DenseBlock的寬高,在TransitionLayer中,一般會使用一個步長為2的AveragePooling2D縮小特征層的寬高。
實現代碼為:
deftransition_block(x,reduction,name):
bn_axis=3
x=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,
name=name+'_bn')(x)
x=layers.Activation('relu',name=name+'_relu')(x)
x=layers.Conv2D(int(_shape(x)[bn_axis]*reduction),1,
use_bias=False,
name=name+'_conv')(x)
x=layers.AveragePooling2D(2,strides=2,name=name+'_pool')(x)
returnx
網絡實現代碼
fromkeras.preprocessingimportimage
fromkeras.modelsimportModel
fromkerasimportlayers
fromkeras.applicationsimportimagenet_utils
fromkeras.applications.imagenet_utilsimportdecode_predictions
fromkeras.utils.data_utilsimportget_file
fromkerasimportbackend
importnumpyasnp
BASE_WEIGTHS_PATH=(
'/keras-team/keras-applications/'
'releases/download/densenet/')
DENSENET121_WEIGHT_PATH=(
BASE_WEIGTHS_PATH+
'densenet121_weights_tf_dim_ordering_tf_kernels.h5')
DENSENET169_WEIGHT_PATH=(
BASE_WEIGTHS_PATH+
'densenet169_weights_tf_dim_ordering_tf_kernels.h5')
DENSENET201_WEIGHT_PATH=(
BASE_WEIGTHS_PATH+
'densenet201_weights_tf_dim_ordering_tf_kernels.h5')
defdense_block(x,blocks,name):
foriinrange(blocks):
x=conv_block(x,32,name=name+'_block'+str(i+1))
returnx
defconv_block(x,growth_rate,name):
bn_axis=3
x1=layers.BatchNormalization(axis=bn_axis,
epsilon=1.001e-5,
name=name+'_0_bn')(x)
x1=layers.Activation('relu',name=name+'_0_relu')(x1)
x1=layers.Conv2D(4*growth_rate,1,
use_bias=False,
name=name+'_1_conv')(x1)
x1=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,
name=name+'_1_bn')(x1)
x1=layers.Activation('relu',name=name+'_1_relu')(x1)
x1=layers.Conv2D(growth_rate,3,
padding='same',
use_bias=False,
name=name+'_2_conv')(x1)
x=layers.Concatenate(axis=bn_axis,name=name+'_concat')([x,x1])
returnx
deftransition_block(x,reduction,name):
bn_axis=3
x=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,
name=name+'_bn')(x)
x=layers.Activation('relu',name=name+'_relu')(x)
x=layers.Conv2D(int(_shape(x)[bn_axis]*reduction),1,
use_bias=False,
name=name+'_conv')(x)
x=layers.AveragePooling2D(2,strides=2,name=name+'_pool')(x)
returnx
defDenseNet(blocks,
input_shape=None,
classes=1000,
**kwargs):
img_input=layers.Input(shape=input_shape)
bn_axis=3
#224,224,3-112,112,64
x=layers.ZeroPadding2D(padding=((3,3),(3,3)))(img_input)
x=layers.Conv2D(64,7,strides=2,use_bias=False,name='conv1/conv')(x)
x=layers.BatchNormalization(
axis=bn_axis,epsilon=1.001e-5,name='conv1/bn')(x)
x=layers.Activation('relu',name='conv1/relu')(x)
#112,112,64-56,56,64
x=layers.ZeroPadding2D(padding=((1,1),(1,1)))(x)
x=layers.MaxPooling2D(3,strides=2,name='pool1')(x)
#56,56,64-56,56,64+32*block[0]
#Densenet12156,56,64-56,56,64+32*6==56,56,256
x=dense_block(x,blocks[0],name='conv2')
#56,56,64+32*block[0]-28,28,32+16*block[0]
#Densenet12156,56,256-28,28,32+16*6==28,28,128
x=transition_block(x,0.5,name='pool2')
#28,28,32+16*block[0]-28,28,32+16*block[0]+32*block[1]
#Densenet12128,28,128-28,28,128+32*12==28,28,512
x=dense_block(x,blocks[1],name='conv3')
#Densenet12128,28,512-14,14,256
x=transition_block(x,0.5,name='pool3')
#Densenet12114,14,256-14,14,256+32*block[2]==14,14,1024
x=dense_block(x,blocks[2],name='conv4')
#Densenet12114,14,1024-7,7,512
x=transition_block(x,0.5,name='pool4')
#Densenet1217,7,512-7,7,256+32*block[3]==7,7,1024
x=dense_block(x,blocks[3],name='conv5')
x=layers.BatchNormalization(axis=bn_axis,epsilon=1.001e-5,name='bn')(x)
x=layers.Activation('relu',name='relu')(x)
x=layers.GlobalAveragePooling2D(name='avg_pool')(x)
x=layers.Dense(classes,activation='softmax',name='fc1000')(x)
inputs=img_input
ifblocks==[6,12,24,16]:
model=Model(inputs,x,name='densenet121')
elifblocks==[6,12,32,32]:
model=Model(inputs,x,name='densenet169')
elifblocks==[6,12,48,32]:
model=Model(inputs,x,name='densenet201')
else:
model=Model(inputs,x,name='densenet')
returnmodel
defDenseNet121(input_shape=[224,224,3],
classes=1000,
**kwargs):
returnDenseNet([6,12,24,16],
input_shape,classes,
**kwargs)
defDenseNet169(input_shape=[224,224,3],
classes=1000,
**kwargs):
returnDenseNet([6,12,32,32],
input_shape,classes,
**kwargs)
defDenseNet201(input_shape=[224,224,3],
classes=1000,
**kwargs):
returnDenseNet([6,12,48,32],
input_shape,classes,
**kwargs)
defpreprocess_input(x):
x/=255.
mean=[0.485,0.456,0.406]
std=[0.229,0.224,0.225]
x[...,0]-=mean[0]
x[...,1]-=mean[1]
x[...,2]-=mean[2]
ifstdisnotNone:
x[...,0]/=std[0]
x[...,1]/=std[1]
x[...,2]/=std[2]
returnx
if__name__=='__main__':
#model=DenseNet121()
#weights_path=get_file(
#'densenet121_weights_tf_dim_ordering_tf_kernels.h5',
#DENSENET121_WEIGHT_PATH,
#cache_subdir='models',
#file_hash='9d60b8095a5708f2dcce2bca79d332c7')
model=DenseNet169()
weights_path=get_file
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中醫按摩養生師承合同
- 拆除工程合同履行及施工許可證辦理承包合同范本
- 茶葉電商平臺入駐與營銷合作合同
- 吞咽治療護理
- 房產代持協議書(婚姻財產分割版)
- 和人有關的課件
- 撤資協議書標準模板
- 車貸抵押擔保業務專屬合同模板
- 城市出租車經營權承包合作協議范本
- 高端汽車定制生產與售后服務協議
- 小區燃氣管道施工方案施工方法
- 糖尿病合并尿路感染
- 教學能力比賽學情分析圖(源圖可編輯)
- 幼兒園2024-2025學年保教工作計劃
- 燕舞集團招聘試題
- 2024年新蘇教版五年級下冊科學全冊精編知識點(附附問答題)
- 腸管脫出的應急救援原則、方法
- 《解密分層教學》讀書心得體會(讀書心得體會30篇)
- 服務檔案管理制度
- 2024年新一輪科技革命的開啟
- 村委消防安全網格化管理工作制度范文
評論
0/150
提交評論