




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 基于yolo的小型動物識別系統設計 周文萱 胡龍桃 張敏 方宇濤 李欣鈺摘 要: 針對常見動物識別的問題,提出了一種基于yolo的識別分類系統。通過搭載linux系統的樹莓派完成實施檢測運行的識別程序。利用yolo算法進行目標物體檢測,其單個神經網絡能夠在一幀圖像中直接預測邊界邊框(bounding box)和分類概率(classified probability),最后根據輸入圖像來輸出動物物種的識別結果。其識別準確率針對鳥類可達94.61%,狗類為90.60%,牛類為79.03%。關鍵詞: 物種圖像識別; 動物識別; yolo; 神經網
2、絡; 樹莓派:tp319 文獻標志碼:a :1006-8228(2019)03-22-04design of yolo-based small animal recognition systemzhou wenxuan, hu longtao, zhang min, fang yutao, li xinyu(school of optoelectronic information and computer engineering, university of shanghai for science and technology, shanghai 200093, china)abstract
3、: to solve the problem of species identification and population identification of small animals, a recognition and classification system based on yolo (you only look once) is proposed in this paper. the recognition program is implemented on a raspberry pi with linux system, and yolo is used as the d
4、etection framework. the single neural network can directly predict the bounding box and the classified probability in a frame image, and output the animal recognized according to the input image. the accuracy rate of identification is 94.61% for birds, 90.60% for dogs and 79.03% for cattle.key words
5、: species image recognition; animal identification; yolo; neural network; raspberry pi0 引言近年來,機器視覺越來越多的用于人類的交通、物流和安防等方面,其在代替人工重復機械的特征識別等方面發揮著重要的作用。但是自然環境、物種研究等領域的圖像識別卻并不多見,隨著深度學習的發展,國內外有很多學者使用卷積神經網絡進行圖像識別。huangyue1等使用cnn算法進行汽車圖標識別,提高了識別的精度和系統的穩定性。王福建2等設計了車輛信息檢測和識別系統,其設計了不同顏色的識別,使得分類更加細化。但是傳統的算法都普遍存在
6、一個問題,那就是檢測識別速度慢3-6,計算量大不適合小型化。而redmond提出的yolo(you only look once)算法,能在保證識別精度的同時,提升運算效率,加快檢測速度7。針對機器視覺需要較大的處理系統和繁瑣的框架配置等問題,本文利用搭載linux和yolo框架的樹莓派設計了小型便攜的物種識別系統,該系統成本低可以大范圍普及使用,兼顧智能算法識別與低功耗小巧的雙重優點,為產品普及提供了理論論證和數據支持。1 yolo神經網絡識別算法yolo(you only look once)算法,是一種端到端卷積神經網絡,常用于目標物體檢測與識別。該算法將目標檢測視為目標區域預測與類別預
7、測的回歸問題,采用單個卷積神經網絡直接從圖像中預測目標邊框和類別概率。yolo的主要特點是快速檢測和較高的準確率。yolo直接將一張整圖應用到網絡中去,以便更好地區分目標和背景;同時,與其他目標檢測識別方法將目標檢測劃分成區域預測和類別預測等多個流程相比,yolo將區域預測和類別預測整合在一個網絡中,從而提高檢測速率5,8。其檢測模型如圖1所示。該算法將待檢測圖像劃分為一個s×s的網格,并且假設識別目標的中心落在某個網格內,則該網格負責檢測此目標7-11。與此同時每個網格預測b個目標窗口,每個目標窗口負責5個參數的計算:目標的中心坐標(x,y)、寬度(width)、高度(height
8、)和置信概率(confidence):式中:pr(object)為此網格中存在目標的概率,表示該網格內預測目標中心坐標位置的準確性,也就是測量在特定數據集中檢測相應物體準確度的一個標準。如果網格內不存在目標物體,則其pr(object)的值為0,(intersection over union)為目標預測窗口與真實窗口的重疊度,是一個位置定位精度的概率。在最后進行結果預測時,每個類別通過上述條件類別概率和目標置信度的乘積得到該類別的置信分數:綜上所述,經過一系列的運算輸出了一個維度為s2的向量,再將該高緯度向量進行篩除,將低于閾值的值去除掉,利用nms算法進行迭代-遍歷-消除的過程;最終只留下
9、置信分數最高的輸出。2 基于yolo的樹莓派識別系統本文設計的搭載在樹莓派上的基于yolo算法的識別系統可以完成常見動物識別的工作9。對于細節和精度一直是圖像識別的難點,所以在識別動物有良好偽裝的情況下,準確率大大降低。但在一般情況下,還是能將目標物體與背景區分開,并且能給出目標物體的中心坐標和邊框。當檢測到包含有目標物體后,將其目標區域內的目標物體特征提取出來,用已經訓練好的分類器進行分類識別,從而完成動物和物種識別分類的工作。本文使用具有強拓展的卡片電腦樹莓派作為運算平臺,圖像采集使用imx2619原裝800萬像素攝像頭,并且在最新stretch版精簡了無用的功能。并且采用pascal v
10、oc2012數據集目標系統,使用其訓練好的模型,在去除掉無用的分類后,可以針對:鳥bird、,貓cat、牛cow、狗dog、馬horse、羊sheep這六種常見的動物進行識別10。本文運行系統為raspiberry-stretch版,arm架構的雙核cpu,主頻800mhz,未使用cuda和gpu核心,且已經部署好opencv、tensorflow和darknet框架。由于其運算能力和內存都不足,故進行了量化模型的操作。神經網絡的節點和權重最初是存儲為32位的浮點數。量化模型最簡單的一個做法就是通過存儲每一層最小和最大的值來壓縮文件的大小,接著壓縮每一個浮點數為8位整型。這樣文件的大小就減少了
11、75%。部分代碼如下所示:curl-l"https:/.pb.tar.gz" |tar -c tensorflow/examples/label_image/data -xzbazelbuildtensorflow/tools/graph_transforms:transform_graphbazel-bin/tensorflow/tools/graph_transforms/transform_graph -in_graph=tensorflow/examples/label_image/data/inception_v3_2016_08_28_frozen.pb -ou
12、t_graph=/tmp/quantized_graph.pb -inputs=input -outputs=inceptionv3/predictions/reshape_1 -transforms='add_default_attributes strip_unused_nodes(type=float, shape="1,299,299,3")remove_nodes(op=identity, op=checknumerics)fold_constants(ignore_errors=true)fold_batch_norms fold_old_batch_n
13、ormsquantize_weights quantize_nodesstrip_unused_nodes sort_by_execution_order3 系統測試和試驗結果經過一系列準備工作和框架部署,為了驗證本文提出的基于yolo算法的識別系統11-14,采用自己制作的數據集進行測試,通過編寫網絡爬蟲程序從中國動物圖片網爬取了大量的動物圖片,作為測試集使用。隨機抽取其中圖片如圖3所示。如圖3所示,四種數據集的測試集部分目標圖像已經被標注出,其目標區域中心坐標和長寬已經保存13,在此不再贅述。本文為了簡化人工工作量,進行人工校驗實行分數據集測試和校驗,分為鳥類、狗、牛和人四類數據集,其中人
14、數據集為無關集,用來測試模型的誤檢測率。其檢測結果如表1所示。通過上述檢測可知,鳥類和狗類數據集的檢驗正確率達到了90%以上,牛類數據集的測試準確率僅為79.03%。對于牛類數據集測試發現,基于人類良好的視覺經驗可以在褐色背景識別出牛類,但是對于機器來說,對于目標物體的識別在有不明顯背景色區分的情況下很難做出良好的判斷,導致正確率不高。對比其他兩類驗證數據集,牛類的數據集中,如印度地區給牛身裝扮了很多首飾的圖片,也有泥濘背景中牛腿被泥水遮擋和不完整等情況的圖片,這類圖像的目標識別區域誤檢率和漏檢率比較高,容易對整個系統的監測造成誤差。另一方面,訓練樣本數目太少,且深度學習算法中多維特征的提取維
15、度不夠多,所以需要更多的樣本。樣本模型的數量太少不足以對于整體數據樣本進行描述,因此其泛化能力不夠,對于差異較大的圖像預測不準的概率較大15。人類的數據集作為不存在其分類特征文件,故理論檢測為0,但經過數據集的查驗,發現部分圖片有和寵物同框的現象,所以檢測結果也有部分識別到。同時該檢測結果運行十分緩慢,由于系統內存不夠,實驗是分多次做的,最后統一計算出結果。針對上述系統誤差的分析結果,還可以采用如下改善方法。 yolo中每個grid有30維其中8維是回歸box的坐標,二維是box的confidence,還有20維的類別,要在此基礎上增加基于hog的局部特征和顏色提取等多維度的特征。 損失函數設
16、計的優化,讓預測坐標(x,y,w,h),confidence和classification這三個方面達到最優的平衡,最基礎的yolo采用sum-squared error loss方法將坐標權重和分類誤差視為同等重要顯然是不合理的,需要增加坐標預測的權重,將其loss weight賦予更大的值16。 目標待識別物體大小不同的預測處理中,小的bounding box中預測的框線偏一點其偏移loss很大,所以采取將box的長和寬取平方根代替原本的長和寬,其對于小box(狗類和鳥類)的偏移,loss小的多,從而提高了其準確率17。4 試驗結論本文設計了一種基于yolo算法的小型化的識別檢測跟蹤系統,
17、利用yolo算法中tiny-model可以極大地減少cpu占用,從而提升其處理效率。經檢驗其識別率較好,但是精度有待提高。本研究主要研究和部署了基于arm架構的yolo深度學習分類器,并對于網絡爬取的不同類型圖片進行目標檢測識別。其綜合檢測識別率為89.04%。樹莓派微型卡片電腦可以運行該系統,可以擴展成為帶有圖像識別功能的監控探頭,對于以后發展的智能監控探頭,提供了理論驗證的依據。同時對于默認的yolo-tiny算法中的前期特征提取和部分權重配置提出了增改的建議,但是增加維度會造成運算量呈幾何數量增長導致效率低下問題還需進一步解決,要平衡好效率與準確率。本文在arm架構部署了yolo和dar
18、knet的開源神經網絡,并且實現了一套圖像輸入-識別-分類的檢測系統,將傳統工作站運行的復雜神經網絡進行簡化,為低功耗便攜式移動圖像識別設備提供了可靠的理論驗證。參考文獻(references):1 huang y, wu r, sun y, et al. vehicle logo recognitionsystem based on convolutional neural networks with a pretraining strategyj. ieee transactions on intelligent transportation systems,2015.16(4):1951-19602 王福建,張俊,盧國權等.基于yolo的車輛信息檢測和跟蹤系統j.工業控制計算機,2018.7:89-913 dlagnekov l, belongie s. recognizing carsj. ecologi-calmodelling,2005.113(13):71-814 邱道尹,張紅濤,劉新宇等.基于機器視覺的大田害蟲檢測系統j.農業機械學報,2007.38(1):120-1225 redmon j, farhadi a. yolo9000: better, f
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 業務流程跟蹤與監控表
- 鋁灰渣資源化利用改建項目實施方案(范文模板)
- 2025年四川省達州市中考英語真題含答案
- 房屋預售購銷合同
- 中試平臺建設的資金籌措與資源配置策略
- 生物制藥中試平臺建設的背景與發展趨勢
- 建筑設計原理與設計題集
- 《宏觀經濟與微觀經濟:高二經濟學基礎教案》
- 資源整合與優化在中試能力建設中的應用
- 品牌加盟合作合同協議書詳細內容約定
- 2023年10月自考00539中國古代文學史二試題及答案含評分標準
- 安保服務方案(技術標 )
- 高中化學課程標準解讀課件
- 輥壓機的維護與檢修
- 四年級下冊數學說課稿-1歌手大賽-北師大版
- 北京市朝陽區2021-2022學年四年級下學期期末語文試卷
- 金融系統反洗錢考試題庫(含答案)
- 甘肅省張掖市2023年中考地理真題試題(含解析)
- 人教小學數學五年級下冊綜合與實踐《怎樣通知最快》示范公開課教學課件
- 脫不花三十天溝通訓練營
- 2023年湖南常德中考語文真題及答案
評論
0/150
提交評論