與智能視頻監控有關的技術挑戰_第1頁
與智能視頻監控有關的技術挑戰_第2頁
與智能視頻監控有關的技術挑戰_第3頁
與智能視頻監控有關的技術挑戰_第4頁
與智能視頻監控有關的技術挑戰_第5頁
全文預覽已結束

付費下載

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

精品文檔-下載后可編輯與智能視頻監控有關的技術挑戰在大數據里,監控視頻的數據占比較高,2022年差不多占到50%左右,到2022年可能會接近70%。當然,隨著大數據越來越多,整個監控視頻的比例會慢慢減少,但是即使減少,在2022年也能達到40%以上,所以這個數據處理的問題很重要。視頻監控是一座城市安全的重要保障,在平安城市、數字城市建設中起著至關重要的作用。主要的挑戰可概括為三個:存不下、找不到、看不清。這三個挑戰具體涉及到的是三個技術問題,第一個存不下的問題,事實上是編碼壓縮的問題。第二個找不到實際上是搜索的問題,當然搜索的話,有的專家經過星期六在論壇上湯曉鷗教授的報告之后,大家就會清楚,我們是多攝像機網絡,要想比較有效的搜索,光看一個攝像機的內容是不夠的,攝像機和攝像機之間必須要聯合起來一起看,所以這個就是在多攝像機網絡里面的搜索問題。第三個挑戰是所謂的看不清,現在的監控視頻攝象頭的質量是不行的,所以導致現在即使拍到了這張照片,但是人可能是看不清的。

編碼壓縮的問題

第一個存不下的問題,事實上是編碼壓縮的問題。視頻編碼的進展還是比較快的,但是技術的進步和數據增長的速度比起來,根本沒有辦法吻合,因為技術是每十年翻一倍,但是我們知道大數據,尤其是和監控有關的大數據,增長起來非常的快,所以靠傳統技術的進步來解決數據本身增長量顯然是不夠的。具體說來,這個技術要解決是視頻數據的編碼效率問題,如果你有辦法把這個視頻數據很好的壓縮了,那么傳輸、存儲也可能不是大問題了。這個方面實際上我們是希望找到一個特別是對于監控視頻比較有效的壓縮方法。

在視頻編碼里面,有三個技術是比較關鍵的,第一個技術是變換技術,就是把實濾的信號放在頻率上處理,使得用一些數據工具能很好的進行編碼壓縮。第二個是預測技術,靠的是在同一幀和不同幀里找到相同的東西。第三個是商業編碼,每一個東西都有信息商,如果用商業編碼來表達就會更加有效率。所有的視頻編碼實際上是這三個技術的組合,這個技術實際上是有一個理論上限,我們現在可達到的成果離理論上限還有非常大的空間。

面向監控視頻,應該要用更好的技術,我們把它叫做Lone―termVirtual,是長時的、虛擬幀的參考技術。所謂長時,就是因為場景可以長時間的使用,所謂的幀其實不是一個真的幀,是算出來的,通過模型的方法來產生,用這樣的方法效率就比較高。這種想法是不管拍自然景物,還是會議視頻,實際上有很多東西是不變的,只有少部分是變的,如果把少部分變的東西檢測出來,不變的東西可以一直在使用,這樣就可以提高編碼效率。這里最關鍵的問題是區分背景和前景,背景用長時間不用的東西表達,前景我用精細的編碼表達。為了把背景找到,我們就提出了一個技術――基幀產生技術。有了這項技術就可以很容易把一個圖像序列的前景、背景分離出來了。知道了前景和背景,有了這樣的結構,接下來就是怎么編的問題了,這樣比原來做的視頻編碼要簡單得多。

此外,還有一項技術不僅僅和監控視頻有關,與互聯網視頻也有關,我們把它叫做Free―term編碼結構,這個完全是面向大數據的。

互聯網上有非常多的視頻和圖像,從這些東西中可以提取出一個很好的縮影,可以利用這個縮影進行檢索,也就是說有了這個大數據了,可以通過一些稀疏的表達來構造一個東西,然后利用這個東西來編輯編碼,使編譯效率更高。

有效搜索的問題

搜索的問題在這里面有這樣的幾個問題:對象能不能檢測得到?檢測的對象能不能跟得上?不同攝像機為了跟上,怎么切換?前兩個問題是一般模式必須要解決的問題,里面有很多必須要解決的技術。

到目前為止基本上是攝象頭接收信息,把接收到的信息送回來,已經做了編碼壓縮,要在根上解開,然后再做分析。先有編碼,然后是解碼,然后再做檢測。如果用前面說的這種想法,因為一開始我們有5分鐘的前景和背景,你的對象一定是前景上,所以只在前景上找就可以了,這樣檢測的效率就非常高。

另外是跟蹤,多攝像機的網絡跟蹤,攝像機和攝像機之間,它的位置、朝向、時間切換點等等,把這些參數很好的結合在一起,這個問題也可以推進,但是到目前為止,這個問題做得并不好,大家可以做的也就是十幾個到幾十個攝像機的跟蹤,一個城市做幾千個,幾萬個,幾十萬個,目前根本做不到。

我們希望原來把編碼和分析像一個火車的兩條軌道完全平衡,使得所做的技術融合在一起,集中在一個編碼的框架下。如果有了這個東西,實際上在攝象頭那一端抓回來的東西,前景直接可以進入到對象的描述和表達,可以基于前景來描述出相關的內容,比如說有哪些區域在前景上,然后把若干的圖像和若干個攝象頭的東西融合在一起,最后可以分析出來他的行為是什么,這樣就可以直接進入到視頻監控的環節,這個是很理想的狀態。有了這個,視頻監控才能夠真正的融合到智慧城市里。

為了做這件事,技術上需要有一個完整的描述,簡單地說就是我們現在要制訂一個很好的語法,語法里面有很多的描述詞,通過描述詞和語法的組合,可以把很多的行為、很多的事件都描述出來,包括車是正常行進還是非正常行進,或者是一堆人是正常的行為,還是非正常的行為,通過這個描述都可以做得到。基于這樣的一個前景的技術,在有了前景之后,利用前景的描述,很容易就把很多對象流檢測出來。只要關注前景的東西,就可以在上面進行分析。

視頻質量的問題

看不清的問題應該是傳統的問題了,現在的攝象頭質量不行,所以使得兩個方面達不到進行很好識別的要求。第一個問題是攝象頭進來的方向的圖像分辨率不夠,第二個問題是圖像的清晰度不夠,由于各種各樣的原因,比如說光照的原因等等,這兩個問題是挑戰性的問題。現在很多人在研究這方面的問題,當然最理想、最根本的辦法是把攝象頭的分辨率提上來,這個不是一兩天可以做得到,現在布下去那么多的攝象頭,真正滿足要求的攝象頭是少之又少的,最好的是4K的攝象頭,這個是很少的,隨著時間的推移,要慢慢推好的分辨率高的攝象頭。例如人臉識別這件事,目前的攝象頭很難做得很好,現在的攝象頭,比如用算法可以識別的,大概的識別率是60%、70%,要想提高到80%多,就要換4K的攝象頭,這個是我們必須要做的事。

但是,我們還可以從后臺彌補攝象頭不足的問題,即拋分辨率,通過不同的算法把分辨率提上來。除了這個方法之外,還有一個方法,就是把視頻流里面多個照片用在一起,最后使得分辨率提升。

在這個科技飛速發展的時代,大數據、云計算、移動互聯網等新一代信息技術相互交叉融合的時代,傳統智

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論