



下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、全景圖的虛擬現(xiàn)實系統(tǒng) 摘要 全景圖(panoramic image)是近來出現(xiàn)在internet上的另一種新的交互式的虛擬場景表示方式,它基于圖像繪制ibr(image-based render)的方式再現(xiàn)了三維場景,可用瀏覽器實現(xiàn)虛擬場景的漫游,同時也詳細介紹了這種全景圖瀏覽器的實現(xiàn)原理。本文在總結已有技術的基礎上,提出一個基于全景圖的虛擬現(xiàn)實系統(tǒng)模型,并改進算法實現(xiàn)了高效的拼接。 關鍵詞 全景圖; 基于圖像繪制ibr; 虛擬現(xiàn)實; 圖像拼接 1 概述 全景圖是基于圖形繪制ibr(ima
2、ge-based render)的關鍵技術?,F(xiàn)有的ibr技術大概可以分為四類:基于全景圖(panoramic image)的方法,基于圖像深度信息的方法,基于光場(light field)信息和基于 morphing的方法。現(xiàn)階段,相對成熟的技術是第一種基于全景圖的方法 ,而且它實現(xiàn)方便處理量易于在internet實現(xiàn)。 目前,業(yè)界對全景圖的基本制作方法是:在固定的視點用照相機或者攝像機按照一定的方式(通常是按照均勻角度繞軸旋轉360 度)采集圖像,采集之后的圖像輸入計算機進行圖像拼接、整合等處理,生成無縫全景圖像,最后再用計算機經(jīng)過投影展示出來,并且提供局部的有限的漫游功能。雖然全景視圖有其
3、自身的局限性,比如視點單一,只能在場景內(nèi)部實現(xiàn)漫游等,但是由于該技術具有極強的可操作性,而且技術也相對成熟,已經(jīng)成為應用最為普遍的ibr技術之一。目前全景視圖主要應用在:虛擬環(huán)境、游戲設計、電影特技效果、虛擬博物館等等。在商用領域比較著名的有apple的quicktime vr、ipix viewer、live picture、ibm的hot media等系統(tǒng)。 2 全景圖的制作流程 全景圖制作流程包括全景模型選擇,圖像采集,圖像拼接,圖像縫合以及全景圖展示瀏覽五個步驟 ,如圖1。 (1)全景模型選擇:根據(jù)全景圖投影展示方式的不同,主要可以分為3種模式:立方體模式、圓柱模式、球面模
4、式。這三種模式就是分別把已經(jīng)拼接好的全景圖投影到立方體/ 圓柱體/球體的內(nèi)表面。此外還有其他展示模式,如采用正多面體去逼近球面的方法。 (2)圖像采集:一般有兩種方法,用全景拍攝器材進行拍攝或者通過普通相機拍攝再進行圖像拼接。前一種方式比較容易采集圖像,但是這種方法往往意味著購買昂貴的攝影器材,因此影響了其通用性。而后一種方式,用普通相機在固定點拍攝圖片然后拼接生成全景圖的研究就顯得比較活躍了,而全景圖生成的核心技術圖像拼接算法正是研究的重點。 (3)圖像拼接與縫合:現(xiàn)有的全景圖像拼接生成算法主要可以分為三類:基于特征的方法、基于流的方法和基于相位相關的方法。在得到拼接好的圖像后,還需要對圖像
5、重疊部分進行處理,以實現(xiàn)圖像的無縫拼接。目前經(jīng)常采用的一種簡單的圖像縫合技術就是線性插值法(linear interpolation)。 (4)全景圖展示:得到360度的全景圖像后,還要把該圖像投影到所選擇模型的內(nèi)表面展示,并提供簡單的瀏覽功能。 (5)運動物體生成和全景圖生成一樣,同樣可以用以上3種方法生成。在用照相機拍攝物體時,如果對物體的水平方向和垂直方向各拍攝一圈,就可以對物體進行二維的交互控制。鏈接是指:把得到的全景圖按一定方式組織起來,供交互式顯示用;把運動物體嵌入到全景圖中去,成為“熱點”,使用戶可以對它進行交互式控制。
6、; 圖全景圖制作流程 3 全景圖像拼接技術的研究 3.1全景圖生成的經(jīng)典算法 自全景圖的概念提出到目前,有很多學者都對全景圖的生成算法做過深入的研究,其中mcmillan和szeliski等人的工作尤其突出。mcmillan和bishop提出了全景函數(shù)模型,該算法根據(jù)攝像機繞軸旋轉360度所拍攝的圖像序列求解每個相機的參
7、數(shù),由此進行全景圖拼接,但是該算法不太適合于照相機,因為它要求兩幅圖像之間要有超過2/3 的重疊,這樣對一個場景如用照相機去采集圖像就需要拍攝大量的圖片,而這顯然增大了圖像采集的難度,也增加了計算量和誤差量。而且mcmillan試圖通過柱面極幾何約束實現(xiàn)匹配點自動匹配,但是極幾何約束核心基礎矩陣對誤差過分敏感,也因此導致匹配結果無法實用。 szeliski和shum3在他們的一系列的文章中提出了用8參數(shù)的二維(2d)投影模型求解投影矩陣m。該模型的數(shù)學表達如下所示:
8、0; (1)
9、0; (2) 3.2全景圖像拼接算法歸類及其比較 現(xiàn)有的全景圖像拼接生成算法主要可以分為三類:基于相位的方法、基于流的方法和基于特征的方法。
10、 (1)基于相位的方法:該方法利用傅立葉變換、小波變換等等先對圖像進行變換,再利用變換后的圖像的某些特征進行匹配。但是如果存在空間上的局部變化,就會導致該方法產(chǎn)生較大誤差。 (2)基于流的方法:也叫做基于面積的方法。該方法是通過比較兩幅圖像亮度(或顏色)差異,并使之最小化來尋找最佳匹配點的。上文描述的兩種經(jīng)典算法就是屬于該方法,采用這種方法的還有:duffin 4和barrett在szeliski研究的基礎上提出的一種恢復6個參數(shù)模型的算法?;诿娣e方法的缺點就是它的計算量明顯偏大。 (3)基于特征的方法:
11、該方法的主要思想就是從一幅圖像中提取一定的特征,如:點、線、邊緣等等,并用此特征為匹配模板,在第二幅圖像中搜索。該方法可以提高計算速度,但是提取合適的圖像特征比較困難。5 如何提取合適的圖像特征,很多學者在這個方面做了探討,其中 kim6等人利用抽取物體輪廓作為特征,而鐘力7等人利用重疊圖像兩列象素的亮度(或顏色)比或者亮度(或顏色)作為特征模板,張鵬8等人利用象素灰度值信息提取某一矩形區(qū)域作為特征模板進行匹配。 需要注意的另一個問題就是采集的圖像中重疊部分并不是單純的平面位移變換,還存在伸縮變形等,所以這也
12、增大了特征提取的難度。 4 算法的選擇與改進 以上三種算法都有其自身的特點,當然也有各自的局限性,應該根據(jù)全景模型的不同和圖像采集方式的差異選擇合適的算法。下面根據(jù)全景圖生成過程詳細描述對算法的選擇和改進。 4.1 全景模型選擇 本文提出的方法中采用圓柱模式,這種模式相對簡單,同時又不影響全景圖像瀏覽的真實性。由于立方體模式過于簡單,該模式在展示全景圖時存在明顯的邊界痕跡,降低了全景圖像真實性;球面模式雖然相對擴大了全景圖瀏覽的視野,可是也相應增加了算法復雜度和圖像采集的難度。 4.2 圖像采集 為了提高圖像拼接算法的復雜度處理能力以及能夠自適
13、應抖動、光照差、扭曲等。本文對圖像采集方式未做過多限制:不用三角架固定相機,繞攝影者中心360度旋轉相機拍攝圖像,每次拍攝相機旋轉的角度為,不固定相機的焦距,這樣做的目的是進一步提高算法自適應校準圖像拼接能力。 4.3 圖像拼接 首先,抽取合適的圖像特征來定位拼接,為了盡可能多的保留圖像的特征,利用數(shù)字圖像處理中的laplace算子邊緣檢測算法,再加上二值化處理和平滑濾波3*3模板的噪音消除抽取出圖像的特征圖。 圖2 特征提取后圖象的二值化圖 圖象經(jīng)過變換之后,得到了具有重疊相似區(qū)域的兩幅圖象,對于
14、相似區(qū)域的尋找,一般的算法都是根據(jù)人體視覺特征定義1個模板矢量(pattern vector),對兩幅圖象分別運算相似距離,根據(jù)相似距離來尋找圖象的相似部分。本文提出了一種新的重疊區(qū)域的搜尋方法,它基于差值圖象的極值點搜尋,可以方便地提取兩幅圖象之間的相似部分,不需要頻域上的任何運算。設有兩個矩形區(qū)域a和b,已知b中包含一個區(qū)域a2,a與a2是相同的模塊,求b中a2的位置。典型的算法是從的左下角起,把每一塊與a大小相同的區(qū)域c與a相比較,得出評價函數(shù),其值最小的區(qū)域就是a2。 評價函數(shù)一般定義為:對于a和c中每一對對應點p和q,
15、160; (1) 考慮到兩幅圖象的亮度不一樣,即使是同一模塊,由于亮度不同,評價函數(shù)的值也很大,把評價函數(shù)定義為:
16、60; (2) 4.4 圖像縫合 圖像縫合分兩個步驟。拼接處會有明顯的一條縫??捎妙伾珨M合的方法來調(diào)和相鄰圖象的亮度,生成無縫的合成圖象。以合成圖象的拼接線為中心,兩邊各取10個象素點的距離,此區(qū)域為矯正區(qū)。第一步是圖像經(jīng)過矩陣投影生成新的圖像需要用到雙性插值。第二步是兩幅圖像重疊區(qū)域之間的線性插值。 4.5柱面投影 柱面投影變換及其反變換算法的核心是投影變換公式,為此建立坐標系,如圖4所示。
17、原始圖象i、投影柱面圖象j和柱面k,原點為觀察點(投影中心)。設柱面半徑為,投影寬度角為,圖象寬度為,高度為。能很容易得到柱面圖象的寬度為r×sin(/2),高度仍為。對圖象i上的任意一點,假設它在圖象上的坐標為(,),p在柱面圖象j上的對應點q,假設q在j上的坐標是(,)。5 圖3柱面投影變換 這里角由每張圖象所占的角度唯一確定。一個全景的角度是360º那么每張圖象對應的角度就顯而易見了一般的角約為30 - 40º。最后,根據(jù)兩幅圖像的平移量,柱面投影,最后拼接全景圖(見圖4和圖)。 5 實驗結果 基于全
18、景圖的虛擬實景生成系統(tǒng)的實現(xiàn)在是一臺windows nt操作系統(tǒng)下的pc工作站,p3-1g,128m內(nèi)存,顯卡(硬件支持opengl加速),使用microsoft visual c+6.0和opengl編程。 圖4 圖象拼接前的情況 圖5 圖象拼接后的全景圖 6 結論及展望 隨著基于圖象繪制技術發(fā)展,全景圖現(xiàn)已廣泛應用在軍事、教育、科研、商業(yè)、影視、娛樂、工程訓練等,并隨著java和internet的發(fā)展成為一種快捷、實用、效果很好的虛擬現(xiàn)實漫游系統(tǒng)。本文對基于全景圖的虛擬現(xiàn)實模型進行了比較
19、深入的研究,在根據(jù)前人對全景圖的研究資料中,本文提出了一種基于全景圖的虛擬現(xiàn)實系統(tǒng)模型的構想,并給出了較為實用的解決方案,克服了抖動、光照差、扭曲等對全景圖的影響,對圖象拼接算法作了比較和改進嘗試,對圓柱面投影作了較深入的探討,實用價值高效率。未來基于全景圖的虛擬現(xiàn)實各種技術發(fā)展將前景廣闊。 參考文獻 1 cai yong, liu xue hui, wu eng hua. image-based rendering: a technology for virtual reality system. journal of software, 1997, 8 (10): 721- 728 ( in chinese) (蔡勇, 劉學慧, 吳恩華. 基于圖像繪制的虛擬現(xiàn)實系統(tǒng)環(huán)境.軟件學報, 1997, 8 (10) : 721- 728) 2 chen s e. quick time vr an image-based approach to virtual environment navigation. in: p roc s iggra ph 95, new york, 1995. 29- 38 3 szeliski r, shum h-y. creating full
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 倉儲物流信息化管理與運輸服務合同
- 跨國公司境內(nèi)股權轉讓及稅務籌劃協(xié)議
- 生態(tài)柴油購銷合同范本與規(guī)范
- 成都租賃合同(含租客租后押金退還)
- 民宿民宿風格改造裝修合同
- 互聯(lián)網(wǎng)保險保本投資協(xié)議
- 北京二手房交易稅費減免咨詢與代理合同
- 餐飲店拆伙協(xié)議及員工安置合同
- 時尚購物廣場門面房租賃與品牌合作合同
- 腫瘤的影像學診斷
- 2025年中國郵政集團有限公司遼寧省分公司人員招聘筆試備考試題及答案詳解1套
- 充電站建設管理制度
- 美好生活大調(diào)查:中國居民消費特點及趨勢報告(2025年度)
- 失業(yè)保障國際比較-洞察及研究
- 黨群工作筆試題目及答案
- 廣東省廣州市天河區(qū)2023-2024學年八年級下學期期末歷史試卷(含答案)
- 黑龍江省2024年普通高校招生體育類本科批院校專業(yè)組投檔分數(shù)線(物理類)
- 2025年陜西延長石油礦業(yè)有限責任公司招聘筆試參考題庫含答案解析
- 天津市部分區(qū)2023-2024學年八年級下學期期末練習道德與法治試卷
- 國開電大《Java語言程序設計》形考任務三答案
- 綜合實踐活動評價表完整
評論
0/150
提交評論