電視非線性編輯系統(參考)_第1頁
電視非線性編輯系統(參考)_第2頁
電視非線性編輯系統(參考)_第3頁
電視非線性編輯系統(參考)_第4頁
電視非線性編輯系統(參考)_第5頁
已閱讀5頁,還剩50頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

電視非線性編輯系統余勝泉ysq@2000/11/10北京師范大學現代教育技術研究所目錄編輯系統的發展歷史非線性編輯概要數字視頻技術基礎非線性編輯系統的基本構成如何選購非線性產品非線性編輯的發展趨勢典型的非線性編輯系統簡介編輯系統的發展歷史物理剪輯1956年,安培公司發明了2英寸磁帶錄像機,電視節目不必像以前那樣借助電影膠片記錄和借助電影銀幕播出了。早期電視節目編輯沿用了電影的剪加方式,它首先用放大鏡對磁帶上的磁跡進行定位,然后使用刀片或切刀在特定的位置切割磁帶,找出一段段所需的節目片段后,用膠帶把他們粘在一起。這種編輯對磁帶的損傷是永久性的,制作過節目的磁帶以后不能再使用。同時由于不能在編輯時查看畫面,編輯點的選擇無法保證精確,編輯人員只能憑經驗并借助刻度尺來確定每個鏡頭的大致長度。電子編輯電視編輯在1961年前后進入了電子編輯的階段。由于能夠使用快進和快速例帶功能在磁帶上尋找編輯點,以及使用暫停功能控制錄像機的錄制和重放,編輯人員可以連接一臺放像機(放機)、一臺錄像機(錄機)和相應的監視器,構成一套標準的對編系統,實現從素材到節目的轉錄。電子編輯擺脫了物理剪輯的黑箱操作模式,避免了對磁帶的永久性的物理損傷,節目制作人員在編輯過程中可以查看編輯結果,并可以及時進行修改,也可以保存作為節目源的素材母帶。電子編輯存在的主要問題是精度不高,因為當時的2英寸錄像機無法逐幀重放。此外,在編輯過程中,由于編輯人員手動操作錄像鍵,錄像鍵按下的時機掌握需要豐富的經驗,一般無法保證編輯點的完全精確。而且錄機在開始錄像和停止錄像的時候帶速不均勻,與放機的走帶速度存在差異,容易造成節目中各鏡頭接點處的跳幀現象。時碼編輯受到電影膠片的片孔號碼定位的啟發,美國電子工程公司(EECO)于1967年研制出了EECO時碼系統。1969年,使用小時、分鐘、秒和幀對磁帶位置進行標記的SMPTE/EBU時碼在國際上實現了標準化。其后,在電視節目后期制作領域,各種基于時碼的編輯控制設備不斷涌現,同時也開發出了大量新的編輯技術和編輯手段。例如,錄機放機同步預卷編輯、編輯預演、自動串編、脫機草編和多對一編輯等等。同時,為了改善編輯精度與提高編輯效率,專業電視設備廠商在穩定帶速和增加搜索速度上也作了很多工作。然而盡管如此,由于信號記錄媒體的固有限制,電視編輯仍然無法實現實時編輯點定位等功能,由于磁帶復制造成的信號損失也無法徹底避免。非線性編輯世界上第一臺非線性編輯系統1970年出現于美國,在這種早期的模擬非線性編輯系統中,圖像信號以調頻方式記錄在可裝卸的磁盤上,編輯時可以隨機訪問磁盤以確定編輯點。80年代,出現了純數字的非線性編輯系統,這些系統使用磁盤和光盤作為數字視頻信號的記錄載體。由于當時的磁盤存儲容量小,壓縮硬件也不成熟,所以畫面是以不壓縮的方式記錄的。系統所能處理的節目總長度約為幾十秒至幾百秒,因此僅能用于制作簡短的廣告和片頭。80年代末到90年代初,非線性編輯系統進入了快速發展的時期,這得益于JPEG壓縮標準的確立、實時壓縮半導體芯片的出現、數字存儲技術的發展和其它相關硬件與軟件技術的進步。同時,由于多種主要的媒體都以數字化的形式存在,在存儲和記錄形式上實現了真正的統一,因此非線性編輯系統的應用范圍也大大超越了傳統的編輯設備,它不僅能夠編輯視頻和音頻節目,還可以處理文字、圖形、圖像和動畫等多種形式的素材,極大的豐富了電視和多媒體制作的手段。概要非線性編輯系統(NolinerEditingSystem,簡稱NLE),是使用數字存儲媒體進行數字視頻編輯的數字化后期制作系統。它是在高檔多媒體電腦的基礎上構造的專用數字視頻后期制作設備,它不但能完成一臺多媒體計算機的大部分工作,還具備了在高畫質情況下完成線性編輯系統的所有功能,集成了電視臺后期機房中多種傳統設備的功能,而且具備了傳統線性電視編輯系統所無法比擬的功能。非線性編輯技術是一門新的綜合性技術,它覆蓋了電視技術和計算機技術的主要領域,包括音頻技術、視頻技術、數字存儲技術、數字圖象處理技術、計算機圖形技術和網絡技術等相關技術,把數字化、多媒體、交互性和網絡化帶人編輯工作中,它解決了線性編輯存在的缺點,簡化了節目編輯流程,提高了編輯效率,特別是方便的剪切和編輯和靈活多變的數字特效處理功能,把制作人員從繁雜的搜尋鏡頭和修改工作中解脫出來,并給制作者以無限的藝術創造空間。非線性編輯給電視后期制作帶來重大的變革?;竟δ茉陔娨暪澞恐谱鬟^程中,典型的非線性編輯系統可以實現以下傳統電視編輯設備的功能:硬盤數字錄像機:即使是最簡單的非線性編輯系統,也能充當一臺硬盤錄像機進行視頻信號的記錄和重放。存儲節目的最長時間根據硬盤容量和對圖像質量的不同要求而定。(非線性)編輯控制器:在硬盤上快速實時的尋找編輯點,設定入點、出點及其它標記,這是非線性編輯系統優于傳統編輯控制器的一個重要特點。切換臺:在傳統的磁帶式編輯中,進行對編和A/B卷編輯分別需要一臺放機、一臺錄機或兩臺放機、一臺錄機。在非線性編輯系統中,采用了時間線和視頻、音頻軌的概念,一般來說一條視頻軌可以看作一臺放像機,因此能用多條軌模擬多通道切換臺。特技機:非線性編輯系統可以使用內置軟件或用硬件實現特技的功能。軟件特技成本低廉,并可不斷升級;硬件支持的特技速度較快。字幕和圖形創作:在非線性編輯系統中,一般有專門的軟件用于制作字幕和圖形,并通過軟件或硬件方法實現與視頻信號的疊加。動畫制作:所有動畫制作都是由助電腦完成的,尤其是三維動畫。在非線性編輯系統中生成的動畫采用標準圖像文件格式,可以包含透明及摳像信息,便于和視頻畫面進行合成。數字錄音機、音源和調音臺:非線性編輯系統中都包含音頻輸入/輸出單元、軟件波表或(和)硬件波表及硬件混音器,可以錄制高質量的聲音,可以用數百種樂器的原始音色演奏MIDI(音樂儀器數字接口)樂曲,也可以配合軟件完成多路音頻信號電平的調節。除了后期制作,非線性系統開始插足前期制作,有些廠商推出硬盤攝錄一體機,如日本池上公司生產的Editcam全數字攝錄一體機,即以硬盤作為記錄載體。同磁帶攝錄一體機相比,它能即時記錄瞬間即逝的鏡頭,放像過程中也能立即進入記錄狀態,不丟失畫面,還可以直接通過攝錄機磁盤進行簡單的節目編輯。技術優勢與特點與線性系統相比,非線性編輯系統具有高度集成化、功能齊全、操作方便等特性,只需外加一臺錄像機,非線性編輯系統就能完成一套線性編輯系統所能完成的編輯工作。具體有:(1)數字非線性編輯系統全部的工作過程均以32BIT數字量化壓縮算法完成。因此視頻信號處理鏈路基本不受外界噪波干擾,沒有傳統模擬線性編輯過程中的噪聲干擾現象產生,圖像質量高。(2)由于是數字信號的編輯,圖像質量不會因設備的新舊而出現大的差別。(3)制作節目快捷,高效。(4)節省機時,設備使用壽命長。傳統的視頻磁頭壽命為500~1000小時,計算機硬盤為300000小時。(5)硬件接口標準化,適應多種編輯軟件,可隨意制作多種數字特技,增加節目的藝術性。(6)具備多代拷貝而圖像質量不會急劇下降的特點。(7)由于編輯系統基于計算機技術,易于構建大型甚至全球視頻網絡,從而使節目的交換及素材資料資源共享成為可能。(8)由于視頻和音頻均可以被采集和量化,因而還可以應用靜幀凍結技術,制作出多彩多姿的圖像電子郵件或軟件封面,在多媒體制作領域中加以應用。(9)設備體積小,便攜性能好,易于掛接計算機互聯網絡,編輯、傳輸工作可以隨時隨地進行。線性與非線性磁盤與磁帶對比圖磁盤上信息組織方式脫機(Offline)與聯機(Online)第一步是“初編”,有人稱為“原始編輯”,后來又稱其為“草稿編輯(DraftEditing)”,那就是先以大壓縮比,如100:1,決定編輯點、特技效果的編輯決定表(EDL),這就是草稿編輯。節目制作者在編輯過程中,不斷選擇各種有用的場景片段,這些片段都有一個地址,這就需要將這些地址存儲在一個表中,如果需要的話可以直接返回到以前選擇的某一個過程,這種存儲場景選擇信息的表稱為編輯決策表(EDL)或編輯判決表。利用EDL控制硬盤的快速旋轉,在重放過程中只選取EDL中所規定的視頻和音頻片段,在軟件的高速執行過程中,重放無間隙,編輯點處無停頓或閃爍,視頻、音頻、圖形均可隨機迭加。顯然,草稿編輯目的在于得到EDL。這種原始的草稿編輯過程,稱為“脫機”編輯。脫機編輯是非線性的,圖像質量達不到廣播級水平。第二步,以小壓縮比,如2:1,將存有EDL的軟盤插入編輯控制器內,控制廣播級錄像機按照EDL進行廣播級成品帶的編輯,這種生產節目成品帶的過程,稱為“聯機”編輯。

非線性編輯系統結構典型的非性編輯系統非線性編輯系統組成信號輸入接口單元多媒體素材存儲單元中央處理單元信號輸出接口單元非線性編輯系統工作原理基本的編輯過程素材采集模擬視頻信號源及其設備:模擬視頻信號源及其設備:錄像機(VCR)、攝像機(VideoCamera或Camcorder),激光視盤機(LaserDiscPlayer)電視機;模擬設備與非線性主機的連接:VideoOut:VideoIn;AudioOut:LineIn;RFOut:RFIn;SpeakerOut:音箱;數字接口:QSDI接口、CSDI接口、SDI接口和DV接口;設置采集參數:對同一種壓縮方法來說,壓縮比越小,圖像質量越高,相應地占用的存儲空間越大。采用不同壓縮方式的非線性編輯系統,錄制視頻素材時的壓縮比可能不同,但也可能獲得同樣的圖像質量。素材分類:素材箱(BIN)

基本的編輯過程編輯制作素材處理時間線編輯數字特技處理字幕制作音效處理合成輸出時間線編輯特技制作視頻的基本概念人的視覺特性人眼依靠視網膜上光敏細胞一桿狀細胞和錐狀細胞獲得了彩色視覺人眼僅對電磁波譜中的可見光區(波長從380nm到780nm)敏感人眼對亮度的敏感程度比對顏色的敏感程度高電視信號及其分類為兼容黑白電視機,因此把彩色信號分成亮度信號和兩上色差信號分別傳送Y=0.30R+0.59G+0.11B色差信號分別為R-Y、G-Y和B-Y亮度信號帶寬為6MHZ,色度信號的帶寬為1.3MHZ電視制式:PAL制、NTSC制和SECAM制視頻信號的產生、處理和傳送過程攝像機拍攝、后期編輯、發送與接收視頻信號的描述像素、掃描行數、幀頻和場頻、寬高比視頻信號的數字化視頻序列的SMPTE表示單位SMPTE(SocietyofMotionPictureandTelevisionEngineers)使用的時間碼標準,其格式是:小時:分鐘:秒:幀,或hours:minutes:seconds:frames

一段長度為00:02:31:15的視頻片段的播放時間為2分鐘31秒15幀數字視頻的采樣步驟濾波、采樣、量化ITU-RBT.601標準規定對YCbCr信號的采樣方案為4:2:2,即亮度信號采樣頻率約為副載波頻率的4倍,為13.5MHZ。色度信號的采樣頻率是亮度信號采樣頻率的一半,為6.75MHZ。數字視頻的采樣格式Y:U:V=4:1:1,這種方式是在每4個連續的采樣點上,取4個亮度Y的樣本值,而色差U、V分別取其第一點的樣本值,共6個樣本。顯然這種方式的采樣比例與全電視信號中的亮度、色度的帶寬比例相同,數據量較小。Y:U:V=4:2:2,這種方式是在每4個連續的采樣點上,取4個亮度Y的樣本值,而色差U、V分別取其第一點和第三點的樣本值,共8個樣本。這種方式能給信號的轉換留有一定余量,效果更好一些。這是通常所用的方式。Y:U:V=4:4:4,在這種方式中,對每個采樣點,亮度Y、色差U、V各取一個樣本。顯然這種方式對于原本就是較高質量分量信號的信號源(如S-Video源),可以保證其色彩質量,但信息量大。數字演播室標準:ITUR601(CCIR601)ITU-601中,包含了如何將模擬視頻變為數字形式的技術問題,但是它沒有發布物理上的實行方法,對采樣頻率;采樣結構;色彩空間轉換等也都作了嚴格的規定,主要包括:分量視頻:ITU-601公布的數字編碼應基于使用一個亮度信號和兩個不同的色度信號,也就是通常所說的YCrCb色彩空間。對電視行業,這些信號直接與如何將整個電視信號編碼、與通過基帶同軸電纜或是地面廣播頻率傳送、和與在電視監視器或是在磁帶錄像機上解碼有關。2.濾波:ITU-601描述了為了獲得最高的數字質量,在進行YCrCb采樣之前,必須進行濾波。3.采樣率:ITU-601規定了對PAL和NTSC視頻圖像的采樣率,實現了世界范圍的可互操作性。為了保證信號的同步,采樣頻率必須是電視信號行頻的倍數。ITU為NTSC、PAL和SECAM制式制定的共同的電視圖像采樣標準:fs=13.5MHZ這個采樣頻率正好是PAL、SECAM制行頻的864倍;NTSC制行頻的858倍,可以保證采樣時采樣時鐘與行同步信號同步。對于4:2:2的采樣格式,亮度信號用fs頻率采樣;兩個色差信號分別用fs/2=6.75MHZ的頻率采樣。由此可推出色度分量的最小采樣率是3.375MHZ。亮度和色度采樣方法:ITU-601推薦對色度的采樣頻率是亮度的一半,這就是所謂的4:2:2采樣方法。分辨率:根據采樣頻率,可算出對于PAL和SECAM制式,每一掃描行采樣864個樣本點;對于NTSC制則是858個樣本點。由于電視信號中每一行都包括一定的同步信號和回掃信號,故有效的圖像信號樣本點并沒有那么多,ITU601規定對所有的制式,其每一行的有效樣本點數為720點。由于不同的制式其每幀的有效行數不同(PAL和SECAM制為576行,NTSC制為484行),ITU定義720×484為高清晰度電視HDTV(HighDefinitionTV)的基本標準。量化:ITU-601提供了一種編碼方法,是關于如何將亮度和色度信號從模擬電壓轉換為數字形式。對亮度通道,黑色是16,白色是235。在16以下和在235以上的數值是用于尖峰值和特殊控制目的的。(一個8位的采樣系統允許總共256個數值)。對色度,有很細微的差異。數據量:ITU601規定,每個樣本點都按8位數字化,也即有256個等級。但實際上亮度信號占220級;色度信號占225級,其它位作同步、編碼等控制用。如果按fs的采樣率、4:2:2的格式采樣,則數字視頻的數據量為:13.5(MHZ)×8(BIT)+2×6.75(MHZ)×8(BIT)=27Mbyte/s(黑場空白信號)同樣可以算出,如果按4:4:4的方式采樣,數字視頻的數據量為每秒40兆字節!按每秒27兆字節的數據率計算,一段10秒鐘的數字視頻要占用270兆字節的存儲空間,編輯數字視頻的關鍵問題是數字視頻的壓縮技術。數字視頻編碼視頻壓縮編碼的基本概念有損(Lossy)和無損(Lossless)壓縮幀內(Intraframe)和幀間(Interframe)壓縮對稱(symmetric)和不對稱(asymmetric)編碼常用視頻壓縮技術預測編碼:也稱為差分脈沖編碼調制(DPCM),是根據原始信號的統計特性進行預測,通過相差除去視頻圖像信號的相關性,達到壓縮的目的離散余弦變換(DCT)編碼:在變換域里描述視頻圖像比空間域里簡單,利用變換編碼,視頻圖像的相關性明顯下降,信號能量集中在幾個變換系數上,可有效的壓縮數據,具有較強的抗干擾能力,分形圖像壓縮:分形編碼實際就是把圖像分割成若干個子圖像,子圖像通過迭代函數反復迭代而成,這些迭代函數只需幾個參數即可確定,因此得到較高的壓縮比。小波壓縮:采用局部函數在頻域和時域同時分析法,將圖像信號分解成不同頻率區域,然后根據圖像統計特性和人眼生理特性,在不同的頻域采用不同的壓縮方法,是視頻數據量減少。非線性編輯系統的常用幾種壓縮方式目前應用于非線性編輯系統的幾種壓縮方式包括:MotionJPEG、MPEG、SONY的BETACAMSX、DVCAM,松下公司的DVCPRO,JVC的DigitalS,小波壓縮格式等。Motion-JPEGMotion-JPEG可以理解為活動圖像的JPEG壓縮,M-JPEG基于靜態圖像壓縮格式JPEG,對活動圖像進行實時的幀內壓縮,幀內壓縮有一個好處就是可以精確的定位每一幀圖像,這一點非常適合非線性編輯,在編輯過程中,可以隨機存取任意一幀圖像,對于幀編輯十分理想。M-JPEG采用DCT編碼技術。JPEG(JointPhotographicExpertsGroup)即聯合圖片專家組,是一個聯合ISO/ITU-T技術委員會,成立于1986年低,主要工作是為連續色調(灰度或彩色)靜止圖像壓縮制定通用的國際標準,通過用電視測試圖像(720×576,Y:U:V=4:2:2;每像素16比特;寬高比4:3)進行不同的方案測試,經過多次篩選,于1988年1月完成最終測試和評選,結果選出自適應8×8DCT方案為最佳方案,1991年正式提交了ISOCD10918號建議草案。JPEG提供了3種壓縮算法:基本系統(BaselineSystem)、擴展系統(ExtendedSystem)和無失真壓縮(Lossless)。所有的JPEG編碼器和解碼器必須支持基本系統,另外兩種壓縮算法適用于特定環境?;鞠到y基于DCT和可變長編碼(VLC)壓縮技術,能提供高達100:1的壓縮比,且能保證可接受的重建圖像質量,由于DCT編碼有失真,故重建圖像不能精確地再現原始圖像,其圖像的失真程度與壓縮比密切相關。JPEG最初雖然是為靜止圖像設計的,但實際上,只要硬件處理速度足夠快,完全可以應用與視頻壓縮,因此,許多非線性編輯系統生產廠家在JPEG的基礎上開發了M-JPEG壓縮技術。M-JPEG的壓縮過程色抽樣:在視頻處理器中處理的是分量信號(YUV),因此輸入的信號不是分量信號,需要進行轉換,亮度信號(Y)、色度信號(UV)各用8比特表示,每個采樣共用24比特。信號轉換后,亮度信號直接進入DCT編碼器中,而色度信號需要進行再抽樣、同步,然后進入DCT編碼器,這個過程是個有損失的過程,有些信息丟失后無法還原。色度抽樣時,處理U分量的同時,丟失V分量;處理V分量時,丟失U分量,這樣減少了數據量,本來需要24比特來表示一個抽樣,現在只用16比特(8比特的亮度信號,8比特的色度信號),這就是常說的4:2:2(Y:U:V)。不同的廠家可能有不同的處理方法,有的會提高壓縮比,有的可能不做處理,而采用24比特的無損信號。色度抽樣完成后,色度信號與亮度信號輸入到DCT變換器中,DCT變換器的作用主要是用頻率變換來表示圖像。DCT:分量信號的圖像進入DCT變換器中,每幀被分割成許多8′8(像素)的正方形,一幅圖像可以分割成幾千個這樣的正方形,DCT變換器對這些正方形進行分析,計算出其灰度變化,然后用頻率表示其灰度值,比如大塊圖形或輪廓變化不大的部分用低頻表示,對邊緣或細節這樣變化大的部分用高頻表示,DCT變換器對所有正方形分析完后,在對下一幅圖像進行分析。從DCT變換器輸出的亮色信號使用頻率來表示的,進入下一個過程-量化。量化:量化過程決定了整個壓縮過程的壓縮程度,可以采用有損壓縮或無損壓縮,一旦進行有損壓縮,丟失的信息無法還原。M-JPEG一般采用2:1的壓縮比,在回放時,可以達到無壓縮時的視覺效果。根據對人類視覺系統的分析,人眼對亮度和色度的敏感程度不同,在辨別一幅圖形時,亮度信號對人眼的刺激更為重要,而色度信號在損失90%的情況下,人眼仍然可以分辨出圖形。數字視頻壓縮技術參考了人眼的這個特點,對色度信號進行壓縮,來得到較高的壓縮比。量化級數是量化的重要參數,其范圍從0到255,級數越大,圖像信息丟失越多,圖像質量越差,可以得到較高的壓縮比。量化級數與每幀的數據量成反比,級數大,每幀圖像的數據量小,反之亦然。通過量化,把圖像的頻率數據根據量化轉換成一系列的數,記錄了圖像的信息。零記數:量化過程產生一個數組,通過計算數組中的零的個數,來幫助在傳輸過程中判斷數組的尾端。這個過程多采用RLE(run-lengthencoding)算法。霍夫曼編碼:霍夫曼編碼是DCT編碼的最后一步,對數據進行冗余計算,把多余的信息去掉,傳遞更少的數據。霍夫曼編碼得到的結果,就是存儲到計算機磁盤上的數據。如果要看視頻影象,將這些數據解碼,然后通過數字/模擬轉換,得到模擬的視頻信號,又可以在監視器上瀏覽或記錄在錄像帶上了。壓縮比與碼速率、記錄時間和圖像質量比較壓縮比碼速率MB/S記錄時間(每GB)圖像質量119.7852秒D1、D51.612.361分2秒D2、D329.891分43秒DVW36.592分35秒BatacamSP、M244.953分26秒BatacamM53.964分19秒U-maticSP82.476分54秒SVHS、Hi8101.988分37秒U-maticVO200.9917分23秒VHSMPEG編碼MPEG(MovingPicturesExpertsGroup)即活動圖像專家組,建立于1988年,MPEG的主要任務是為了把計算機系統和廣播電視系統結合起來,建立統一的信息網絡。在制定MPEG-1標準前,確定出標準建立的要求,規定質量和當前錄像機所達到的水平相當,壓縮圖像和伴音總碼率為1.5Mbps,數字存儲適合當前應用的幾種媒體。MPEG壓縮標準于1990年制訂,是一種既可以通過軟件實現,也可以同過硬件實現的標準。M-JPEG是基于靜態圖像的壓縮技術,MPEG卻是基于動態圖像的壓縮標準。MPEG也采用8′8DCT壓縮編碼技術,編碼過程和前面介紹的類似,但在分析運動部分時,會采用更大面積的分塊。MPEG壓縮技術有廣泛的應用領域,如VCD、非線性編輯、電視會議、VOD等。MPEG有好幾個版本,各有不同的特點和應用:(1)MPEG-1:MPEG-1以4:2:0采樣壓縮,每秒1.2MBITS的傳輸碼率,圖像大小352′240,掃描頻率30場/秒。MPEG-1采用幀間編碼技術,幀間編碼比幀內編碼可達到的壓縮比高,而且能夠自適應幀內/幀間編碼,圖像活動劇烈時,視頻信號的幀間相關性下降,幀內相關性增強,圖像活動緩慢或靜止時,幀間相關性增強,因此自適應幀內/幀間編碼使幀間預測誤差減小,提高編碼效率。MPEG-1標準提供的圖像質量比電視略強,適合于非專業視頻領域,如VCD等,但用于廣播電視方面,其視頻質量是遠遠不夠的。(2)MPEG-2:MPEG-2是一種高質量視頻的壓縮標準,也有人稱它為用于廣播電視的視頻壓縮標準。MPEG-2標準的視頻圖像格式采用720×480像素,這與ITU.601標準規定的演播室用數字電視像素相同,是MPEG-1標準所定像素的4倍,同時規定傳輸碼率為4~10Mbps,差不多是MPEG-1傳輸碼率的4倍,MPEG-2采用10比特量化方式,MPEG-2與MPEG-1完全兼容。MPEG-2的專業版本(ProfessionalProfile@mainlevel)采用4:2:2采樣壓縮,傳輸碼率可達50-60Mbps。MPEG-2視頻體系包括5類(簡單類、主類、SNR可分級類、空間可分級類、高類)、4個等級(低級、主級、高1440級、高級),適應廣播、通信、計算機和家電視聽工業的不同需求。在同等視頻質量下,MPEG-2所占空間為M-JPEG的10%~15%,同時MPEG-2已經成為DVD和DVB的標準,因此,有些非線性編輯系統也采用MPEG-2這種壓縮方式,目前基于MPEG-2標準的數字壓縮格式有SONY的BETACOMSX(4:2:2P@ML)和松下的DVCPRO(4:2:0)等。(3)MPEG-4:MPEG-4正在制訂中,是一種廣域傳輸標準,傳輸碼率在10kbps到1Mbps之間。交換格式在產品的后期處理過程中,我們經常強烈需要將數字視頻數據從一個應用程序平滑地傳送到另一個應用程序。為此,不同應用程序之間為了相互交換數據而共同遵守某一共同的交換文件格式是非常重要的,常用有兩種視頻交換文件格式。1.OMFOMF就是開放媒體格式(OpenMediaFormat)的縮寫。OMF交換是為方便各種不同的系統協作處理數字媒體數據而設計的一種交換格式。目前OMF是異質平臺上交換數字媒體的文件標準。當使用OMF存儲數字媒體時,視頻數據從一個應用程序傳遞到另一個時就不需要重新采樣:只需將其輸出成OMF文件格式,再在另一個程序中從OMF格式文件中導入即可。OMF在專業質量級別上定義了一個交換數字媒體的標準方法。它被設計成可擴展的并且隨著數字媒體使用的廣泛性和復雜性的增長而演化。創建、編輯和播放數字媒體所需要的所有信息都可以在某個OMF交換文件中封裝;盡管OMF主要是被設計用來交換的但它的結構同樣適于直接播放。最初是AVID公司開始研制OMF的,但現在有400多家生產廠商和終端公司一起在參與OMF標準的制定。但根據我們目前所了解的情況和市場前景(從不同的制造商獲取的信息),主要的非線形編輯系統的制造商都不愿意遵守OMF。他們中的一些人認為OMF是AVID公司所專有的格式沒有成為標準的潛在可能。2.OpenDMLOpenDML最初由Microsoft、D-vision、DynatechEML、JVC、Montage、PinnacleSystems、C-Cube、Truvision和Adobe等大公司一起制定。OpenDML是一個通用的數字媒體文件格式。它允許用戶直接讀取任何公司產品中的同一塊視頻數據。OpenDML是一個在Windows平臺上運行的程序,這就意味著所有基于Mac的的產品將被排除在這個標準之外。OMF方法與OpenDML方法有著本質上的區別:它們并不是對立的,而是一種互補的關系。OMF是一種在兩個不同的非兼容格式下的交換格式,OpenDML是一種通用文件格式。AVID正在準備與OpenDML靠攏,但其它公司如Panasonic、Sony、Quantel等卻都沒有絲毫靠攏的跡象。數字音頻技術聲音的本質:通過空氣、水或物體中分子的震動傳播的一種縱向波。聲音描述:振幅與頻率,聽覺頻率范圍稍有差異,但一般認為是在20HZ到20000HZ聲音的記錄原理:物理存儲(電流信號)、磁存儲和光存儲聲音的數字化:采樣、量化音頻采樣類型聲音類型采樣頻率量化位數聲道數存儲量(每分鐘)電話質量的語音11.025KHZ8單聲道662KB高質量的語音11.025KHZ16單聲道1.32MB音樂22.05KHZ16單聲道2.65MB音樂22.95KHZ16立體聲5.3MBCD質量的音頻44.1KHZ16立體聲10.6MB

音頻卡中聲音信號的處理過程輸入的模擬音頻信號經過前置放大器放大后,由程序可控增益放大器進一步對輸入信號的幅度進行控制。抗混濾波器根據采樣頻率濾除可能引起噪聲的頻率。經過模數轉換(A/D)和采樣保持(S/H)電路,得到8位或16位數字化聲音數據。DSP芯片對聲音數據進行ADPCM壓縮,以DMA傳送方式,通過PC總線將數據存儲在硬盤上。聲音重放輸出的過程正好相反,從硬盤讀出的編碼聲音數據,被系統以DMA方式傳道到DSP處理器,經DSP解碼和數模轉換(D/A),變成模擬信號,再由重建濾波器進行低通平滑(sinx/x)濾波。聲音信號的輸出電平在軟件的控制下,經過功率放大器輸出。數字音頻的壓縮編碼及文件存儲編碼和壓縮ADPCM:高質、高數據率的無損音頻壓縮算法,可用于任何類型聲音的編碼。MPEGLayer3低數據率、高質量的復合音頻壓縮方法,對混合類型的聲音比對純語壓縮的效果要好,在Internet網上應用比較普遍。DSPGroupTrueSpeech:一種中低速碼率的、面向語音的壓縮編碼方法。(CCITT)G711A-Lawandu-Law:電話質量的語音壓縮標準,數據率比較低?!爸噶睢备袷接址Q“創作”格式,一般由音樂作曲和創作人員設計完成,其典型的文件類型是MIDI文件。在這種文件中記錄了一系列的發聲指令,其中包含音色、音調和聲音的延續長度等信息。MIDI文件只占用很小的硬盤存儲空間,但需要比較復雜的硬件和軟件(例如波表音源)相配合才能使用,而且在不同的音源上演奏的效果相差非常遠;“數據”格式又稱“記錄”格式,這種類型的音頻文件一般用來保存真實世界中發生的語音、音樂和音響。常用的音頻文件幾種:*.aif:蘋果Macintosh多媒體計算機中標準音頻文件格式;*.asf:微軟所定義的流式音頻格式,支持多種壓縮編碼方案,適用于14.4KBPS和28.8KBPS的低速網絡應用,該種格式的文件中除了保存原始音頻信號之外,還能記錄附加的數據信息。*.avi:一種常見的視頻文件格式,也可用于記錄采用多種壓縮算法的多軌音頻信號;*.ra:一種網絡流式音頻格式,適用于14.4KBPS和28.8KBPS的低速連接;*.voc:用于多媒體PC計算機的音頻數據格式,支持8比特和16比特數字采樣,由創通公司定義;*.wav:標準的Windows音頻數據格式,支持多種壓縮算法、8比特和16比特數字采樣和單聲道與立體聲通道。*.mov:蘋果Macintosh多媒體計算機中視音頻文件記錄格式,可以不包括視頻畫面只包含音頻信號。非線性編輯系統的基本構成一套完整的非線性編輯系統主要包括:計算機主機及顯示器、視音頻處理卡、硬盤陣列箱、接線盒、錄像機、監視器、音箱、網絡接口、軟件,另外還有許多擴展設備如特技卡等。錄像機在非線性編輯系統中起著播放素材帶和錄制母帶的做用,不參與節目的制作工作,錄像機是視音頻信號源,其質量決定了信號的質量。監視器是監視視頻信號的設備,由于現在電視制作基本都采用分量信號,因此,監視器應該具備監視分量信號的功能。音箱是用來監聽音頻信號的設備,在音頻編輯的過程中,要監聽制作的音響效果,因此音箱的質量不能太差,一般使用木制有源音箱。計算機平臺非線性編輯系統中,視音頻信號的處理編輯都是在計算機中完成的,計算機可以說是非線性編輯系統的最基本的部分,提供給整個系統各種軟硬件資源。一般非線性編輯系統采用的計算機平臺主要是蘋果計算機和高檔PC機,也有一些廠商采用價格不菲的SGI工作站。1991年SGI推出了真正完整的非線性編輯工作站——Indigo2。其中央處理器采用的分別是33、50和75MHz的R3000、R4000和R4400RISC芯片,這些處理器的速度獨立于系統總線速度。主板上除了CPU、FPU以及兩級高速緩存Cache外,還在總線上設置了專用集成電路芯片,這些特別設計的ASIC芯片可以在不需要CPU參與的情況下,執行內存和處理器的中斷、I/O處理、總線控制、像素填充、圖形繪制等操作。CPU總線與用于連接處理器核心、主內存、I/O系統、擴展槽以及圖形板的GIO總線分別以不同的速度運行,擁有不同的時鐘,使二者的能力得到最大限度的發揮,因而可以快速高效地傳送大量的數據。SGI工作站的圖形和動畫功能很強,但其昂貴的價格常令用戶望而卻步。蘋果計算機在視頻領域里發展時間長,技術先進,操作系統穩定,特別是其64位PCI總線技術,為數據的高速傳輸奠定了基礎,蘋果機一開始就具有多媒體功能,使用PCI總線和SCSI外設,速度比PC機具有明顯優勢。最早進行非線性編輯系統開發的也采用蘋果機器,如美國AVID公司的MC系列,其核心部件都集中在Mac主機里,包括Nuvista圖像板(將視頻信號數字化并負責控制編輯顯示器上的顯示)、JPEG板(用來實時壓縮和解壓縮信號)、音頻板(進行音頻信號的數字化和處理)和硬盤加速卡(能以16BIT位長傳輸字節,保證視頻采集和重放時需要的硬盤性能)。Mac機雖然在印刷、平面設計領域有著較穩固的地位,但是基于Windows/Intel體系結構的PC機與蘋果機相比,硬件配件的可選范圍和軟件種類更多,數據格式通用性更強,而且有較多的開發工具可供編程,因此生產和開發廠家越來越將目光轉移到PC機平臺。比起蘋果計算機來,PC機雖然占有計算機市場的主要份額,但在圖像方面上,還是稍遜一籌,不過PC機也在視頻方面不斷的發展,與蘋果機競爭視頻行業的市場,特別近幾年PC機的CPU主頻飛速提高,而且伴隨的總線技術也有較大進步,因此基于WindowsNT平臺的非線性系統大量涌現,同時工作站的價格也在不斷下降,由于其優越的圖形處理功能,使工作站在非線性編輯中占有一席之地。存儲介質非線性系統采用的外部存儲器主要是磁盤和光盤,判斷存儲器的性能考慮三個因素:容量、數據傳輸速率和訪問時間。磁盤以“0”、“1”這樣的數字信號記錄數據,準確、無損失的記錄、復制、傳輸各種數據,而且可以迅速訪問磁盤上任意位置的數據。磁盤目前朝著高容量、高速度的方向發展,磁盤容量從幾十MB發展到上百GB,更大的磁盤還在不斷出現。由于計算機的CPU主頻迅速提高,處理數據速度已經非??炝耍谟嬎銠C系統里的瓶頸主要在于數據傳輸,因此對磁盤的性能和接口速度的要求也在不斷的提高。磁盤可以分為軟盤和硬盤兩種。磁盤陣列:RAID的本意是為了容錯。容錯系統是標準化的,RAID結構稱為級(Level),不同級有各自的特點,并不是級序越高、性能全面的就好,應該根據不同的應用選擇不同的級別,才能達到最佳使用狀態。RAID共分為0、1、3、5、10、30和50七個級別,0、1、3、5級已標準化,10、30、50仍在討論中。在非線性編輯系統中,硬盤中的數據是從錄像帶上上載的,容錯起碼在目前是不重要的,而傳輸速度才是最迫切需要解決的問題。因而,RAID的第0級,即帶區集是非線性編輯系統中最受歡迎的方式。帶區集雖不提供任何容錯,但能使組成帶區的邏輯盤讀寫速度提高數倍。用3—10只8MB/S的廉價SCSI硬盤組成帶區集速度能達到16—40MB/S,基本上能與UltraWideSCSI總線的速度相匹配,使無損壓縮和無壓縮的單路視頻采集不丟幀,并能實現視頻壓縮數據的多路采集和回放。光盤存儲器作為大容量的存儲介質,以其體積小、密度高、容量大、數據保存壽命長、介質可換、工作安全可靠、抗灰塵能力強、單位價格低廉以及應用多樣化的特點,已成為一種重要的外設。光盤大致分為兩類:WORM(writeonce,readmany一次寫盤,多次讀盤)和WMRM(writemany,readmany多次讀寫),WORM只能進行一次寫盤,數據一旦寫到盤上,就不能刪去重寫,寫盤后只供讀取數據用,和CD-ROM的區別在于CD-ROM上已經由生產廠家寫好數據供用戶讀取使用,WORM需用戶自己往盤上寫數據。WMRM是可擦寫光盤,就象磁盤一樣,數據寫到盤上還可以刪除,寫入新的數據。RAID0級1級3級5級SCSI、SSA、FC、IEEE1394接口接口類型時鐘速度數據寬度傳輸率SCSI-15MHz1字節5MB/秒高速窄口(Fast,Narrow)SCSI

10MHz1字節10MB/秒高速寬口(Fast,Wide)SCSI(SCSI-2)10MHz2字節20MB/秒超高速寬口(Ultra,Wide)SCSI20MHz2字節40MB/秒SCSI(Smallcomputersysteminterface小型計算機系統接口)作為磁盤接口。SCSI接口標準最早在大型機里流行,后來蘋果公司在其產品中引入SCSI接口,SCSI接口才在臺式機中出現,而后進入工作站、PC機領域。SCSI接口一般應用在要求數據傳輸量大的系統中,SCSI存儲設備的性能也比一般的設備好,對于數字視頻系統來說,這可能是最佳選擇。SCSI控制卡是連接CPU和存儲器的接口,由于它提供DMA(directmemoryaccess)通道功能,大大提高了SCSI設備的傳輸速率,比如只使用SCSI-1型接口的硬盤,可提供1.5MB/秒的傳輸率,如果配置一塊相應的SCSI控制卡,傳輸率可達到5MB/秒。另外SCSI技術受到距離的限制,最大支持3米的連接距離,超高速寬口SCSI只支持1.5米距離和4個SCSI設備。但使用控制卡模式可以增大有效距離,如單端控制卡(Single-endcontrollers)可以支持6米,多端控制卡(Differentialcontrollers)可支持72米(超高速寬口SCSI除外,只能到1.5米)。SSA(Serialstoragearchitecture)是IBM開發的一種CPU與存儲器之間的高速接口技術,一般SSA可以提供和SCSI相當的傳輸速率(20MB/秒,40MB/秒),高速SSA可以達到100到160MB/秒的傳輸率,利用SSA可以輕松的傳輸無壓縮的ITU-601標準視頻數據。但是由于SSA接口沒有被大多磁盤、控制卡制造商采用,這種技術沒能在非線性系統中流行起來。FC(FibreChannel)是一種采用光通道的高速傳輸技術,它利用光纖取代了銅芯,傳輸速率可達250MB/秒,FC-AL(FibreChannelArbitratedLoop)提供125MB/秒的CPU-存儲器傳輸速率。許多廠商開始支持這種光通道技術,在不久的將來,也許會在非線性系統領域里展露頭角。IEEE1394是蘋果公司針對串并行接口(RS232,SCSI等)提出的,1995年底得到認可,并且成立商業聯盟,這種接口技術具有實時數據傳輸能力,并且可以熱插拔和網絡連接,支持的傳輸速率可達400MBITS/秒,將來可以達到1GBITS/秒,甚至更高。目前IEEE1394得到了廣泛支持,相應的產品也不斷的出現,如數字攝錄機、數字相機等,為非線性編輯的前后期一體化提供了支持。備份存儲8mm25-40美元25GBDAT15-20美元25GBDLT99美元20-35GB8mm一代2GB1.5MB/秒(寫速率)8mm二代4GB1.5MB/秒(寫速率)8mm三代15GB1.5MB/秒(寫速率)8mm四代20GB3MB/秒(寫速率)8mm五代30GB5MB/秒(寫速率)目前最常用的大數據量備份設備是磁帶,磁帶不僅能夠記錄模擬的視音頻信號,而且還可以記錄數字信號。市面上有多種格式的磁帶,如:4mm磁帶,8mm磁帶,DAT(digitalaudiotape數字音頻磁帶),DLT(digitallineartape數字線性磁帶),不同的磁帶需要不同的磁帶驅動器。磁帶的磁密度高,單位面積記錄的數據量大,而且造價低廉,其傳輸速度相對較慢,但能滿足備份數據的速率要求。下面的列表顯示了磁帶的造價和傳輸速度的相關數據。DLT一代10GB1.25MB/秒(寫速率)DLT二代15GB1.25MB/秒(寫速率)DLT三代20GB1.5MB/秒(寫速率)DLT四代35GB5MB/秒(寫速率)DAT一代1GB250KB/秒(寫速率)DAT二代4GB500KB/秒(寫速率)DAT三代12GB1.25MB/秒(寫速率)視音頻處理卡

從硬件構成的角度看,視音頻處理卡可分為單通道和雙通道兩種。這里通道的意思是指在內部視頻混合器之前的獨立的視頻回放通道。目前絕大多數的非線性編輯系統使用的都是M-JPEG算法,因此可分為只有一個M-JPEGCodec(編解碼器)的單通道系統和有兩個M-JPEGCodec的雙通道系統。單通道系統只能對一路視頻信號進行壓縮記錄和解壓回放,這就意味著系統肯定無法完成多層畫面的實時處理。雙通道系統由于可以完成兩路視頻信號的解壓回放,再與系統內部其它處理單元相配合,就可以完成兩路活動畫面的實時混合處理。目前市場上主流板卡有:Pinnacle公司的Targa系列,它屬于音視頻合一卡,是最早進入國內的板卡,突出特點是采集質量好、信號穩定,不過支持它的軟件不多,在與三維動畫軟件搭配方面有良好的發揮,至今仍是許多廣告公司手中的利器。DPS公司PRT系列,使用Videoaction軟件,Matrax公司的Digisuite系列,與PRT一樣,是較新的板卡,支持多層實時。此外還有Nitro,Reeltime等板卡。支持它們的軟件國外有Premiere,Speedrazor,Videoaction等。Avid產品與上述產品不同,它自成體系,屬于系統集成商,自己開發軟、硬件。Avid開發第一款非線編到今天,經過了十年的時間,推出九代非線編產品,和其他幾十種數字視頻設備。單通道系統單通道系統其核心部件就是M-JPEG圖像系統,它需要完成視頻信號的解碼,壓縮解壓縮和顯示(在計算機CRT上顯示)以及信號的編碼輸出。由于單通道系統的回放通道只有一個,因此無法實時地完成電視節目制作中常用的特技混合和切換處理。視音頻的處理只能通過軟件來生成。采用軟件生成素材有兩大缺陷:一是由于生成需要不斷對同一素材進行壓縮和解壓縮,造成視頻質量的損失;二是通過軟件生成的文件還需再存到硬盤上去,又占據了硬盤空間。單通道系統的設計主要是為了降低成本,其著眼點只是具備基本的“采集—壓縮—存儲—解壓—回放”功能。單通道系統(只有一個壓縮/解壓縮通道)通常在硬件上無數字特技、數字混合和字幕疊加部分。它只是完成視音頻信息的采集、壓縮解壓縮和編碼輸出。雙通道系統

雙通道系統有兩路視音頻的采集和回放通道,其視音頻子系統的硬件包括:外部視音頻輸入模塊,壓縮采集解壓縮回放模塊,圖文產生模塊,二維數字特技模塊,三維數字特技模塊,多層疊加模塊,預覽輸出及主輸出模塊。視頻信號輸入后先進入數字混合器,這樣設計的目的是可有一路活動的背景信號在數字混合器中與其它已存在硬盤中的視頻文件作混合。要壓縮保存的視頻信號經混合器旁路后進入壓縮/解壓縮通道進行壓縮后變為標準的視頻文件存放在硬盤中。音頻信號經A/D變換后存入硬盤。在使用應用程序進行編輯時,視音頻文件從硬盤中調出,可有兩路視頻信號通過解壓縮后進入視頻混合器,這時由視頻效果DSP控制對進入混合器的視頻信號進行二維和三維特技變換。在混合器中還完成掃換、疊化、鍵控等效果。由32BITR.G.B-Alpha圖文幀緩存產生的字幕在回放過程中在混合器中實時混合輸出,完成圖像和圖文字幕的疊加。音頻信號經數字音頻處理后輸出。在這種雙通道系統中,復雜的功能由各個功能模塊組成。壓縮解壓縮是兩個完全獨立的通道,因此要求組件盡量小型化和低功耗。由于內部實時數字視頻通道對回放畫面不產生損失,因此最大限度地保證了經過特技合成畫面的質量。同時這樣的系統不需要制作人員等待,系統僅存儲視音頻素材及其合成信息,節省了硬盤資源。雙通道系統通常由兩塊以上的套卡組成。每塊板卡各司其職。視頻信號的采集和壓縮JPEG算法的好處在于幀內壓縮,系統構成的靈活性比較大,既可以做到無損壓縮,也可以做到質量尚可的有損壓縮。完成JPEG算法的信號處理器從90年以來發展很快,可以達到以實時的速度(PAL制為25幀/秒,NTSC制為30幀/秒)完成運動視頻圖像的壓縮。因此這時的壓縮性能被稱為Motion-JPEG。由于專業視頻編輯常常需要對場進行處理,因此壓縮必須對場進行,而不是幀。這樣在數字解碼后需經過一個兩場存儲器FRAM才能進行后續壓縮處理。這也是Motion-JPEG與JPEG的最大區別。此外,由于需要以25幀/秒的速度實時地壓縮電視圖像,一般在硬件中是把一場分區同時壓縮,以減少一幅圖像的壓縮時間。在雙通道系統中視頻信號壓縮解壓縮部分及其接口處理框圖如右圖所示。視頻信號經過輸入解碼后送入壓縮解壓縮Codec,Codec有兩個接口:與系統其他信號處理部分的接口通過高速寬帶總線相連;與存儲介質相連,通過第二條PCI總線接口,使主PCI總線徹底地解放出來。多層畫面的實現

多畫面合成在過去主要應用于平面設計中,為了增強藝術效果,常把幾層至幾十層畫面合成一層。在平面設計中,由于是單幅靜止圖像,處理比較容易。而要把多路活動圖像合成一層就要困難得多。傳統的特技發生器一次只能合成二層圖像。一個n層畫面則需合成n-1次,因此需采用多代復制才能實現多層合成。而如果使用的是模擬分量錄像機,在多代復制后圖像質量會嚴重下降。切換臺雖能一次合成多層畫面,但只能實現簡單的功能,不能滿足廣告和片頭制作的要求。目前非線性編輯系統中的多畫面合成有硬件和軟件兩種類型。軟件合成多用于簡單的單通道非線性編輯系統中,它是用程序算法一幀幀生成的。生成時間視合成的層數和復雜程度而異,通常生成一分鐘的多層畫面需要很長時間。除了最底層的畫面外,其余層的畫面都是通過α通道來合成的。每一層α通道的來源都可以不同,比如說色鍵或是一幅在圖像處理軟件中作出的黑白圖像(α通道圖像)等等。在高檔雙通道非線性編輯系統中都采用硬件合成技術。硬件合成方式有多次合成和一次合成兩種方法。

多次合成硬件結構多次合成硬件結構比較簡單,只要有1—2個DVE發生器和一個數字混合器就可實現。采用的方法是把兩路編輯軌上的畫面分別賦予特技,先經過數字混合器合成一個文件保存在硬盤中,再調出后與第三層畫面用同樣的方法進行合成。這種合成方式與錄像機多代復制原理一樣,但混合是在數字級上進行的,質量損失很小。它的特點是硬件成本較低,但操作時效率不高,需要等待,等待時間要比純粹用軟件生成要快,而且硬盤利用率低。

一次合成硬件結構一次合成的硬件結構非常復雜。一次合成幾層畫面,就得動用幾個DVE發生器,并且需要多路劃像器、多路色鍵、亮鍵和多軌DAT。這種方式是最理想的。圖像質量最好,制作效率最高。這種合成方式以Digisuite為代表。它內部包含兩個5層數字視頻混合器,5個板上2DDVE,用DSP控制的掃換發生器,兩個亮度鍵,兩個色度鍵和七個背景發生器。可以同時合成五層畫面:A路視頻、B路視頻、錄像機直通信號、一層圖文字幕和背景圖案。這五層畫面的合成是下載過程中實時實現的,所保存的為編輯鏈表文件(容量很小,只有幾十K)。合成時不需要中間存儲介質,硬盤利用率很高,可修改性極好。這種方式硬件成本較高。圖中示出的是由三層圖像,三個DVE,兩個數字混合器,一個掃換波形發生器,一個色鍵發生器和一個亮鍵發生器構成的多層畫面合成的硬件結構。數字視頻特技單元數字特技又稱數字視頻效果(DigitalVideoEffect,DVE),是對視頻圖像的尺寸、位置、色彩、方向等運用數學模型經過數學運算完成變換的技術。數學運算必須依靠一定的數學模型,而這些數學模型就是數字特技算法。一幅圖像對應的是一個二維空間的矩形點陣,設(x,y)為變換前原圖像函數f(x,y)任意點坐標,(x',y')為變換后圖像函數f(x',y')任意點坐標。二維變換的數學模型為:x'=ax+by+cy'=dx+ey+f當a,b,c,d,e,f為常系數值時就是二維線性特技變換,通過調整各系數值可得到各種方式的二維特技。當a,b,c,d,e,f為非常數值,即是(x,y)的函數時,則屬于二維非線性變換,通常的二維特技有畫面平移、鏡頭變焦、平面畸變、平面旋轉等。三維變換的數學模型為:x'=ax+by+c/gx+hy+Iy'=dx+ey+f/gx+hy+i三維特技是通過對二維畫面的變換形成一種三維空間形體,即由大到小,由遠到近的三維空間運動的透視效果。常用的如卷頁、翻滾、水波紋等。DVE算法所需的計算量很大,一般只有靠專用的高速硬件處理芯片做成強大硬件支持才能完成真正的實時三維特技運算。它最基本的形式是將視頻以一定的時鐘和地址寫入存儲器,然后再用與特技算法相關的時鐘和地址從存儲器中讀出數據,如下圖所示。圖文字幕的疊加硬件字幕需要專門的電路支持。其硬件構成通常由一個圖形加速器和一個圖文幀緩存構成。圖形加速器的效率和功能將直接影響圖文字幕的速度和效果。一層字幕必須有對應的一頁R.G.B-Alpha32BIT全PAL分辨率(720*576)幀緩存。一般4MWRAM圖文幀緩存可實現兩頁圖文。疊加字幕的工作過程是將漢字從硬盤字庫中調到計算機內存中,從線性地址寫入圖文幀緩存,經屬性描述后輸出到圖像混合器的下游鍵中,與圖像合成后輸出。一層字幕的硬件開銷比一層圖像要復雜。圖像幀緩存是Y.Cr.Cb4:2:2結構,一個像素用16BIT描述;圖文幀緩存是R.G.B-Alpha4:4:4結構,一個像素用32BIT描述,幀緩存規模比圖像大1倍。Alpha是線性鍵是一層8BIT的黑白圖像,用作鍵信號,能使圖文具有256階漸進半透明。它不僅可以改善圖文與背景視頻疊加的效果,而且經過軟件運算還可以實現字幕邊緣的抗混疊(Anti-aliase)處理。即通過對像素突變處插入不同透明度的像素來平滑字幕的邊緣,消除斜線鋸齒效應和單線閃爍現象,極大地提高字幕邊緣的質量。一個圖文幀緩存只具備了一層靜態字幕的功能。要使字幕實時運動,還需2個DVE專門為字幕作特技,一個賦予24BIT的R.G.B幀緩存;另一個賦予8BIT的Alpha幀緩存。2個DVE還必須同步工作,才能實時完成字幕的二維和三維運動。依次類推n層字幕就需n個32BIT的圖文幀緩存和2n個DVE。可見硬件字幕的造價是很高的,因而一般非線性編輯系統中只有一層實時字幕。字幕播出可鋪在視頻編輯軌上或是按照傳統的方式眼觀圖像手敲鍵盤上字幕。軟件字幕是利用作圖軟件的原理,把字幕作為圖形鍵處理,生成帶Alpha鍵的位圖文件。將其調入編輯軌對某一層圖像進行摳像貼圖,完成字幕功能。軟件貼圖需逐個像素生成,字幕功能簡單,成本較低,不需要硬件開銷。國內一些非線性編輯生產廠家專門開發了非線性編輯用字幕軟件,可以插入到圖像編輯軟件中使用,沒有這些軟件時也可用專用的作圖軟件,如Photoshop制作貼圖字幕,作臨時湊合之用,當然功能比專用字幕軟件要差一些。視音頻信號的連接專業非線性編輯系統的結構非常復雜,必須用多塊板卡組合起來才能實現非線性編輯系統的基本功能。這些板卡都插在計算機主板的總線槽上。主板上的總線并沒有足夠的富裕帶寬來傳輸視音頻數據,于是人們設計了在板卡之間傳輸連續高速數據流的介質流總線(MediaStreamBus)。介質流總線是各種媒體傳輸總線的總稱,直至目前仍在發展之中。

Movie-2總線是符合ITU-R601標準的介質流總線,可容納14路視頻數據和4路串行數字音頻數據,總線速率超過242MB/S。總線有兩個高密度接口CON1和CON2。CON1是一個90芯接口,提供板卡的雙向I/O,基準和同步。CON2是一個70芯接口,傳送往返DVE信號和鍵信號,與CON1有相同的基準和同步。連接在Movie總線上的多塊板卡中,任一板都可以是主板或從板。但在某一段時間里,只能有一塊是主板,其它是從板。Movie-2總線可同時傳輸下列信號:8路獨立的ITU-R601標準8BIT或10BIT不壓縮數字視頻數據(并行D1)6路獨立的ITU-R601標準的8BIT鍵信號4路串行數字音頻數據(AES/EBU和S/PDIF兼容)IIC總線協議控制信號或其它控制信號視頻和音頻定時基準Movie-2總線上的數據是高速連續傳輸的,不需要FIFO緩沖器。視頻采樣時鐘是13.5MHz,音頻采樣時鐘是12.288MHz,都是由27MHz的主基準分頻得到的,保證了視音頻的準確同步。Movie-2總線是目前最先進的視頻總線,受到全世界主要視頻廠家的認可,已成功應用在DigiSuite、Genie、ReelTime和PerceptionRT等板卡中。視頻信號的輸出和顯示如果在計算機屏幕的GUI窗口中看到正在采集或回放視頻可以免去在視頻監視器和計算機顯示器之間來回轉動腦袋之苦,這在技術上要解決逐行掃描的VGA圖形與隔行掃描的電視圖像迭顯的問題。視頻和計算機的迭顯一般有兩種實現方式:硬件實現和軟件實現。軟件迭顯是指系統的視頻迭顯機制是由軟件實現的。它通過建立對應于計算機圖形子系統的圖形顯示存儲區的顯示映射區,對相應的控制寄存器進行控制,將變換過大小和彩色空間的視頻像素傳送至圖形顯示存儲區,在圖形子系統中完成視頻迭顯。這種迭顯方式由于需要逐點計算,因而占用了CPU大量時間。由于視頻和壓縮數據都由CPU和總線技術來管理,因此容易出現計算機顯示器上顯示的視頻圖像不連續的現象。有的非線性編輯系統因此不用這種軟件迭顯的方式,而是直接將視頻信號編碼輸出,從TV監視器上觀看。軟件迭顯常用在廉價非線性系統中。硬件迭顯的核心部件是圖形加速器。隨著芯片集成度的日益提高,原先的VGA控制器被高性能的圖形加速器所代替。這些圖形加速器雖然沒有超出VGA的原理框架,但它的硬件具有了刷新緩沖區的基本管理機制。這種管理機制主要是對于單個像素、專用像素和像素組等圖形單元和圖形部件的管理,增加了對繪制線段、圓弧和顯示模塊等高層次圖形功能。因而明顯減輕了由于眾多的圖形管理給CPU帶來的壓力。圍繞高集成度的圖形加速器的視頻迭顯方案可使顯示系統無須再單獨為視頻數據增加一塊幀緩存,使系統設計大大簡單。高性能的圖形加速器,如Trident的9685和Matrox的MGA2964W都支持不同的數據格式輸入,視頻數據可以送入常規的圖形幀緩存中,和圖形數據分開存放,兩種顯示方式互不影響。圖形加速器可通過其本身的視頻顯示機制,將視頻信號轉換為VGA格式的信號,迭顯在計算機顯示屏上。用這種圖形加速器構成的高檔顯示卡可接收不同格式的視頻數據,由軟件配合在計算機顯示器上開不同大小的視頻窗口,因而可以單獨地完成視頻輸入和顯示的功能。典型的視音頻卡介紹

板卡指標PerceptionRTTarga2000RTX/SDXReelTimeDigiSuitLEDigiSuit實時項目劃像劃像、色鍵、亮鍵劃像、色鍵、亮鍵劃像、2層色鍵、2層亮鍵、2層二維劃像、2層色鍵、2層亮鍵、3層二維圖象層數2層2層3層5層5層最小壓縮比2:11.5:11.6:11.3:1可關閉DCTSDI接口有SDX有可選可選有IEEE1394接口無無可選無無聲音平衡支持無有有有有聲音I/O通道數22244數字AES/EBU無SDX有無可選有數字S/PDIF無無無有有專業DAT質量無無無有有劃像種類200200130>200>2002DDVE無1個無2個5個色/亮鍵層數01122常見的雙通道圖像處理卡DigiSuite板卡功能DigiMix圖像處理卡DigiMotion雙通道壓縮/解壓縮卡DigiDesktop帶Trimedia通道雙屏四電視窗口X、Y定標顯示卡MarvelMillenium單屏單電視窗口顯示卡DigiLink數字視頻接口卡

一般PCI接口12.1“*4.2”,2PCI槽,遵循V2.1遵循的規則FCCA類,

CEMarkA類視頻特點同步鎖定黑場輸入輸入3個復合,3Y/C或2個模擬分量串行數字可選輸出復合、模擬分量,串行數字可

可選預預監:復合

Y/C線形鍵視頻格式ITU-R60YUV4:2:2NTSC720*486PAL720*576音頻特性與視頻同步鎖定遵循SMPTE-272M和AES11-1991模擬音頻I/O4in/4out,

平衡(XLR)或平衡(RCA)和立體聲預監輸出采樣方法16位48KHZ128X過采樣聽音室17db視頻codecs基線M-JPEG遵循ISO10918-1和MicrosoftPEGDIB無損壓縮質量Haffmom和運行長度平均信息量編碼內置SICI控制器

AdaptecAIC7880p,40MB/SUltraWideSICI,支持15個設備內置處理器視頻特技控制器T1TM320BC52100MHz音頻控制器AmlogDevius

z106232位33MHZ圖形控制器Matrox

MGA-2064W2DDVD處理器Matrox

Fiesta-1(5位)視頻混合器Matrox

Siestea-1110位YUV4:2:2處理DigiSuite是Matrox公司的一組套卡,5塊板卡組成。這是一組用Movie-2總線連接在一起的雙通道板卡,卡上的硬件資源較豐富,有五個二維DVE、兩個五路數字混合器、兩個劃像器、兩個數字色鍵、兩個數字亮鍵、七個電子背景發生器、一個圖文幀緩存、五個特技幀緩存。四路八軌DAT處理器??ㄉ献詭ltraWideSCSI接口,能直接以RAID帶區方式管理多達14個素材硬盤。可關閉DCT,只做熵編碼,實現無損壓縮。能實時處理放機圖像、兩路硬盤回放圖像、電子背景和字幕共五層畫面,軟件底層支持開放的DirectShow。這套板卡中缺少三維特技處理功能,應用中須配一塊Pinnacle公司的三維特技卡Genie。音頻處理和視頻處理卡一樣,音頻處理卡對音頻信號的處理也是一個編解碼的過程。音頻信號由模擬信號轉變為數字信號,使用壓縮技術通過編碼量化,記錄在磁盤上。音頻壓縮系統是將音頻信號的表示從時域轉換到頻域,以實現基于心理聲學的音頻壓縮,所得的頻域系數即是接下來要編碼的內容,頻域系數可數字量化,因為產生的量化噪聲將與音頻信號在同一頻率上,由于心理聲學掩蔽效應,對低的信噪比是可接受的,基于人類聽覺的心理聲學模型,對于每個單獨的頻率系數,比特分配操作決定了什么樣的SNR(信噪比)可以接受,最后,頻域系數數字量化到所需精度,并格式化音頻的基本碼流。基本碼流包括了使音頻解碼器實現相同(對編碼器)比特分配的必要信息,這樣,解碼器將基本碼流頻率系數進行分組拆裝和反量化,從而重建頻率系數。合成濾波器組是分組濾波器組的逆過程,它將重建的頻率系數還原為時域信號。采樣頻率(kHz)最大比特數存儲量(kB/分鐘)聲音質量11.025811廣播講話,一般語言22.05822調頻廣播音樂44.11688.2CD光盤音樂481696數字磁帶錄音(錄像)機音樂在質量較好的非線性編輯系統中,音頻處理卡與視頻處理卡往往是集成在一塊卡上的,稱之為視音頻處理卡,完成視音頻處理工作,如采集、合成、輸出等。某些非線性編輯系統由于主處理卡沒有音頻處理功能,是通過外插音頻處理卡來解決音頻處理問題,如果使用普通的多媒體音頻卡,其音頻通道的頻響、信噪比、接口形式及是否平衡輸出都滿足不了廣播電視的要求,而且,這種低檔的音頻卡,處理速度緩慢,在采集和回放時,跟不上視頻卡處理的速度,出現視音頻信號不同步現象,為了保持視音頻同步,就會出現丟幀現象。雖然使用外插卡往往造成不同步現象,并不是說使用外插卡就一定不能滿足要求,有些高檔的專業音頻處理卡,性能優越,可以保持視音頻信號的同步,提供專業音頻接口,只不過價格相當高昂。所以音視頻處理集成在一塊卡上是比較合理的設計,既能保證音視頻信號的同步,又降低了成本,在非線性編輯系統中普遍使用。編輯軟件視頻效果:AfterEffects、Primier、BorisEffects、Transjammer、MediaPaint、ElasticReality、Debabelizer、MovieFlow、Morphy、Finaleffects。繪畫/合成:Photoshop、CorelDraw、KPTBryce、Xres、Collage、Painter、Texturescape。三維動畫:3DMax、ElectricImage、Infini-D、Extreme3-D、RayDream、Macromodel、3DStudio、Typestry、LogoMotion、Stratavision3-D。數字音頻:DeckII、CyberSound、Digitrax、SoundEdit16、SoundDesignerII、DigitalPerformer?;竟δ埽河布O置、軟件設置、素材采集、素材管理、視頻編輯、音頻編輯、輸出視頻網絡調制解調器14.4kBITS/秒、33.6kBITS/秒、56kBITS/秒租用專線56kBITS/秒ISDN64kBITS/秒(每通道)AppleTalk:230kBITS/秒以太網:10MBITS/秒、100MBITS/秒、1000MBIT/秒T1:1.5MBITS/秒T3:45MBITS/秒FDDI:100MBITS/秒、200MBITS/秒ATM:155MBITS/秒、622MBITS/秒(OC1=51.8MBITS/秒,OC2=155MBITS/秒,OC3=622MBITS/秒,OC48=2.4GBITS/秒)FibreChannel(光通道):133MBITS/秒、1GBITS/秒、4GBITS/秒FireWire:400MBITS/秒、1GBITS/秒、HiPPI(highperformanceparallelinterface,高性能并行接口):800MBITS/秒、1600MBITS/秒非線性編輯系統的選購計算機平臺視音頻處理卡系統的處理速度編輯功能軟件功能素材管理集成性的寫作和效果兼容性開放的解決方案系統的可靠性和售后服務壓縮比相應的模擬視頻指標每個GB存儲的錄像時間1:1無壓縮DI49秒2:1數字Batac

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論