




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
多媒體基礎知識軟件設計師課程講義教學要求掌握多媒體信息處理基礎知識多媒體技術的概念;多媒體應用中的媒體元素多媒體信息處理的關鍵技術多媒體計算機系統(tǒng)的組成多媒體計算機的硬件系統(tǒng)多媒體計算機的軟件系統(tǒng)主要內(nèi)容:多媒體信息處理基礎知識6.1多媒體計算機系統(tǒng)的組成6.2多媒體基礎知識
6.1多媒體信息處理基礎知識
多媒體(Multimedia)技術是集文字、聲音、圖形、圖像、視像和計算機技術于一體的綜合技術。一、多媒體技術的概念
(一)媒體及其分類 媒體是信息標識和傳輸?shù)妮d體。媒體在計算機領域可分為以下五類(國際電報電話咨詢委員會(CCITT)對媒體的分類)。
⑴感覺媒體(PerceptionMedium) 感覺媒體是直接作用于感知器官的,能直接感覺的媒體,如人類的各種語言,各種聲音、音樂、圖形、圖像、視像、文字等等。
⑵表示媒體(RepresentationMedium)
表示媒體是為了加工、處理和傳輸感覺媒體而人為構造出來的一類媒體。它是將感覺媒體數(shù)字化,主要指各種編碼,如語言編碼、文本編碼、圖像編碼等。
⑶表現(xiàn)媒體(PresentationMedium) 表現(xiàn)媒體是感覺媒體與計算機之間的界面,如鍵盤、攝像機、話筒、顯示器、打印機等。
⑷存儲媒體(StorageMedium)
存儲媒體用于存儲表示媒體,及存儲感覺媒體數(shù)字化之后的代碼。常用的存儲媒體有磁盤、磁帶、光盤和半導體存儲器等。
⑸傳輸媒體(TransmissionMedium)
傳輸媒體是用來傳送媒體的物理載體,如雙絞電纜、同軸電纜、光纖電纜、微波、紅外線、衛(wèi)星信道等。(二)多媒體及其主要特征 多媒體系統(tǒng)強調(diào)以下三大特征:集成性、交互性和數(shù)字化特征。
集成性是指可對文字、圖形、圖像、聲音、視像、動畫等信息媒體進行綜合處理,達到各種媒體的協(xié)調(diào)一致。
交互性是指人能方便地與系統(tǒng)進行交流,以便對系統(tǒng)的多媒體處理功能進行控制。
數(shù)字化特性是指各種媒體的信息,都以數(shù)字形式(即轉(zhuǎn)換為“0”和“1”的方式)進行存儲、處理和傳輸,而不是傳統(tǒng)的模擬信號方式。
“虛擬現(xiàn)實”(virtualreality,簡稱vr)是用計算機技術來生成一個逼真的三維視覺、聽覺、觸覺或嗅覺等感覺世界,讓用戶可以從自己的視點出發(fā),利用自然的技能和某些設備對這一生成的虛擬世界客體進行瀏覽和交互考察。它可使用戶獲得與真實世界一樣的感覺,可達到代替實際系統(tǒng)的目的.(三)虛擬現(xiàn)實
專業(yè)級虛擬現(xiàn)實系統(tǒng)具有高度的實時性,能同時使用多種輸入輸出設備,用戶可以用人體的自然技能,借助數(shù)字頭盔、立體顯示技術、數(shù)據(jù)手套和數(shù)據(jù)衣服等工具,與虛擬的感覺世界進行交互作用。
現(xiàn)在虛擬現(xiàn)實的范圍很廣,包括虛擬環(huán)境、塞伯空間等。虛擬現(xiàn)實最重要的目標就是真實的體驗和方便自然的人機交互,凡是能夠達到或部分達到這樣目標的系統(tǒng)就稱為虛擬現(xiàn)實系統(tǒng)。虛擬現(xiàn)實的基本特征虛擬現(xiàn)實系統(tǒng)的關鍵特性沉浸:“真實”的體驗交互:實時操縱得到反饋信息多感知:具有人所有的感覺1.桌面虛擬現(xiàn)實2.沉浸式虛擬現(xiàn)實3.增強現(xiàn)實系統(tǒng)4.分布式虛擬現(xiàn)實虛擬現(xiàn)實類型1.桌面虛擬現(xiàn)實利用個人計算機和低級工作站進行仿真,將計算機的屏幕作為用戶觀察虛擬境界的一個窗口。使用簡單的外部設備(如鼠標、軌跡球)來觀察360度范圍內(nèi)的虛擬世界,并操縱虛擬場景中的各種物體。純軟件型2.沉浸式虛擬現(xiàn)實高級虛擬現(xiàn)實系統(tǒng),提供完全沉浸的體驗,使用戶有一種置身于虛擬境界之中的感覺。利用頭盔式顯示器或其他硬件設備數(shù)據(jù)手套位置跟蹤器3.增強現(xiàn)實系統(tǒng)不僅是利用虛擬現(xiàn)實技術來模擬現(xiàn)實世界、仿真現(xiàn)實世界,而且要利用它來增強參與者對真實環(huán)境的感受。增強現(xiàn)實中無法感知或不方便的感受。真實環(huán)境和虛擬環(huán)境結(jié)合起來的系統(tǒng),部分系統(tǒng)是真實環(huán)境,這樣既可減少真實環(huán)境的資源消耗,又可對實際物體進行操作。4.分布式虛擬現(xiàn)實如果多個用戶通過計算機網(wǎng)絡連接在一起,同時參加一個虛擬空間,共同體驗虛擬經(jīng)歷,那虛擬現(xiàn)實則提升到了一個更高的境界,這就是分布式虛擬現(xiàn)實系統(tǒng)。(四)音頻基本概念
聲音是多媒體表現(xiàn)形式中不可缺少的一部分,它使多媒體的表現(xiàn)力更加豐富。聲音主要包括語言、背景聲、音效和音樂4個部分。語言背景聲
音效音樂聲音的概念空氣中的分子在某些介質(zhì)的作用下振動,形成聲音,其振動過程可用一連續(xù)的曲線表示,稱為聲波。
振幅周期曲線上的任一點再次出現(xiàn)所需時間間隔稱為周期。而一秒鐘內(nèi)聲音由高(壓力強)到低(壓力低)再到高(壓力強),這個循環(huán)出現(xiàn)的次數(shù)稱為頻率。聲音頻率:聲音的三要素為音調(diào)、音強、音色。音調(diào)與聲音的頻率有關,頻率快則音調(diào)高,頻率慢則音調(diào)低。音強又稱響度,取決于聲音的幅度,即振幅的大小和強弱。音色指音的感覺特性。不同的物體發(fā)出的聲音我們可以通過音色分辨,不同發(fā)生體的材料、結(jié)構不同,發(fā)出聲音的音色也就不同。根據(jù)不同的音色,即使在同一音高和同一聲音強度的情況下,也能區(qū)分出是不同樂器或人聲發(fā)出的。聲音的三要素聲音頻率:聲音按頻率可分為3種:次聲波、可聽聲波和超聲波。人類聽覺的聲音頻率范圍為20Hz~20kHz,低于20Hz的為次聲波,高于20kHz的為超聲波。人說話的聲音信號頻率通常為300Hz~3kHz,人們把在這種頻率范圍內(nèi)的信號稱為語音信號。
聲音頻率:聲音質(zhì)量用聲音信號的頻率范圍來衡量,頻率范圍又叫“頻域”或“頻帶”,不同種類的聲源其頻帶也不同。聲源的頻帶越寬,表現(xiàn)力越好,層次越豐富。
電話質(zhì)量:200Hz~3.4kHz。調(diào)幅廣播質(zhì)量:50Hz~7kHz。調(diào)頻廣播質(zhì)量:20Hz~15kHz。數(shù)字激光唱盤(CD-DA)質(zhì)量:10Hz~20kHz
聲音的數(shù)字化把模擬聲音信號轉(zhuǎn)換為數(shù)字聲音信號的過程稱為聲音的數(shù)字化,它是通過對聲音信號進行采樣、量化和編碼來實現(xiàn)的。1.采樣
把模擬聲音變成數(shù)字聲音時,需要每隔一個時間間隔在模擬聲音波形上取一個幅度值,稱為采樣,即A/D(模/數(shù))轉(zhuǎn)換。目前最常用的采樣頻率有3種:44.1kHz、22.5kHz、11.025kHz。2.量化
把某一幅度范圍內(nèi)的電壓用一個數(shù)字來表示稱為量化,量化的過程實際上也是選擇分辨率的過程。標準的語音編碼采用8bit(位),即可有28=256個量化級。音頻量化的位數(shù)通常采用16位,其對應有216=65536個量化級。量化位數(shù)8bit采樣頻率11KHz+127…+64+320-32-64…-12801001010比較:量化位數(shù)16bit采樣頻率22KHz+32767…+512+1280-128-512…-327680010101100011000比較:3.編碼
由于計算機內(nèi)數(shù)據(jù)的存儲采用的是二進制,為此必須將聲音數(shù)據(jù)寫成計算機的數(shù)據(jù)格式,稱為編碼。所以,數(shù)字聲音是一個數(shù)據(jù)序列,它是由模擬聲音經(jīng)過采樣、量化和編碼后得到的。
聲音文件的大小數(shù)據(jù)量=采樣頻率×量化位數(shù)×錄音時間×聲道數(shù)/8數(shù)據(jù)量的單位為B/s(字節(jié)/秒)。例如,一首5分鐘CD音樂光盤音質(zhì)的歌曲,即采樣頻率44.1kHz,量化位數(shù)16位,立體聲音頻文件的大小為:(44
100×16×300×2)/8=52
920
000B=50.47MB聲音合成由計算機合成的聲音①語音合成②音樂合成語音合成語音合成,又稱文語轉(zhuǎn)換(TexttoSpeech)技術,能將任意文字信息實時轉(zhuǎn)化為標準流暢的語音朗讀出來,相當于給機器裝上了人工嘴巴。我們所說的“讓機器像人一樣開口說話”與傳統(tǒng)的聲音回放設備(系統(tǒng))有著本質(zhì)的區(qū)別。傳統(tǒng)的聲音回放設備(系統(tǒng)),如磁帶錄音機,是通過預先錄制聲音然后回放來實現(xiàn)“讓機器說話”的。這種方式無論是在內(nèi)容、存儲、傳輸或者方便性、及時性等方面都存在很大的限制。而通過計算機語音合成則可以在任何時候?qū)⑷我馕谋巨D(zhuǎn)換成具有高自然度的語音,從而真正實現(xiàn)讓機器“像人一樣開口說話”。文語轉(zhuǎn)換系統(tǒng)語音合成技術分類波形編輯合成參數(shù)分析合成聲道模型參數(shù)合成音樂合成技術
◆調(diào)頻(FM)合成
,是將多個頻率的簡單聲音合成復合音來模擬各種樂器的聲音。FM合成方式是早期使用的方法,用這種方法產(chǎn)生的聲音音色少、音質(zhì)差。
◆波形表(Wave
Table)合成
這種方法是先把各種真正樂器的聲音錄下來,再進行數(shù)字化處理形成波形數(shù)據(jù),然后將各種波形數(shù)據(jù)存儲在只讀存儲器中。發(fā)音時通過查表找到所選樂器的波形數(shù)據(jù),再經(jīng)過調(diào)制、濾波、再合成等處理形成立體聲送去發(fā)音。存儲聲音樣本的ROM容量的大小對波表合成效果影響很大。二、多媒體應用中的媒體元素
(一)文本(Text)
文本是指各種文字,包括各種字體、尺寸、格式及色彩的文字。文本是計算機文字處理的基礎,也是多媒體應用程序的基礎。通過對文本顯示方式的組織,多媒體應用系統(tǒng)可以使顯示的信息形式多樣化、更易于理解。 文本的多樣化主要是通過文字的屬性,如格式(style)、對齊方式(align)、字體(font)、大小(size)、顏色(color)以及它們的各種組合而表現(xiàn)出來的。MIDI
MIDI(musical
instrument
digital
interface)是數(shù)字樂器接口的國際標準,它定義了電子音樂設備與計算機的通訊接口,規(guī)定了使用數(shù)字編碼來描述音樂樂譜的規(guī)范。
常見的MIDI設備有電子琴等。計算機中以MID為擴展名的文件稱為MIDI文件,其中存放的是對MIDI設備的命令,即每個音符的頻率、音量、通道號等指示信息。最后播出的聲音是由MIDI設備根據(jù)這些信息產(chǎn)生的。
MIDI聲音可以用于配音,它的缺點是對回放設備的依賴太強,還有就是不能記錄人聲(五)圖形和圖像圖形:一般是指計算機繪制的畫面,如直線、園、圓弧、矩形、任意曲線和圖表等。圖像:指由輸入設備捕捉的實際場景畫面或以數(shù)字化形式存儲的畫面。圖像的細化分類:模擬圖像是固定在圖層上的畫面。如一張照片,就是通過化學攝影術而制成的一幅靜態(tài)的畫面,它一旦形成就很難再改變。數(shù)字圖像是以0或1的二進制數(shù)據(jù)表示的,其優(yōu)點是便于修改、易于復制和保存。數(shù)字圖像可以分為以下2種形式:矢量圖和位圖實踐一:根據(jù)生活經(jīng)驗討論傳統(tǒng)相機拍攝的照片與數(shù)碼相機拍的照片各有什么特點?特點模擬圖像數(shù)字圖像傳輸性再現(xiàn)性可處理性相對困難較易差強較快較差圖像數(shù)字化的缺點:1、經(jīng)過數(shù)字化的圖像會有所損失和失真;2、數(shù)字化后的文件不能直接觀看,必須借助播放設備才可觀看;3、由于采用二進制形式的存儲方法,數(shù)據(jù)量巨大一般包括三個階段:采樣、量化和編碼采樣量化編碼多媒體信息輸入數(shù)字化的多媒體信息輸出采樣:就是按照一定的規(guī)律每隔一定時間間隔抽取模擬信號的值。量化:就是對樣本值進行離散化處理,即事先規(guī)定一組數(shù)據(jù),每個數(shù)據(jù)按一定規(guī)則近似表示一組相關采樣值。編碼:經(jīng)過量化后得到的數(shù)字信息,還必須按一定格式轉(zhuǎn)換成計算機可以識別的二進制形式,才能在計算機中保存。用二進制形式表示量化值的過程稱為編碼。圖形、圖像數(shù)字化原理圖形、圖像的數(shù)字化:將模擬圖像轉(zhuǎn)化為數(shù)字圖像的過程。看上去一個“像素”就是一個正方形的色塊,事實上,“像素”是一個純理論的概念,它沒有形狀也沒有尺寸,看不見摸不著,只存在于理論計算中。圖形、圖像數(shù)字化原理每一個方塊(可看成一個點)稱為像素,每英寸的像素點數(shù)稱為分辨率2、實物圖像被分割成一個一個的顏色方塊發(fā)現(xiàn):1、圖像是由很小的顏色方塊組成的常用的四種分辨率:輸入分辨率、顯示分辨率、輸出分辨率、圖像分辨率采樣過程要涉及的兩個重要參數(shù):分辨率、色彩深度(1)、分辨率
采樣時,首先要決定在一定的面積內(nèi)取多少個點,或者叫多少個像素,它決定了圖像的清晰度,其衡量指標就是分辨率。圖像分辨率是指以像素數(shù)表示數(shù)字圖像的總信息量。例如:72dpi分辨率的1英寸X1英寸圖像包含總共5184像素;
300dpi分辨率的1英寸X1英寸圖像包含總共90000像素圖像的像素數(shù)=(分辨率)2色彩深度指記錄每個像素的顏色(或亮度)所占的二進制位數(shù),單位是“位/像素”,即b/p。對于彩色圖像來說,色彩深度決定了該圖像可以使用的最多顏色數(shù)目;色彩深度越高,顯示的圖像色彩越豐富,畫面越自然、逼真,但數(shù)據(jù)量也隨之猛增。較大的色彩深度(每像素信息的位數(shù)更多)意味著數(shù)字圖像具有較多的可用顏色和較精確的顏色表示。
例如,色彩深度為1的像素有兩個可能的值:黑色和白色,而色彩深度為8的像素有256個可能的值。色彩深度為24的像素有大約1,600萬個可能的值。常用的位深度值范圍為1到64位/像素。
在不同的領域,人們采用的色彩深度往往不同,比如,從事藝術繪畫的畫家們習慣用HSB(色調(diào)、飽和度和亮度)模型;顯示器這類發(fā)光物體用RGB模型;打印機這類吸光物體的CMYK模型;電視系統(tǒng)用YUV模型等。這只是幾種經(jīng)常使用的色彩模型,它們均有各自的特點。
Photoshop
也可以處理每個顏色通道包含16位數(shù)據(jù)的Lab、RGB、CMYK、多通道和灰度圖像。此外,Photoshop
還可以處理每個顏色通道包含32位數(shù)據(jù)的RGB和灰度圖像(高動態(tài)范圍HDR圖像)。
常見的色彩深度4bit:是VGA標準支持的色彩深度,共24種顏色。8bit:是多媒體應用中的最低色彩深度,共28種顏色,是索引彩色圖。24bit:用三個字節(jié)分別表示RGB,即8bit表示一個通道,可生成224=16777216種顏色,真彩色。32bit:同24位的顏色深度一樣,剩余的8bit用來表示圖像的其他屬性,如透明度,即alpha通道等。實踐二:分別設置顯示器分辨率(640*480、800*600、1024*768)后,把素材中“桌面.jpg”文件設置成桌面,觀看效果并討論影響圖像的顯示效果的因素。小結(jié):分辨率:指在單位面積中采集的樣點數(shù)。它的基本作用就是用來說明數(shù)字圖像信息的數(shù)量和密度。也就是說,分辨率越高,采樣的點數(shù)就越多,圖像的像素就越大,圖像也就越清晰。分辨率與數(shù)字化圖形、圖像的效果1:一幅圖像的分辨率為256×512,計算機的屏幕分辨率是1024×768,該圖像按100%顯示時,占據(jù)屏幕的()。
A、1/2B、1/6C、1/3D、1/102:要打印出清晰的圖片,在進行圖像處理時就要重點關注圖片的()。A、圖像分辨率B、顯示分辨率C、輸出分辨率D、上述三項練習題位圖是以點或象素的方式來記錄圖像的,因此圖像是由許許多多小點組成的。創(chuàng)建一幅位圖圖像的最常用方法是通過掃描來獲得。位圖圖像的優(yōu)點是色彩顯示自然、柔和、逼真。其缺點是圖像在放大或縮小的轉(zhuǎn)換過程中會產(chǎn)生失真,且隨著圖像精度提高或尺寸增大,所占用的磁盤空間也急劇增大。矢量圖是以數(shù)學方式來記錄圖像的,由軟件制作而成。矢量圖的優(yōu)點是信息存儲量小,分辨率完全獨立,在圖像的尺寸放大或縮小過程中圖像的質(zhì)量不會受到絲毫影響,而且它是面向?qū)ο蟮模恳粋€對象都可以任意移動、調(diào)整大小或重疊,所以很多3D軟件都使用矢量圖。矢量圖的缺點是用數(shù)學方程式來描述圖像,運算比較復雜,而且所制作出的圖像色彩顯示比較單調(diào),圖像看上去比較生硬,不夠柔和逼真。
靜止圖像在計算機中難以用矢量來表示,基本上只能用點陣來表示,其元素代表空間的一個點,稱之為像素(pixel),這種圖像也稱位圖。位圖中的位(bit)用來定義圖像中每個像素點的顏色和亮度。對于黑白圖像常用1個二進制的位來表示;對灰度圖像常用4個二進制的位(16種灰度等級)或8個二進制的位(256種灰度等級)表示該點的亮度;位圖圖象矢量圖形特征能較好表現(xiàn)色彩濃度與層次可展示清楚線條或文字用途照片或復雜圖象文字、商標等相對規(guī)則的圖形圖影縮放效果易失真不易失真制作3D影象不可以可以文件大小較大較小常用的文件格式BMP、PSD、TIFF、GIF、JPEG、EPS、DXF、PS、WMF、SWF位圖圖像與矢量圖形區(qū)別圖形圖像的格式BMP:最典型的應用BMP格式的程序就是Windows的畫筆。BMP是用于Windows和OS/2的位圖(Bitmap)格式,文件幾乎不壓縮,占用磁盤空間較大,它的顏色存儲格式有1位、4位、8位及24位。開發(fā)Windows環(huán)境下的軟件時,BMP格式是最不容易出問題的格式,并且DOS與Windows環(huán)境下的圖像處理軟件都支持該格式,因此,該格式是當今應用比較廣泛的一種格式。但缺點是該格式文件比較大,所以只能應用在單機上,不受網(wǎng)絡歡迎。
GIF格式
是非常普遍的圖像格式,適合在網(wǎng)上傳輸交換。GIF文件格式采用了LZW壓縮算法來存儲圖像數(shù)據(jù),GIF文件允許用戶為圖像設置背景的透明屬性。此外,GIF文件格式可在一個文件中存放多幅彩色圖形/圖像。如果在GIF文件中存放有多幅圖,它們可以像演幻燈片那樣顯示或者像動畫那樣演示。PCX格式
PCX格式是ZSOFT公司在開發(fā)圖像處理軟件Paintbrush時開發(fā)的一種格式,基于PC的繪圖程序的專用格式,一般的桌面排版、圖形藝術和視頻捕獲軟件都支持這種格式。PCX支持256色調(diào)色板或全24位的RGB,圖像大小最多達64K*64K像素。
TIFF格式
TIFF格式(TagImageFileFormat)是Macintosh上廣泛使用的圖形格式,具有圖形格式復雜、存貯信息多的特點。3DS、3DSMAX中的大量貼圖就是TIFF格式的。TIFF最大色深為32bit,可采用LZW無損壓縮方案存儲。JPEG格
JPEG文件的擴展名為.jpg或.jpeg,其壓縮技術十分先進,它用有損壓縮方式去除冗余的圖像和彩色數(shù)據(jù),獲取得極高的壓縮率的同時能展現(xiàn)十分豐富生動的圖像,由于它優(yōu)異的性能,所以應用非常廣泛,而在Internet上,它更是主流圖形格式PSD格式
ADOBE公司開發(fā)的圖像處理軟件PHOTOSHOP中自建的標準文件格式就是PSD格式,在該軟件所支持的各種格式中,其存取速度比其它格式快很多,功能也很強大。由于PHOTOSHOP軟件越來越廣泛地應用,所以這個格式也逐步流行起來。PSD格式是Photoshop的專用格式,里面可以存放圖層、通道、遮罩等多種設計草稿。以便于下次打開文件可以修改上一次的設計。PNG格式
PNG(PortableNetworkGraphics)是一種新興的網(wǎng)絡圖形格式,結(jié)合了GIF和JPEG的優(yōu)點,具有存貯形式豐富的特點。PNG最大色深為48bit,采用無損壓縮方案存儲。著名的Macromedia公司的Fireworks的默認格式就是PNG。
圖形、圖像文件的壓縮數(shù)據(jù)壓縮:對數(shù)據(jù)重新進行編碼,以消除數(shù)據(jù)序列中的冗余性,實現(xiàn)原數(shù)據(jù)序列變換成較短的輸出數(shù)據(jù)序列(又稱壓縮數(shù)據(jù)序列)的技術。壓縮比:壓縮數(shù)據(jù)序列與原數(shù)據(jù)序列長度之比。圖像文件大小 圖像文件的大小用字節(jié)數(shù)來表示,其描述方法為:(水平像素數(shù)×垂直像素數(shù)×灰度位數(shù))/8。 而一張3英寸×5英寸的彩色相片,經(jīng)掃描儀掃描進入計算機中成為數(shù)字圖像,若掃描分辨率達1200DPI(點/英寸),則數(shù)字圖像文件的大小為:
5×1200×3×1200×24÷8=64800000B≈62MB無損壓縮:是指利用信息相關性進行的數(shù)據(jù)壓縮,這種壓縮并不損失原有信息的內(nèi)容,是一種可逆壓縮,即經(jīng)過文件壓縮后可以將原有的信息完整保留的一種數(shù)據(jù)壓縮方式范圍:文檔、可執(zhí)行文件等普通的數(shù)據(jù)文件。有損壓縮:是利用了人類視覺和聽覺器官對圖像或聲音中某些部分不敏感的特性,采用一些高效的有限失真數(shù)據(jù)壓縮算法,大幅度減少多媒體中的冗余信息,它允許在壓縮過程中損失一定信息,即壓縮后不能將原來的文件信息完全保留,所以是不可逆壓縮。范圍:圖像、音頻、視頻等多媒體文件。變換部分:體現(xiàn)了輸入原始圖像和經(jīng)過變換的圖像之間的一一對應關系。變換也稱為去除相關,它減少了圖像中的冗余信息,提供了一種更易于壓縮的圖像數(shù)據(jù)表示形式。量化部分:把經(jīng)過變換的圖像數(shù)據(jù)作為輸入進行處理后,會得到有限數(shù)目的一些符號。這一部會帶來信息的損失,是有損壓縮與無損壓縮的主要區(qū)別。編碼部分:將經(jīng)過變換的數(shù)據(jù)編碼為二進制位流,可以采用固定長度編碼或變動長度編碼。圖像壓縮的基本過程:數(shù)據(jù)壓縮和編碼技術標準
◆H.261H.261是用于音頻視頻服務的視頻編碼解碼器,也稱為P×64標準。由CCITT(ITU-T)制定。其應用目標是可視電話和視頻會議系統(tǒng)。含有此標準的系統(tǒng)必須能實時的按標準進行編碼和解碼。H.261于JPEG、MPEG標準的區(qū)別在于它是為動態(tài)使用而設計的,并提供完全包含的組織的高水平的交互控制。◆JPEGJPEG是靜止圖像壓縮和解壓縮算法的標準,它是基于DCT的有損算法,是ISO的國際標準。MPEG在三方面優(yōu)于其他的壓縮/解壓方案:
開始就是一個國際化的標準,兼容性很好;
比其他算法有更高的壓縮比,最高可達到200:1;在提供高壓縮比的同時,對數(shù)據(jù)的損失很小;◆MPEGMPEG-X是一組由ITU和ISO制定發(fā)布的視頻、音頻和數(shù)據(jù)的壓縮標準。◆MPEG-1制定于1992年,傳輸率最高可達4Mbps~5Mbps,質(zhì)量級別與VHS相當。可用于記錄媒體或是在Internet上傳輸音頻。◆MPEG-2制定于1994年,傳輸率在3Mbps~10Mbps之間,DVD指定標準。◆MPEG-4傳輸率要求在4800bps~64000bps之間。其主要特點是交互性和綜合性。更適合交互AV服務記憶即遠程監(jiān)控,,是第一個使觀眾由被動變主動的動態(tài)圖象標準。◆DVIDVI視頻圖像壓縮算法的性能與MPEG相當,圖像質(zhì)量可達到VHS的水平。壓縮以后的圖像傳輸率約為1.5Mbps。
(六)視頻(Video)
視頻圖像(video)是一種活動影像,是利用人眼的視覺暫留現(xiàn)象,將足夠的畫面(frame,幀)連續(xù)播放,只要能夠達到每秒20幀以上,人的眼睛就察覺不出畫面之間的不連續(xù)性。電影是以每秒24幀的速度播放,而電視則依視頻標準的不同,播放速度有25幀/秒(中國用PAL制)和30幀/秒(北美用NTSCM制)之分,法國和中東一帶用SECAM制。活動影像如果幀率在15幀/秒之下,則將產(chǎn)生明顯的閃爍甚至停頓;相反,若提高50幀/秒甚至100幀/秒,則感覺到圖像極為穩(wěn)定。視頻影像文件的格式在PC中主要有三種:
①.AVI:
AVI(audiovideointerleaved聲音/影像交錯),Windows所使用的動態(tài)圖像格式,不需要特殊的設備就可以將聲音和影像同步播出。這種格式的數(shù)據(jù)量較大。
②.MPG:MPG是MPEG(MotionPhotographicExpertsGroup,活動圖像專家組)制定出來的壓縮標準所確定的文件格式,供動畫和視頻影像用。這種格式數(shù)據(jù)量較小。
③.ASF:ASF是微軟公司采用的流式媒體播放的格式(advancedstreamformat),比較適合在網(wǎng)絡上進行連續(xù)的視像播放。
視頻圖像輸入計算機是通過攝像機、錄像機或電視機等視頻設備的AV輸出信號,送至PC機內(nèi)視頻圖像捕捉卡進行數(shù)字化而實現(xiàn)的。數(shù)字化后的圖像通常以.AVI格式儲存,如果圖像卡具有MPEG壓縮功能,或用軟件對.AVI進行壓縮,則以.MPG格式儲存。新型數(shù)字化攝像機可直接得到數(shù)字化圖像,則不再需要通過視頻捕捉卡,而直接通過PC的并行口、SCSI口或USB口等數(shù)字接口,輸入給計算機。(七)動畫
動畫也是一種活動影像,最典型的是“卡通”片。它與視頻影像不同的是:視頻影像一般是指生活上所發(fā)生的事件的記錄,而動畫通常指人工創(chuàng)作出來的連續(xù)圖形所組合成的動態(tài)影像。(八)超文本(HyperText)
超文本是一種非線性的信息組織與表達方式,超文本所建立的連接,往往是網(wǎng)狀連接。Internet的WWW(WorldWideWeb)網(wǎng)頁使用了一種超媒體的文件格式,稱為“超文本標記語言”
HTML(HyperTextMarkupLanguage),該文件具有規(guī)定的擴展名?html或?htm。三、多媒體信息處理的關鍵技術(一)數(shù)據(jù)壓縮技術 數(shù)據(jù)壓縮算法可分為無損壓縮和有損壓縮兩種:
⑴無損壓縮 無損壓縮用于要求重構的信號與原始信號完全相同的場合。 ⑵有損壓縮 有損壓縮適用于重構信號不一定非要與原始信號完全相同的場合。
目前應用于計算機的多媒體壓縮算法標準有如下兩種:
⑴壓縮靜止圖像的JPEG標準 這是由聯(lián)合圖像專家組(JoinPhotographicExpertGroup,JPEG)制定的靜態(tài)數(shù)字圖像數(shù)據(jù)壓縮編碼標準。
⑵壓縮運動圖像的MPEG標準 這是由活動圖像專家組(MotionPhotographicExpertGroup,MPEG)制定的用于視頻影像和高保真聲音的數(shù)據(jù)壓縮標準。6.2多媒體計算機硬件一、多媒體主機 多媒體主機通常由主機板、CPU、內(nèi)存、軟盤驅(qū)動器、硬盤驅(qū)動器、光盤驅(qū)動器等組成。由于多媒體計算機系統(tǒng)需要交互式地綜合處理文字、聲音、圖形、圖像、動畫等大信息量的媒體,因此,多媒體計算機的主機系統(tǒng)要求中央處理器的速度快、存儲器的容量大、輸入輸出接口及系統(tǒng)總線速度盡可能快。二、多媒體卡
(一)聲卡 聲卡(是多媒體計算機的標準配件之一,是實現(xiàn)聲波/數(shù)字信號相互轉(zhuǎn)換的硬件電路。其主要功能是錄制和播放數(shù)字聲音,編輯合成MIDI音樂等。
(1)聲卡的工作原理 聲卡從話筒中獲取聲音模擬信號,通過模數(shù)轉(zhuǎn)換器(ADC),將聲波振幅信號采樣轉(zhuǎn)換成數(shù)字信號,進行處理后,存儲到計算機中。當播放聲音時,將數(shù)字信號送到數(shù)模轉(zhuǎn)換器(DAC),還原為模擬波形,放大后輸出。
(2)聲卡的主要性能指標 采樣頻率 量化精度: 聲道數(shù):聲道數(shù)即為聲音通道的個數(shù)。 (二)視頻卡 視頻卡就是多媒體計算機系統(tǒng)中用于對視頻進行采集、處理、播放的部件。視頻卡按功能的不同可以分為視頻采集卡、電視編碼卡、電視接收卡、MPEG解壓卡、DVD解壓卡。
(1)視頻采集卡 視頻采集卡用來把攝像頭、錄像機、激光視盤中的視頻信號轉(zhuǎn)換為數(shù)字信號,把視頻圖像以數(shù)字的形式采集到計算機的存儲設備中。
(2)電視編碼卡 電視編碼卡可將計算機顯示器上的信號轉(zhuǎn)換成標準電視視頻信號,這樣就可以利用電視來顯示計算機顯示器上的畫面。
(3)視頻監(jiān)控卡 一般是對攝像頭或者攝像機等信號進行捕捉,并以MPEG格式存儲在硬盤上的PCI插槽的卡。
(4)DV卡 也叫1394卡,目前市場上有兩種1394(DV)卡,一種是1394A,一種是1394B,1394A的傳輸速率為400MB/S,1394B的傳輸速率為800MB/S。1394采集卡插入PC的PCI插槽里,數(shù)碼攝像機與它相連,就可以把DV影片復制制(采集)到PC的硬盤里(或是從硬盤把信號傳輸?shù)綌z像機)。三、多媒體輸入設備 掃描儀、數(shù)字相機等;視頻輸入設備,如攝像機、錄像機等。
(一)掃描儀 掃描儀是將照片、文字或圖片獲取下來,以圖片文件的形式保存在計算機中的一種設備。(1)掃描儀的分類按工作原理可將掃描儀分為平板式掃描儀、手持式掃描儀和滾筒式掃描儀。目前常用的是平板式掃描儀。按可掃描幅面的大小可以分為小幅面的手持式掃描儀、中等幅面的臺式掃描儀和大幅面的工程圖掃描儀。按色彩方式可以將掃描儀分為單色掃描儀和彩色掃描儀。單色掃描儀又可分為黑白掃描儀和灰度掃描儀,一般的灰度掃描儀均可以兼容黑白掃描儀工作方式。(2)掃描儀的組成和原理 掃描儀主要由光電傳感器、機電同步機構、數(shù)據(jù)傳輸電路三部分組成。掃描儀的原理是:將光學圖像轉(zhuǎn)送到光電轉(zhuǎn)換器中變?yōu)槟M信號,然后模擬信號通過A/D轉(zhuǎn)換器轉(zhuǎn)換為數(shù)字信號,通過計算機接口送到計算機中。它的工作原理與傳真機的工作原理相似。(3)掃描儀的主要性能指標 光學分辨率:分辨率越高,掃描出的圖像也越清晰。一般來說,300DPI的分辨率基本能滿足要求。色彩分辨率:表示色彩所用的二進制位數(shù),單位為Bit(位)。色彩位越高,所能表示的色彩數(shù)就越多,色彩也就越清晰。一般掃描儀的色彩分辨率都可以達到24位真彩色或更高。 (3)數(shù)碼相機 它是一種將圖像以數(shù)字方式記錄在存儲器中的照相機。它的核心部件是CCD(電荷耦合元件)圖像傳感器,可將光線作用轉(zhuǎn)化為電荷,再通過模數(shù)轉(zhuǎn)換芯片轉(zhuǎn)換成數(shù)字信號,經(jīng)過壓縮以后存儲在內(nèi)部存儲器中。(4)攝像機 攝像機由攝像頭、攝像管、同步電信號發(fā)生電路、放大電路組成。其原理是:被攝物體在攝像管上形成光學圖像,經(jīng)攝像管轉(zhuǎn)換成電信號,以視頻信號輸出。四、多媒體輸出設備 常用的多媒體輸出設備除了顯示器和打印機之外,音箱是多媒體計算機音頻輸出的重要設備。五、多媒體計算機的軟件系統(tǒng)
(一)多媒體操作系統(tǒng) 系統(tǒng)軟件中操作系統(tǒng)是多媒體計算機系統(tǒng)的核心,它除了具有一般操作系統(tǒng)的功能外,還具有管理多媒體硬件和多媒體數(shù)據(jù)的功能。Windows2000是一個32位、多任務、具有強大多媒體功能的操作系統(tǒng),因此是多媒體體計算機中廣泛使用的操作系統(tǒng)。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025餐飲服務承包經(jīng)營合同樣本
- 導尿病人護理要點與流程
- 苗族女孩創(chuàng)意美術課件
- 2025年壓力容器管理人員試題
- 學生會權益部工作總結(jié)模版
- 2025年2月高一下學期入學考試生物試題總結(jié)模版
- 小學書法進校園活動總結(jié)模版
- 合同管理工作總結(jié)模版
- 新質(zhì)生產(chǎn)力策略
- 浙江省衢州市五校聯(lián)盟2024-2025學年高二下學期期中聯(lián)考試題 地理 PDF版含答案
- 建設工程質(zhì)量管理手冊范本
- 中國文化遺產(chǎn)資料長城100字
- 高中生物選擇性必修1基礎背誦 課件
- 中醫(yī)適宜技術操作規(guī)程及評分標準
- 2023-2024學年貴州省六盤水市小學語文六年級期末提升測試題詳細參考答案解析
- 江蘇南通軌道交通集團有限公司運營分公司社會招聘工作人員考試真題及答案2022
- 頸椎JOA腰椎JOA 評分-表格-日本骨科協(xié)會評估治療
- 人工智能時代小學勞動教育的現(xiàn)實困境與突破路徑 論文
- 野生動物管理學智慧樹知到答案章節(jié)測試2023年東北林業(yè)大學
- 國際友人在中國智慧樹知到答案章節(jié)測試2023年西北大學
- 函數(shù)的零點與方程的解(說課稿)
評論
0/150
提交評論