




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1.1多媒體和多媒體技術1.2多媒體技術的應用與發展1.3多媒體研究的主要關鍵技術1.4多媒體系統的層次結構及基本組成本章小結練習一
1.1多媒體和多媒體技術在20世紀80年代之前很長的一段時間里,信息媒體的交互方式僅局限于文字和文本。然而,計算機的出現實現了文字和文本的電子化,給人們提供了不少方便,大大減輕了人的勞動強度,提高了效率。但是,僅文字和文本方式的交互與人的自然交互還相距很遠。因為在人的感知系統中,視覺所獲取的信息約占65%,聽覺所獲取的信息約占20%,另外還有觸覺、嗅覺、味覺、臉部表情、手勢等占其余部分。雖然只靠文字、文本傳輸和獲取信息也能表達信息內容,但直觀性差,不能聽其聲、見其人。從20世紀80年代中后期開始,多媒體計算機技術逐漸成為人們關注的熱點之一。多媒體技術的出現從根本上改變了昔日基于字符的各種計算機處理。首先是語音和圖像的實時獲取、傳輸及存儲,使人們獲取和交互信息流的渠道豁然開朗,既能聽其聲,又能見其人,千里之外,近在咫尺,大大改變了人們的交互方式、生活方式和工作方式。其次是促進了各個學科的發展和融合,開拓了計算機在國民經濟各個領域中的廣泛應用,從而對整個社會結構產生了重大影響。多媒體計算機加速了計算機進入家庭和社會各個方面的進程,給人們的工作和生活帶來了一場革命。1.1.1多媒體與多媒體技術的概念
要弄清什么是多媒體(Multimedia),首先要知道什么是媒體(Media)。媒體即媒介、媒質,是信息的載體。在計算機領域中,媒體有兩種含義:一是指用以存儲信息的實體,如磁帶、磁盤、光盤和半導體存儲器;另一種是指信息的載體,如數字、文字、聲音、圖像和圖形。多媒體技術中的媒體是指后者。所謂多媒體,就是用多種媒介方法傳輸信息。例如,電影是一個很好的多媒體例子:在有聲電影發明以前,電影采用文字顯示的方法來表達人物對話的內容。后來,人們把第二種媒質——聲音加到電影中,使我們不但能聽到演員的對話,而且能聽到各種其他聲音,與此同時,背景音樂的加入有助于產生某種特殊氣氛。現代個人計算機程序用到了電影的所有組成部分,包括活動圖像、音響效果、語言、文字、音樂、動畫以及靜止圖像。例如,網絡游戲中就利用了活動圖像與音響效果。多媒體技術的內涵和范圍極其廣泛,很難給出精確的定義。到目前為止,關于多媒體概念的標準定義還沒有統一,仍是眾說紛紜。但僅從字面上理解,多媒體就是多種媒體的綜合,而多媒體技術也就是怎樣進行多種媒體綜合的技術。這個定義道出了多媒體的實質,但有些太籠統。本書引用Lippincott和Robinson于1990年給出的定義:多媒體技術(MultimediaComputerTechnology)是指用計算機綜合處理多種媒體信息——文本、圖形、圖像和聲音等,使多種信息建立邏輯連接,集成為一個系統并具有交互性的技術。
多媒體的本質不僅是信息的集成,也是設備的集成和軟件的集成,它們通過邏輯連接形成一個有機整體,同時又可實現交互控制。可以說,集成和交互是多媒體的精髓。1.1.2多媒體技術的特性
1.信息載體的多樣性
信息載體的多樣性是多媒體技術的主要特征之一,也是多媒體研究需要解決的關鍵問題。信息載體的多樣性是相對計算機而言的,指的就是信息媒體的多樣性。把計算機所能處理的信息空間范圍擴展和放大,而不再局限于數值、文本、圖形和圖像,這是計算機變得更加人類化所必需的條件。人類對于信息的接收和產生主要基于五個感官空間:視覺、聽覺、觸覺、嗅覺和味覺,其中視覺約占65%,聽覺約占20%,觸覺約占10%,味覺、嗅覺等其他感覺約占5%。借助于這些多感覺形式的信息交流,人類對于信息的處理可以說是得心應手。然而,計算機以及與之相類似的設備都遠遠沒有達到人類的水平,在信息交互方面與人的感官空間就相差更遠。多媒體就是要把機器處理的信息多維化,通過信息的捕獲、處理與展現,使其在交互過程中具有更加廣闊和更加自由的空間,滿足人類感官空間全方位的多媒體信息需求。
2.交互性
多媒體技術的第二個關鍵特性是交互性。所謂交互,就是通過各種媒體信息,使參與的各方(不論是發送方還是接收方)都可以對信息進行編輯、控制和傳遞。
交互性向用戶提供了更加有效的控制和使用信息的手段與方法,同時也為應用開辟了更加廣闊的領域。交互可做到自由地控制和干預信息的處理,增加對信息的注意力和理解,延長信息的保留時間。當交互性引入時,活動(Activity)本身作為一種媒體介入了信息轉變為知識的過程。借助于活動,我們可以獲得更多的信息,如在計算機輔助教學、模擬訓練、虛擬現實等方面都已取得了巨大的成功。媒體信息的簡單檢索與顯示,是多媒體的初級交互應用;通過交互特性使用戶介入到信息的活動過程中,才達到了交互應用的中級水平;當用戶完全進入到一個與信息環境一體化的虛擬信息空間自由遨游時,才是交互應用的高級階段,這有待于虛擬現實或臨境(VirtualReality)技術的進一步研究和發展。
3.協同性
每一種媒體都有其自身規律,各種媒體之間必須有機地配合才能協調一致。多種媒體之間的協調以及時間、空間的協調是多媒體的關鍵技術之一。
4.實時性
所謂實時,就是在人的感官系統允許的情況下進行多媒體交互,就好像面對面(Face-to-Face)一樣,圖像和聲音都是連續的。實時多媒體分布系統能把計算機的交互性、通信的分布性和電視的真實性有機地結合在一起。
5.集成性
多媒體技術是多種媒體的有機集成,它集文字、文本、圖形、圖像、視頻、語音等多種媒體信息于一體。目前,多種媒體還在進一步深入研究中,如觸覺、味覺、嗅覺。多種媒體的集成是多媒體技術的一個重要特點,但要想完全像人一樣從多種渠道獲取信息,還有相當的距離。多媒體的集成性應該說是在系統級上的一次飛躍。早期多媒體中的各項技術和產品幾乎都是由不同廠商根據不同的方法和環境開發研制出來的,基本上只能單一、零散和孤立地被使用,在能力和性能上很難滿足用戶日益增強的信息處理需求。但當它們在多媒體的旗幟下大會師時,一方面意味著技術已經發展到相當成熟的程度,另一方面也意味著各自獨立的發展不再能滿足應用的需要。信息空間的不完整,開發工具的不可協作性,信息交互的單調性等都將嚴重地制約和限制著多媒體系統的全面發展。因此,多媒體的集成性主要表現在兩個方面:多媒體信息的集成和操作這些媒體信息的工具與設備的集成。對于前者而言,各種信息媒體應能按照一定的數據模型和組織結構集成為一個有機的整體,這對媒體的充分共享和操作使用是非常重要的。多媒體的各種處理工具與設備集成,強調了與多媒體相關的各種硬件的集成和軟件的集成,為多媒體系統的開發和實現建立了一個理想的集成環境,目的是提高多媒體軟件的生產力。1.1.3多媒體中的媒體元素
多媒體中的媒體元素是指多媒體應用中可顯示給用戶的媒體的組成,如文本、圖形、圖像、動畫、音頻和視頻,如圖1-1所示。圖1-1多媒體元素文本分為非格式化文本文件和格式化文本文件。非格式化文本文件是指只有文本信息而沒有其他任何有關格式信息的文件,又稱為純文本文件,如“.TXT”文件。格式化文本文件是指帶有各種文本排版信息等格式信息的文本文件,如“.DOC”文件。
圖形(Graphic)一般是指用計算機繪制的畫面,如直線、圓、圓弧、矩形、任意曲線和圖表等。圖形的格式是一組描述點、線、面等幾何圖形的大小、形狀及其位置、維數的指令集合。在圖形文件中,只記錄生成圖的算法和圖上的某些特征點,因此也稱矢量圖。用于產生和編輯矢量圖形的程序通常稱為“draw”程序。計算機上常用的矢量圖形文件有“.3DS”(用于3D造型)、“.DXF”(用于CAD)、“.WMF”(用于桌面出版)等。由于圖形只保存算法和特征點,因此其占用的存儲空間很小。但圖形顯示時需經過重新計算,因而顯示速度相對慢些。圖像(Image)是指由輸入設備捕捉的實際場景畫面,或以數字化形式存儲的任意畫面。靜止的圖像是一個矩陣,陣列中的各項數字用來描述構成圖像的各個點(稱為像素點pixel)的強度與顏色等信息,這種圖像也稱為位圖(bit-mappedpicture)。用于生成和編輯位圖圖像的軟件通常稱為“paint”程序。圖像文件在計算機中的存儲格式有多種,如?.BMP、.PCX、.TIF、.TGA、.GIF、.JPG等,一般數據量都較大。
圖像處理時要考慮三個要素:分辨率、圖像深度與顯示深度及圖像文件大小,如圖1-2所示。圖1-2圖像處理三要素數字音頻(Audio)可分為波形聲音語音和音樂。波形聲音實際上已經包含了所有的聲音形式,它可以將任何聲音進行采樣量化,相應的文件格式是?.WAV文件或?.VOC文件。語音也是一種波形,所以和波形聲音的文件格式相同。音樂是符號化了的聲音,樂譜可轉變為符號媒體的形式,對應的文件格式是?.MID或?.CMF文件。計算機音頻技術主要包括聲音的采集、數字化、壓縮/解壓縮以及聲音的播放。數字化主要包括采樣和量化這兩個方面。采樣頻率(samplingrate)是將模擬聲音波形轉換為數字時每秒所抽取聲波幅度樣本的次數,單位是Hz(赫茲)。量化數據位數(也稱量化級)是每個采樣點能夠表示的數據范圍,經常采用的有8位、12位和16位。例如,8位量化級表示每個采樣點可以表示256個不同的量化值,而16位量化級則可以表示65536個不同的量化值。記錄聲音時,如果每次生成一個聲波數據,則稱為單聲道;如果每次生成兩個聲波數據,則稱為立體聲(雙聲道)。動畫是活動的畫面,其實質是一幅幅靜態圖像的連續播放。動畫的連續播放既指時間上的連續,也指圖像內容上的連續。計算機設計的動畫有兩種:一種是幀動畫,一種是造型動畫。幀動畫是由一幅幅位圖組成的連續的畫面,就如電影膠片或視頻畫面一樣,要分別設計每屏幕顯示的畫面。造型動畫是對每一個運動的物體分別進行設計,賦予每個動元一些特征,然后用這些動元構成完整的幀畫面。動元的表演和行為是由制作表組成的腳本來控制的。存儲動畫的文件格式有?.FLC、.MMM等。視頻是由一幅幅單獨的畫面序列(幀frame)組成的,這些畫面以一定的速率(f/s)連續地投射在屏幕上,使觀察者產生圖像連續運動的感覺。視頻文件的存儲格式有?.AVI、.MPG、.MOV等。視頻標準主要有NTSC制和PAL制兩種:NTSC標準為30?f/s,每幀525行;PAL標準為25?f/s,每幀625行。視頻的技術參數有幀速、數據量和圖像質量。1.2.1多媒體走進家庭
1.家庭教育
眾所周知,通過對人體多種感官的刺激,更能加深人們對新鮮事物的印象,從而取得更好的學習效果。將多媒體應用到教育領域來幫助人們學習,其效率強于傳統的教學方式。這是因為,多媒體不僅能以文字和聲音的形式告訴用戶某件事物,而且還能用普通課堂上難以使用的動態影像和動畫展現某一文字語言難以表達的事物。1.2多媒體技術的應用與發展而在計算機教學中,目前得益最深的算是語言教學,因為語言教學需要聲音,而這正是多媒體的技術優勢。現在的多媒體應用軟件中,其內容大多為語音教學。如新加坡雙語公司出版的語言教學系列軟件,在目前的光盤軟件市場中有相當的占有率。多媒體學習軟件的另一種類型就是形形色色的知識性光盤,如“大百科全書”軟件等,用生動的方式展現了各種各樣的學習內容。
2.信息查詢
多媒體為家庭生活提供了便利,豐富了生活內容,例如,孩子們在計算機上通過使用鼠標器就可查詢歷史事件,進行海底旅行和宇宙漫游。
3.娛樂
計算機剛出現時,人們對它的要求是數學運算和邏輯判斷,后來發現,還能利用計算機玩游戲。為了讓計算機游戲更加形象,能發出各種聲音,導致了多媒體一個重要部件——音頻卡的產生。隨著多媒體技術的不斷發展,多媒體在娛樂中的應用不僅包括三維游戲,還加入了欣賞音樂CD、觀看VCD、制作/聆聽計算機數字音樂(MIDI),以及越來越完善的數字視頻(DVD)、多媒體視頻點播系統(VOD,如圖1-3所示)、多媒體家電(信息家電)。圖1-3多媒體視頻點播系統
VOD系統由四部分組成,即視頻服務器、數字視頻解碼器/接收器(機頂盒)、帶寬交換網絡和用戶接入網絡。視頻服務器主要用來為用戶提供視頻數據流,響應用戶的請求,協調多個用戶的傳送。一般的視頻服務器可安裝上百至上千部電影,供用戶點播。機頂盒的功能是節目選擇、解碼以及狀態診斷和出錯處理。帶寬交換網絡主要提供節目和信道數據的傳輸與交換。用戶接入網絡是指從交換局到用戶間的線路設備,如光纖到路邊(FTTC)、光纖到大樓(FTTB)和光纖到戶(FTTH)。
VOD系統的主要功能是,在一個小區中用戶不需要從電視頻道上收看電視節目,而可以任意點播視頻點播系統中的影片,并可隨意切換、重復點播,用戶能夠控制快進與快退、向前與向后查看、開始、暫停、取消或移到別的場景。另外,用戶還可利用該系統對新聞、卡拉OK、游戲等進行點播,條件是這些內容必須事先裝入系統中。隨著數字電視的普及,多媒體視頻點播系統將會得到進一步的發展。多媒體家電是多媒體應用中一個很大的領域。過去,人們常說計算機和電視機合一,即計算機電視(Comvision)和電視計算機(Teleputer)。現在,在計算機上插一塊板就可以看電視了。數字電視已經進入市場,它是將電視信號進行數字化采樣,經過壓縮后進行播放。數字電視有兩種類型:一種是投影數字電視,分辨率為1920×1080;一種是大屏幕顯像管數字電視,分辨率為1280×720,并提供16:9的寬屏。我國現在已有多套節目的數字電視通過衛星播送,但由于計算機和電視的掃描方式不同,電視機為提高速率采用隔行掃描,而計算機為了提高分辨率采用逐行掃描,如何統一還需進一步發展。但是,數字電視必將代替模擬電視,使計算機和電視走向融合。
另外,微軟公司在我國發布了舉世矚目的“維納斯”計劃,相信其他家電(如電話、傳真機、錄像機等)也會隨著這一計劃的發展逐漸走向統一和融合。1.2.2多媒體進入學校
以計算機為中心的多媒體技術的崛起,不但給現代教育帶來了極大的沖擊力,也給現代教育注入了新的生命力,使其產生了一次重大飛躍。教育領域是多媒體技術最重要、最有發展前途的應用領域之一。多媒體技術代表著教育技術的方向、趨勢和未來,它直接影響到學校教育、遠程教育和未來的家庭教育。隨著多媒體技術進入教育領域,不僅傳統的教學思想、教學手段、教學內容、教學過程、教學組織隨之發生變化,而且將引起傳統的教學模式和教育體制的根本變革。多媒體的交互軟件、圖像、聲響將在教學中發揮主力軍作用,教育工作者長期追求的“寓教于樂”的理想正在逐步變成現實。
1.進行交互式學習
傳統的教學模式主要是世代沿襲的面對面的單向式課堂教學。課堂上,教師主要通過第二信號系統(語言)傳遞信息,而第一信號系統(圖像)很少發揮作用。學生始終處于被動地位,不能調動學生的學習積極性,而且教師只能根據大多數學生的水平掌握課程進度,不能兼顧“兩頭”的學生,特別是不能兼顧學習成績差的學生。學生學得累,教師教得也累。20世紀80年代初,隨著教育技術的迅速進步,幻燈機、投影機、錄音機、錄像機、計算機等教學媒體先后運用到了教學中,使教學活動變得靈活多樣,豐富了課堂教學方式,對提高教學質量起到了極大的推動作用。但是,這些媒體在承載信息的種類和能力、使用的方便程度上都有極大的局限性。多媒體技術的崛起突破了傳統媒體的束縛,解決了這一難題。人們依照現代的教育理論,實現了多種媒體的優化組合。多媒體教學軟件取代了各種單獨使用的媒體,集所有媒體的功能于一身。該軟件以配備了聲霸卡、視霸卡、電視卡、DVD-ROM的計算機為中心,統一調度指揮各種媒體,大大減少了人為的操作失誤,高速可靠。教師只需操作鼠標或觸摸顯示屏的相應部位,即可完成操作,教師用起來得心應手,學生感知起來格外親切。這個教學過程充分發揮人機對話、雙向交互、獨立思考、強化訓練等方面的優勢,是傳統教學過程所無法比擬的。由于多媒體綜合了計算機技術、通信技術、視聽技術,因而其既可以為學生提供傳統的授課方式,也可以提供交互式學習方式和以個人自學為主的個別化學習方式,而師生通過提示性界面的簡單操作,即可獲取學習資料,學習多學科知識。多媒體還可以模擬交際環境,使學生在聽到聲音的同時,看到相關的真實畫面,實現語畫同步,聲情并茂。學生視聽結合,如臨其境,使教材的思想性與藝術性充分結合,邏輯性與直觀性同時并重,創造出與講授內容相關的豐富生動的學習環境,啟發學生的形象思維,使學生富于聯想,樂于表現,相互學習,逐步提高分析和解決問題的能力。更重要的是,多媒體技術出現以前的教學媒體,雖然引入了現代化的教學手段,但只是單向刺激,學生始終處于被動、從屬、消極的地位,沒有交互作用的功能,學生無法主動參與。多媒體則提供了人機交互作用的方式,計算機信息“刺激”學生,學生又把“反應”反饋給計算機。計算機隨時可以了解學生掌握的程度,根據學生的實際水平,自動提高或降低學習進度,使個別教學和因材施教成為現實。這樣,教師按照預先的教學設計,根據多媒體提供的信息,依據不同的目標,選擇相應的教學軟件,制定優化的學習程序,確定適宜的信息傳輸量,通過反饋調節,充分發揮各要素的功能,實現教學效果的最優化。
2.模擬試驗和演示(虛擬實驗室)
多媒體可以逼真地展現實驗過程。更有意義的是,利用交互式多媒體可讓學生無需顧慮實驗器材和實驗規則,隨心所欲地利用多媒體提供的“實驗材料”來完成實驗。這種未來的實驗室也稱“開放實驗室”。
3.信息查詢和檢索(虛擬圖書館)
在學校或家里,學生可以使用多媒體虛擬圖書館快速地查詢所需的圖書及技術資料。1.2.3多媒體用于商業和企事業單位
多媒體技術能發揮企業的競爭優勢,其威力已被工商界和政府所認識,并已影響到培訓、教育、零售、商展、通信等行業。
1.分布式多媒體系統的應用
分布式多媒體系統包括分布式多媒體會議系統、多媒體視頻點播系統、多媒體監控及監測系統、遠程醫療和遠程教學系統以及電視購物和家庭辦公等多種應用系統。
1)多媒體會議系統
多媒體會議系統包括會議控制和管理系統、文件和程序共享并提供交互使用的電子白板、基于超文本和超媒體的文檔制作系統、多媒體管理數據庫以及音頻、視頻、實時采集壓縮和傳輸系統。多媒體會議系統可以是點對點多媒體信息的交互和傳輸,也可以是點對多和多對多的交互和傳輸。其網絡平臺可以在局域網上運行,也可以在令牌環網、城域網、廣域網以及ISDN網上運行,甚至可以在Internet、Intranet或公用電話網(PSTN)上運行。其工作方式既可以是單向(如廣播方式),也可以是雙向(信息交互雙方均可以進行信息的發送和接收)和雙工(信息交互雙方可以同時進行信息的發送和接收)的實時多媒體信息交互傳輸。目前,在局域網和ISDN網上都已推出了多媒體會議系統的實用產品。在ISDN網上一般按H.320協議規范,局域網按H.323協議規范,而公用電話網則按H.324協議規范。目前推出的完全按照協議標準的多媒體會議系統已越來越多,這為會議系統的普及和推廣提供了方便。多媒體會議系統一般分為兩大類,一類是基于會議室的視頻會議系統(Room-basedVideoConferencing),如圖1-4所示,另一類是桌面視頻會議系統(Desk-topVideoConferencing)。前者主要用于會議室,在室內設一個節點(終點會議室),當然也可以把全部會議設備安裝在一個可移動的支架上,在不同的會議室間來回移動。全球已安裝會議室型系統6萬余臺,截至2006年底,我國已建立了國家會議電視骨干網。生產這類系統的廠家有PictureTel、美國視訊公司Vtel和CLI、英國的GPT公司和BT公司、日本的Sony公司等。桌面視頻會議系統是基于微機的會議系統,它既可以作為會議系統使用,也可以獨立作為微機使用,比較方便、靈活。國外著名的產品有:Intel公司的Proshare200系統,支持H.320標準協議,在LAN和窄帶ISDN網上可實現20幀/秒的傳輸;CLI公司的DesktopVideo,在ISDN網上使用。國內也有不少單位推出了多媒體會議系統,如深圳華為公司推出的會議室型系統,清華大學計算機系推出的基于MPEG-1的桌面會議系統,這二者利用H.323標準,在局域網平臺上實現;還有其他一些科研單位和院校也推出了相應的系統。圖1-4多媒體視頻會議系統
2)多媒體監控及監測系統
現在有不少企業為了提高效率,減少人員開銷,實行了無人管理,即采用監控、監測系統,定期采集儀器儀表數據,一旦發現問題,采用自動控制或集中人工干預,如電力系統對電廠、變電站的管理,以及石油、化工行業中一些部門的管理。另外,一些部門因工作需要而應進行實時監控(如海關、銀行出納、大型運動會),以及一些危險部門的管理監控(如核能的監控、水下作業的監控等)。
3)遠程醫療和遠程教學系統
多媒體技術發展到現在,已具備了進行遠程醫療和遠程教學的條件。利用電視會議雙向或雙工音頻及視頻,與病人面對面地交談,進行遠程咨詢和檢查,從而進行遠程會診,甚至在遠程專家的指導下進行復雜的手術,并在醫院與醫院之間,甚至國與國之間的醫療系統建立起信息通道,實現信息共享,國外已在不同網絡(如ISDN、Internet、ATM和公用電話網)上實現了遠程醫療。在波黑戰爭中,美國后方醫療中心就是借助遠程醫療系統來幫助前方搶救傷員。該技術目前的瓶頸問題是網絡的帶寬和費用的問題需要進一步解決。至于遠程教學,目前,中央電大、各大專院校都在花大力氣重點實施,以解決邊遠地區的教育質量,以及進行專業文化的普及提高。遠程教育一般的解決辦法是通過衛星發射和接收,只要能接收到衛星頻道的地方,就可以接受一流學校優秀教師的現場教學。但要解決邊遠地區的遠程教學,還有待于通信網絡的普及和費用的降低。
2.多媒體在工業中的應用
計算機早已在工業界得到了廣泛的應用,而多媒體技術的出現,使計算機在工業中的應用提升到了一個新的高度。目前,它在工業中的應用表現在:
(1)改變了產品的設計制造方式。制造業中的虛擬制造,是指利用多媒體技術進行產品設計,并仿真制造過程和最終產品。這種基于制造的設計方式成本低廉,豐富了設計方案,避免了無效制造。
(2)對高危險性生產現場進行監控。在這些生產場所,一般不適合工作人員直接靠近或進行操作,比較先進的做法是利用閉路電視監視,但該方法只能監視,無法控制。而交互式多媒體則可以二者兼顧,既能直觀、實時地反映現場狀況,又能使工作人員在現場之外操縱生產工程。
(3)改變了人與機器設備的交互方式。多媒體豐富的圖像和語音技術,能使工作人員輕松直觀地操縱機器。例如,在煤礦報警系統中,如有緊急情況出現,計算機可以根據事故原因自動選擇相應的語音向操縱人員播放。該技術改變了以往單調的報警方式,提高了工作效率。
3.多媒體在醫學中的應用
計算機在醫療領域已得到廣泛應用,多媒體技術的介入,為進一步研究人體自身提供了更便利的條件,大大提高了醫學的診斷、分析、處理和控制水平。目前,多媒體在醫學中應用較活躍的領域有:
(1)醫療數據庫。在信息化社會中,電子病歷應運而生,它包括有關病人病情的一切文本、圖像、圖形和聲音信息,非多媒體數據庫不能完成。醫生能夠充分利用多媒體信息,為診斷、研究提供有效的幫助。
(2)醫療專家系統。采用多媒體技術作為人工智能的核心,集多種知識表達為一體(知識媒體包括文字、圖形、圖像、影像和聲音)的醫療專家系統可以有效模擬醫生的臨床診斷,是未來醫療專家系統的發展方向,如圖1-5所示。圖1-5多媒體醫療專家系統
4.多媒體在出版業中的應用
電子出版物已成為出版界的新秀,多媒體出版物更是獨領風騷,其主要以光盤形式出版,包括CD-ROM、VCD、DVD等。與傳統出版物相比,多媒體出版物的優勢表現在以下方面:
(1)圖、文、聲并茂。采用多媒體技術編輯制作的電子圖書可以將彩色圖形、圖像、多文種文字、多語種聲音、音樂、三維動畫等信息進行綜合處理、表現,使讀者能方便、迅速、直觀地獲取圖、文、聲并茂的立體信息。
(2)價格較低。隨著壓縮技術的提高,光盤存儲量越來越大。在美國,光盤的價格遠遠低于圖書,一本200多頁的圖書一般售價在30美元以上,而一張具有680?MB信息量的CD-ROM僅售幾美元。
多媒體出版物還有便于攜帶、檢索和查詢等優點,諸多優點將給它帶來廣闊的市場。
5.多媒體在通信業中的應用
回歸到多媒體的本質,即多種形式的信息互動式交流,那么多媒體的應用范圍肯定包括通信。以上的兩種多媒體應用其實都是人和計算機之間的信息交流,其實在人際信息交流中,多媒體應用也顯得極為重要。不同的交流形式適合不同內容的信息,而多種信息交流形式的相互補充,又能加深信息交流的有效性,這就導致人們最終將多媒體技術應用到視頻電話上,因為它能同時進行文字、語音、圖形和圖像的交流。隨著國際互聯網在我國的普及和提高,通過互聯網打國際長途電話、甚至是可視電話都已成為事實。另一方面,以往我們瀏覽互聯網時,看到的只是文字和圖像,而如今還包括了語音、音樂、動態圖像、動畫和三維影像。用戶通過互聯網得到的,確確實實是多媒體信息。1.3.1多媒體的主要關鍵技術
多媒體系統需要將不同的媒體數據表示成統一的結構碼流,然后對其進行變換、重組和分析處理,以進一步地存儲、傳送、輸出和交互控制。所以,多媒體的傳統關鍵技術主要集中在以下四類:數據壓縮技術、大規模集成電路(VLSI)制造技術、大容量光盤存儲器(DVD-ROM)、實時多任務操作系統。正是因為這些技術取得了突破性的進展,多媒體技術才得以迅速發展,而成為今天這樣具有強大的處理聲音、文字、圖像等媒體信息能力的高科技技術。1.3多媒體研究的主要關鍵技術
但說到當前用于互聯網的多媒體關鍵技術,有些專家卻認為,可以按層次分為媒體處理與編碼技術、多媒體系統技術、多媒體信息組織與管理技術、多媒體通信網絡技術、多媒體人機接口與虛擬現實技術以及多媒體應用技術這六個方面。另外,還應該包括多媒體同步技術、多媒體操作系統技術、多媒體中間件技術、多媒體交換技術、多媒體數據庫技術、超媒體技術、基于內容檢索技術、多媒體通信中的QoS管理技術、多媒體會議系統技術、多媒體視頻點播與交互電視技術、虛擬實景空間技術等。
由于多媒體是多學科、多領域的融合,因而它的研究范圍非常廣泛。與此同時,多媒體研究涉及諸多技術難題,其中主要有以下幾個方面。1.3.2數據壓縮
數據壓縮(DataCompression)技術在計算機科學中早已存在,其用途很多。當前,由于圖像等多媒體信息的研究和實用化,以及大容量、高速度通信和處理的需求,因而使數據壓縮技術變為不可缺少的一項技術,也使它成為計算機領域中的一個熱點。早期以字符信息處理為主,其信息量一般在幾萬個字節以下,一般不需要對數據進行壓縮處理。在多媒體系統中,各種媒體信息(特別是圖像和動態視頻)數據量非常之大,所需要的存儲空間是十分巨大和驚人的。例如,彩色電視信號一般是25幀/秒(PAL制式)或30幀/秒(NTSC制式),如果不經壓縮,一個1?GB的光盤(或磁盤)只能存儲約1分鐘的電視信號數據;一幅640×480分辨率的24位真彩色圖像的數據量約為900?KB;一個100?MB的磁盤只能存儲約100幅靜止圖像。語音的處理也不例外,對于音頻信號,激光唱盤(CD-DA)的采樣頻率為44.1?kHz,量化位數為16位,雙通道立體聲,100?MB硬盤僅能存儲約10分鐘錄音。
NTSC標準的幀速率為30幀/秒,視頻信號的傳輸速率約為26.4?MB/s,遠高于計算機的數據傳輸速率。在通信網絡上,以太網設計速率為100?Mb/s,實際僅能達到其一半以下的水平,大多數遠程通信網絡的速率都在每秒幾兆位以下。顯然,這樣大的數據量不僅超出了計算機的存儲和處理能力,更是當前通信信道的傳輸速率所不及的。
多媒體計算機要求具有存儲容量大、速度快、頻帶寬、實時性好、能處理多種媒體的硬軟件環境。因此,為了存儲、處理和傳輸這些數據,為了使多媒體達到實用水平,除了采用新技術手段增加存儲空間和通信寬帶外,對數據進行有效壓縮將是多媒體發展中必須解決的最關鍵的技術之一。然而,值得慶幸的是,經過多年的數據壓縮研究,從PCM編碼理論開始,到現今成為多媒體數據壓縮標準的JPEG(JointPhotographicExpertsGroup,ISO/IEC10918,靜態圖像壓縮標準)和MPEG(MotionPictureExpertsGroup,動態視頻壓縮標準),已經產生了各種各樣針對不同用途的壓縮算法、壓縮手段和實現這些算法的大規模集成電路或計算機軟件,并逐漸趨于成熟,走向市場。
現已成熟的數據壓縮方法種類繁多,可以分為無損壓縮和有損壓縮兩大類,如圖1-6所示。圖1-6數據壓縮方法下面介紹幾種常用的壓縮方法。
霍夫曼(Huffman)編碼是一種應用十分廣泛的壓縮算法,它是一種不等長格式的編碼方案。在各字符出現的頻率不均勻的情況下,它用最短的二進制位表示出現頻率最高的字,用較長的位表示出現頻率最低的字,從而使平均碼長縮短。獲得了各字符出現的頻率以后,可以根據這些頻率構造一棵用于編碼和譯碼的霍夫曼樹。該樹中葉結點代表一個字符,頻率最高的字符離根最近。構造好霍夫曼樹以后,就可以從字符序列中逐個取出字符,從根開始取該字符在樹中位置路徑上的數字作為它的編碼,以位為單位依次存放,從而實現壓縮目的。由于各字符在不同領域、不同場合出現的頻率往往是不相同的,為了獲得較好的壓縮效率,頻率的確定要以大量的統計數字為依據,這種壓縮方法稱為靜態霍夫曼壓縮。如果壓縮時動態地統計各字符出現的頻率,則這種壓縮方法稱為動態霍夫曼壓縮。實際應用中霍夫曼編碼已有很多變種。目前圖像領域中數據壓縮的國際標準有彩色靜止圖像壓縮算法(JointPhotographicExpertGroup,JPEG)、運動圖像壓縮算法(MovingPhotographicsExpertGroup,MPEG)以及電視電話/會議電視編碼方式H.261,它們均使用了霍夫曼編碼方式。圖1-7是運動圖像壓縮算法(MPEG)的過程框圖。對于音頻處理,主要經過音頻編碼形成數據流;對于圖像處理,則經過活動圖像的估算和補償、離散余弦變換、量化器、霍夫曼編碼而形成數據流,完成壓縮過程。回放時,數據流必須解壓縮。圖1-8表示了解壓縮的過程,它幾乎是壓縮算法的逆過程。圖1-7MPEG壓縮算法圖1-8MPEG解壓縮算法
LZ壓縮算法(LempletZiv)也是一種應用十分廣泛的壓縮算法。目前各類微型機都采用這種算法,如MSDOS6.0也采用了這種算法。LZ算法由一個符號串分析規則和編碼方法組成,這個分析規則把字母表分解成子串或字,其長度不超過預定的長度(通常該長度被命名為L1,并被賦予一個值,比如令L1=10),編碼方法就是把這些子串順序地映射成具有固定長度(通常該長度被命名為L2,并被賦予一個值,比如令L2=5)的可唯一譯解的碼字。選擇的串具有近似相等的出現概率,因此,頻繁出現的符號組成長的串,不常出現的符號組成短的串,以達到壓縮的目的。這種方法在探索符號出現頻率、字符重復度及高使用模式所引起的冗余度中是十分有效的。LZ算法由于壓縮率高,壓縮速度快,壓縮和解壓所用時間比合適,使它在無損壓縮(如程序)和數據庫中得到了廣泛應用。目前比較流行的壓縮算法還有離散余弦變換(DiscreteCosineTransformation)、小波變換(WaveletTransformation)和分形壓縮(FractalCompression),它們都是有損圖像壓縮。圖1-8中MPEG標準使用了離散余弦變換,它是一種正交變換編碼技術,MPEG采用幀內靜態壓縮(JPEG)和幀間運動補償(預測和內插等)相結合的方法進行壓縮。JPEG把圖像分割成8×8大小的方塊后再進行變換、量化和編碼。小波變換也是一種正交變換編碼技術,它具有付氏變換所沒有的時頻特性及多分辨率分析,它的變換是對整幅圖像進行的,量化法來自各級分辨率之間的自相似性,采用逐級逼近技術實現數據壓縮。分形壓縮主要利用分形幾何中的自相似原理,它把圖像分塊,利用仿射變換的系數表示每塊圖像數據,達到數據壓縮的目的。由于分形壓縮的快速解碼及與分辨率無關的優點,使它得以流行。數據壓縮不僅要求存儲量減少,而且對速度有較高的要求,因此,壓縮算法一般需要有快速算法,否則應用范圍將大大減少。根據不同需要,人們創造了很多壓縮算法,壓縮算法已成為計算機系統的一部分。在應用系統中,設計和選擇壓縮算法時還應考慮其他因素,如存儲和傳送的區別,實時和非實時的區別。數據壓縮研究中應注意的問題是:首先,編碼方法必須能用計算機或VLSI硬件電路高速實現;其次,要符合當前的國際標準。1.3.3多媒體數據的模型、組織與管理
數據的組織和管理是任何信息系統首先要解決的核心問題。在現代信息社會中,計算機在我們面前堆起了一座座數據大山,但我們卻常常苦于沒有從這些數據中獲取有用信息的方便工具和手段。多媒體的引入,更加劇了這種狀況的惡化。數據量大、種類繁多、關系復雜、超介質性等是多媒體數據的基本特征。以什么樣的數據模型表達和模擬這些多媒體信息空間?如何組織和存儲這些數據?如何管理這些數據?如何操縱和查詢這些數據?這些都是傳統數據庫系統的能力和方法難以勝任的。目前,人們利用面向對象(ObjectOriented,OO)的方法和機制開發了新一代的面向對象數據庫系統(ObjectOrientedDataBase,OODB),結合超媒體(Hypermedia)技術的應用,為多媒體信息的建模、組織和管理提供了非常有效的方法。與此同時,市場上也出現了多媒體數據庫管理系統。但是,OODB和多媒體數據庫的研究還很不成熟,與實際復雜數據的管理和應用要求仍有較大的差距。因而,功能強大的多媒體數據庫的研究仍是多媒體領域研究的重中之重。1.3.4多媒體信息的展現與交互
在傳統的計算機應用中,因為大多數都采用文本媒體,所以對信息的表達僅局限于顯示(Display)。在未來的多媒體環境下,各種媒體并存,視覺、聽覺、觸覺、味覺和嗅覺媒體信息的綜合與合成,就不能僅僅用顯示來完成媒體的表現了。各種媒體的時空安排和效應,相互之間的同步和合成效果,相互作用的解釋和描述等都是表達信息時所必須考慮的問題。有關信息的這種表達問題統稱為展現(Presentation)。時至今日,盡管影視聲響技術廣泛應用,但多媒體的時空合成、同步效果,可視化、可聽化以及靈活的交互方法等仍是多媒體領域需要研究和解決的棘手問題。1.3.5多媒體通信與分布處理
多媒體通信對多媒體產業的發展、普及和應用有著舉足輕重的作用,構成了整個產業發展的關鍵和瓶頸。在現行使用的通信網絡中,如電話網、廣播電視網和計算機網絡,其傳輸性能都不能很好地滿足多媒體數據數字化通信的需求。從某些意義上講,現行的數據通信設施和能力嚴重地制約著多媒體信息產業的發展,因而,多媒體通信一直被當作整個產業的基礎技術來對待。因此,真正解決多媒體通信問題的根本方法,有賴于信息高速公路的進一步發展。寬帶綜合業務數字網(BISDN)是目前解決這個問題的一個比較完整的方法,其中ATM(異步傳輸模式)是近年來在研究和開發方面的一個重要成果。多媒體的分布處理是一個十分重要的研究課題。因為要想廣泛地實現信息共享,計算機網絡及其在網絡上的分布式與協作操作就不可避免。多媒體空間的合理分布和有效的協作操作將極大地縮小個體與群體、局部與全球的工作差距。超越時空限制,充分利用信息,協同合作,相互交流,節約大量的時間和經費等是多媒體信息分布的基本目標。分布式體系結構研究,多媒體通信、交換和協作操作是目前多媒體工作的重點,還有諸多艱難的路程要走。1.3.6多媒體的軟/硬件平臺
軟件和硬件平臺(如圖1-9所示)是實現任何系統的物質基礎,多媒體系統也不例外。所謂多媒體軟/硬件平臺,實際上是由開發和應用多媒體系統的各種技術和各類設備組成的有效開發環境。硬件平臺主要指的是支撐多媒體系統的各種機器和設備,而軟件平臺主要指的是支持多媒體系統運行和開發的各類軟件和開發工具。圖1-9多媒體軟/硬件平臺在硬件的研究和開發方面,數字視頻交換卡——DVI和CDI作為最早的兩個典型的視頻多媒體接口,具有里程碑的意義。但隨著硬件技術的飛速發展,各類成熟且廣泛應用的多媒體接口卡件與播放和采集設備不斷更新換代,為多媒體的發展奠定了堅實的基礎。但是,在硬件的一體化與集成方面仍然有許多重要的任務有待完成。在軟件的研究和開發方面,與硬件相比就相差甚遠。不管是支撐多媒
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年福建省中考語文真題
- 地理實踐力培養策略研究:高中地理教學案例分析論文
- 小學生零花錢使用與道德品質養成的關聯研究論文
- 基于信息技術的初中歷史教學中算法思維培養的實證研究論文
- 中國醫藥級纖維素類衍生物行業市場前景預測及投資價值評估分析報告
- 節水洗車臺管理制度
- 規范安全臺帳范本
- 茶藝師(高級)試題含答案
- 財務管理學-自考歷年真題
- 課程大綱數學分析
- ISO9001質量管理體系培訓考試試題含答案
- 基于UHPC的蝶形腹板混凝土拱橋創新設計研究
- 2025-2030中國雷達告警接收機行業市場發展趨勢與前景展望戰略研究報告
- 一例高血壓合并糖尿病患者的個案護理課件
- 2025年中考地理務必掌握的答題思路與模板
- 臨時占地免責協議書
- 工會法律知識培訓課件
- 檔案管理員實操能力考試題試題及答案
- 供應鏈風險管理知識點及試題及答案
- 隱患排查五定制度
- BRCGS全球標準食品安全第9版標準要求
評論
0/150
提交評論