




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
圖像檢索技術綜述第一頁,共二十八頁,編輯于2023年,星期二本文主要內容圖像檢索技術的發展歷史當前主流的圖像檢索技術介紹一個圖像搜索引擎的系統模型第二頁,共二十八頁,編輯于2023年,星期二20世紀70年代:TBIR(Text-basedImageRetrieval)基于文本的圖像檢索技術沿用了傳統文本檢索技術,利用文本描述的方式表示圖像的特征。第三頁,共二十八頁,編輯于2023年,星期二早期的TBIR:手工對圖像進行注釋,工作量相當大,不可避免地會帶來主觀性和不精確性Internet環境下的TBIR:網頁信息的自動采集和標引技術索引方式:全文索引和關鍵詞索引Google,Yahoo和百度等搜索引擎所提供的圖像檢索服務,它們采用的都是TBIR技術.第四頁,共二十八頁,編輯于2023年,星期二TBIR的優點:使用成熟的文本檢索和搜索引擎技術,符合人們的檢索習慣,實現簡單第五頁,共二十八頁,編輯于2023年,星期二TBIR的缺點:標注的準確性差,也不能滿足用戶對圖像原始特征信息的檢索第六頁,共二十八頁,編輯于2023年,星期二MPEG-7國際標準化組織ISO/IEC制定的MPEG-7國際標準,該標準的正式名稱為“多媒體內容描述接口”(MultimediaContentDescriptionInterface),為各類多媒體信息提供一種標準化的描述,并將該描述與所描述的內容相關聯,極大地促進了對各種多媒體信息的快速查詢和訪問。該標準于1998年10月提出,于2001年最終完成并公布。第七頁,共二十八頁,編輯于2023年,星期二MPEG-7標準化的范圍包括:一系列的描述子(描述子是特征的表示法,一個描述子就是定義特征的語法和語義學);一系列的描述結構(詳細說明成員之間的結構和語義);一種詳細說明描述結構的語言、描述定義語言(DDL);一種或多種編碼描述方法。
第八頁,共二十八頁,編輯于2023年,星期二90年代以來:CBIR(Content-basedImageRetrieval)基于內容的圖像檢索對圖像的視覺內容,如圖像的顏色、紋理、形狀等進行分析和檢索圖像。其特點是圖像本身包含的客觀視覺特性,不需要人為干預和解釋,能夠通過計算機自動實現對圖像特征的提取和存儲。第九頁,共二十八頁,編輯于2023年,星期二CBIR進行檢索時利用的是第2層的特征。特征提取是CBIR系統最基礎的部分,在很大程度上決定了CBIR系統的成敗.[1]特征提取第3層:語義特征層人們對圖像內容概念級的反映第2層:物理特征層圖像的顏色、紋理、形狀和輪廓等低層物理特征第1層:原始數據層圖像的原始像素點圖1圖像內容的層次模型第十頁,共二十八頁,編輯于2023年,星期二1基于顏色特征的檢索實踐表明,基于顏色的CBIR系統具有較好的性能,而且實現相對容易.最常用的表達顏色特征的方法是顏色直方圖。其他常用的顏色特征表示方法還有顏色矩和顏色相關圖。[2]
第十一頁,共二十八頁,編輯于2023年,星期二2基于紋理特征的檢索紋理是一種不依賴于顏色或亮度的反映圖像中同質現象的視覺特征,對圖像灰度變化的特征進行量化,與對象的位置、走向、大小、形狀有關,與平均灰度級無關。圖像檢索中用到的紋理特征表示方法主要有:Tamura法、小波變換和自回歸紋理模型。[3]第十二頁,共二十八頁,編輯于2023年,星期二3基于形狀特征的檢索
形狀特征常與目標聯系在一起,需提取目標的輪廓或描述目標輪廓所包圍的區域的性質。因此形狀比顏色和紋理的語義性更強。基于邊界的表示:代表方法是傅里葉描述子。其基本思想是用對圖像進行傅里葉變換得到的邊界作為形狀描述.其中一個優點就是把二維問題簡化為一維問題。基于區域的表示:代表方法是不變矩法。第十三頁,共二十八頁,編輯于2023年,星期二CBIR系統向用戶提供的查詢方式示例查詢就是由用戶提交一個或幾個例子圖像,然后由系統檢索出特征與之相似的圖像.這里的“相似”,指的是上述的顏色、紋理和形狀等幾個視覺特征上的相似。草圖查詢:用戶可以簡單地畫一幅草圖,由系統檢索出視覺特征上與之相似的圖像。第十四頁,共二十八頁,編輯于2023年,星期二目前基于內容圖像檢索技術已經取得了不少的成就,一些著名的圖像檢索系統相繼被推出,有IBM的QBIC系統,哥倫比亞大學開發的Visual-SEEK,MIT多媒體實驗室開發的Photo-Book,UCBerkeley開發的Chabot系統等。第十五頁,共二十八頁,編輯于2023年,星期二CBIR利用圖像本身固有的物理信息,能夠對圖像的顏色、紋理和形狀等特征進行比較,在指紋識別、商標檢索和醫學圖像檢索等特定領域得到了廣泛應用,因為這些領域的圖像在某些特征上容易識別,比如同一個手指的指紋其紋理是一樣的。然而,Internet上的圖像來自不同的領域,根本無法捕獲其共同點,用基于內容的方法對這些圖像進行檢索,其效果遠不能令人滿意.第十六頁,共二十八頁,編輯于2023年,星期二
基于語義的圖像檢索基于語義的圖像檢索的目的,就是要使計算機檢索圖像的能力達到人的理解水平。在圖1所示的圖像內容層次模型中,語義位于最高層:第3層。第2層和第3層之間的差別被許多學者稱為“語義鴻溝”(semanticgap)。縮小語義鴻溝的辦法有2種:由高層語義導出低層特征和由低層特征向高層語義的轉換。第十七頁,共二十八頁,編輯于2023年,星期二
在原有檢索系統中加入高級語義到低層特征的轉化,可以在不改變現有的圖像特征庫和匹配方式的情況下,實現基于語義的圖像檢索,其基本框圖見圖2.
圖像語義的提前過程是由低層特征向高層語義轉化的過程。在獲取語義和有效地表達語義的基礎上,可以建立語義索引,提取圖像語義的模型見圖3。第十八頁,共二十八頁,編輯于2023年,星期二高層語義導出低層特征反饋信息檢索結果圖像數據庫管理特征比較圖像特征庫特征提取圖2基于語義的圖像檢索系統框圖結果輸出圖像數據庫管理語義查詢相似性比較第十九頁,共二十八頁,編輯于2023年,星期二對象空間關系分析對象識別圖像分割局部視覺特征提取全局抽象語義處理全局視覺特征提取圖像標注用戶交互外部信息原始圖像圖像語義描述圖3圖像語義提取模型利用系統知識的語義提取基于系統交互的語義生成基于外部信息的語義提取第二十頁,共二十八頁,編輯于2023年,星期二基于反饋的圖像檢索
相關反饋方法的基本思想是在檢索過程中,允許用戶對檢索結果進行評價和標記,指出結果中哪些是用戶希望得到的查詢圖像,哪些是不相關的,然后將用戶標記的相關信息作為訓練樣本反饋給系統進行學習,指導下一輪檢索,從而使得檢索結果更符合用戶的需要。第二十一頁,共二十八頁,編輯于2023年,星期二基于知識的圖像檢索將人工智能領域的基于知識的處理方法引入到圖像處理領域,通過對圖像理解、知識表達、機器學習,并結合專家和用戶的先驗知識,建立圖像知識庫實現對圖像數據庫的智能檢索。主要涉及到自然語言理解、專家系統、知識表達和機器學習等人工智能的主要研究領域。第二十二頁,共二十八頁,編輯于2023年,星期二一個圖像搜索引擎的系統模型SeekImg系統是華中科技大學圖像識別與人工智能研究所開發的,一個www上的圖像搜索引擎的原型系統。[4]該系統采用Internet搜索技術、圖像自動識別技術和基于內容的圖像檢索技術,基于C1ient/Server架構和MicrosoftSQLServer/NT平臺研制開發。第二十三頁,共二十八頁,編輯于2023年,星期二SeekImg由四部分組成:爬蟲部分、圖像處理、圖像數據庫和查詢服務器。爬蟲圖像處理查詢界面用戶圖像處理數據庫數據庫維護圖4SeekImg的系統結構圖
示例圖像文字信息結果示例圖像索引向量文字信息圖像索引向量文字信息第二十四頁,共二十八頁,編輯于2023年,星期二爬蟲又稱為“www圖片自動搜尋和下載模塊”,主要完成從www網站上尋找圖片并下載到系統的服務器上;圖像處理部分是SeekImg的核心模塊,主要完成下載的圖像的自動分析和特征信息的自動提取;數據庫部分在服務器端完成SeekImg的圖像信息組織,在客戶端接受用戶的例子圖像,通過基于內容的圖像檢索算法,完成對服務器端圖像信息的檢索,并將結果輸出給用戶。[5]第二十五頁,共二十八頁,編輯于2023年,星期二用戶可采用的三種查詢方式:①當用戶采用傳統的關鍵字檢索方式時,利用圖像數據庫中的關鍵字字段進行檢索。②當用戶提供了示例圖像時,先對示例圖像產生索引向量,采用某種距離度量算法,算出示例圖像和圖像數據庫中圖片的索引向量之間的距離,得到距離最近的若干幅圖片。③用戶也可以指定圖像特征,例如,紅色30%,黃色50%。服務器將構造出索引向量,然后找出距離最近的若干幅圖片。第二十六頁,共二十八頁,編輯于2023年,星期二參考文獻[1]賀玲,吳玲達,蔡益朝.
CBIR中的索引技術綜述[J].小型微型計算機系統.2006,vol.27:141-145[2]劉忠偉,章毓晉.十種基于顏色特征的圖像檢索算法的比較和分析[J].信號處理,2OOO,16(1):79-84[3]MAWY,ZHANGHJ.BenchmarkingofImageFeaturesforContent-basedRetrieval[C]//The32ndAsilomarConferenceonSignals,Systems&Computer
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年四川省廣元市中考歷史真題
- 高中校園手工制作活動對學生科學探究能力的培養策略論文
- 芯片出入庫管理制度
- 蘋果店庫存管理制度
- 草莓園全年管理制度
- 茶文化創業計劃書
- 《一年級下冊語文園地五》課件
- 高二人教版高中英語模塊56有效課型課堂教學設計及案例分析鄭秋秋
- vivo智能手機營銷策劃案
- 財產分割協議書
- 【高教版】中職數學拓展模塊:31《排列與組合》課件
- 招標代理公司內部監督管理制度
- 達林頓三極管
- 電力電子單相橋式整流電路設計報告
- 正常心電圖及常見心律失常心電圖的表現
- 蠟筆小新優質獲獎課件
- 油罐車駕駛員日常考核細則
- 主體結構工程驗收自評報告
- 中國音樂史與名作欣賞智慧樹知到答案章節測試2023年吉林師范大學
- 各級醫療機構醫院分級診療18個常見病分級診療流程(2023年版)
- BEC商務英語中級考試閱讀真題
評論
0/150
提交評論