



版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、項目編號: 2015007CALIS 全國農(nóng)學(xué)文獻信息中心研究項目結(jié)題報告項目名稱:基于內(nèi)容圖像檢索技術(shù)在數(shù)字圖書館中的應(yīng)用項目關(guān)鍵詞:圖像檢索、數(shù)字圖書館、基于內(nèi)容項目單位(蓋章):大連海洋大學(xué)圖書館通信地址 :大連市沙河口區(qū)黑石礁街52 號大連海洋大學(xué)項目主持人:邢旭峰聯(lián)系電話xf電子郵件:提交日期:2016年 5月 20 日項目結(jié)題驗收單1 專家驗收表項目名稱主持人所在單位專家意見基于內(nèi)容圖像檢索技術(shù)在數(shù)字圖書館中的應(yīng)用邢旭峰職務(wù) /職稱中級(加蓋公章)本課題以圖像等多媒體信息檢索為研究方向,在收集并分析了目前已有的數(shù)字圖書館中使用的圖像檢索技術(shù)后,對圖像特征匹
2、配及相似度計算進行了研究,并以面向海量圖像數(shù)據(jù)的檢索技術(shù)作為研究重點,主要解決如何面向海量圖像數(shù)據(jù)實現(xiàn)圖像檢索。該部分研究包含了三個方面:圖像索引技術(shù)的研究、快速反饋處理方法的研究、圖像特征與文本信息相結(jié)合的快速檢索方法的研究。本課題通過對圖像索引技術(shù)的探索研究,目的是要解決如何在復(fù)雜的高維特征向量基礎(chǔ)上構(gòu)建索引,并且所構(gòu)建的索引能有效的提升圖像檢索速度。該研究可以在圖書館圖書的檢索、數(shù)字安全、版權(quán)保護等方面提供非常有利的支持,為數(shù)字圖書館的發(fā)展提供了有利的支持,特別是在大數(shù)據(jù)來臨的時代,數(shù)字圖像檢索技術(shù)可以有效的解決數(shù)字圖書館中圖片冗余、查找困難、管理困難等問題。聽取項目組匯報后, 驗收專家
3、組本著公正、 公平的原則對該項目進行了驗收,經(jīng)審議一致通過?。ㄈ缧枰稍黾禹摂?shù))專家簽字郭顯久盧笑明王本欣張紅白麗杰職務(wù)/職稱第一章研究背景、目的及意義數(shù)字圖書館是伴隨著計算機技術(shù)、存儲技術(shù)和Internet技術(shù)的發(fā)展和普及而逐步興起的。在 20世紀 90年代 ,歐美發(fā)達國家逐步開始把數(shù)字圖書館列入發(fā)展計劃。數(shù)字圖書館是傳統(tǒng)圖書館在信息時代的發(fā)展,它不但包含了傳統(tǒng)圖書館的功能,向社會公眾提供相應(yīng)的服務(wù),還融合了博物館、檔案館等其他信息資源,提供綜合的公共信息訪問服務(wù)。數(shù)字圖書館將成為未來社會的公共信息中心和樞紐, 數(shù)字化將是未來圖書館的發(fā)展方向。數(shù)字圖書館不同于傳統(tǒng)意義上的圖書管理軟件系統(tǒng)。傳
4、統(tǒng)意義上的圖書管理軟件系統(tǒng)是典型的 MIS 軟件 , 由前臺和后臺組成,它負責保存、查詢圖書的庫存和借閱狀況, 統(tǒng)計圖書信息。其數(shù)據(jù)庫中的基本信息是指圖書的名稱、作者、出版社等圖書屬性, 而不是圖書內(nèi)容。它僅僅為圖書管理人員提供了一種方便的管理手段,為讀者提供了一種方便的查詢圖書的手段,但不能替代紙介質(zhì)圖書。 而數(shù)字圖書館從內(nèi)容上講,具有傳統(tǒng)意義上的圖書管理和圖書的功能;從載體上看 , 不僅有傳統(tǒng)的紙介質(zhì)書籍的內(nèi)容, 而且可以包括圖像、音頻、視頻等多媒體信息。隨著存儲技術(shù)、 網(wǎng)絡(luò)技術(shù)發(fā)展 , 數(shù)字圖書館系統(tǒng)中的信息存儲不再是問題, 但多媒體信息的檢索仍是當前的技術(shù)難點。文本信息借助于傳統(tǒng)的關(guān)系
5、數(shù)據(jù)庫系統(tǒng)可以非常方便地實現(xiàn)圖書的查詢等管理,用戶可以輸入關(guān)鍵詞等方式實現(xiàn)信息的檢索。但圖像等多媒體信息很難通過關(guān)鍵詞方式實現(xiàn)準確的檢索。為了更好的服務(wù)于讀者、讓讀者在數(shù)字圖書館中快速、便捷的檢索到需要的信息,在數(shù)字圖書館中使用基于內(nèi)容的圖像檢索技術(shù)勢在必行。直方圖作為圖像的特征2;曹莉華等人提出在對HSV色彩空間進行非均勻量化的基礎(chǔ)上建立 72 柄顏色直方圖進行圖像檢索3 ;目前最新研究是蘇小紅等人提出的基于凸包的顏色直方圖4 。在形狀特征提取方面, 早期的研究包括: 基于狹長度的形狀表示 5 ,邊界輪廓特征的提取 6 ,形狀背景描述符 7 ,形狀區(qū)域的劃分 8,及基于矩的特征表示 9等。目
6、前最新研究是, 基于 Rando變換來描述形狀特征10 。在紋理特征提取方面,早期研究包括:灰度共生矩陣方法11 、 Gabor濾波的應(yīng)用12 、基于LBP 算法的特征表示13 等。目前該方向的最新研究主要是基于Wavelet特征表示和高斯分布的紋理圖像檢索 14 。除了以上三種常用的底層視覺特征之外,近年的研究更多集中于局部特征的提取 15 。局部特征的提取一般分為兩個步驟,首先進行興趣點檢測,其次在興趣點的基礎(chǔ)上提取特征描述。興趣點是指圖像中信息含量較高的點,這些點能很好的表示圖像的基本特征。傳統(tǒng)的興趣點檢測算法包括:Harris算法 16 ,KLT 算法 17 ,Loupias算法等?;?/p>
7、于興趣點的圖像檢索技術(shù)最新研究有:基于KLT 特征點匹配的檢索算法,Harris特征點與SIFT 特征相結(jié)合的檢索方法,多尺度特征點及其匹配技術(shù)等。(2) 、圖像特征匹配及相似度計算的研究:在提取圖像特征之后,通過特征匹配即可計算圖像間的相似度。常用的特征匹配方法一般有兩種,一是特征向量間的距離計算,所得到的距離值與圖像間相似度成反比關(guān)系;二是特征向量間的匹配程度計算,所得到的匹配程度與圖像間相似度成正比關(guān)系。在距離計算方面,傳統(tǒng)的方法有: Hafner 等人提出以顏色直方圖之間的二次距離作為圖像相似性度量的方法等;最新的方法有: Frome等人提出的局部距離函數(shù)及全局一致性的距離函數(shù);Wei
8、 Liu 等人提出了半監(jiān)督距離測量學(xué)習(xí)算法等。傳統(tǒng)方法主要優(yōu)點是簡單且容易實現(xiàn),缺點是精確性較差;最新方法主要是將反饋學(xué)習(xí)引入到距離測量中用來修正距離函數(shù),這樣將大大提高結(jié)果的精確性,但需要反饋過程。(3) 、用戶反饋處理的研究:在對底層視覺特征的提取與特征匹配的研究過程中,人們已開始逐漸認識到圖像底層特征與其上層語義之間存在一定鴻溝,從而有了“語義鴻溝”的概念。如何彌補“語義鴻溝”改善圖像檢索如何彌補“語義鴻溝”改善圖像檢索結(jié)果成為近幾年的研究熱點。在當前研究中,主流方法是通過引入用戶反饋機制來彌補 “語義鴻溝” 。所謂用戶反饋是指, 用戶在初次檢索結(jié)果中標示出哪些結(jié)果符合其查詢意圖,那些結(jié)
9、果為錯誤結(jié)果。將標示后的結(jié)果反饋給查詢系統(tǒng),系統(tǒng)可以根據(jù)這些結(jié)果對查詢方案進行修正,從而給出更加準確的檢索結(jié)果。近幾年在反饋處理問題上多采用機器學(xué)習(xí)的方法, 其中包括: 基于支持向量機的方法, 基于 EM算法的方法等。 目前最新研究主要集中在,如何構(gòu)建有效的核函數(shù),從而使基于核的學(xué)習(xí)算法更加適用于反饋的處理。另外,目前關(guān)于檢索反饋的最新研究熱點主要集中在用戶反饋的表現(xiàn)形式。在檢索應(yīng)用中若要求用戶直接提供較多的反饋信息,將大大降低用戶體驗。因此可針對用戶的點擊行為進行分析與挖掘,從而得到輔助信息來進一步精確檢索結(jié)果。目前該研究主要針對文本信息檢索,可以考慮將其遷移到圖像檢索方面。將數(shù)字圖書館與基
10、于內(nèi)容的圖像檢索技術(shù)進行融合,勢必促進數(shù)字圖書館的大力發(fā)展,特別是在大數(shù)據(jù)來臨的時代,數(shù)字圖像檢索技術(shù)可以有效的解決數(shù)字圖書館中圖片冗余、查找困難、管理困難等問題。第二章研究內(nèi)容及方法(思路、方法、具體內(nèi)容)主要具體研究內(nèi)容1. 基于內(nèi)容的數(shù)字圖書館圖像數(shù)據(jù)庫數(shù)據(jù)模型結(jié)構(gòu)設(shè)計:支持基于內(nèi)容檢索的圖像數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)模型結(jié)構(gòu),由于研究的角度不同,可以分為圖像數(shù)據(jù)庫的體系結(jié)構(gòu)和框架結(jié)構(gòu)。較完善的圖像數(shù)據(jù)庫的體系結(jié)構(gòu)是Chang SK 提出的五層結(jié)構(gòu) : 用戶視圖、語義特征視圖、圖像特征視圖、特征表達、特征的組織和檢索。但是由于數(shù)字圖書館的圖像數(shù)據(jù)有其自身的特點,所以應(yīng)設(shè)計一套適應(yīng)于數(shù)字圖書館的圖像
11、檢索數(shù)據(jù)模型。2. 面向海量圖像數(shù)據(jù)的檢索技術(shù)的研究:該部分工作屬于重點研究內(nèi)容,主要解決如何面向海量圖像數(shù)據(jù)實現(xiàn)圖像檢索任務(wù)。該部分研究包含了三個方面:圖像索引技術(shù)的研究、快速反饋處理方法的研究、圖像特征與文本信息相結(jié)合的快速檢索方法的研究。圖像索引技術(shù)的研究主要是解決如何在復(fù)雜的高維特征向量基礎(chǔ)上構(gòu)建索引,并且所構(gòu)建的索引能有效的提升圖像檢索速度。3. 集成驗證平臺及典型應(yīng)用的實現(xiàn):該部分工作主要是通過搭建集成驗證平臺來對研究中所得到的成果進行驗證與改進,并在最終研究成果基礎(chǔ)上構(gòu)建典型應(yīng)用系統(tǒng),從而為研究成果的進一步應(yīng)用推廣打下堅實的基礎(chǔ)。將圖像檢索技術(shù)應(yīng)用到實際中時,需要針對實際中的問題
12、進行進一步的研究。主要問題包括:異構(gòu)圖像檢索技術(shù)的研究、基于輔助信息的圖像檢索技術(shù)研究。異構(gòu)圖像檢索技術(shù)的研究,是指使用檢索服務(wù)的各式各樣終端的圖像捕獲能力是不同的,因此圖像質(zhì)量也是不一樣的。為此需要檢索技術(shù)能有效的處理不同質(zhì)量的圖像,且不會因為圖像質(zhì)量不同而影響檢索結(jié)果?;谳o助信息的圖像檢索技術(shù)研究,是指在用戶使用檢索服務(wù)時,可以捕獲到例如地理位置信息、用戶偏好信息等相應(yīng)的額外信息,通過這些信息可以進一步精確檢索結(jié)果。第三章結(jié)論與建議與傳統(tǒng)的數(shù)字圖書館數(shù)據(jù)檢索技術(shù)相比,基于內(nèi)容的數(shù)字圖書館圖像管理系統(tǒng)所采用的新技術(shù)與所處的復(fù)雜的網(wǎng)絡(luò)環(huán)境對數(shù)據(jù)安全有著很高的要求和標準??梢哉f,基于內(nèi)容的數(shù)字
13、圖書館圖像管理系統(tǒng)是未來數(shù)字圖書館的發(fā)展方向,也是未來智慧圖書館、數(shù)字圖書館以及移動圖書館所必須要依靠的技術(shù)之一。這項技術(shù)可以在圖書館圖書的檢索、數(shù)字安全、版權(quán)保護等方面提供非常有利的支持,未來的圖書館一定是智能化、小型化以及數(shù)字化的發(fā)展方向,本研究為數(shù)字圖書館的發(fā)展提供了有利的支持。第四章項目成果( 1) 提出了具備空間辨別力的詞袋模型 (Bag-of-Word) 海量圖像檢索算法傳統(tǒng)的 BoW 算法有很多的優(yōu)點,例如平移不變性、縮放不變性等,但是傳統(tǒng)的BoW 檢索模型也存在很多的問題,例如所提取的特征不具備空間信息、語義信息等。一般情況下,人們比較關(guān)心查詢圖像中的前景信息,希望弱化背景信息
14、在視覺詞匯表中的體現(xiàn)。但是傳統(tǒng)的BoW算法, 在整個圖像范圍內(nèi)提取特征,這就忽略了人的視覺特性,以導(dǎo)致查全率、 查準率比較低。為了解決以上問題,我們提出一種具備空間辨別力的BoW海量圖像檢索算法。方法中首先提出了可以使用顯著性圖的方法提取出圖像中的前景信息,弱化圖像中的背景信息。在提取出了圖像中的前景信息后,所使用的sift特征主要集中在所提取出的前景中,這樣就弱化了背景信息或者是噪聲對檢索效果的影響( 如圖1) 。利用這樣的特征,重新利用顯著性值構(gòu)建視覺詞匯表,取得了比較好的檢索結(jié)果。圖1( 2) 提出了具有自適應(yīng)閾值的圖像感興趣區(qū)提取模型有效的提取出圖像中的感興趣區(qū)對于目標識別有著重要的意
15、義,現(xiàn)在國際上采用較多的方法是圖像分割技術(shù),但目前圖像分割技術(shù)進展緩慢。為此,許多專家學(xué)者提出利用圖像的顯著性圖來感知圖像中的目標,但大多數(shù)的提取顯著性圖的方法都存在著許多問題,例如提取的顯著性圖不明顯,特別是圖像中背景過于復(fù)雜的情況下效果較差;提取的顯著性區(qū)域過于瑣碎,不能有效的突出圖像中的顯著性目標。為了解決以上問題,我們自己提出了一種新的顯著性圖提取方法。在這個方法中,我們設(shè)計了自適應(yīng)閾值來區(qū)分圖像中的前景與背景,利用設(shè)定的閾值,可以有效的剔除圖像中的背景區(qū)域,目標區(qū)域的提取效果有顯著提高(如圖 2)。圖 2( 3) 提出了一種新的包含有多種特征的詞袋模型 (BoW) 視覺詞匯表目前大多
16、數(shù)的圖像檢索框架采用的是使用一個單獨特征來進行圖像匹配,特別是在詞袋模型中更為普遍。但是使用單獨的特征進行匹配,普遍產(chǎn)生的問題是,對于某一類圖像,效果較為理想,而相對于其他種類的圖像,則效果較差,魯棒性不高。因為不同的圖像對于不同的特征,圖像的相似度差異較大。為了解決這個問題,我們提出使用多種特征同時構(gòu)造詞袋模型的視覺詞匯表,并利用自動閾值合理分配多種特征間的權(quán)重比例。大量實驗證明,重新構(gòu)造的視覺詞匯表更能表示一幅圖像,并取得了不錯的實驗效果。(4)發(fā)表論文情況(1) Junfeng Wu ,Zhiyang Li ,Wenyu Qu,Yujie Xu,Yuanyuan Li,Image Ret
17、rieval via Discriminative Spatial Bag-of-Word Scheme, Journal of Multiple-Valued Logic and Soft Computing,2016(12),accepted(2) Junfeng Wu ,Zhiyang LI ,Wenyu Qu,Yuanyuan Li,A New Bag-of-Words ModelUsing Multi-cue Integration for Image Retrieval ,International Journal of Computational Science and Engi
18、neering,2016(6),accepted第五章參考文獻1 Arnold W.M. Smeulders, Marcel Worring, Simone Santini, Amarnath Gupta, and Ramesh Jain. Content-Based Image Retrieval at the End of the Early Years. IEEE Trans. Pattern Analysis and Machine Intelligence, V ol 22(12), 2000.2 Swain M J and Ballard D H. Color Indexing.
19、International Journal of Computer Vision, Vol.7(1),1991.3 曹莉華 , 柳偉 ,李國輝 . 基于多種主色調(diào)的圖像檢索算法研究與實現(xiàn) . 計算機研究與發(fā)展 , Vol.36(l), 1999.4 蘇小紅 ,丁進 , 馬培軍 . 用興趣點凸包和 SVM 加權(quán)反饋實現(xiàn)圖像檢索 . 計算機學(xué)報 , Vol.32(11),2009.5 鄔浩 ,潘云鶴等 . 基于對象形狀的圖像查詢技術(shù). 軟件學(xué)報 , Vol.9(5), 1998.6 K.B. Sun, B.J. Super. Classification of Contour Shapes Usi
20、ng Class Segment Sets. Proceedings of Computer Vision and Pattern Recognition (CVPR), 2005.7 G. Mori, S. Belongie, J. Malik, Efficient Shape Matching Using Shape Contexts. IEEE Trans. Pattern Anal. Vol 27 2005.8 Feng Jing, Mingjing Li, Hong-Jiang Zhang, Bo Zhang. An Efficient and Effective Region-Ba
21、sed Image Retrieval Framework. IEEE Trans. Image Processing. V ol 13 2004.9 G.A. Papakostas, Y .S. Boutalis, D.A. Karras, B.G. Mertzios. A New Class of Zernike Moments forComputer Vision Applications. Information Science. Vol 177 (13) 2007.10 Nacereddine N, Tabbone S, Ziou D and HamamiL. Shape-Based
22、 Image Retrieval Using a NewDescriptor Based on the Radon and Wavelet Transforms. 20th InternationalConference on PatternRecognition. 2010.11 Gotlieb C C and Kreyszig H E. Texture Descriptors Based on Co-occurrence Matrices. Compute Vis Graph Image Process. Vol 51, 1990.12 Dunn D, Higgins W E. Optimal Gabor Filters for Texture Segmentation. IEEE Transcations on Image Processing Vol 4, 1995.13 Ojala T, Pietikainen M and Maenpaa T. Multiresolution Gray Sca
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 女性身材管理培訓(xùn)課件
- 證券公司季度工作總結(jié)
- 倉庫有那些培訓(xùn)課件
- 電大畢業(yè)論文機電一體化
- 小學(xué)生法制教育論文
- 北航計算機碩士畢業(yè)年薪
- 輿情推廣培訓(xùn)課件模板
- 檢驗科血常規(guī)判讀
- 危重患者觀察和護理要點
- 《數(shù)據(jù)庫原理及MySQL應(yīng)用(微課版)》課件 第5章標準的結(jié)構(gòu)化查詢語言SQL
- 車輛進廠出廠管理制度
- 安全生產(chǎn)月題庫-2025年安全生產(chǎn)月安全知識競賽題庫(附題目答案)
- 2025-2030年古建筑行業(yè)市場深度調(diào)研及前景趨勢與投資研究報告
- 2024年貴州省黔西縣教育局公開招聘試題含答案分析
- 集裝箱投資項目可行性研究報告
- 拆分合同:合伙企業(yè)解散及債務(wù)分擔協(xié)議
- 2025河北邯鄲市肥鄉(xiāng)區(qū)選聘農(nóng)村黨務(wù)(村務(wù))工作者100人筆試參考題庫完整參考答案詳解
- 2025年中小學(xué)美術(shù)教師招聘考試美術(shù)專業(yè)知識必考題庫及答案(共170題)
- 2025年05月四川阿壩州級事業(yè)單位公開選調(diào)工作人員78人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 2025-2030中國硫酸鈣晶須行業(yè)市場發(fā)展現(xiàn)狀及競爭格局與投資發(fā)展研究報告
- DB31/T 1035-2017綠化有機覆蓋物應(yīng)用技術(shù)規(guī)范
評論
0/150
提交評論