圖像模式識別的方法介紹_第1頁
圖像模式識別的方法介紹_第2頁
圖像模式識別的方法介紹_第3頁
圖像模式識別的方法介紹_第4頁
圖像模式識別的方法介紹_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 2.1圖像模式識別的方法 圖像模式識別的方法很多,從圖像模式識別提取的特征對象來看,圖像識別方法可分為以下幾種:基于形狀特征的識別技術(shù)、基于色彩特征的識別技術(shù)以與基于紋理特征的識別技術(shù)。其中,基于形狀特征的識別方法,其關(guān)鍵是找到圖像中對象形狀與對此進行描述,形成可視特征矢量,以完成不同圖像的分類,常用來表示形狀的變量有形狀的周長、面積、圓形度、離心率等。基于色彩特征的識別技術(shù)主要針對彩色圖像,通過色彩直方圖具有的簡單且隨圖像的大小、旋轉(zhuǎn)變換不敏感等特點進行分類識別?;诩y理特征的識別方法是通過對圖像中非常具有結(jié)構(gòu)規(guī)律的特征加以分析或者則是對圖像中的色彩強度的分布信息進行統(tǒng)計來完成。從模式特征

2、選擇與判別決策方法的不同可將圖像模式識別方法大致歸納為兩類:統(tǒng)計模式(決策理論)識別方法和句法(結(jié)構(gòu))模式識別方法。此外,近些年隨著對模式識別技術(shù)研究的進一步深入,模糊模式識別方法和神經(jīng)網(wǎng)絡模式識別方法也開始得到廣泛的應用。在此將這四種方法進行一下說明。2.1.1句法模式識別 對于較復雜的模式,如采用統(tǒng)計模式識別的方法,所面臨的一個困難就是特征提取的問題,它所要求的特征量十分巨大,要把某一個復雜模式準確分類很困難,從而很自然地就想到這樣的一種設(shè)計,即努力地把一個復雜模式分化為若干較簡單子模式的組合,而子模式又分為若干基元,通過對基元的識別,進而識別子模式,最終識別該復雜模式。正如英文句子由一些

3、短語,短語又由單詞,單詞又由字母構(gòu)成一樣。用一組模式基元和它們的組成來描述模式的結(jié)構(gòu)的語言,稱為模式描述語言。支配基元組成模式的規(guī)則稱為文法。當每個基元被識別后,利用句法分析就可以作出整個的模式識別。即以這個句子是否符合某特定文法,以判別它是否屬于某一類別。這就是句法模式識別的基本思想。 句法模式識別系統(tǒng)主要由預處理、基元提取、句法分析和文法推斷等幾部分組成。由預處理分割的模式,經(jīng)基元提取形成描述模式的基元串(即字符串)。句法分析根據(jù)文法推理所推斷的文法,判決有序字符串所描述的模式類別,得到判決結(jié)果。問題在于句法分析所依據(jù)的文法。不同的模式類對應著不同的文法,描述不同的目標。為了得到于模式類相

4、適應的文法,類似于統(tǒng)計模式識別的訓練過程,必須事先采集足夠多的訓練模式樣本,經(jīng)基元提取,把相應的文法推斷出來。實際應用還有一定的困難。 2.1.2統(tǒng)計模式識別統(tǒng)計模式識別是目前最成熟也是應用最廣泛的方法,它主要利用貝葉斯決策規(guī)則解決最優(yōu)分類器問題。統(tǒng)計決策理論的基本思想就是在不同的模式類中建立一個決策邊界,利用決策函數(shù)把一個給定的模式歸入相應的模式類中。統(tǒng)計模式識別的基本模型如圖2,該模型主要包括兩種操作模型:訓練和分類,其中訓練主要利用己有樣本完成對決策邊界的劃分,并采取了一定的學習機制以保證基于樣本的劃分是最優(yōu)的;而分類主要對輸入的模式利用其特征和訓練得來的決策函數(shù)而把模式劃分到相應模式類

5、中。統(tǒng)計模式識別方法以數(shù)學上的決策理論為基礎(chǔ)建立統(tǒng)計模式識別模型。其基本模型是:對被研究圖像進行大量統(tǒng)計分析,找出規(guī)律性的認識,并選取出反映圖像本質(zhì)的特征進行分類識別。統(tǒng)計模式識別系統(tǒng)可分為兩種運行模式:訓練和分類。訓練模式中,預處理模塊負責將感興趣的特征從背景中分割出來、去除噪聲以與進行其它操作;特征選取模塊主要負責找到合適的特征來表示輸入模式;分類器負責訓練分割特征空間。在分類模式中,被訓練好的分類器將輸入模式根據(jù)測量的特征分配到某個指定的類。統(tǒng)計模式識別組成如圖2所示。圖2 統(tǒng)計模式識別模型2.1.2.1幾種統(tǒng)計模式識別的方法統(tǒng)計模式識別根據(jù)采用方法的不同可以進行多種形式的分類:通過貝葉

6、斯決策理論對條件密度已知的樣本進行分類;對于類條件密度不明的情況,可根據(jù)訓練樣本的類別是否己知將分類問題分為監(jiān)督學習和非監(jiān)督學習兩大類;監(jiān)督學習和非監(jiān)督學習又可根據(jù)是否通過參數(shù)決策分為參數(shù)估計和非參數(shù)估計。統(tǒng)計模式識別的另一種分類方法是根據(jù)決策界是否直接得到將其分為幾何方法和基于概率密度的方法。幾何方法經(jīng)常直接從優(yōu)化一定的代價函數(shù)構(gòu)造決策界;而基于概率密度的方法要首先估計密度函數(shù)然后構(gòu)造分類函數(shù)指定決策界。1、幾何分類法 1) 模板匹配法它是模式識別中的一個最原始、最基本的方法,它將待識模式分別與各標準模板進行匹配,若某一模板與待識模式的絕大多數(shù)單元均相匹配,則稱該模板與待識模式“匹配得好”,

7、反之則稱“匹配得不好”,并取匹配最好的作為識別結(jié)果。 2)距離分類法 距離是一種重要的相似性度量,通常認為空間中兩點距離越近,表示實際上兩樣本越相似。大約有十余種作為相似性度量的距離函數(shù),其中使用最廣泛的是歐氏距離。它是使用最為廣泛的方法,常用的有平均樣本法、平均距離法、最近鄰法和近鄰法。 3)線性判別函數(shù) 和上述的方法不同,判決函數(shù)法是以判決邊界的函數(shù)形式的假定為其特性的,而上述的方法都是以所考慮的分布的假定為其特性的。假如我們有理由相信一個線性判決邊界取成:是合適的話,那么剩下的問題就是要確定它的權(quán)系數(shù)。權(quán)系數(shù)可通過感知器算法或最小平方誤差算法來實現(xiàn)。但作為一條規(guī)則,應用此方法必須注意兩點

8、;第一就是方法的可適性問題,第二就是應用判決函數(shù)后的誤差準則。 4)非線性判別函數(shù) 線性判決函數(shù)的特點是簡單易行,實際應用中許多問題往往是非線性的,一種處理的辦法將非線性函數(shù)轉(zhuǎn)換為線性判決函數(shù),所以又稱為廣義線性判決函數(shù)。另一種方法借助電場的概念,引入非線性的勢函數(shù),它經(jīng)過訓練后即可用來解決模式的分類問題。 2 概率分類法 幾何分類法是以模式類幾何可分為前提條件的,在某些分類問題中這種條件能得到滿足,但這種條件并不經(jīng)常能得到滿足,模式的分布常常不是幾何可分的,即在同一區(qū)域中可能出現(xiàn)不同的模式,這時,必須借助概率統(tǒng)計這一數(shù)學工具??梢哉f,概率分類法的基石是貝葉斯決策理論。 設(shè)有R類樣本,分別為w

9、1, w2 , , wR,若每類的先驗概率為P(wii), i = 1,2 ,3,R,對于一隨機矢量,每類的條件概率為(又稱類概率密度)P(X/Wii),則根據(jù)Bayes公式,后驗概率為:從后驗概率出發(fā),有Bayes法則: 2.1.2.2樸素貝葉斯分類器樸素貝葉斯分類是一種十分簡單的分類算法,叫它樸素貝葉斯分類是因為這種方法的思想真的很樸素,樸素貝葉斯的思想基礎(chǔ)是這樣的:對于給出的待分類項,求解在此項出現(xiàn)的條件下各個類別出現(xiàn)的概率,哪個最大,就認為此待分類項屬于哪個類別。通俗來說,就好比這么個道理,你在街上看到一個黑人,我問你你猜這哥們哪里來的,你十有八九猜非洲。為什么呢?因為黑人中非洲人的比

10、率最高,當然人家也可能是美洲人或亞洲人,但在沒有其它可用信息下,我們會選擇條件概率最大的類別,這就是樸素貝葉斯的思想基礎(chǔ)。樸素貝葉斯分類的工作過程如下:(1)每個數(shù)據(jù)樣本用一個n維特征向量表示,分別描述對n個屬性A1,A2,An樣本的n個度量。(2)假定有m個類C1,C2,Cm。給定一個未知的數(shù)據(jù)樣本X(即沒有類標號),分類法將預測X屬于具有最高后驗概率(條件X下)的類。即是說,樸素貝葉斯分類將未知的樣本分配給類Ci,當且僅當這樣,最大化。其最大的類Ci稱為最大后驗假定。根據(jù)貝葉斯定理,(3)由于P(X)對于所有類為常數(shù),只需要最大即可。如果類的先驗概率未知,則通常假定這些類是等概率的,即P(

11、C1)=P(C2)=P(Cm)。并據(jù)此只對最大化。否則,最大化。注意,類的先驗概率可以用計算其中si是類Ci中的訓練樣本數(shù),而s是訓練樣本總數(shù)。(4)給定具有許多屬性的數(shù)據(jù)集,計算的開銷可能非常大。為降低計算的開銷,可以做類條件獨立的樸素假定。給定樣本的類標號,假定屬性值相互條件獨立,即在屬性間,不存在依賴關(guān)系。這樣, (7.8)概率,可以由訓練樣本估值,其中(a)如果Ak是分類屬性,則,其中sik是在屬性Ak上具有值xk的類Ci的樣本數(shù),而si是Ci中的訓練樣本數(shù)。(b)如果Ak是連續(xù)值屬性,則通常假定該屬性服從高斯分布,因而, (7.9)其中,給定類Ci的訓練樣本屬性Ak的值,是屬性Ak的

12、高斯密度函數(shù),而分別為平均值和標準差。(5)為對未知樣本X分類,對每個類Ci,計算。樣本X被指派到類Ci,當且僅當換言之,X被指派到其最大的類Ci。整個樸素貝葉斯分類分為三個階段: 第一階段準備工作階段,這個階段的任務是為樸素貝葉斯分類做必要的準備,主要工作是根據(jù)具體情況確定特征屬性,并對每個特征屬性進行適當劃分,然后由人工對一部分待分類項進行分類,形成訓練樣本集合。這一階段的輸入是所有待分類數(shù)據(jù),輸出是特征屬性和訓練樣本。這一階段是整個樸素貝葉斯分類中唯一需要人工完成的階段,其質(zhì)量對整個過程將有重要影響,分類器的質(zhì)量很大程度上由特征屬性、特征屬性劃分與訓練樣本質(zhì)量決定。 第二階段分類器訓練階

13、段,這個階段的任務就是生成分類器,主要工作是計算每個類別在訓練樣本中的出現(xiàn)頻率與每個特征屬性劃分對每個類別的條件概率估計,并將結(jié)果記錄。其輸入是特征屬性和訓練樣本,輸出是分類器。這一階段是機械性階段,根據(jù)前面討論的公式可以由程序自動計算完成。 第三階段應用階段。這個階段的任務是使用分類器對待分類項進行分類,其輸入是分類器和待分類項,輸出是待分類項與類別的映射關(guān)系。這一階段也是機械性階段,由程序完成。半樸素貝葉斯分類模型(SNBC)為了突破樸素貝葉斯分類器的獨立性假設(shè)條件的限制,除了上述“提升”等方法之外,還可以通過改變其結(jié)構(gòu)假設(shè)的方式來達到目的,為此有人提出了半樸素貝葉斯分類(SNBG Sem

14、i-Naive Bayesian classifier)的構(gòu)想。半樸素貝葉斯分類模型對樸素貝葉斯分類模型的結(jié)構(gòu)進行了擴展,其目的是為了突破樸素貝葉斯分類模型特征屬性間獨立性假設(shè)限制,提高分類性能。目前半樸素貝葉斯分類模型學習的關(guān)鍵是如何有效組合特片屬性。條件互信息度量半樸素貝葉斯分類學習算法可以解決目前一此學習算法中存在的效率小高與部分組合意義不大的問題。SNBC的結(jié)構(gòu)比NBC緊湊,在SNBC的模型構(gòu)建過程中,依照一定的標準將關(guān)聯(lián)程度較大的基本屬性(即NBC中的特征屬性)合并在一起構(gòu)成“組合屬性”(也稱之為“大屬性”)。邏輯上,SNBC中的組合屬性與NBC中的基本屬性沒有根本性差別,SNBC的

15、各個組合屬性之間也是相對于類別屬性相互獨立的。圖是SNBC的模型示意圖。這類模型通過將依賴性強的基本屬性結(jié)合在一起構(gòu)建新的模型,這樣可以部分屏蔽NBC中獨立性假設(shè)對分類的負面作用。但從名稱可以看出,SNBC依然屬于樸素貝葉斯分類的疇。這是因為除了結(jié)構(gòu)上的差別之外,計算推導過程與NBC無異。半樸素貝葉斯分類結(jié)構(gòu)示意圖2.1.2.3圖像金字塔圖像金字塔是以多分辨率來解釋圖像的一種結(jié)構(gòu)。1987年,在一種全新而有效的信號處理與分析方法,即多分辨率理論中,小波首次作為分析基礎(chǔ)出現(xiàn)了。多分辨率理論將多種學科的技術(shù)有效地統(tǒng)一在一起,如信號處理的子帶編碼、數(shù)字語音識別的積分鏡像過濾以與金字塔圖像處理。正如其

16、名字所表達的,多分辨率理論與多種分辨率下的信號(或圖像)表示和分析有關(guān)。其優(yōu)勢很明顯,某種分辨率下無法發(fā)現(xiàn)的特性在另一種分辨率下將很容易被發(fā)現(xiàn)。圖像金字塔是結(jié)合降采樣操作和平滑操作的一種圖像表示方式。它的一個很大的好處是,自下而上每一層的像素數(shù)都不斷減少,這會大大減少計算量;而缺點是自下而上金字塔的量化變得越來越粗糙,而且速度很快。高斯金字塔里有兩個概念:組(Octave)和層(Level或Interval),每組里有若干層。高斯金字塔的構(gòu)造是這樣的,第一組的第一層為原圖像,然后將圖像做一次高斯平滑(高斯卷積、高斯模糊),高斯平滑里有一個參數(shù),然后將乘一個比例系數(shù)k作為新的平滑因子來平滑第一組

17、第二層得到第三層。重復若干次,得到L層他們分別對應的平滑參數(shù)為:0,k,k2,。然后將最后一幅圖像做比例因此為2的降采樣得到第二組的第一層,然后對第二組的第一層做參數(shù)是的高斯平滑,對第二層做k的平滑得到第三層,以此類推。每組對應的平滑因子是一樣的,這樣反復形成了O組L層,組建成高斯金字塔。2.1.3模糊模式識別 模糊模式識別的理論基礎(chǔ)是20世紀60年代誕生的模糊數(shù)學,它根據(jù)人對事物識別的思維邏輯,結(jié)合人類大腦識別事物的特點,將計算機中常用的二值邏輯轉(zhuǎn)向連續(xù)邏輯。在圖像識別領(lǐng)域應用時該方法可以簡化圖像識別系統(tǒng),并具有實用、可靠等特點。 模式識別是一門邊緣學科,它和許多技術(shù)學科有著密切的聯(lián)系,它本

18、身就是人工智能的重要組成部分,因此,從本質(zhì)上來說,模式識別所要討論的核心問題,就是如何使機器能模擬人腦的思維方法,來對客觀事物進行有效的識別和分類。一方面現(xiàn)有的廣為運用的統(tǒng)計模式識別方法與人腦進行模式識別相比,其差別還很大,另一方面待識別的客觀事物又往往具有不同程度的模糊性。 不少學者試圖運用模糊數(shù)學的方法來解決模式識別問題,形成一個專門的研究領(lǐng)域-模糊模式識別(Fuzzy Pattern Recognition)。比較成熟的理論和方法有最大來屬原則、基于模糊等價關(guān)系的模式分類、基于模糊相似關(guān)系的模式分類和模糊聚類,其中模糊聚類方法的研究和應用尤為成功和廣泛。目前,模糊模式識別方法已廣泛應用圖形識別、染色體和白血球識別、圖象目標的形狀分析、手寫體文字識別等,但其中也遇到不少困難,其中一個典型的例子就是隸屬函數(shù)的確定往往帶有經(jīng)驗色彩。 應用模糊方法進行圖像識別的關(guān)鍵是確定某一類別的隸屬函數(shù),而各類的統(tǒng)計指標則要由樣本像元的灰度值和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論