基于知識庫的手寫體數(shù)字識別_第1頁
基于知識庫的手寫體數(shù)字識別_第2頁
基于知識庫的手寫體數(shù)字識別_第3頁
基于知識庫的手寫體數(shù)字識別_第4頁
基于知識庫的手寫體數(shù)字識別_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

本文格式為Word版,下載可任意編輯——基于知識庫的手寫體數(shù)字識別

HUNANUNIVERSITY

課題

學(xué)學(xué)專學(xué)

生生業(yè)院

姓學(xué)班名

程模式識別

目基于知識庫的手寫體數(shù)字識別

名號級稱

2023年6月25日

基于知識庫的手寫體數(shù)字識別

1案例背景:

手寫體數(shù)字識別是圖像識別學(xué)科下的一個分支,是圖像處理和模式識別研究領(lǐng)域的重要應(yīng)用之一,并且具有很強(qiáng)的通用性。由于手寫數(shù)字的隨意性很大,如筆畫粗細(xì)、字體大小、傾斜角度等因素都有可能直接影響到字符的識別確鑿率,所以手寫體數(shù)字識別是一個很有挑戰(zhàn)性的課題。在過去的數(shù)十年中,研究者們提出了大量識別方法,并取得了一定的成果。在大規(guī)模數(shù)據(jù)統(tǒng)計如例行年檢、人口普查、財務(wù)、稅務(wù)、郵件分揀等應(yīng)用領(lǐng)域都有廣闊的應(yīng)用前景。本案例實現(xiàn)了手寫阿拉伯?dāng)?shù)字的識別過程,并對手寫數(shù)字識別的基于統(tǒng)計的方法進(jìn)行了簡要介紹和分析。本文實現(xiàn)的手寫字體識別程序具有手寫數(shù)字圖像讀取、特征提取、數(shù)字模板特征庫以及識別功能。

2理論基礎(chǔ):

2-1手寫字體識別方法:

手寫體數(shù)字識別是一個跨學(xué)科的繁雜問題,綜合了圖像處理、模式識別、機(jī)器學(xué)習(xí)等多個領(lǐng)域的知識,其識別過程一般包含圖像預(yù)處理、特征提取、分類器的設(shè)定及其后處理等組成。處理流程如圖2-1所示。

圖2-1手寫體數(shù)子識別流程圖

2-2圖像預(yù)處理

手寫體數(shù)字識別的首要工作是圖像預(yù)處理。在圖像預(yù)處理過程中需要解決的主要問題有:定位、圖像二值化、平滑化(去噪)HJ、字符切分、規(guī)范化等。圖像二值化是指將整個圖像浮現(xiàn)出明顯的黑白效果。待識別的手寫體數(shù)字圖像在掃描過程中,常會帶來一些噪聲,用不同的掃描分辯率得到的數(shù)字圖像,其質(zhì)量也各不一致,故而要先將這些干擾因素排除掉。另外,還需要正確分割整幅文檔圖像中的手寫體數(shù)字,而分割后的數(shù)字大小、字體常各不一致,故還需進(jìn)行歸一化處理。

2-3特征提取

特征提取的目的是從經(jīng)過預(yù)處理后的數(shù)字圖像中,提取出用以區(qū)分與其它數(shù)字類別的本質(zhì)屬性并數(shù)值化,形成特征矢量的過程。常見的手寫體數(shù)字特征有:模板特征、統(tǒng)計特征、結(jié)構(gòu)特征和變換特征。

2

2-4分類器

不同的分類方式對應(yīng)不同的分類器,可選的分類器有神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等。利用訓(xùn)練出的分類器,對特征提取后的手寫體數(shù)字進(jìn)行分類識別。分類器的識別原理是通過其拓?fù)浣Y(jié)構(gòu)和內(nèi)置參數(shù)定義了特征空間上的一組曲面或超曲面,利用這組曲面或超曲面將特征空間劃分為不同的區(qū)域,從而達(dá)到分類識別的目的。

2-5算法流程

首先,讀入手寫數(shù)字圖片進(jìn)行歸一化處理,統(tǒng)一尺寸。默認(rèn)為24×24圖形塊,并通過ostu算法進(jìn)行二值化;其次,對二值化圖像進(jìn)行圖像細(xì)化等形態(tài)學(xué)操作,并依照算法要求進(jìn)行特征提??;最終,載入模板矩陣進(jìn)行對比,選用歐式距離測度,得到識別結(jié)果。其算法流程如圖1所示。特征提取根據(jù)手寫數(shù)字圖像本身的結(jié)構(gòu)特征,通過計算端點、指定方向直線的交織點個數(shù)來作為特征向量。其主要步驟如下:1.垂直交點。對細(xì)化后的手寫數(shù)字圖像分別在其列寬的5/12、1/2、7/12處生成垂直的三條直線,提取這三條垂直直線與數(shù)字筆畫的角點數(shù)并存儲。2.水平交點。對細(xì)化后的手寫數(shù)字圖像分別在其列寬的1/3、1/2、2/3處生成水平的三條直線,提取這三條垂直直線與數(shù)字筆畫的角點數(shù)并存儲。3.對角交點。對細(xì)化后的手寫數(shù)字圖像分別提取兩條對角直線,提取這兩條對角直線與數(shù)字筆畫的交點數(shù)并存儲。由于以上步驟均作用于細(xì)化后的數(shù)字圖像,其筆畫簡單且特征穩(wěn)定,因此對其提取的基本交點及結(jié)構(gòu)端點能反映數(shù)字的本質(zhì)特征,可快速、有效地識別數(shù)字字符,并達(dá)到較好的識別正確率。其中,提取筆畫結(jié)構(gòu)端點特征的算法如下。1.目標(biāo)定位。對細(xì)化后的手寫數(shù)字圖像按行從上到下、按列從左到右進(jìn)行順序掃描,定位選擇黑像素點P作為手寫筆畫目標(biāo)。2.鄰域統(tǒng)計。計算黑色像素P的8領(lǐng)域之和N,若N=1,則像素P為端點,端點計數(shù)器加1;否則舍棄該點。3.遍歷圖像。遍歷整個圖像,重復(fù)進(jìn)行目標(biāo)定位、領(lǐng)域統(tǒng)計的操作流程,提取端點特征。依據(jù)上述對手寫數(shù)字圖像的交點、端點特征提取方法,本案例中的特征向量VEC由9個分類組成,其排列如下:VEC=[垂直5/12處交點數(shù),垂直中線交點數(shù),垂直7/12處交點數(shù),

水平1/3處交點數(shù),水平中線交點數(shù),水平2/3處交點數(shù),左對角線交點數(shù),右對角線交點數(shù),端點數(shù)]

3模式識別

本案例采用的是基于模式知識庫的識別方法,所以系統(tǒng)調(diào)研的關(guān)鍵步驟就是對數(shù)字字符的結(jié)構(gòu)特征的分析及其模型的構(gòu)造。因此,本案例首先對0-9這10個數(shù)字進(jìn)行結(jié)構(gòu)分析并建模,然后提取相關(guān)特征,最終構(gòu)造模板庫。

在試驗過程中,我們選擇規(guī)范手寫和自由手寫兩組樣本對知識庫進(jìn)行參數(shù)調(diào)整,這些訓(xùn)練樣本由200個規(guī)范手寫樣本和200個自由手寫樣本組成,通過計算樣本對應(yīng)分量的算術(shù)平均值獲得知識庫中特征向量的每個分量。通過上述步驟得到的知識庫由兩套模板組成,在本次試驗過程中,我們選擇基于模板匹配的識別方法,通過技術(shù)歐式距離來衡量匹配程度。識別系統(tǒng)中的特征向

3

量包含9個分量,且計算距離公式是歐式距離。因此,在識別過程中分別計算待識別圖像與知識庫中各個模板特征向量之間的歐式距離,即與0-9這10個數(shù)字逐個比較,選擇最小距離對應(yīng)的數(shù)字作為最終的識別結(jié)果。

4程序?qū)崿F(xiàn)

手寫體數(shù)字識別有著廣泛的應(yīng)用前景,目前被廣泛應(yīng)用于財務(wù)報表、銀行票據(jù)、戶籍登記、稅務(wù)信息、統(tǒng)計信息等方面,是模式識別和圖像處理領(lǐng)域的一個研究熱點。

4-1圖像預(yù)處理

該步驟主要是對輸入的圖像進(jìn)行灰度化、歸一化、濾波、二值化。鑒于數(shù)字的識別與色調(diào)無關(guān),并且考慮到噪聲影響,這里采用中值濾波去噪,將圖像進(jìn)行預(yù)處理,最終可得到二值化圖像。

圖4-1待識別手寫數(shù)字圖4-2二值化圖像

圖4-3歸一化圖像圖4-4中值濾波

4-2特征提取

該步驟主要是對預(yù)處理得到的二值圖像進(jìn)行圖像細(xì)化操作,并依照算法要求提取交點、端點特征,組成特征向量。本節(jié)根據(jù)上一節(jié)中的特征提取方法,對基于24x24點陣的細(xì)化圖像進(jìn)特征提取,提取的特征矢量維度為32。

對于矩特征,提取特征變量M,M為7個Hu平面不變矩的第一個,再除以1000,將特征變量的取值范圍規(guī)范化,這是為了防止特征變量的取值較大時發(fā)生浮點數(shù)溢出。M/1000是特征矢量的第1個矢量。

綜合端點特征提取方法和分區(qū)域特征提取方法產(chǎn)生了6個特征矢量:點陣上半?yún)^(qū)域端點數(shù)、點陣下半?yún)^(qū)域端點數(shù)、點陣左半?yún)^(qū)域端點數(shù)、點陣右半?yún)^(qū)域端點數(shù)、三結(jié)點數(shù)和四結(jié)點數(shù)

4

圖4-5圖像特征預(yù)處理結(jié)果

4-3模式識別

該步驟主要是對載入的模板矩陣及輸入圖像計算出特征向量選用歐式距離測度,進(jìn)而得到識別結(jié)果。

載入模式庫。我們選擇規(guī)范手寫和自由手寫兩組樣本對知識庫進(jìn)行參數(shù)調(diào)整,這些訓(xùn)練樣本由200個規(guī)范手寫樣本和200個自由手寫樣本組成,通過計算樣本對應(yīng)分量的算術(shù)平均值獲得知識庫中特征向量的每個分量。該知識庫也稱為判別標(biāo)準(zhǔn)向量矩陣,本文把該矩陣命名為Data.mat。

匹配識別。在本文所提出的方法中,選擇基于模板匹配的識別方法,通過計算歐式距離來衡量匹配的程度。識別系統(tǒng)中的特征向量包含9個分量,且計算距離公式是歐式距離。

5試驗結(jié)果

6不足與展望

手寫體數(shù)字的樣本類別只有10類,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論