


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、2008-10-31 19:32支持向量機(jī)Matlab示例程序四種支持向量機(jī)用于函數(shù)擬合與模式識別的Matlab示例程序1模式識別基本概念模式識別的方法有很多,常用有:貝葉斯決策、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等等。特別說明的是,本文所談及的模式識別是指“有老師分類”,即事先知道訓(xùn)練樣本所屬的類別,然后設(shè)計分類器,再用該分類器對測試樣本進(jìn)行識別,比較測試樣本的實際所屬類別與分類器輸出的類別,進(jìn)而統(tǒng)計正確識別率。正確識別率是反映分類器性能的主要指標(biāo)。分類器的設(shè)計雖然是模式識別重要一環(huán),但是樣本的特征提取才是模式識別最關(guān)鍵的環(huán)節(jié)。試想如果特征矢量不能有效地描述原樣本,那么即使分類設(shè)計得再好也無法實現(xiàn)正確分類
2、。工程中我們所遇到的樣本一般是一維矢量,如:語音信號,或者是二維矩陣,如:圖片等。特征提取就是將一維矢量或二維矩陣轉(zhuǎn)化成一個維數(shù)比較低的特征矢量,該特征矢量用于分類器的輸入。關(guān)于特征提取,在各專業(yè)領(lǐng)域中也是一個重要的研究方向,如語音信號的諧振峰特征提取,圖片的PCA特征提取等等。2神經(jīng)網(wǎng)絡(luò)模式識別神經(jīng)網(wǎng)絡(luò)模式識別的基本原理是,神經(jīng)網(wǎng)絡(luò)可以任意逼近一個多維輸入輸出函數(shù)。以三類分類:I、II、III為例,神經(jīng)網(wǎng)絡(luò)輸入是樣本的特征矢量,三類樣本的神經(jīng)網(wǎng)絡(luò)輸出可以是1;0;0、0;1;0、0;0;1,也可以是1;-1;-1、-1;1;-1、-1;-1;1。將所有樣本中一部分用來訓(xùn)練網(wǎng)絡(luò),另外一部分用于
3、測試輸出。通常情況下,正確分類的第I類樣本的測試輸出并不是1;0;0或是1;-1;-1,而是如0.1;0;-0.2的輸出。也是就說,認(rèn)為輸出矢量中最大的一個分量是1,其它分量是0或是-1就可以了。3支持向量機(jī)的多類分類支持向量機(jī)的基本理論是從二類分類問題提出的。我想絕大部分網(wǎng)友僅著重于理解二類分類問題上了,我當(dāng)初也是這樣,認(rèn)識事物都有一個過程。二類分類的基本原理固然重要,我在這里也不再贅述,很多文章和書籍都有提及。我覺得對于工具箱的使用而言,理解如何實現(xiàn)從二類分類到多類分類的過渡才是最核心的內(nèi)容。下面我僅以1-a-r算法為例,解釋如何由二類分類器構(gòu)造多類分類器。二類支持向量機(jī)分類器的輸出為1,
4、-1,當(dāng)面對多類情況時,就需要把多類分類器分解成多個二類分類器。在第一種工具箱LS_SVMlab中,文件Classification_LS_SVMlab.m中實現(xiàn)了三類分類。訓(xùn)練與測試樣本分別為n1、n2,它們是3 x 15的矩陣,即特征矢量是三維,訓(xùn)練與測試樣本數(shù)目均是15;由于是三類分類,所以訓(xùn)練與測試目標(biāo)x1、x2的每一分量可以是1、2或是3,分別對應(yīng)三類,如下所示:n1 = rand(3,5),rand(3,5)+1,rand(3,5)+2;x1 = 1*ones(1,5),2*ones(1,5),3*ones(1,5); n2 = rand(3,5),rand(3,5)+1,rand
5、(3,5)+2;x2 = 1*ones(1,5),2*ones(1,5),3*ones(1,5); 1-a-r算法定義:對于N類問題,構(gòu)造N個兩類分類器,第i個分類器用第i類訓(xùn)練樣本作為正的訓(xùn)練樣本,將其它類的訓(xùn)練樣本作為負(fù)的訓(xùn)練樣本,此時分類器的判決函數(shù)不取符號函數(shù)sign,最后的輸出是N個兩類分類器輸出中最大的那一類。在文件Classification_LS_SVMlab.m的第42行:codefct = code_MOC,就是設(shè)置由二類到多類編碼參數(shù)。當(dāng)?shù)?2行改寫成codefct =code_OneVsAll,再去掉第53行最后的引號,按F5運行該文件,命令窗口輸出有:codebook
6、 = 1-1-1-1 1-1-1-1 1old_codebook = 1 2 3比較上面的old_codebook與codebook輸出,注意到對于第i類,將每i類訓(xùn)練樣本做為正的訓(xùn)練樣本,其它的訓(xùn)練樣本作為負(fù)的訓(xùn)練樣本,這就是1-a-r算法定義。這樣通過設(shè)置codefct =code_OneVsAll就實現(xiàn)了支持向量機(jī)的1-a-r多類算法。其它多類算法也與之雷同,這里不再贅述。值得注意的是:對于同一組樣本,不同的編碼方案得到的訓(xùn)練效果不盡相同,實際中應(yīng)結(jié)合實際數(shù)據(jù),選擇訓(xùn)練效果最好的編碼方案。4核函數(shù)及參數(shù)選擇常用的核函數(shù)有:多項式、徑向基、Sigmoid型。對于同一組數(shù)據(jù)選擇不同的核函數(shù),
7、基本上都可以得到相近的訓(xùn)練效果。所以核函數(shù)的選擇應(yīng)該具有任意性。對訓(xùn)練效果影響最大是相關(guān)參數(shù)的選擇,如:控制對錯分樣本懲罰的程度的可調(diào)參數(shù),以及核函數(shù)中的待定參數(shù),這些參數(shù)在不同工具箱中的變量名稱是不一樣的。這里仍以Classification_LS_SVMlab.m為例,在第38、39行分別設(shè)定了gam、sig2的值,這兩個參數(shù)是第63行trainlssvm函數(shù)的輸入?yún)?shù)。在工具箱文件夾的trainlssvm.m文件的第96、97行有這兩個參數(shù)的定義:% gam : Regularization parameter% sig2 : Kernel parameter (bandwidth in
8、 the case of the RBF_kernel)這里gam是控制對錯分樣本懲罰的程度的可調(diào)參數(shù),sig2是徑向基核函數(shù)的參數(shù)。所以在充分理解基本概念的基礎(chǔ)上,將這些概念與工具箱中的函數(shù)說明相結(jié)合,就可以自如地運用這個工具箱了,因此所以最好的教科書是函數(shù)自帶的函數(shù)說明。最佳參數(shù)選擇目前沒有十分好的方法,在Regression_LS_SVMlab.m的第46至49行的代碼是演示了交叉驗證優(yōu)化參數(shù)方法,可這種方法相當(dāng)費時。實踐中可以采用網(wǎng)格搜索的方法:如gam=0:0.2:1,sig2=0:0.2:1,那么gam與sig2的組合就有6x6=36種,對這36種組合訓(xùn)練支持向量機(jī),然后選擇正確識別率最大的一組參數(shù)作為最優(yōu)的gam與sig2,如果結(jié)果均不理想,就需要重新考慮gam 與sig2的范圍與采樣間隔了。5由分類由回歸的過渡LS_SVMlab、SVM_SteveGunn這兩個工具箱實現(xiàn)了支持向量機(jī)的函數(shù)擬合功能。從工具箱的使用角度來看,分類與回歸的最大區(qū)別是訓(xùn)練目標(biāo)不同。回歸的訓(xùn)練目標(biāo)是實際需要擬合的函數(shù)值;而分類的訓(xùn)練目標(biāo)是1,2,N(分成N類),再通過適當(dāng)?shù)木幋a方案將N類分類轉(zhuǎn)換成多個二類分類。比較文件R
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 項目簽約協(xié)議書范本
- 草場租賃與生態(tài)補(bǔ)償機(jī)制協(xié)議
- 企業(yè)車輛事故責(zé)任免除與賠償協(xié)議
- 青島商鋪租賃協(xié)議書范本
- 綠色節(jié)能彩鋼活動房安裝施工安全保證合同
- 高端公寓租賃管理合同范本
- 中外合資餐飲品牌開發(fā)與推廣協(xié)議
- 草籽種植補(bǔ)貼與購銷保障合同
- 橋梁模態(tài)分析試驗專題報告
- 餐飲部管理運轉(zhuǎn)手冊
- 2025年陜西省中考數(shù)學(xué)真題試卷及答案解析
- 呼吸機(jī)的維護(hù)與保養(yǎng)標(biāo)準(zhǔn)流程
- 2025年北方華創(chuàng)招聘筆試參考題庫含答案解析
- 期末綜合試題 2024-2025學(xué)年下期初中英語人教版七年級下冊(新教材)
- 2025年全國新高考I卷高考全國一卷真題英語試卷(真題+答案)
- 公共組織績效評估-形考任務(wù)三(占10%)-國開(ZJ)-參考資料
- 2025年廣東高中學(xué)業(yè)水平合格性考試化學(xué)試卷試題(含答案解析)
- JT∕T 795-2023 事故汽車修復(fù)技術(shù)規(guī)范
- 趣識古文字智慧樹知到期末考試答案章節(jié)答案2024年吉林師范大學(xué)
- 北京市西城區(qū)2021-2022學(xué)年三年級下冊數(shù)學(xué)期末試卷(含答案)
- 天津城建大學(xué)概率論試卷試題
評論
0/150
提交評論