




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、課程名稱數(shù)據(jù)分析方法課程編口P實驗地點系統(tǒng)建模與仿真實驗室SL110實驗時間校外指導(dǎo)教師無校內(nèi)指導(dǎo)教師實驗名稱實驗3距離判別與貝葉斯判別分析評閱人簽字成績實驗數(shù)據(jù)與內(nèi)容我國山區(qū)杲大型化,廠,在廠區(qū)及鄰近地區(qū)挑選有代表性的15個大氣取樣點,每日4次同時抽取大氣樣品,測定其中含有的6種氣體的濃度,前后共4天,每個取樣點每種氣體實測16次,計算每個取樣點每種氣體的平均濃度,數(shù)據(jù)見表4-8。氣體數(shù)據(jù)對應(yīng)的污染地區(qū)分類見表4-8中最舟-列。現(xiàn)有兩個取自該地區(qū)的4個氣體樣本,氣體指標(biāo)見表4-8中后4行,試解決以下問題:1.判別兩類總體的協(xié)方差矩陣是否相等,然后用馬氏距離差別這4個未知氣體樣本的污染類別,并
2、計算回代誤判率與交叉誤判率;若兩類息體服從止態(tài)分卅,第一類與第二類的先驗概率分別為7/15、8/15,利用貝葉斯判別樣本的污染分類。2.先驗概率為多少時,距離判別與貝時斯判別相同?調(diào)整先驗概率對判別結(jié)果的影響是什么?3.對A類與第一我的先驗概率分別為7/15、8/15,計算誤判概率。衰小8大氣樣品數(shù)據(jù)表氣體硫化氣二靈化疏碳4環(huán)疑鬣丙烷環(huán)己就污染分及I0.0560.0S40.0310.0380,00B10.02212a04Q0.0550.1000.1100.02200.M73130.0500+0740.(Ml0.0480.00710.020140.0450*0S00.1100.1000.0250
3、0.006315P.Q3B0.1300.0790.1700.05800.043250.0300.】00.0700-1600.05000.046270.0340.095C+Q580.1600.2000.0四儂)氣體氯破化氫二氧化破4環(huán)找瓶西燒環(huán)己烷污柒分類80,0300.09060680,180d220a03*1gO.OA40.0660.029。+32。0.012。4】2100.0850.0760.0190.3000.0100,0402110.0640,0720.0200l25O0.0280.0382120.0540.0450.0220.2800.0210.0402uC0.oat)0.062a2
4、60。0380.036214。,0450.0920,0720.2000,0350.0322isE069d0B70.027a0500.089Q.Q211樣品】C>.0520.0840.0210.0370,00710,022待定樣品2(.0410.0550.1100.1100.02100,0073特定樣品3k030o.n?0.072Q1600,0560.021待定樣品40.0740.0830.1050.1»0.020L000特定*一、實驗?zāi)康? .熟練掌握MATLAB件進(jìn)行距離判別與貝葉斯判別的方法與步驟。2 .掌握判別分析的回代誤判率與交叉誤判率的編程。3 .掌握貝葉斯判別的誤判
5、率的計算。二、實驗原理1)在MATLA¥,進(jìn)行數(shù)據(jù)的乎U別分析命令為classify,其調(diào)用格式為:class=classify(sample,training,group'type')將sample數(shù)據(jù)的每一行指定到訓(xùn)練集training的一個類中。Sample和training必須具有相同的列數(shù)。group向量包含從1到組數(shù)的正整數(shù),它指明訓(xùn)練營集中的每一行屬于哪一類。group和training必須具有相同的行數(shù)。type'是可選項,選'linear'表示總體為多元正態(tài)總體,選'quadratic'與'mahala
6、nobis'。該函數(shù)返回class,它是一個與sample具有相同行數(shù)的向量。Class的每一個元素指定sample中對應(yīng)元素的分類。通過計算sample和training中每一行的馬氏距離,classify函數(shù)決定sample中的每一行屬于哪一個分類。2)貝葉斯判別方法步驟第1步,驗證兩個總體服從二元正態(tài)分布;第2步,檢驗兩個總體的協(xié)方差矩陣相等;估計兩個總體的先驗概率p1、p2;利用MATLA顫件計算。3)回代誤判率設(shè)G1,G2為兩個總體,x1,x2和y1,y2是分別來自G1,G2的訓(xùn)練樣本,以全體訓(xùn)練樣本作為m+n個新樣品,逐個代入已建立的判別準(zhǔn)則中判別其歸屬,這個過程稱為回判。
7、回判結(jié)果中若屬于G1的樣品被誤判為屬于G2的個數(shù)為N1個,屬于G2的樣品被誤判為屬于G1的個數(shù)為N2個,則誤判估計為:PA=(N1+N2/(m+n)誤判率的回代估計易于計算。但是,pA是由建立判別函數(shù)的數(shù)據(jù)反過來用作評估準(zhǔn)則的數(shù)據(jù)而得到的。所以有偏,往往比真實誤判率小。當(dāng)訓(xùn)練樣本容量較大時,pA可以作為真實誤判率的一種估計。4)交叉誤判率估計是每次剔除一個樣品,利用m+n-1個訓(xùn)練樣本建立判別準(zhǔn)則,再利用建立的準(zhǔn)則對刪除的樣本進(jìn)行判別。對每個樣品做如上分析,以其誤判的比例作為誤判率,步驟;從總體G1的訓(xùn)練樣本開始,剔除其中一個樣品,剩余的m-1個樣品與G2中的全部樣品建立判別函數(shù);用建立的判別
8、函數(shù)對剔除的樣品進(jìn)行判別;重復(fù)以上步驟,直到G1中的全部樣本依次被刪除又進(jìn)行判別,其誤判的樣品個數(shù)記為N1*;對G2的樣品重復(fù)以上步驟,直到G2中的全部樣本依次被刪除又進(jìn)行判別,其誤判的樣品個數(shù)記為N2*。于是交叉誤判率估計為:pA*=(Ni*+N2*)/(m+n)5)貝葉斯判別的有效性可以通過平均誤判率來確定。判別準(zhǔn)則的誤判率在一定程度上依賴于所考慮的各總體間的差異程度。各總體間差異越大,就越有可能建立有效的判別準(zhǔn)則。如果各總體間差異很小,做判別分析的意義不大。三、實驗步驟輸入數(shù)據(jù),判別兩類總體的協(xié)方差陣是否相等,用馬氏距離判斷判別污染類別,計算回代誤判率與交叉誤判率,貝葉斯判別污染分類。四
9、、實驗過程原始記錄(數(shù)據(jù)、圖表、計算等)1、輸入矩陣,計算協(xié)方差矩陣是否相等> >A=0.05600.08400.03100.03800.00810.02200.04000.05500.10000.11000.02200.00730.06900.08700.02700.05000.08900.02100.05200.08400.02100.03700.00710.0220> >x=0.0520.0840.0210.0370.00710.0220.04100.05500.11000.11000.02100.00730.03000.11200.07200.16000.056
10、00.02100.07400.08300.10500.19000.02001.0000> >G1=A(1:47:815,:);> >G2=A(5:69:415,:);> >n1=size(G1,1);> >n2=size(G2,1);> >n=n1+n2;>>p=6;> >f=p*(p+1)*(k-1)/2;>>d=(2*pA2+3*p-1)*(1/(n1-1)+1/(n2-1)-1/(n-k)/(6*(p+1)*(k-1);> >p1=n1/n;p2=n2/n;> >m1=
11、mean(G1);m2=mean(G2);> >s1=cov(G1);s2=cov(G2);> >s=(n1-1)*s1+(n2-1)*s2)/(n-k);>>M=(n-k)*log(det(s)-(n1-1)*log(det(s1)+(n2-1)*log(det(s2);> >T=(1-d)*MT=-44.8237+0.9288i> >C=chi2inv(0.95,f)C=32.6706> >ifT<chi2inv(0.95,f)disp('兩組數(shù)據(jù)協(xié)方差相等);elsedisp('兩組數(shù)據(jù)協(xié)方差不
12、相等);end兩組數(shù)據(jù)協(xié)方差相等> 、構(gòu)造判別函數(shù),得由判別結(jié)果>>fori=1:4w(1)=m1*inv(s)*x(i,:)'-1/2*m1*inv(s)*m1'+log(p1);w(2)=m2*inv(s)*x(i,:)'-1/2*m1*inv(s)*m2'+log(p2);forj=1:2ifw(j)=max(w)disp('待判樣品屬于第',num2str(j),'類污染');endendend待判樣品屬于第2類污染待判樣品屬于第2類污染待判樣品屬于第2類污染待判樣品屬于第2類污染3、計算回代誤判率>
13、;>n11=0;n22=0;> >fori=1:n1w1(i,1)=m1*inv(s)*G1(i,:)'-1/2*m1*inv(s)*m1'+log(p1);w1(i,2)=m2*inv(s)*G1(i,:)'-1/2*m2*inv(s)*m2'+log(p2);forj=1:2ifw1(i,j)=max(w1(i,:)&j=1n11=n11+1;endendend> >fori=1:n2w2(i,1)=m1*inv(s)*G2(i,:)'-1/2*m1*inv(s)*m1'+log(p1);w2(i,2)=
14、m2*inv(s)*G2(i,:)'-1/2*m2*inv(s)*m2'+log(p2);forj=1:2ifw2(i,j尸max(w2(i,:)&j=2n22=n22+1;endendend> >poo=(n11+n22)/(n1+n2)poo=0.10004、計算交叉誤判率> >N11=0;N22=0;A=G1(1:k-1,k+1:n1,:);N1=length(A(:,1);M1=mean(A,1);s11=cov(A);S1=(N1-1)*s11+(n2-1)*s2)/(N1+n2-k);po1=N1/(n-1);po2=n2/(n-1);fori=1:n1w1(i,1)=M1*inv(S1)*G1(i,:)'-1/2*M1*inv(S1)*M1'
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 家具行業(yè)用戶心理分析方法試題及答案
- 學(xué)習(xí)物理中的重要知識要素試題及答案
- 班組長述職報告范文簡單
- 施工安全責(zé)任明確化的試題及答案
- 組胚肌組織試題及答案
- 茶葉化學(xué)試題及答案解析
- 新能源汽車對于社會經(jīng)濟(jì)的貢獻(xiàn)試題及答案
- 自信游戲測試題及答案
- 新能源汽車的創(chuàng)新驅(qū)動發(fā)展試題及答案
- 暑假長高測試題及答案
- KTV工程部崗位職責(zé)
- 社會科學(xué)處橫向課題合同書
- 常州施工招標(biāo)開標(biāo)清標(biāo)評標(biāo)報告
- 第十五屆運動會場館醫(yī)療保障工作方案
- 生理衛(wèi)生教學(xué)課件青春期男生性教育走向成熟
- 體外診斷試劑標(biāo)準(zhǔn)品、校準(zhǔn)品、質(zhì)控品
- GB/T 3452.4-2020液壓氣動用O形橡膠密封圈第4部分:抗擠壓環(huán)(擋環(huán))
- 王力宏-緣分一道橋-歌詞
- 高校電子課件:現(xiàn)代管理學(xué)基礎(chǔ)(第三版)
- 《藥物學(xué)》課程教學(xué)大綱
- 艾滋病感染孕產(chǎn)婦所生兒童艾滋病早期診斷與抗體檢測流程圖
評論
0/150
提交評論