




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、word葡萄酒的評(píng)價(jià)摘要葡萄擁有很高的營(yíng)養(yǎng)價(jià)值,本文通過對(duì)葡萄酒的評(píng)價(jià),以及釀酒葡萄和葡萄酒的理化指標(biāo)之間的關(guān)系進(jìn)行討論分析,對(duì)不同的釀酒葡萄進(jìn)行了分類,并更深入討論兩者的理化指標(biāo)是否影響葡萄酒質(zhì)量。 針對(duì)問題一,我們首先分別計(jì)算每類葡萄酒樣品在兩組組評(píng)酒師評(píng)價(jià)下的綜合得分,以此作為每組評(píng)酒師的最終評(píng)價(jià)結(jié)果。再運(yùn)用統(tǒng)計(jì)學(xué)中的T檢驗(yàn)進(jìn)行假設(shè)與檢驗(yàn),得出兩組評(píng)價(jià)結(jié)果具有顯著性差異。最后通過計(jì)算各組評(píng)價(jià)員的評(píng)價(jià)結(jié)果的標(biāo)準(zhǔn)差,以此推算穩(wěn)定性指標(biāo)值P,P值較大的可信度較高,得出與,進(jìn)而得出第二組的評(píng)價(jià)結(jié)果更加可信。 針對(duì)問題二,我們分別對(duì)兩組葡萄進(jìn)行分類。在這里我們采用聚類分析法和主成分分析法,在mat
2、lab中實(shí)現(xiàn)對(duì)釀酒葡萄的分類。針對(duì)問題三,根據(jù)對(duì)附件2中的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,排除單位不同的影響。以釀酒葡萄的30個(gè)一級(jí)理化指標(biāo)作為自變量X,葡萄酒9個(gè)一級(jí)的理化指標(biāo)作為因變量y,建立多元線性回歸模型,得出釀酒葡萄的理化指標(biāo)與葡萄酒的理化指標(biāo)之間的聯(lián)系即回歸系數(shù)矩陣。 針對(duì)問題四,用灰色關(guān)聯(lián)度分析對(duì)兩者的關(guān)系進(jìn)行度量,求得理化指標(biāo)對(duì)樣品酒的的關(guān)聯(lián)系數(shù)。然后根據(jù)葡萄酒綜合得分及指標(biāo)的相關(guān)系數(shù)得出樣品酒的綜合指標(biāo),通過MATLAB軟件對(duì)綜合指標(biāo)與第二問中葡萄酒的分?jǐn)?shù)進(jìn)行指數(shù)擬合,擬合效果不佳,因此不能定量的用葡萄和葡萄酒的理化指標(biāo)來評(píng)價(jià)葡萄酒的質(zhì)量,只能根據(jù)圖像大致猜想綜合指標(biāo)與葡萄酒的質(zhì)量負(fù)相關(guān)
3、。關(guān)鍵詞:T檢驗(yàn) 聚類分析法 主成分分析法 Z分?jǐn)?shù) 多元線性回歸 一、問題重述確定葡萄酒質(zhì)量時(shí)一般是通過聘請(qǐng)一批有資質(zhì)的評(píng)酒員進(jìn)行品評(píng)。每個(gè)評(píng)酒員在對(duì)葡萄酒進(jìn)行品嘗后對(duì)其分類指標(biāo)打分,然后求和得到其總分,從而確定葡萄酒的質(zhì)量。釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系,葡萄酒和釀酒葡萄檢測(cè)的理化指標(biāo)會(huì)在一定程度上反映葡萄酒和葡萄的質(zhì)量。附件1給出了某一年份一些葡萄酒的評(píng)價(jià)結(jié)果,附件2和附件3分別給出了該年份這些葡萄酒的和釀酒葡萄的成分?jǐn)?shù)據(jù)。請(qǐng)嘗試建立數(shù)學(xué)模型討論以下問題:1.分析附件1中兩組評(píng)酒員的評(píng)價(jià)結(jié)果有無顯著性差異,哪一組結(jié)果更可信2.根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對(duì)這些釀酒葡萄
4、進(jìn)行分級(jí)。3.分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系。4.分析釀酒葡萄和葡萄酒的理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響,并論證能否用葡萄和葡萄酒的理化指標(biāo)來評(píng)價(jià)葡萄酒的質(zhì)量二、問題分析葡萄酒的評(píng)價(jià)是一個(gè)復(fù)雜的過程,需要綜合考慮不同評(píng)價(jià)員的評(píng)分,而且葡萄酒和葡萄的組成成分非常復(fù)雜,它們也要影響葡萄酒的質(zhì)量,對(duì)如此繁多的數(shù)據(jù),我們就必須依靠計(jì)算機(jī)工具,運(yùn)用數(shù)學(xué)統(tǒng)計(jì)學(xué)知識(shí)對(duì)它們進(jìn)行處理,并找出各個(gè)含量之間的關(guān)系,聯(lián)系生活實(shí)際,對(duì)葡萄酒作出有理有據(jù)的評(píng)價(jià)。對(duì)于問題一:要想得到兩組評(píng)價(jià)員的評(píng)價(jià)結(jié)果有無顯著差異,并對(duì)它們的可靠性作出判斷,我們首先就應(yīng)該將兩組評(píng)價(jià)員的對(duì)27組紅葡萄酒和28組白葡萄酒的評(píng)價(jià)結(jié)果整理出來
5、,求得葡萄酒的綜合得分,再運(yùn)用統(tǒng)計(jì)學(xué)中的T檢驗(yàn)進(jìn)行假設(shè)與檢驗(yàn),判斷兩組是否存在顯著性差異,再通過計(jì)算各組評(píng)價(jià)員的評(píng)價(jià)結(jié)果的標(biāo)準(zhǔn)差和穩(wěn)定性指標(biāo),進(jìn)而判斷誰的結(jié)果更加可信。 對(duì)于問題二:需要對(duì)葡萄進(jìn)行分級(jí),由于葡萄酒的質(zhì)量與釀酒葡萄的好壞有直接關(guān)系,所以我們可以根據(jù)葡萄酒的質(zhì)量對(duì)釀酒葡萄做一個(gè)簡(jiǎn)單的分級(jí),之后,我們用主成分分析法算出每一組樣本葡萄的哪些指標(biāo)該葡萄的主成分,然后通過數(shù)據(jù)分析判斷出這些成分哪些對(duì)葡萄酒的質(zhì)量作出了奉獻(xiàn),篩選出主要成分后,對(duì)不同葡萄的成分做加權(quán)求和,以此作為葡萄分級(jí)的另一個(gè)依據(jù)。對(duì)于問題三:要想得到葡萄與葡萄酒的指標(biāo)間的聯(lián)系,即得到它們之間的函數(shù)關(guān)系表達(dá)式,必須求出兩者指
6、標(biāo)之間的相關(guān)系數(shù)。但是,由于它們各自的指標(biāo)太多,此處僅以一級(jí)指標(biāo)作為相關(guān)因素進(jìn)行分析。令釀酒葡萄的30個(gè)一級(jí)指標(biāo)作為自變量,葡萄酒的9個(gè)一級(jí)指標(biāo)作為因變量,建立線性回歸模型,通過最小二乘法計(jì)算出回歸系數(shù),即釀酒葡萄的指標(biāo)與葡萄酒的指標(biāo)間的相關(guān)性。對(duì)于問題四:題中想要求出理化指標(biāo)對(duì)質(zhì)量的影響,即各理化指標(biāo)與質(zhì)量的線性或非線性關(guān)系,但是,由于理化指標(biāo)太多,并且并非沒個(gè)理化指標(biāo)都會(huì)對(duì)葡萄酒的質(zhì)量造成影響,所以首先必須進(jìn)行數(shù)據(jù)的篩選,這里我們使用spss軟件進(jìn)行典型相關(guān)性分析,找出哪些指標(biāo)與質(zhì)量有較大的關(guān)系,然后將這些指標(biāo)設(shè)為自變量,將質(zhì)量設(shè)為因變量,對(duì)它們進(jìn)行多元線性擬合,最后得到一個(gè)多元表達(dá)式以后
7、,我們就可以通過這個(gè)方程來對(duì)葡萄酒的質(zhì)量進(jìn)行驗(yàn)證,如果驗(yàn)證的結(jié)果與評(píng)價(jià)員打分的結(jié)果根本吻合的話,就說明可以用葡萄與葡萄酒的理化指標(biāo)來對(duì)葡萄酒的質(zhì)量進(jìn)行評(píng)價(jià)。三、根本假設(shè)1、 假設(shè)評(píng)酒員對(duì)每種葡萄酒的評(píng)價(jià)結(jié)果是大致符合正態(tài)分布的;2、 假設(shè)釀酒葡萄與葡萄酒中的芳香物質(zhì)主要成分是:低醇、酯類、苯等,其余成份忽略;3、 假設(shè)釀酒葡萄與葡萄酒的理化指標(biāo)中一級(jí)指標(biāo)為主要影響。4、 假設(shè)釀酒葡萄中存在的而葡萄酒中不存在的理化指標(biāo)也會(huì)影響葡萄酒的理化指標(biāo)及質(zhì)量;5、 假設(shè)不考慮多種葡萄可制成一種酒,只考慮一種葡萄制成一種酒;6、 假設(shè)只考慮紅葡萄制成紅葡萄酒,白葡萄制成白葡萄酒,忽略去皮紅葡萄可釀制白葡萄酒
8、;7、 假設(shè)質(zhì)量高的葡萄酒一定由質(zhì)量好的釀酒葡萄制成,但是質(zhì)量好的釀酒葡萄不一定能釀制成質(zhì)量高的葡萄酒;8、 表示第i瓶酒的第j個(gè)指標(biāo)無量綱化后的值9、 表示第i種釀酒葡萄的第j個(gè)指標(biāo)無量綱化后的值10、表示第i瓶酒的綜合指標(biāo)四 符號(hào)說明 統(tǒng)計(jì)量T 第k組序號(hào)為h的樣品第i個(gè)指標(biāo)第j個(gè)品酒師的給分 序號(hào)為h的樣品中第i個(gè)指標(biāo)第k組10位品酒師給分的平均值 第k組序號(hào)為h的樣品第i個(gè)指標(biāo)10位品酒師評(píng)分的標(biāo)準(zhǔn)差 第k組第i個(gè)指標(biāo)所占權(quán)重 第k組序號(hào)為h的樣品的穩(wěn)定性指標(biāo) 第k組紅葡萄酒的評(píng)分總平均穩(wěn)定性指標(biāo) 第k組白葡萄酒的評(píng)分總平均穩(wěn)定性指標(biāo) : 為第i個(gè)樣品的第j個(gè)指標(biāo) : 第i個(gè)葡萄樣品的
9、總得分: 第i個(gè)樣品葡萄理化指標(biāo)得分為 其中:第一個(gè)指標(biāo)指澄清度,第二個(gè)指標(biāo)指色調(diào),第三個(gè)指標(biāo)指香氣純粹度,第四個(gè)指標(biāo)指香氣濃度,第五個(gè)指標(biāo)指香氣質(zhì)量,第六個(gè)指標(biāo)指口感純粹度,第七個(gè)指標(biāo)指口感濃度,第八個(gè)指標(biāo)指持久性,第九個(gè)指標(biāo)指口感質(zhì)量,第十個(gè)指標(biāo)指平衡/整體評(píng)價(jià)。 五 模型建立與求解5. 1 問題一 :葡萄酒評(píng)價(jià)結(jié)果的顯著性差異及可信度分析5. 1. 1 葡萄酒評(píng)價(jià)結(jié)果數(shù)據(jù)預(yù)處理對(duì)附件1中數(shù)據(jù)通過Excel篩選觀察時(shí)可發(fā)現(xiàn)某些數(shù)據(jù)錯(cuò)誤,如:第一組紅葡萄酒品嘗評(píng)分中酒樣品20號(hào)下4號(hào)品酒員對(duì)于外觀分析的色調(diào)評(píng)價(jià)數(shù)據(jù)缺失;第一組白葡萄酒品嘗評(píng)分中酒樣品3號(hào)下7號(hào)品酒員對(duì)于口感分析的持久性評(píng)價(jià)數(shù)
10、據(jù)為77,明顯超過該項(xiàng)上限8;第一組白葡萄酒品嘗評(píng)分中酒樣品8號(hào)下9號(hào)品酒員對(duì)于口感分析的持久性評(píng)價(jià)數(shù)據(jù)為16,明顯超過該項(xiàng)上限8等。對(duì)這些異常數(shù)據(jù)為減少其對(duì)于總體評(píng)價(jià)結(jié)果的影響,采取預(yù)處理:取該酒樣對(duì)應(yīng)誤差工程其余品酒員評(píng)價(jià)結(jié)果平均值替代該異常數(shù)據(jù)。經(jīng)過數(shù)據(jù)預(yù)處理可得出每一種類葡萄酒的綜合得分,建立表1與表2。表1 紅葡萄酒總得分平均值紅酒n12345678910第一組第二組746611121314151617181920第一組73第二組21222324252627第一組7873第二組72根據(jù)表1,用excel 作出兩組評(píng)酒師對(duì)每一類葡萄酒的評(píng)分折線圖。圖1表2 紅葡萄酒總得分平均值白酒n1
11、2345678910第一組8271第二組11121314151617181920第一組7274第二組2122232425262728第一組71第二組77根據(jù)表2,用excel 作出兩組評(píng)酒師對(duì)每一類葡萄酒的評(píng)分折線圖。 圖2根據(jù)圖1、 圖2可初步簡(jiǎn)單看出兩組評(píng)酒師的評(píng)價(jià)結(jié)果存在有顯著性差異。 512 葡萄酒評(píng)價(jià)結(jié)果差異性分析與可信度分析模型建立與求解(1) 檢驗(yàn)?zāi)P徒?首先假定兩個(gè)總體平均數(shù)間沒有顯著差異,即查T值表,比擬計(jì)算得到的T值與理論T值,推斷發(fā)生概率一般為95%。兩個(gè)正態(tài)總體的均值檢驗(yàn)?zāi)P图僭O(shè) 是來自總體 的樣本 是來自總體 的樣本,且兩樣本獨(dú)立。設(shè) ,和 均未知,其檢驗(yàn)問題為.且
12、.當(dāng)為真時(shí),統(tǒng)計(jì)量T的計(jì)算公式.式中,.查T值表,比擬計(jì)算得到的T值與理論T值,推斷發(fā)生概率一般為95%,其中 為顯著性水平,因此當(dāng) 那么認(rèn)為不成立,兩組評(píng)酒員對(duì)紅葡萄酒的評(píng)價(jià)結(jié)果有顯著性差異。2兩組評(píng)酒員對(duì)紅葡萄酒的評(píng)價(jià)結(jié)果比擬: 分別計(jì)算出 ,說明該兩組評(píng)酒員對(duì)紅葡萄酒的評(píng)價(jià)結(jié)果有顯著性差異。3兩組評(píng)酒員對(duì)白葡萄酒的評(píng)價(jià)結(jié)果比擬: 分別計(jì)算出 ,說明該兩組評(píng)酒員對(duì)白葡萄酒的評(píng)價(jià)結(jié)果有顯著性差異。5. 1. 3可信度分析模型建立與求解 :第k組序號(hào)為h的樣品 第i個(gè)指標(biāo)10位品酒師給分的平均值第k組序號(hào)為h的樣品第i個(gè)指標(biāo)10位品酒師的標(biāo)準(zhǔn)差算出第k組序號(hào)為h的樣品的穩(wěn)定性指標(biāo) 第k組紅,白
13、葡萄酒的評(píng)分總平均穩(wěn)定性指標(biāo) 計(jì)算求得: 比擬紅葡萄酒的兩組總平均穩(wěn)定性指標(biāo),因?yàn)?所以第二組品酒師的評(píng)價(jià)結(jié)果更可信。同樣,比擬白葡萄酒的總平均穩(wěn)定性指標(biāo),因?yàn)?,所以第二組品酒師的評(píng)價(jià)結(jié)果可信度更高。問題二: 根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對(duì)這些釀酒葡萄進(jìn)行分級(jí)。問題二求根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對(duì)釀酒葡萄進(jìn)行分級(jí),葡萄酒由釀酒葡萄釀制而成,那么釀酒葡萄的質(zhì)量與葡萄酒的質(zhì)量有著直接的關(guān)系,那么可以根據(jù)葡萄酒的質(zhì)量對(duì)釀酒葡萄做一個(gè)簡(jiǎn)單的分級(jí),在根據(jù)主成分分析從葡萄的理化指標(biāo)中篩選出對(duì)葡萄質(zhì)量產(chǎn)生影響的主要因素,根據(jù)所得各主要因素的奉獻(xiàn)率給個(gè)因素加權(quán)作為系數(shù),求出葡萄中主成分的含量
14、,并進(jìn)行排名,之后將此排名與之前根據(jù)葡萄酒質(zhì)量所得出的排名綜合,進(jìn)而得出較準(zhǔn)確的對(duì)釀酒葡萄的分級(jí)。 K均值法聚類分析模型k均值法的根本步驟:(1) 選擇k個(gè)葡萄酒樣品作為初始凝聚點(diǎn),或者將所有葡萄酒樣品分成k個(gè)初始 類,然后將這k個(gè)類的重心(均值)作為初始凝聚點(diǎn)。 (2)對(duì)除凝聚點(diǎn)之外的所有葡萄酒樣品逐個(gè)歸類,將每個(gè)葡萄酒樣品歸入凝聚點(diǎn)離它最近的那個(gè)類通常采用歐氏距離,該類的凝聚點(diǎn)更新為這一類目前的均值,直至所有葡萄酒樣品都?xì)w了類。(3)重復(fù)步驟(2),直至所有的葡萄酒樣品都不能再分配為止。最終的聚類結(jié)果在一定程度上依賴于初始凝聚點(diǎn)或初始分類的選擇。經(jīng)驗(yàn)說明,聚類過程中的絕大多數(shù)重要變化均發(fā)生
15、在第一次再分配中。也就是:先算各類的均值再算各類中樣本到本類及其他類的均值的絕對(duì)值距離歐氏距離將葡萄酒樣本重新歸類到歐氏距離較小的類中重新歸類就得算均值首先,根據(jù)第一問得出的結(jié)果,我們采用第二組評(píng)酒員的結(jié)果作為判斷葡萄酒質(zhì)量的依據(jù),根據(jù)各葡萄酒的分?jǐn)?shù),我們得出了紅葡萄酒和白葡萄酒的排名 ,雖然是葡萄酒質(zhì)量的排名,但由于葡萄酒的質(zhì)量由釀酒葡萄的質(zhì)量決定,所以上表可以看作是葡萄質(zhì)量的排名,以上表中葡萄酒的分?jǐn)?shù)作為釀酒葡萄質(zhì)量的分?jǐn)?shù),可以對(duì)釀酒葡萄作出初步的分級(jí),針對(duì)葡萄酒的成績(jī),我們用聚類分析的方法,得出了葡萄的初步分級(jí),運(yùn)行的得到的圖樣如下: 圖 3 圖 4根據(jù)上述結(jié)果,得出紅、白葡萄酒的等級(jí)分
16、類,建立表3,表4. 表 3 紅葡萄酒等級(jí)分類等級(jí)酒樣品號(hào)A1,10,12,13,16,25B4,5,14,19,21,22,24,26,27C6,7,8,11,15,18D2,3,9,17,20,23表 4 白葡萄酒等級(jí)分類等級(jí)酒樣品號(hào)A5,9,10,15,17,21,22,25,28B1,2,3,4,6,14,18,19,20,23,24,27C7,8,11,12,13,26D16 主成分權(quán)值分級(jí)模型雖然釀酒葡萄所對(duì)應(yīng)葡萄酒的質(zhì)量能在一定程度上反映釀酒葡萄的質(zhì)量,但葡萄的質(zhì)量還應(yīng)以葡萄本身的成分來區(qū)分其級(jí)別,為了得到更準(zhǔn)確的分級(jí),我們又對(duì)附件中所給釀酒葡萄中的理化指標(biāo)做了一些分析。為了綜合
17、考慮釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對(duì)這些釀酒葡萄進(jìn)行分級(jí),將附件3中芳香物質(zhì)含量總和作為一個(gè)一級(jí)理化指標(biāo),設(shè)第i個(gè)樣品葡萄理化指標(biāo)得分為,葡萄酒的質(zhì)量總分為,那么第i個(gè)葡萄樣品的總得分可以表示為選取一個(gè)使得樣品趨于較穩(wěn)定值的,此時(shí)的可作為釀酒葡萄的分級(jí)權(quán)值。(1) 首先對(duì)各理化指標(biāo)進(jìn)行歸一化處理,釀酒葡萄一級(jí)理化指標(biāo)中樣本有n個(gè),指標(biāo)有m個(gè),分別設(shè)為,令為第i個(gè)樣品的第j個(gè)指標(biāo)。做變換得到標(biāo)準(zhǔn)化的數(shù)據(jù)矩陣,其中(2) 在標(biāo)準(zhǔn)化數(shù)據(jù)矩陣N的根底上計(jì)算個(gè)原始指標(biāo)相關(guān)性系數(shù)矩陣其中 (3) 求相關(guān)性系數(shù)矩陣R的特征值并排序,再求出R的特征值的相應(yīng)的正交單位化特征向量,那么第i個(gè)主成分可表示為各指標(biāo)
18、的線性組合。計(jì)算綜合得分。首先計(jì)算得到第i個(gè)樣本中第k個(gè)主成分的得分為,再以個(gè)主成分的方差奉獻(xiàn)率為權(quán)重,求得第i個(gè)樣品的綜合得分。模型求解:表5 紅葡萄樣品主成份及其排序主成份序列1234567主成份花色苷纈氨酸干物質(zhì)含量順式白藜蘆醇苷PH值多酚氧化酶活力果梗比主成份序列89主成份酪氨酸百粒質(zhì)量表 6 紅葡萄樣品綜合得分葡萄樣品號(hào)綜合得分分?jǐn)?shù)排序?qū)?yīng)樣品號(hào)樣品分差值1 9 2 23 3 20 4 22 5 3 6 12 7 6 8 18 9 1 10 13 11 11 12 2 13 8 14 26 15 21 16 5 17 10 18 17 19 27 20 16 21 19 22 24
19、23 4 24 25 25 14 26 15 27 7 對(duì)綜合得分相鄰樣品分差值進(jìn)行分析,當(dāng)其值到達(dá)及以上,認(rèn)為兩釀酒葡萄的品質(zhì)差異較大,不能分在同一級(jí),按照此方法,紅葡萄可分成六級(jí),一級(jí)到六級(jí)表示葡萄品質(zhì)逐漸降低,具體情況如下表:表 7 紅葡萄分級(jí)結(jié)果級(jí)數(shù)紅葡萄樣品號(hào)一級(jí)9 23二級(jí)1 3 6 12 18 20 22 三級(jí)2 8 11 13 26 四級(jí)5 21五級(jí)4 7 10 15 16 17 19 24 25 六級(jí)27 本模型中主要以紅葡萄樣品的相關(guān)數(shù)據(jù)進(jìn)行分級(jí),按照同樣的方法將白葡萄的相關(guān)數(shù)據(jù)代入,求得白葡萄分級(jí)如下:表 8 白葡萄分級(jí)結(jié)果級(jí)數(shù)白葡萄樣品號(hào)一級(jí)27二級(jí)1 4 10 15
20、18 22 23 28 三級(jí)5 6 12 13 17 20四級(jí)2 3 14 16 21 24 25五級(jí)7 8 9 11 195. 3 問題三:分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系 數(shù)據(jù)預(yù)處理標(biāo)準(zhǔn)化及綜合理化指標(biāo)在處理附件2中數(shù)據(jù)時(shí)可以發(fā)現(xiàn)某些存在異常的數(shù)據(jù)值,如:葡萄理化指標(biāo)中白葡萄百粒質(zhì)量的第三次檢測(cè)值為22261 g,明顯超過其它兩次的檢測(cè)值。為防止異常數(shù)據(jù)值對(duì)分級(jí)結(jié)果的影響,取其它兩次值的平均值替代該異常值。同時(shí)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,取其z分?jǐn)?shù):其中, 為變量值, 為平均數(shù), 為標(biāo)準(zhǔn)差。 分?jǐn)?shù)表示的是此變量大于或小于平均數(shù)幾個(gè)標(biāo)準(zhǔn)差。由于z分?jǐn)?shù)分母的單位與分子的單位相同,故z分?jǐn)?shù)沒有
21、單位,因而可以用Z分?jǐn)?shù)來比擬兩個(gè)從不同單位總體中抽出的變量值。同時(shí)將原始數(shù)據(jù)直接轉(zhuǎn)化為z分?jǐn)?shù)時(shí),常會(huì)出現(xiàn)負(fù)數(shù)和帶小數(shù)點(diǎn)的值。5. 3. 2多元線性回歸模型(1) 模型建立 觀察所給附件中的數(shù)據(jù)易知,影響釀酒葡萄與葡萄酒理化指標(biāo)的因素往往不止一個(gè),所以建立多元線性回歸模型求解釀酒葡萄與葡萄酒兩者理化指標(biāo)之間的聯(lián)系。設(shè)變量Y與變量間有線性關(guān)系.式中,和是未知參數(shù), 。設(shè) 是 的n 次獨(dú)立觀測(cè)值,那么多元線性模型可表示為.式中,,且獨(dú)立同分布??捎镁仃囆问奖硎?,令那么多元線性模型可表示為 。式中.(2) 模型求解類似于一元線性回歸,求參數(shù)的估計(jì)值,就是求最小二乘函數(shù).到達(dá)最小的值,可以證明的最小二乘
22、估計(jì).從而可得經(jīng)驗(yàn)回歸方程為 .將釀酒葡萄看做自變量,葡萄酒看做因變量。注意,計(jì)算時(shí)用的是經(jīng)過處理后的Z分?jǐn)?shù)表。我們用 表示釀酒葡萄的30個(gè)一級(jí)指標(biāo),作為自變量X;用表示葡萄酒的9個(gè)一級(jí)指標(biāo),作為因變量y。其中,理化指標(biāo)的編號(hào)順序依照所給附件中的大小順序。例如,紅葡萄酒中理化指標(biāo)順序依次為花色苷、單寧、總酚、酒總黃酮、白藜蘆醇、DPPH半抑制體積、L 、a、b 。經(jīng)過MATLAB對(duì)回歸系數(shù)的最小二乘估計(jì)計(jì)算,得出回歸系數(shù),即自變量與因變量之間的聯(lián)系,見附表。根據(jù)回歸系數(shù)表得出兩者之間的正負(fù)相關(guān)性,其中數(shù)字為釀酒葡萄理化指標(biāo)編號(hào)。正相關(guān)花色苷單寧總酚酒總黃酮白藜蘆醇DPPH半抑制體積L*a*b*
23、101017171317221317171716122210262714122044231211681616121611163054821141814209118201281420142518567105272121313442082542419167147134829812131310162815271424182419115127282824331320338328215112419599283019212977125231919131323924表 9 釀酒紅葡萄與紅葡萄酒正相關(guān)回歸系數(shù)表 10 釀酒紅葡萄與紅葡萄酒負(fù)相關(guān)回歸系數(shù)負(fù)相關(guān)花色苷單寧總酚酒總黃酮白藜蘆醇DPPH半抑制體積L*
24、a*b*915196818232619292329202829271425182928730231282015925231827164242525921515617231512529251923293061115173010201527163062612721261815271511325261111301126225229223027261673028132622241429627221242110261013922221810816172411表11 釀酒白葡萄與白葡萄酒正相關(guān)回歸系數(shù)正相關(guān)單寧總酚酒總黃酮白藜蘆醇DPPH半抑制體積L*a*b*30183092024214221612211
25、118302332943181412152412151823179276111221620272921232313102415122151024308161628927226629112627717221410235519291152674262575912102822195142642818208510176137314262325表12 釀酒白葡萄與白葡萄酒負(fù)相關(guān)回歸系數(shù)負(fù)相關(guān)單寧總酚酒總黃酮白藜蘆醇DPPH半抑制體積L*a*b*125261311422728131254642321978109728716221525272622813289122911827282458152561581
26、923312101342561215161325111414271392224918202919301919522181121181710192301171430241716283329172127620162317202120201432121218245. 4 問題4灰色關(guān)聯(lián)度分析模型5. 4. 1模型的建立假設(shè)要分析釀酒葡萄和葡萄酒的理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響,那么應(yīng)該先求出它們的相關(guān)性。此題應(yīng)用灰色關(guān)聯(lián)度分析對(duì)系統(tǒng)兩者的關(guān)系進(jìn)行度量?;疑C合分析用以下模型.R為M個(gè)被評(píng)價(jià)對(duì)象的綜合評(píng)價(jià)結(jié)果向量:W為N個(gè)評(píng)價(jià)指標(biāo)的權(quán)重向量:E為評(píng)判矩陣。為第i個(gè)被評(píng)價(jià)對(duì)象的第k個(gè)指標(biāo)與第k個(gè)最優(yōu)指標(biāo)的關(guān)
27、聯(lián)系數(shù)。根據(jù)R的數(shù)值,進(jìn)行排序。設(shè),此最優(yōu)序列的每個(gè)指標(biāo)值可以是各個(gè)評(píng)價(jià)對(duì)象的最優(yōu)值。式中為第i個(gè)葡萄樣品第k個(gè)指標(biāo)的原始數(shù)值由于評(píng)價(jià)指標(biāo)間有不同的量綱和數(shù)量級(jí),故不能直接進(jìn)行比擬,因此需要對(duì)原始指標(biāo)進(jìn)行標(biāo)準(zhǔn)處理。那么可以用下式將原始數(shù)值變成無量綱值,i=1,2,.m; k=1,2,.n.根據(jù)灰色系統(tǒng)理論將.作為參考數(shù)列將作為比擬數(shù)列,那么用關(guān)聯(lián)分析法分別求得第i個(gè)被評(píng)價(jià)對(duì)象的第k個(gè)指標(biāo)與第k個(gè)指標(biāo)最優(yōu)指標(biāo)的關(guān)聯(lián)系數(shù),、即:.上式中:一般取.這樣綜合評(píng)價(jià)的結(jié)果為:如果關(guān)聯(lián)度最大,說明與最優(yōu)指標(biāo)最接近,據(jù)此可排出被評(píng)價(jià)對(duì)象的優(yōu)劣次序。選取五種理化指標(biāo)和六種葡萄酒進(jìn)行研究,具體數(shù)據(jù)見表:局部理化指
28、標(biāo)數(shù)據(jù)指標(biāo)葡萄樣品14葡萄樣品18葡萄樣品24葡萄樣品8葡萄樣品 4 葡萄樣品12乙醛乙醇1-己醇1-辛醇苯乙醇13,.617.設(shè)分辨系數(shù)為將值帶人中,運(yùn)用matlab求得= = = 0= 0,7672 0= 0計(jì)算關(guān)聯(lián)度,由公式.分別計(jì)算出乙醛,乙醇,1-己醇,1-辛醇,苯乙醇的關(guān)聯(lián)度.得出結(jié)論.同理可得:白葡萄酒的關(guān)聯(lián)度大小關(guān)系為:.由以上說明醇類物質(zhì)等理化指標(biāo)對(duì)葡萄酒的質(zhì)量有重要影響,然而影響葡萄及質(zhì)量的因素不止這些。比方:葡萄果實(shí)中糖的成分的多少,是制約發(fā)酵后葡萄酒的酒精度的要素。因此我們建立了綜合指標(biāo)評(píng)價(jià)模型來論證能否用葡萄和葡萄酒的理化指標(biāo)來評(píng)價(jià)葡萄酒的質(zhì)量。 綜合指標(biāo)評(píng)價(jià)模型:模
29、型建立:綜合指標(biāo)計(jì)算公式:每一瓶酒對(duì)應(yīng)一個(gè)綜合指標(biāo)紅葡萄酒有27個(gè)綜合指標(biāo) 白葡萄酒有28個(gè)綜合指標(biāo) 模型求解:利用計(jì)算機(jī)編程求解出每瓶葡萄酒的綜合指標(biāo)程序見附錄見下表:紅葡萄酒編號(hào)分?jǐn)?shù)綜合指標(biāo)白葡萄酒編號(hào)分?jǐn)?shù)綜合指標(biāo)13511512622559433337814470924577518153261489611725407730860873591329630106881022911213115051220958123013489813284149146398158714152116951613176417376184553218772319881974672076532762015211621
30、343221322266231572320241272418425140122529261596262257279782710212812利用matlab擬合綜合指標(biāo)的值與第二問中葡萄酒的分?jǐn)?shù)得到以下圖:紅葡萄酒:去除一個(gè)奇點(diǎn)后用指數(shù)函數(shù)擬合得以下圖:擬合結(jié)果:f(x) = a*exp(b*x) a = +011 +013, +013) b = , R-square: 白葡萄酒:用指數(shù)函數(shù)擬合后如以下圖:擬合結(jié)果:f(x) = a*exp(b*x) a = 1215 +004, +004) b = , R-square: 由R-square值可以看出兩組曲線擬合的結(jié)果不好,變換擬合函數(shù)嘗試數(shù)次
31、后所得擬合結(jié)果均不理想,因此我們認(rèn)為不能定量的用葡萄和葡萄酒的理化指標(biāo)來評(píng)價(jià)葡萄酒的質(zhì)量,只能根據(jù)圖像大致猜想綜合指標(biāo)與葡萄酒的質(zhì)量負(fù)相關(guān)六 模型評(píng)價(jià) 優(yōu)點(diǎn): 1.本文在建模過程中,使用了建模與軟件分析相結(jié)合的方法,提高了計(jì)算結(jié)果的準(zhǔn)確性; 2.本文在求解是對(duì)同一問題使用兩種不同方法,使模型得出的結(jié)果更加可靠;3.本文在建模過程中使用的方法簡(jiǎn)單有效,在原模型的根底上又有一定的創(chuàng)新。缺點(diǎn):通過經(jīng)驗(yàn)設(shè)定綜合指標(biāo)進(jìn)行求解,簡(jiǎn)化了相應(yīng)的數(shù)學(xué)模型,只是缺少對(duì)綜合指標(biāo)設(shè)立的檢驗(yàn),依據(jù)性不強(qiáng)。七 參考文獻(xiàn)1陳光亭 裘哲勇 數(shù)學(xué)建模 高等教育出版社 2022年2月2王宏洲 數(shù)學(xué)建模優(yōu)秀論文 清華大學(xué)出版社 2
32、022年9月3 姜啟源、謝金星、葉俊, 數(shù)學(xué)模型 (第四版),北京:高等教育出版社,2022年。4 白鳳山、么煥民等, 數(shù)學(xué)建模 (上冊(cè)),哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2003年。附錄X(j)Y(i)123456789120000000003456789101112131415161718192021222324252627282930釀酒紅葡萄與紅葡萄酒理化指標(biāo)的回歸系數(shù)釀酒白葡萄與白葡萄酒理化指標(biāo)的回歸系數(shù)X(j)Y(i)12345678123456789101112131415161718192021222324252627282930代碼 T 檢驗(yàn)functionH,P,CI=tte
33、st(X,Y)%H表示在顯著性水平為下,H=1時(shí)能拒絕原假設(shè),驗(yàn)的零假設(shè)H0為兩總體均值之間不存在顯著差異%p< 拒絕H0有顯著性差異 %Cl均值的置信區(qū)間不跨越0時(shí)說明有顯著性差異Muhat, sigmahat, muci, sigmaci=normfit(X)%Muhat為均值 muci為均值 置信區(qū)間%sigmahat為標(biāo)準(zhǔn)差 sigmaci標(biāo)準(zhǔn)差 置信區(qū)間a=Muhat;b=sigmahat;Cx=b/a%X的變異系數(shù)Muhat, sigmahat, muci, sigmaci=normfit(Y)%Muhat為均值 muci為均值 置信區(qū)間%sigmahat為標(biāo)準(zhǔn)差 sigma
34、ci標(biāo)準(zhǔn)差 置信區(qū)間a=Muhat;b=sigmahat;Cy=b/a%Y的變異系數(shù)如果Cx<Cy,那么說明x比y更可靠if Cx<Cy disp('x比y 變異系數(shù)小,更穩(wěn)定,結(jié)果更可靠') else disp('y比x變異系數(shù)小,更穩(wěn)定,結(jié)果更可靠')endend聚類分析程序:x = 74 66 72 ' opts = statset('Display','final'); % 顯示每次聚類的最終結(jié)果% 將原始的5個(gè)點(diǎn)聚為3類,距離采用絕對(duì)值距離,重復(fù)聚類5次,顯示每次聚類的最終結(jié)果idx = kmeans
35、(x,4,'Distance','city','Replicates',27,'Options',opts)%*繪制聚類輪廓圖*x = 74 66 72 ' % 例中的觀測(cè)數(shù)據(jù)% 將原始的5個(gè)點(diǎn)聚為3類,距離采用絕對(duì)值距離,重復(fù)聚類5次idx = kmeans(x,4,'Distance','city','Replicates',27); S, H = silhouette(x,idx) % 繪制輪廓圖,并返回輪廓值向量S和圖形句柄H % 例中的觀測(cè)數(shù)據(jù)opts = stat
36、set('Display','final'); % 顯示每次聚類的最終結(jié)果% 將原始的5個(gè)點(diǎn)聚為3類,距離采用絕對(duì)值距離,重復(fù)聚類5次,顯示每次聚類的最終結(jié)果idx = kmeans(x,4,'Distance','city','Replicates',27,'Options',opts)%*繪制聚類輪廓圖*x = 74 66 72 ' % 例中的觀測(cè)數(shù)據(jù)% 將原始的5個(gè)點(diǎn)聚為3類,距離采用絕對(duì)值距離,重復(fù)聚類5次idx = kmeans(x,4,'Distance',
37、9;city','Replicates',27); S, H = silhouette(x,idx) % 繪制輪廓圖,并返回輪廓值向量S和圖形句柄Htitle('聚類分析紅葡萄酒K均值聚類') % 為X軸加標(biāo)簽主成分分析程序:PHO = ;%代入數(shù)據(jù)%*調(diào)用pcacov函數(shù)根據(jù)相關(guān)系數(shù)矩陣作主成分分析*% 返回主成分表達(dá)式的系數(shù)矩陣COEFF,返回相關(guān)系數(shù)矩陣的特征值向量latent和主成分奉獻(xiàn)率向量explainedCOEFF,latent,explained = pcacov(PHO)% 為了更加直觀,以元胞數(shù)組形式顯示結(jié)果result1(1,:) = '特征值', '差值', '奉獻(xiàn)率', '累積奉獻(xiàn)率'result1(2:7,1) = num2cell(latent);result1(2:6,2) = num2cell(-diff(latent);result1(2:7,3:4) = num2cell(explained, cumsum(explained)% 以元胞數(shù)組形式顯示主成分表達(dá)式s = '''x1:''x2:''x3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 歌唱活動(dòng)活動(dòng)方案
- 江山集團(tuán)露營(yíng)活動(dòng)方案
- 母嬰店小套路活動(dòng)方案
- 檢察院集中工作活動(dòng)方案
- 民政入戶宣傳活動(dòng)方案
- 江蘇高校女神節(jié)活動(dòng)方案
- 永輝超市虎年活動(dòng)方案
- 榜樣發(fā)布活動(dòng)方案
- 母嬰元旦活動(dòng)策劃方案
- 汽車店公司團(tuán)建策劃方案
- 海南省??谑?2024年-2025年小學(xué)四年級(jí)語文)人教版期末考試((上下)學(xué)期)試卷及答案
- 護(hù)理質(zhì)量控制中心經(jīng)費(fèi)管理辦法
- MFP無機(jī)硅聲能凝膠施工方案
- GB/T 150.1-2024壓力容器第1部分:通用要求
- 籃球課程思政課程設(shè)計(jì)
- 2024年質(zhì)量知識(shí)競(jìng)賽考試題庫500題(含答案)
- 2024年北京市中考數(shù)學(xué)真題試卷及答案
- 2024年浙江省杭州市蕭山區(qū)事業(yè)單位招考高頻考題難、易錯(cuò)點(diǎn)模擬試題(共500題)附帶答案詳解
- 系統(tǒng)解剖學(xué)(南方醫(yī)科大學(xué))智慧樹知到期末考試答案章節(jié)答案2024年南方醫(yī)科大學(xué)
- 初中英語大綱詞匯表
- 山東省濟(jì)南市槐蔭區(qū)2023-2024學(xué)年小學(xué)六年級(jí)語文畢業(yè)檢測(cè)指導(dǎo)卷含答案
評(píng)論
0/150
提交評(píng)論