多元統(tǒng)計(jì)復(fù)習(xí)題附答案_第1頁(yè)
多元統(tǒng)計(jì)復(fù)習(xí)題附答案_第2頁(yè)
多元統(tǒng)計(jì)復(fù)習(xí)題附答案_第3頁(yè)
多元統(tǒng)計(jì)復(fù)習(xí)題附答案_第4頁(yè)
多元統(tǒng)計(jì)復(fù)習(xí)題附答案_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、復(fù)習(xí)題原文:答案:4.2 試述判別分析的實(shí)質(zhì)。4.3 簡(jiǎn)述距離判別法的基本思想和方法。4.4 簡(jiǎn)述貝葉斯判別法的基本思想和方法。4.5 簡(jiǎn)述費(fèi)希爾判別法的基本思想和方法。4.6 試析距離判別法、貝葉斯判別法和費(fèi)希爾判別法的異同。4.2 試述判別分析的實(shí)質(zhì)。答:判別分析就是希望利用已經(jīng)測(cè)得的變量數(shù)據(jù),找出一種判別函數(shù),使得這一函數(shù)具有某種最優(yōu)性質(zhì),能把屬于不同類別的樣本點(diǎn)盡可能地區(qū)別開(kāi)來(lái)。設(shè)R1,R2,Rk是p維空間R p的k個(gè)子集,如果它們互不相交,且它們的和集為Rp,則稱R1,R2Rp為Rp的一個(gè)劃分。判別分析問(wèn)題實(shí)質(zhì)上就是在某種意義上,以最優(yōu)的性質(zhì)對(duì)p維空間Rp構(gòu)造一個(gè)“劃分”,這個(gè)“劃分

2、”就構(gòu)成了一個(gè)判別規(guī)則。4.3 簡(jiǎn)述距離判別法的基本思想和方法。答:距離判別問(wèn)題分為兩個(gè)總體的距離判別問(wèn)題和多個(gè)總體的判別問(wèn)題。其基本思想都是分別計(jì)算樣本與各個(gè)總體的距離(馬氏距離),將距離近的判別為一類。兩個(gè)總體的距離判別問(wèn)題設(shè)有協(xié)方差矩陣相等的兩個(gè)總體G1和G2,其均值分別是m1和m 2,對(duì)于一個(gè)新的樣品X,要判斷它來(lái)自哪個(gè)總體。計(jì)算新樣品X到兩個(gè)總體的馬氏距離D2(X,G1)和D2(X,G2),則 X G1 ,D2(X,G1) D2(X,G2)X G2 ,D2(X,G1)> D2(X,G2,具體分析, 記 則判別規(guī)則為 X G1 ,W(X)0X G2 ,W(X)<0多個(gè)總體的

3、判別問(wèn)題。設(shè)有個(gè)總體,其均值和協(xié)方差矩陣分別是和,且。計(jì)算樣本到每個(gè)總體的馬氏距離,到哪個(gè)總體的距離最小就屬于哪個(gè)總體。具體分析, 取,??梢匀【€性判別函數(shù)為, 相應(yīng)的判別規(guī)則為 若 4.4 簡(jiǎn)述貝葉斯判別法的基本思想和方法?;舅枷耄涸O(shè)k個(gè)總體,其各自的分布密度函數(shù),假設(shè)k個(gè)總體各自出現(xiàn)的概率分別為,。設(shè)將本來(lái)屬于總體的樣品錯(cuò)判到總體時(shí)造成的損失為,。設(shè)個(gè)總體相應(yīng)的維樣本空間為 。在規(guī)則下,將屬于的樣品錯(cuò)判為的概率為 則這種判別規(guī)則下樣品錯(cuò)判后所造成的平均損失為 則用規(guī)則來(lái)進(jìn)行判別所造成的總平均損失為 貝葉斯判別法則,就是要選擇一種劃分,使總平均損失達(dá)到極小?;痉椒ǎ毫?,則 若有另一劃分,

4、則在兩種劃分下的總平均損失之差為 因?yàn)樵谏蠈?duì)一切成立,故上式小于或等于零,是貝葉斯判別的解。從而得到的劃分為 4.5 簡(jiǎn)述費(fèi)希爾判別法的基本思想和方法。答:基本思想:從個(gè)總體中抽取具有個(gè)指標(biāo)的樣品觀測(cè)數(shù)據(jù),借助方差分析的思想構(gòu)造一個(gè)線性判別函數(shù) 系數(shù)可使得總體之間區(qū)別最大,而使每個(gè)總體內(nèi)部的離差最小。將新樣品的個(gè)指標(biāo)值代入線性判別函數(shù)式中求出值,然后根據(jù)判別一定的規(guī)則,就可以判別新的樣品屬于哪個(gè)總體。4.6 試析距離判別法、貝葉斯判別法和費(fèi)希爾判別法的異同。答: 費(fèi)希爾判別與距離判別對(duì)判別變量的分布類型無(wú)要求。二者只是要求有各類母體的兩階矩存在。而貝葉斯判別必須知道判別變量的分布類型。因此前兩

5、者相對(duì)來(lái)說(shuō)較為簡(jiǎn)單。 當(dāng)k=2時(shí),若1=2=則費(fèi)希爾判別與距離判別等價(jià)。當(dāng)判別變量服從正態(tài)分布時(shí),二者與貝葉斯判別也等價(jià)。 當(dāng)12時(shí),費(fèi)希爾判別用1+2作為共同協(xié)差陣,實(shí)際看成等協(xié)差陣,此與距離判別、貝葉斯判別不同。 距離判別可以看為貝葉斯判別的特殊情形。貝葉斯判別的判別規(guī)則是 X G1 ,W(X)lndX G2 ,W(X)<lnd距離判別的判別規(guī)則是 X G1 ,W(X)0X G2 ,W(X)<0二者的區(qū)別在于閾值點(diǎn)。當(dāng),時(shí),。二者完全相同。4.7 設(shè)有兩個(gè)二元總體G1和G2 ,從中分別抽取樣本計(jì)算得到 X(1)=51, X(2)=3-2,Sp=5.82.12.17.6 假設(shè)1=

6、2,試用距離判別法建立判別函數(shù)和判別規(guī)則。 樣品X=(6,0)應(yīng)屬于哪個(gè)總體?解:1=X(1)=51 ,2=X(2)=3-2 , =1+22=4-0.5Wp=x-=x-'-11-2x-'=6,0-4,0.5=2,0.5-1=139677.6-2.1-2.15.81-2=(2,3)'Wp=2,0.5139677.6-2.1-2.15.823=24.439.67>0 X G1即樣品X屬于總體G15.1 判別分析和聚類分析有何區(qū)別?5.2 試述系統(tǒng)聚類的基本思想。5.3 對(duì)樣品和變量進(jìn)行聚類分析時(shí), 所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡(jiǎn)要說(shuō)明為什么這樣構(gòu)造5.5試述K均值法與系

7、統(tǒng)聚類法的異同。5.1 判別分析和聚類分析有何區(qū)別?答:即根據(jù)一定的判別準(zhǔn)則,判定一個(gè)樣本歸屬于哪一類。具體而言,設(shè)有n個(gè)樣本,對(duì)每個(gè)樣本測(cè)得p項(xiàng)指標(biāo)(變量)的數(shù)據(jù),已知每個(gè)樣本屬于k個(gè)類別(或總體)中的某一類,通過(guò)找出一個(gè)最優(yōu)的劃分,使得不同類別的樣本盡可能地區(qū)別開(kāi),并判別該樣本屬于哪個(gè)總體。聚類分析是分析如何對(duì)樣品(或變量)進(jìn)行量化分類的問(wèn)題。在聚類之前,我們并不知道總體,而是通過(guò)一次次的聚類,使相近的樣品(或變量)聚合形成總體。通俗來(lái)講,判別分析是在已知有多少類及是什么類的情況下進(jìn)行分類,而聚類分析是在不知道類的情況下進(jìn)行分類。5.2 試述系統(tǒng)聚類的基本思想。答:系統(tǒng)聚類的基本思想是:距

8、離相近的樣品(或變量)先聚成類,距離相遠(yuǎn)的后聚成類,過(guò)程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類中。5.3 對(duì)樣品和變量進(jìn)行聚類分析時(shí), 所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡(jiǎn)要說(shuō)明為什么這樣構(gòu)造?答:對(duì)樣品進(jìn)行聚類分析時(shí),用距離來(lái)測(cè)定樣品之間的相似程度。因?yàn)槲覀儼裯個(gè)樣本看作p維空間的n個(gè)點(diǎn)。點(diǎn)之間的距離即可代表樣品間的相似度。常用的距離為(一)閔可夫斯基距離:q取不同值,分為(1)絕對(duì)距離() (2)歐氏距離() (3)切比雪夫距離() (二)馬氏距離 (三)蘭氏距離 對(duì)變量的相似性,我們更多地要了解變量的變化趨勢(shì)或變化方向,因此用相關(guān)性進(jìn)行衡量。將變量看作p維空間的向量,一般用(一)夾角余

9、弦(二)相關(guān)系數(shù)5.5試述K均值法與系統(tǒng)聚類法的異同。答:相同:K均值法和系統(tǒng)聚類法一樣,都是以距離的遠(yuǎn)近親疏為標(biāo)準(zhǔn)進(jìn)行聚類的。不同:系統(tǒng)聚類對(duì)不同的類數(shù)產(chǎn)生一系列的聚類結(jié)果,而K均值法只能產(chǎn)生指定類數(shù)的聚類結(jié)果。具體類數(shù)的確定,離不開(kāi)實(shí)踐經(jīng)驗(yàn)的積累;有時(shí)也可以借助系統(tǒng)聚類法以一部分樣品為對(duì)象進(jìn)行聚類,其結(jié)果作為K均值法確定類數(shù)的參考。6.1 試述主成分分析的基本思想。6.2 主成分分析的作用體現(xiàn)在何處?6.3 簡(jiǎn)述主成分分析中累積貢獻(xiàn)率的具體含義。6.5 試述根據(jù)協(xié)差陣進(jìn)行主成分分析和根據(jù)相關(guān)陣進(jìn)行主成分分析的區(qū)別。6.1 試述主成分分析的基本思想。答:我們處理的問(wèn)題多是多指標(biāo)變量問(wèn)題,由于

10、多個(gè)變量之間往往存在著一定程度的相關(guān)性,人們希望能通過(guò)線性組合的方式從這些指標(biāo)中盡可能快的提取信息。當(dāng)?shù)谝粋€(gè)組合不能提取更多信息時(shí),再考慮第二個(gè)線性組合。繼續(xù)這個(gè)過(guò)程,直到提取的信息與原指標(biāo)差不多時(shí)為止。這就是主成分分析的基本思想。6.2 主成分分析的作用體現(xiàn)在何處?答:一般說(shuō)來(lái),在主成分分析適用的場(chǎng)合,用較少的主成分就可以得到較多的信息量。以各個(gè)主成分為分量,就得到一個(gè)更低維的隨機(jī)向量;主成分分析的作用就是在降低數(shù)據(jù)“維數(shù)”的同時(shí)又保留了原數(shù)據(jù)的大部分信息。6.3 簡(jiǎn)述主成分分析中累積貢獻(xiàn)率的具體含義。答:主成分分析把個(gè)原始變量的總方差分解成了個(gè)相互獨(dú)立的變量的方差之和。主成分分析的目的是減

11、少變量的個(gè)數(shù),所以一般不會(huì)使用所有個(gè)主成分的,忽略一些帶有較小方差的主成分將不會(huì)給總方差帶來(lái)太大的影響。這里我們稱 為第個(gè)主成分的貢獻(xiàn)率。第一主成分的貢獻(xiàn)率最大,這表明綜合原始變量的能力最強(qiáng),而的綜合能力依次遞減。若只取個(gè)主成分,則稱 為主成分的累計(jì)貢獻(xiàn)率,累計(jì)貢獻(xiàn)率表明綜合的能力。通常取,使得累計(jì)貢獻(xiàn)率達(dá)到一個(gè)較高的百分?jǐn)?shù)(如85以上)。 6.5 試述根據(jù)協(xié)差陣進(jìn)行主成分分析和根據(jù)相關(guān)陣進(jìn)行主成分分析的區(qū)別。答:從相關(guān)陣求得的主成分與協(xié)差陣求得的主成分一般情況是不相同的。從協(xié)方差矩陣出發(fā)的,其結(jié)果受變量單位的影響。主成分傾向于多歸納方差大的變量的信息,對(duì)于方差小的變量就可能體現(xiàn)得不夠,也存在

12、“大數(shù)吃小數(shù)”的問(wèn)題。實(shí)際表明,這種差異有時(shí)很大。我們認(rèn)為,如果各指標(biāo)之間的數(shù)量級(jí)相差懸殊,特別是各指標(biāo)有不同的物理量綱的話,較為合理的做法是使用R代替。對(duì)于研究經(jīng)濟(jì)問(wèn)題所涉及的變量單位大都不統(tǒng)一,采用R代替后,可以看作是用標(biāo)準(zhǔn)化的數(shù)據(jù)做分析,這樣使得主成分有現(xiàn)實(shí)經(jīng)濟(jì)意義,不僅便于剖析實(shí)際問(wèn)題,又可以避免突出數(shù)值大的變量。7.1 試述因子分析與主成分分析的聯(lián)系與區(qū)別。7.2 因子分析主要可應(yīng)用于哪些方面?7.3 簡(jiǎn)述因子模型X=AY+中載荷矩陣A的統(tǒng)計(jì)意義。7.4 在進(jìn)行因子分析時(shí),為什么要進(jìn)行因子旋轉(zhuǎn)?最大方差因子旋轉(zhuǎn)的基本思路是什么?7.1 試述因子分析與主成分分析的聯(lián)系與區(qū)別。答:因子分

13、析與主成分分析的聯(lián)系是:兩種分析方法都是一種降維、簡(jiǎn)化數(shù)據(jù)的技術(shù)。兩種分析的求解過(guò)程是類似的,都是從一個(gè)協(xié)方差陣出發(fā),利用特征值、特征向量求解。因子分析可以說(shuō)是主成分分析的姐妹篇,將主成分分析向前推進(jìn)一步便導(dǎo)致因子分析。因子分析也可以說(shuō)成是主成分分析的逆問(wèn)題。如果說(shuō)主成分分析是將原指標(biāo)綜合、歸納,那么因子分析可以說(shuō)是將原指標(biāo)給予分解、演繹。因子分析與主成分分析的主要區(qū)別是:主成分分析本質(zhì)上是一種線性變換,將原始坐標(biāo)變換到變異程度大的方向上為止,突出數(shù)據(jù)變異的方向,歸納重要信息。而因子分析是從顯在變量去提煉潛在因子的過(guò)程。此外,主成分分析不需要構(gòu)造分析模型而因子分析要構(gòu)造因子模型。7.2 因子分

14、析主要可應(yīng)用于哪些方面?答:因子分析是一種通過(guò)顯在變量測(cè)評(píng)潛在變量,通過(guò)具體指標(biāo)測(cè)評(píng)抽象因子的統(tǒng)計(jì)分析方法。目前因子分析在心理學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)等學(xué)科中都有重要的應(yīng)用。具體來(lái)說(shuō),因子分析可以用于分類。如用考試分?jǐn)?shù)將學(xué)生的學(xué)習(xí)狀況予以分類;用空氣中各種成分的比例對(duì)空氣的優(yōu)劣予以分類等等因子分析可以用于探索潛在因素。即是探索未能觀察的或不能觀測(cè)的的潛在因素是什么,起的作用如何等。對(duì)我們進(jìn)一步研究與探討指示方向。在社會(huì)調(diào)查分析中十分常用。因子分析的另一個(gè)作用是用于時(shí)空分解。如研究幾個(gè)不同地點(diǎn)的不同日期的氣象狀況,就用因子分析將時(shí)間因素引起的變化和空間因素引起的變化分離開(kāi)來(lái)從而判斷各自的影響和變化規(guī)律

15、。7.3 簡(jiǎn)述因子模型X=AY+中載荷矩陣A的統(tǒng)計(jì)意義。 答:對(duì)于因子模型 因子載荷陣為與的協(xié)方差為:=若對(duì)作標(biāo)準(zhǔn)化處理,rXi,Fj=,因此 一方面表示對(duì)的依賴程度;另一方面也反映了變量對(duì)公共因子的相對(duì)重要性。變量共同度 說(shuō)明變量的方差由兩部分組成:第一部分為共同度,它描述了全部公共因子對(duì)變量的總方差所作的貢獻(xiàn),反映了公共因子對(duì)變量的影響程度。第二部分為特殊因子對(duì)變量的方差的貢獻(xiàn),通常稱為個(gè)性方差。而公共因子對(duì)的貢獻(xiàn)表示同一公共因子對(duì)各變量所提供的方差貢獻(xiàn)之總和,它是衡量每一個(gè)公共因子相對(duì)重要性的一個(gè)尺度。7.4 在進(jìn)行因子分析時(shí),為什么要進(jìn)行因子旋轉(zhuǎn)?最大方差因子旋轉(zhuǎn)的基本思路是什么?答:

16、因子分析的目標(biāo)之一就是要對(duì)所提取的抽象因子的實(shí)際含義進(jìn)行合理解釋。但有時(shí)直接根據(jù)特征根、特征向量求得的因子載荷陣難以看出公共因子的含義。這種因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很難對(duì)因子的實(shí)際背景進(jìn)行合理的解釋。這時(shí)需要通過(guò)因子旋轉(zhuǎn)的方法,使每個(gè)變量?jī)H在一個(gè)公共因子上有較大的載荷,而在其余的公共因子上的載荷比較小。最大方差旋轉(zhuǎn)法是一種正交旋轉(zhuǎn)的方法,其基本思路為:AA*d11d12dp1dp2 d1mdpm 其中令 的第列元素平方的相對(duì)方差可定義為最大方差旋轉(zhuǎn)法就是選擇正交矩陣,使得矩陣所有m個(gè)列元素平方的相對(duì)方差之和達(dá)到最大。8.1 什么是對(duì)應(yīng)分析?它與因子分析有何關(guān)系?8

17、.2試述對(duì)應(yīng)分析的基本思想。8.3 試述對(duì)應(yīng)分析的基本步驟。8.1 什么是相應(yīng)分析?它與因子分析有何關(guān)系?答:相應(yīng)分析也叫對(duì)應(yīng)分析,通常意義下,是指兩個(gè)定性變量的多種水平進(jìn)行相應(yīng)性研究。其特點(diǎn)是它所研究的變量可以是定性的。相應(yīng)分析與因子分析的關(guān)系是: 在進(jìn)行相應(yīng)分析過(guò)程中,計(jì)算出過(guò)渡矩陣后,要分別對(duì)變量和樣本進(jìn)行因子分析。因此,因子分析是相應(yīng)分析的基礎(chǔ)。具體而言,r(Zuj)=j(Zuj)式表明Zuj為相對(duì)于特征值j的關(guān)于因素A各水平構(gòu)成的協(xié)差陣r的特征向量。從而建立了相應(yīng)分析中R型因子分析和Q型因子分析的關(guān)系。8.2試述相應(yīng)分析的基本思想。答:相應(yīng)分析,是指對(duì)兩個(gè)定性變量的多種水平進(jìn)行分析。

18、設(shè)有兩組因素A和B,其中因素A包含r個(gè)水平,因素B包含c個(gè)水平。對(duì)這兩組因素作隨機(jī)抽樣調(diào)查,得到一個(gè)的二維列聯(lián)表,記為。要尋求列聯(lián)表列因素A和行因素B的基本分析特征和最優(yōu)列聯(lián)表示。相應(yīng)分析即是通過(guò)列聯(lián)表的轉(zhuǎn)換,使得因素A 和因素B具有對(duì)等性,從而用相同的因子軸同時(shí)描述兩個(gè)因素各個(gè)水平的情況。把兩個(gè)因素的各個(gè)水平的狀況同時(shí)反映到具有相同坐標(biāo)軸的因子平面上,從而得到因素A、B的聯(lián)系。8.3 試述相應(yīng)分析的基本步驟。答:(1)建立列聯(lián)表設(shè)受制于某個(gè)載體總體的兩個(gè)因素為和,其中因素包含個(gè)水平,因素包含個(gè)水平。對(duì)這兩組因素作隨機(jī)抽樣調(diào)查,得到一個(gè)的二維列聯(lián)表,記為。(2)將原始的列聯(lián)資料K=(kij)

19、r ´c變換成矩陣Z=(zij) r ´c,使得zij對(duì)因素A和列因素B具有對(duì)等性。通過(guò)變換Zij=kij-ki.k.jrki.k.j。得,。(3)對(duì)因素B 進(jìn)行因子分析。計(jì)算出的特征向量1,2,m 及其相應(yīng)的特征向量 t1,t2,tm計(jì)算出因素B的因子U1, U2U=(1t1,2t2,mtm)(4)對(duì)因素A 進(jìn)行因子分析。計(jì)算出的特征向量1,2,m 及其相應(yīng)的特征向量v1,v2,vm計(jì)算出因素A的因子V1, V2Vm=(1v1,2v2,mvm(5)選取因素B 的第一、第二公因子U1, U2 選取因素A 的第一、第二公因子V1, V2將B因素的c個(gè)水平(U11, U12),

20、(U21, U22),(Uc1, Uc2)A因素的r個(gè)水平(V11, V12)(V21, V22)(Vr1, Vr2)同時(shí)反應(yīng)到相同坐標(biāo)軸的因子平面上上(6)根據(jù)因素A和因素B各個(gè)水平在平面圖上的分布,描述兩因素及各個(gè)水平之間的相關(guān)關(guān)系。9.1 什么是典型相關(guān)分析?簡(jiǎn)述其基本思想。9.2 什么是典型變量?它具有哪些性質(zhì)?9.3 試分析一組變量的典型變量與其主成分的聯(lián)系與區(qū)別。9.1 什么是典型相關(guān)分析?簡(jiǎn)述其基本思想。 答: 典型相關(guān)分析是研究?jī)山M變量之間相關(guān)關(guān)系的一種多元統(tǒng)計(jì)方法。用于揭示兩組變量之間的內(nèi)在聯(lián)系。典型相關(guān)分析的目的是識(shí)別并量化兩組變量之間的聯(lián)系。將兩組變量相關(guān)關(guān)系的分析轉(zhuǎn)化為

21、一組變量的線性組合與另一組變量線性組合之間的相關(guān)關(guān)系。 基本思想:(1)在每組變量中找出變量的線性組合,使得兩組的線性組合之間具有最大的相關(guān)系數(shù)。即:若設(shè)、是兩組相互關(guān)聯(lián)的隨機(jī)變量,分別在兩組變量中選取若干有代表性的綜合變量Ui、Vi,使是原變量的線性組合。在的條件下,使得達(dá)到最大。(2)選取和最初挑選的這對(duì)線性組合不相關(guān)的線性組合,使其配對(duì),并選取相關(guān)系數(shù)最大的一對(duì)。(3)如此繼續(xù)下去,直到兩組變量之間的相關(guān)性被提取完畢為此。9.2 什么是典型變量?它具有哪些性質(zhì)?答:在典型相關(guān)分析中,在一定條件下選取系列線性組合以反映兩組變量之間的線性關(guān)系,這被選出的線性組合配對(duì)被稱為典型變量。具體來(lái)說(shuō),

22、在的條件下,使得達(dá)到最大,則稱、是、的第一對(duì)典型相關(guān)變量。典型變量性質(zhì):典型相關(guān)量化了兩組變量之間的聯(lián)系,反映了兩組變量的相關(guān)程度。1. 2. 9.3 試分析一組變量的典型變量與其主成分的聯(lián)系與區(qū)別。答:一組變量的典型變量和其主成分都是經(jīng)過(guò)線性變換計(jì)算矩陣特征值與特征向量得出的。主成分分析只涉及一組變量的相互依賴關(guān)系而典型相關(guān)則擴(kuò)展到兩組變量之間的相互依賴關(guān)系之中,度量了這兩組變量之間聯(lián)系的強(qiáng)度。4.8 某超市經(jīng)銷十種品牌的飲料,其中有四種暢銷,三種滯銷,三種平銷。下表是這十種品牌飲料的銷售價(jià)格(元)和顧客對(duì)各種飲料的口味評(píng)分、信任度評(píng)分的平均數(shù)。6.8利用主成分分析法,綜合評(píng)價(jià)六個(gè)工業(yè)行業(yè)的

23、經(jīng)濟(jì)效益指標(biāo)。6.10 根據(jù)習(xí)題5.10中2003年我國(guó)省會(huì)城市和計(jì)劃單列市的主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù),利用主成分分析法對(duì)這些地區(qū)進(jìn)行分類。7.8 某汽車組織欲根據(jù)一系列指標(biāo)來(lái)預(yù)測(cè)汽車的銷售情況,為了避免有些指標(biāo)間的相關(guān)關(guān)系影響預(yù)測(cè)結(jié)果,需首先進(jìn)行因子分析來(lái)簡(jiǎn)化指標(biāo)系統(tǒng)。下表是抽查歐洲某汽車市場(chǎng)7個(gè)品牌不同型號(hào)的汽車的各種指標(biāo)數(shù)據(jù),試用因子分析法找出其簡(jiǎn)化的指標(biāo)系統(tǒng)。4.8 某超市經(jīng)銷十種品牌的飲料,其中有四種暢銷,三種滯銷,三種平銷。下表是這十種品牌飲料的銷售價(jià)格(元)和顧客對(duì)各種飲料的口味評(píng)分、信任度評(píng)分的平均數(shù)。銷售情況產(chǎn)品序號(hào)銷售價(jià)格口味評(píng)分信任度評(píng)分暢銷12.25822.56733.0394

24、3.286平銷52.87663.58774.898滯銷81.73492.242102.743 根據(jù)數(shù)據(jù)建立貝葉斯判別函數(shù),并根據(jù)此判別函數(shù)對(duì)原樣本進(jìn)行回判。 現(xiàn)有一新品牌的飲料在該超市試銷,其銷售價(jià)格為3.0,顧客對(duì)其口味的評(píng)分平均為8,信任評(píng)分平均為5,試預(yù)測(cè)該飲料的銷售情況。解:增加group變量,令暢銷、平銷、滯銷分別為group1、2、3;銷售價(jià)格為X1,口味評(píng)分為X2,信任度評(píng)分為X3,用spss 解題的步驟如下:1. 在SPSS窗口中選擇AnalyzeClassifyDiscriminate,調(diào)出判別分析主界面,將左邊的變量列表中的“group”變量選入分組變量中,將X1、X2、X

25、3變量選入自變量中,并選擇Enter independents together單選按鈕,即使用所有自變量進(jìn)行判別分析。2. 點(diǎn)擊Define Range按鈕,定義分組變量的取值范圍。本例中分類變量的范圍為1到3,所以在最小值和最大值中分別輸入1和3。單擊Continue按鈕,返回主界面。如圖4.1 圖4.1 判別分析主界面3. 單擊Statistics按鈕,指定輸出的描述統(tǒng)計(jì)量和判別函數(shù)系數(shù)。選中Function Coefficients欄中的Fishers:給出Bayes判別函數(shù)的系數(shù)。(注意:這個(gè)選項(xiàng)不是要給出Fisher判別函數(shù)的系數(shù)。這個(gè)復(fù)選框的名字之所以為Fishers,是因?yàn)榘磁?/p>

26、別函數(shù)值最大的一組進(jìn)行歸類這種思想是由Fisher提出來(lái)的。這里極易混淆,請(qǐng)讀者注意辨別。)如圖4.2。單擊Continue按鈕,返回主界面。 圖4.2 statistics子對(duì)話框4. 單擊Classify按鈕,彈出classification子對(duì)話框,選中Display選項(xiàng)欄中的Summary table復(fù)選框,即要求輸出錯(cuò)判矩陣,以便實(shí)現(xiàn)題中對(duì)原樣本進(jìn)行回判的要求。如圖4.3。 圖4.3 classification對(duì)話框5. 返回判別分析主界面,單擊OK按鈕,運(yùn)行判別分析過(guò)程。1) 根據(jù)判別分析的結(jié)果建立Bayes判別函數(shù):Bayes判別函數(shù)的系數(shù)見(jiàn)表4.1。表中每一列表示樣本判入相應(yīng)

27、類的Bayes判別函數(shù)系數(shù)。由此可建立判別函數(shù)如下:Group1: Group2: Group3: 將各樣品的自變量值代入上述三個(gè)Bayes判別函數(shù),得到三個(gè)函數(shù)值。比較這三個(gè)函數(shù)值,哪個(gè)函數(shù)值比較大就可以判斷該樣品判入哪一類。 Classification Function Coefficientsgroup123x1-11.689-10.707-2.194x212.29713.3614.960x316.76117.0866.447(Constant)-81.843-94.536-17.449Fisher's linear discriminant functions 表4.1 Ba

28、yes判別函數(shù)系數(shù)根據(jù)此判別函數(shù)對(duì)樣本進(jìn)行回判,結(jié)果如表4.2。從中可以看出在4種暢銷飲料中,有3種被正確地判定,有1種被錯(cuò)誤地判定為平銷飲料,正確率為75%。在3種平銷飲料中,有2種被正確判定,有1種被錯(cuò)誤地判定為暢銷飲料,正確率為66.7%。3種滯銷飲料均正確判定。整體的正確率為80.0%。Classification ResultsagroupPredicted Group MembershipTotal123OriginalCount131042120330033%175.025.0.0100.0233.366.7.0100.03.0.0100.0100.0a. 80.0% of or

29、iginal grouped cases correctly classified. 表4.2 錯(cuò)判矩陣2) 該新飲料的,將這3個(gè)自變量代入上一小題得到的Bayes判別函數(shù),的值最大,該飲料預(yù)計(jì)平銷。也可通過(guò)在原樣本中增加這一新樣本,重復(fù)上述的判別過(guò)程,并在classification子對(duì)話框中同時(shí)要求輸出casewise results,運(yùn)行判別過(guò)程,得到相同的結(jié)果。6.8利用主成分分析法,綜合評(píng)價(jià)六個(gè)工業(yè)行業(yè)的經(jīng)濟(jì)效益指標(biāo)。單位:(億元)行業(yè)名稱資產(chǎn)總計(jì)固定資產(chǎn)凈值平均余額產(chǎn)品銷售收入利潤(rùn)總額煤炭開(kāi)采和選業(yè)6917.23032.7683.361.6石油和天然氣開(kāi)采業(yè)5675.93926.2

30、717.533877黑色金屬礦采選業(yè)768.1221.296.513.8有色金屬礦采選業(yè)622.4248116.421.6非金屬礦采選業(yè)699.9291.584.96.2其它采礦業(yè)1.60.50.30解:令資產(chǎn)總計(jì)為X1,固定資產(chǎn)凈值平均余額為X2,產(chǎn)品銷售收入為X3,利潤(rùn)總額為X4,用SPSS對(duì)這六個(gè)行業(yè)進(jìn)行主成分分析的方法如下:1. 在SPSS窗口中選擇AnalyzeData ReductionFactor菜單項(xiàng),調(diào)出因子分析主界面,并將變量移入Variables框中,其他均保持系統(tǒng)默認(rèn)選項(xiàng),單擊OK按鈕,執(zhí)行因子分析過(guò)程(關(guān)于因子分子在SPSS中實(shí)現(xiàn)的詳細(xì)過(guò)程,參見(jiàn)7.7)。得到如表6.

31、1所示的特征根和方差貢獻(xiàn)率表和表6.2所示的因子載荷陣。第一個(gè)因子就可以解釋86.5%表6.1 特征根和方差貢獻(xiàn)率表表6.2 因子載荷陣2. 將表6.2中因子載荷陣中的數(shù)據(jù)輸入SPSS數(shù)據(jù)編輯窗口,命名為a1。點(diǎn)擊菜單項(xiàng)中的TransformCompute,調(diào)出Compute variable對(duì)話框,在對(duì)話框中輸入等式:z1=a1 / SQRT(3.46),計(jì)算第一個(gè)特征向量。點(diǎn)擊OK按鈕,即可在數(shù)據(jù)編輯窗口中得到以z1為變量名的第一特征向量。 表6.3 特征向量矩陣z1x10.509 x20.537 x30.530 x40.413 根據(jù)表6.3得主成分的表達(dá)式:3. 再次使用Compute命

32、令,調(diào)出Compute variable對(duì)話框,在對(duì)話框中輸入等式: 根據(jù)六個(gè)工業(yè)行業(yè)計(jì)算所的y1的大小可得石油和天然氣開(kāi)采業(yè)的經(jīng)濟(jì)效益最好,煤炭開(kāi)采和選業(yè)其次,接著依次是黑色金屬、非金屬、有色金屬和其他采礦業(yè)。6.10 根據(jù)習(xí)題5.10中2003年我國(guó)省會(huì)城市和計(jì)劃單列市的主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù),利用主成分分析法對(duì)這些地區(qū)進(jìn)行分類。解:用SPSS進(jìn)行主成分分析的具體方法參見(jiàn)6.8,分析結(jié)果如下:表6.7 特征根和方差貢獻(xiàn)率表表6.8 因子載荷陣表6.6 特征向量矩陣z1z2x10.29 0.47 x20.28 0.48 x30.14 -0.29 x40.31 -0.37 x50.40 -0.20

33、x60.40 -0.27 x70.31 0.39 x80.39 0.12 x90.39 -0.24 根據(jù)表6.6得主成分的表達(dá)式:分別計(jì)算出以上三項(xiàng)后,利用公式得到綜合得分并排序如下表:地區(qū)y1y2y深圳170038.89 254204.05 197055.90 上海70185.88 34213.02 58638.59 廈門50894.53 69593.93 56897.04 廣州55849.21 32174.58 48249.65 杭州42167.71 29244.98 38019.51 寧波40552.85 28367.34 36641.30 北京45747.38 11555.73 347

34、71.86 南寧45747.38 11555.73 34771.86 天津39597.90 21080.52 33653.82 ???9597.90 21080.52 33653.82 南京36680.75 25804.65 33189.52 青島35237.27 14552.46 28597.44 大連31830.56 17629.53 27272.03 濟(jì)南25149.73 16499.39 22372.97 福州22734.16 16326.97 20677.45 烏魯木齊22284.54 15284.68 20037.59 沈陽(yáng)23184.99 12310.22 19694.19 武漢

35、23909.27 9770.56 19370.75 長(zhǎng)春21524.95 14179.21 19166.96 成都33808.79 -17638.73 17294.14 太原19445.42 9809.99 16352.45 鄭州18561.81 9822.90 15756.62 蘭州16568.97 13769.80 15670.44 ???7666.70 11325.77 15631.26 昆明18494.34 8579.72 15311.75 呼和浩特16128.60 13359.10 15239.59 長(zhǎng)沙18845.23 6252.54 14802.98 石家莊18229.33 73

36、99.62 14752.99 西安16764.15 4871.97 12946.76 南昌14598.40 9288.20 12893.83 哈爾濱15782.07 6297.20 12737.43 合肥14319.85 8659.41 12502.85 銀川12865.97 10960.08 12254.18 貴陽(yáng)15339.90 4138.48 11744.24 重慶27859.53 -22407.66 11723.76 西寧10450.62 6144.51 9068.36 南寧11526.86 2677.29 8686.15 最后的分類可以根據(jù)最終得分Y的值來(lái)劃分,由于沒(méi)有給出具體的分類

37、標(biāo)準(zhǔn),具體分類結(jié)果根據(jù)各人的主觀意愿可以有多種答案。可以歸為一類,屬于文科學(xué)習(xí)能力的指標(biāo);第二個(gè)公共因子在前三個(gè)指標(biāo)上有較大載荷,同樣可以歸為一類,這三個(gè)指標(biāo)同屬于理科學(xué)習(xí)能力的指標(biāo)。根據(jù)表7.3易得: 表7.3 因子得分系數(shù)矩陣將每個(gè)學(xué)生的六門成績(jī)分別代入F1、F2,比較兩者的大小,F(xiàn)1大的適合學(xué)文,F(xiàn)2大的適合學(xué)理。計(jì)算結(jié)果為學(xué)號(hào)是1、16、24的學(xué)生適合學(xué)文,其余均適合學(xué)理。7.8 某汽車組織欲根據(jù)一系列指標(biāo)來(lái)預(yù)測(cè)汽車的銷售情況,為了避免有些指標(biāo)間的相關(guān)關(guān)系影響預(yù)測(cè)結(jié)果,需首先進(jìn)行因子分析來(lái)簡(jiǎn)化指標(biāo)系統(tǒng)。下表是抽查歐洲某汽車市場(chǎng)7個(gè)品牌不同型號(hào)的汽車的各種指標(biāo)數(shù)據(jù),試用因子分析法找出其簡(jiǎn)化的指標(biāo)系統(tǒng)。品牌價(jià)格發(fā)動(dòng)機(jī)功率軸距寬長(zhǎng)軸距燃料容量燃料效率A215001.8140101.267.3172.42.63913.228A284003.2225108.170.3192.93.51717.225A420003.5210114.671.4196.63.85018.022B239901.8150102.668.2178.02.99816.427B339502.8200108.776.1192.03.56118

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論