




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上多元數(shù)據(jù)分析練習(xí)題第二章多元正態(tài)的參數(shù)估計(jì)一. 判斷題(1)若是對角矩陣,則相互獨(dú)立。( )(2)多元正態(tài)分布的任何邊緣分布為正態(tài)分布,反之也成立。( )(3)對任意的隨機(jī)向量來說,其協(xié)方差矩陣是對稱矩陣,并且總是半正定的。( )(4)對標(biāo)準(zhǔn)化的隨機(jī)向量來說,它的協(xié)方差矩陣與原來變量的相關(guān)系數(shù)陣相同。( )(5)若分別為樣本均值和樣本協(xié)差陣,則分別為的無偏估計(jì)。( )二.計(jì)算題1. 假設(shè)隨機(jī)向量的協(xié)方差矩陣為,試求相關(guān)系數(shù)矩陣。2. 假設(shè)隨機(jī)向量的協(xié)方差矩陣為,令,試求的協(xié)方差矩陣。3.假設(shè),其中,試求的分布。三.證明題1.設(shè)是來自的隨機(jī)樣本,為樣本均值。試證明: ,
2、。2.設(shè)是來自的隨機(jī)樣本,為樣本協(xié)差陣。試證明: 。3證明:若維正態(tài)隨機(jī)向量的協(xié)差陣為對角矩陣,則的各分量是相互獨(dú)立的隨機(jī)變量。第四章判別分析一.判斷題1.從某種意義上講,距離判別是Bayes判別的一種特例。( )2.距離判別的思想是分別計(jì)算樣本到各個(gè)總體的歐幾里得距離,根據(jù)距離的大小判別樣本屬于哪個(gè)總體。( )3.量綱的變化對歐幾里得距離的計(jì)算結(jié)果有影響,而馬氏距離則克服了這種影響。歐氏距離是馬氏距離的一種特例。( )4.貝葉斯判別法是一種考慮了總體出現(xiàn)的先驗(yàn)概率和誤判損失的判別方法。( )5.在貝葉斯判別法中,是一個(gè)劃分,是將樣品誤判給總體的加權(quán)平均損失,則。 ( )6.費(fèi)希爾判別法是借助
3、方差分析的思想構(gòu)造線性判別函數(shù),使得總體之間區(qū)別最大,而使每個(gè)個(gè)體內(nèi)部的離差最小。( )二.計(jì)算題1.設(shè)有兩個(gè)正態(tài)總體,已知: (1)建立距離判別法的判別準(zhǔn)則;(2)判斷:樣品:,應(yīng)歸屬于哪一類?(答案:)2.設(shè)G1,G2為兩個(gè)二元總體,從中分別抽取容量為3的樣本如下:x1 x2x1 x23 72 4 : G14 76 95 7 :G24 8(1)求兩樣本的樣本均值及協(xié)方差矩陣;(2)假定兩總體協(xié)方差矩陣相等,記為,用聯(lián)合估計(jì);(3)建立距離判別法則;(4)假設(shè)有一新樣品,進(jìn)行距離判別。3.已知兩總體的概率密度分別為和,且總體的先驗(yàn)分布為,誤判損失為。(1)建立Bayes判別準(zhǔn)則;(2)假設(shè)有
4、一新樣品滿足和,判定的歸屬問題。4. 假設(shè)兩總體G1,G2的概率密度分別為和。(1)做出和的圖像。若假定先驗(yàn)概率,求Bayes判別區(qū)間的臨界點(diǎn);(0.25)(2)若,求Bayes判別區(qū)間的臨界點(diǎn);(-0.33)5.假定有三個(gè)組,已知,和,。(1)若不計(jì)誤判損失,判定屬于哪個(gè)組;()(后驗(yàn)概率分別為0.004,0.361,0.635)(2)假定誤判代價(jià)矩陣為誤判為真實(shí)組 判定屬于哪個(gè)組。(誤判的平均損失為51.39,36.05,41.95 )6. 已知兩總體的概率密度分別為和,且總體的先驗(yàn)分布為,誤判損失為。(1)建立Bayes判別準(zhǔn)則;(2)假設(shè)有一新樣品滿足和,判定的歸屬問題。()7.假設(shè)先
5、驗(yàn)概率,誤判代價(jià)及概率密度值已列于下表。試用貝葉斯判別法將樣品分到組中的一個(gè)。若不考慮誤判代價(jià),則判別結(jié)果又將如何?判別為真實(shí)組 先驗(yàn)概率概率密度8. 金融分析員需要有兩項(xiàng)重要指標(biāo)來衡量,設(shè)總體G1為“金融分析員滿足要求”;總體G2為“金融分析員不滿足要求”(兩個(gè)總體均服從正態(tài)分布,協(xié)差陣相等),今測得兩個(gè)總體的若干數(shù)據(jù),并由這些數(shù)據(jù)得到 (1)假設(shè)對某一金融分析員進(jìn)行測量得到兩個(gè)指標(biāo)為,判別這一分析員是否能滿足這項(xiàng)工作。(滿足)(2)當(dāng)兩組先驗(yàn)概率分別為,損失相同。問該金融分析員滿足要求嗎?為什么?(不滿足)第五章聚類分析一.判斷題1.快速(動(dòng)態(tài))聚類分析中,分類的個(gè)數(shù)是確定的,不可改變。(
6、 )2.K均值聚類分析中,樣品一旦劃入某一類就不可改變。( )3.判別分析,聚類分析和主成分分析都不要求數(shù)據(jù)來自正態(tài)總體。( )4.系統(tǒng)聚類可以對不同的類數(shù)產(chǎn)生一系列的聚類結(jié)果。( )5. K均值聚類和系統(tǒng)聚類一樣,可以用不同的方法定義點(diǎn)點(diǎn)間的距離。( )6. K均值聚類和系統(tǒng)聚類一樣,都是以距離的遠(yuǎn)近親疏為標(biāo)準(zhǔn)進(jìn)行聚類的。( )二. 計(jì)算題1. 下面是5個(gè)樣品兩兩間的距離矩陣 試用最長距離法作系統(tǒng)聚類,并畫出譜系聚類圖。2. 假設(shè)有6個(gè)樣本,每個(gè)樣本只測量一個(gè)指標(biāo),數(shù)據(jù)如表。樣本點(diǎn)間使用絕對值距離,類間使用最長距離,利用系統(tǒng)聚類法對這6個(gè)樣本進(jìn)行分類。要求:(1)寫出距離矩陣及類的合并過程;
7、(2)畫出聚類的譜系圖;(3)寫出樣本分成兩類時(shí)的結(jié)果。樣本編號(hào)123456指標(biāo)11243-4-23. 假定我們對三個(gè)樣品分別測量兩個(gè)變量和得到結(jié)果如表:用快速聚類法將以上樣品聚成兩類。樣品變量 X1X2A53B-11C124. 檢驗(yàn)?zāi)钞a(chǎn)品的重量,抽了6個(gè)樣品,每個(gè)樣品只測了一個(gè)指標(biāo),分別為1,2,3,6,9,11,試用最短距離法,重心法進(jìn)行聚類分析。5. 考慮下列4個(gè)樣品的距離矩陣:,用最短距離,最長距離法和類平均法對這4個(gè)樣品進(jìn)行聚類,并畫出譜系圖。6. 有8個(gè)樣本,每個(gè)樣本兩個(gè)指標(biāo),數(shù)據(jù)如表。樣本點(diǎn)間使用歐氏距離,類間使用最短距離法,利用系統(tǒng)聚類法對這8個(gè)樣本進(jìn)行分類。樣本編號(hào)12345
8、678指標(biāo)12244-4-2-3-1指標(biāo)25343322-37.檢驗(yàn)?zāi)钞a(chǎn)品的重量,抽了5個(gè)樣品,每個(gè)樣品只測了一個(gè)指標(biāo),分別為1,2,6,11,試用快速聚類法將樣品分為兩類。三.簡答題1.判別分析與聚類分析有何區(qū)別?判別分析是對于n個(gè)給定的樣本,已知每個(gè)樣本屬于k個(gè)類別中的某一類,利用這些數(shù)據(jù),找到一種判別方法,使得這種判別方法具有某種最優(yōu)性質(zhì),能把屬于不同種類的樣本點(diǎn)盡可能的區(qū)別開來,并對測得同樣指標(biāo)數(shù)據(jù)的新樣本,能夠判別這個(gè)樣本歸屬于哪一類。 聚類分析是在樣品和類之間定義一種距離,按照距離的大小對樣品進(jìn)行聚類,距離相近的樣品先聚成類,距離相遠(yuǎn)的后聚成類,過程一直進(jìn)行下去,每個(gè)樣品總能聚到合
9、適的類中。聚類分析沒有判別函數(shù),對新的樣品無法判別它應(yīng)該歸屬哪一類,必須重新進(jìn)行聚類過程,才能判別它屬于哪類。系統(tǒng)聚類分析能夠得到樣品從最小的分類(每個(gè)樣品自成一類)到最大的分類的情況,而判別分析沒有這種功能,但判別分析的距離判別法與聚類分析非常相似,也是根據(jù)距離的遠(yuǎn)近判別樣本的歸屬問題。2.K均值法與系統(tǒng)聚類法的異同(1) K均值法事先必須確定分類的個(gè)數(shù),分類的個(gè)數(shù)確定,而系統(tǒng)聚類分析系統(tǒng)聚類分析能夠得到樣品從最小的分類(每個(gè)樣品自成一類)到最大的分類的情況,可以根據(jù)需要將樣品分為幾類。(2) K均值法可以隨意將樣品分為K類,根據(jù)樣品到類中心的距離遠(yuǎn)近重新進(jìn)行分類,而系統(tǒng)聚類中樣品一旦劃入某
10、一類就不能更改。(3) K均值法樣品與不同類間的距離采用點(diǎn)到類中心的平方歐氏距離,而系統(tǒng)聚類中點(diǎn)間距離有很多種定義方法。3. 簡述系統(tǒng)聚類法的思想。4. 簡述快速聚類法的思想。第六章主成分分析一.判斷題1.主成分分析數(shù)學(xué)模型中的正交變換,在幾何上就是做一個(gè)坐標(biāo)旋轉(zhuǎn)。( )2假設(shè)為某實(shí)際問題所涉及的個(gè)變量,是其個(gè)主成分,判斷下列說法是否正確:(1)由原始變量的協(xié)方差矩陣和相關(guān)矩陣出發(fā),求得的主成分是一致的。 ( )(2)對變量做主成分分析之前,必須對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。( )(3)由標(biāo)準(zhǔn)化數(shù)據(jù)的協(xié)方差矩陣出發(fā)求得的主成分與由原始數(shù)據(jù)的相關(guān)系數(shù)矩陣出發(fā)求得的主成分一致。( )(4)。( )(5)由
11、于包含原始變量的信息量遞減,因而實(shí)際應(yīng)用中選取前幾個(gè)主成分代替原來的原始變量。( )(6)當(dāng)各個(gè)變量取值范圍相差不大或者是度量單位相同的指標(biāo)時(shí),一般選擇直接從協(xié)方差矩陣求解。( )(7)。 ( )(8)假設(shè)的協(xié)方差矩陣為,為的非零特征根, 為對應(yīng)的單位化的特征向量,則第個(gè)主成分為。( )(9)是的線性組合。 ( )(10)。( )(11)主成分的協(xié)方差矩陣是對角陣。( )(12)方差貢獻(xiàn)率表明了主成分綜合原始變量的能力。( )3.主成分分析中的信息,是用變量期望的大小來表示的。( )二. 計(jì)算題1.假設(shè)總體的協(xié)方差矩陣為,求的主成分并計(jì)算第一主成分的累計(jì)貢獻(xiàn)率。2.假設(shè)總體的相關(guān)矩陣為,求的標(biāo)
12、準(zhǔn)化變量的主成分并計(jì)算各主成分的貢獻(xiàn)率和累計(jì)貢獻(xiàn)率。(,)3.假設(shè)總體的協(xié)方差矩陣為,求的主成分并計(jì)算各主成分的貢獻(xiàn)率和累計(jì)貢獻(xiàn)率,確定應(yīng)取幾個(gè)主成分。4.設(shè)的協(xié)方差矩陣為,其中,試求的主成分及主成分具有的特征值。(,方差為)三.簡答題1.試述主成分分析的基本思想及求解步驟。2.簡述主成分分析中累積貢獻(xiàn)率的具體意義。第七章因子分析一.判斷題1.因子載荷矩陣經(jīng)過旋轉(zhuǎn)后,每個(gè)公因子對原始變量的貢獻(xiàn)度不變。( )2.因子分析模型中公共因子是互不相關(guān)、不可測的變量,并且。( )3.因子分析一般從變量的相關(guān)系數(shù)陣出發(fā)求因子模型。( )4.因子載荷矩陣經(jīng)過旋轉(zhuǎn)后,變量的共同度不變。( )5.因子分析模型中
13、特殊因子與公共因子是不相關(guān)的。( )6.因子分析與主成分分析都是一種降維,簡化數(shù)據(jù)的方法,都是通過把原變量轉(zhuǎn)化為新變量的線性組合達(dá)到降維的目的。( )7.主成分分析中,主成分是不唯一的,但在因子分析中,因子模型是唯一的。( )二. 計(jì)算題1.設(shè)標(biāo)準(zhǔn)化變量的協(xié)差陣(即相關(guān)陣)為 的特征值和相應(yīng)的單位正交化的特征向量分別為:要求: 1) 計(jì)算因子載荷矩陣A,并建立因子模型;2)計(jì)算變量的共同度和公因子的方差貢獻(xiàn),并說明其各自的統(tǒng)計(jì)意義。2. 為研究某一片樹葉的葉片形態(tài),選取50片葉測量其長度x1(mm)和寬度x2(mm),按樣本數(shù)據(jù)求得其平均值和協(xié)差陣為,求相關(guān)系數(shù)矩陣,并由出發(fā)進(jìn)行因子分析。三.
14、簡答題1.簡述因子模型中載荷矩陣的統(tǒng)計(jì)意義。2.因子分析與主成分分析的區(qū)別與聯(lián)系(1) 因子分析從變量的相關(guān)性出發(fā),根據(jù)相關(guān)性的大小將變量進(jìn)行分組,同組變量的相關(guān)性較強(qiáng),不同組變量的相關(guān)性較弱,每組代表一個(gè)結(jié)構(gòu),這個(gè)結(jié)構(gòu)用一個(gè)公因子表示,將變量表示成公因子的線性組合和特殊因子的和。主成分分析是從空間生成的角度尋找能解釋諸多變量變異絕大部分的幾組彼此不相關(guān)的新變量。(2) 因子分析是把變量表示成公因子的線性組合和特殊因子的和,主成分分析是把主成分表示成各變量的線性組合。(3) 抽取因子的方法不僅有主成分法,還有主軸因子法,極大似然估計(jì)法等,主成分分析只有主成分法抽取主成分。(4) 主成分分析中當(dāng)
15、給定的協(xié)差陣或相關(guān)系數(shù)陣的特征值唯一時(shí),主成分一般是固定的,而因子分析中的因子不是固定的,可以旋轉(zhuǎn)得到不同的因子。四下表是以學(xué)生六門考試成績?yōu)樽兞?,從相關(guān)系數(shù)陣出發(fā),以主成分法抽取因子,進(jìn)行因子分析的部分結(jié)果,根據(jù)表格回答下列問題:表1 Total Variance ExplainedComponentInitial Eigenvalues Total% of VarianceCumulative %13.73562.25462.25421.13318.88781.1423.4577.61988.7614.3235.37694.1375.1993.32097.4576.1532.543100.
16、000表2 Component Matrix(a) 表3 Rotated Component Matrix(a)Component12math-.806.353phys-.674.531chem-.675.513literat.893.306history.825.435english.836.425Component12math-.387.790phys-.172.841chem-.184.827literat.879-.343history.911-.201english.913-.2165.(1) 寫出變量的相關(guān)系數(shù)陣的特征根 及 的方差和;(2) 假設(shè)用表示主成分,寫出前二個(gè)主成分的表
17、達(dá)式及的貢獻(xiàn)率和前兩個(gè)主成分的累計(jì)貢獻(xiàn)率并說明累計(jì)貢獻(xiàn)率的統(tǒng)計(jì)意義;(3) 寫出旋轉(zhuǎn)后的因子載荷矩陣及因子模型;(4) 求變量math的共同度及因子的方差貢獻(xiàn),并解釋,的統(tǒng)計(jì)意義;(5) 對因子,進(jìn)行合理的命名和解釋。第八章相應(yīng)分析一.判斷題1.相應(yīng)分析中,行慣量與列慣量相同。( )2.對變量進(jìn)行相應(yīng)分析時(shí),應(yīng)首先檢驗(yàn)變量之間的獨(dú)立性,只有當(dāng)變量不獨(dú)立時(shí),進(jìn)行相應(yīng)分析才有意義。( )3.相應(yīng)分析實(shí)際是對兩組高維空間的點(diǎn)的二維投影進(jìn)行分析,并且相應(yīng)分析主要是建立在圖形分析的基礎(chǔ)上,因此,相應(yīng)分析的結(jié)果帶有一定的主觀性。( )二.計(jì)算題1.假定有兩個(gè)因素,每個(gè)因素各有兩個(gè)水平,隨機(jī)考察100個(gè)樣品
18、,得到一個(gè)二維的列聯(lián)表如下,求:(1)頻率矩陣;(2)因素的第一個(gè)水平的分布輪廓;(3)因素兩個(gè)水平之間的距離; (4)檢驗(yàn)因素是否獨(dú)立。(,)因素因素50201020第九章典型相關(guān)分析一.判斷題1.典型相關(guān)分析是研究多組變量之間相關(guān)關(guān)系的一種多元統(tǒng)計(jì)方法。( )2.典型相關(guān)分析是識(shí)別并量化兩組變量之間的關(guān)系,將兩組變量的相關(guān)關(guān)系的研究轉(zhuǎn)化為一組變量的線性組合與另一組變量的線性組合之間的相關(guān)關(guān)系的研究。( )3.若是兩組變量的第一對典型相關(guān)變量,則是的所有線性組合對中相關(guān)系數(shù)最大的一對。( )4.進(jìn)行典型相關(guān)分析時(shí),若變量的量綱不同時(shí),需要對變量進(jìn)行標(biāo)準(zhǔn)化或從相關(guān)陣出發(fā)求典型相關(guān)變量;而若變量
19、的單位相同時(shí),則不需要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,直接分析即可。( )5.若是變量的典型相關(guān)變量,則,并且( )6. 若是變量的典型相關(guān)變量,分別是變量的方差陣,是變量的協(xié)方差陣,是矩陣的特征根,則(1)。其中為矩陣的秩。( )(2)若,則第一典型相關(guān)系數(shù)為。( )(3)若,分別為矩陣,相應(yīng)于的特征向量,則即為第一對典型相關(guān)變量。( )7. 典型相關(guān)分析中,分別求出兩組變量的第一主成分,兩個(gè)第一主成分即構(gòu)成第一對典型相關(guān)變量。( )8.利用樣本對兩組變量進(jìn)行典型相關(guān)分析時(shí),即使互不相關(guān),也有可能得到的典型相關(guān)變量的協(xié)差陣不為零,因而利用樣本數(shù)據(jù)進(jìn)行典型相關(guān)分析時(shí)要對原始變量的協(xié)差陣是否為零進(jìn)行檢驗(yàn)。(
20、)9.典型載荷分析是了解每組變量提取的典型變量解釋的該組樣本總方差的比例,從而定量的測度典型變量所包含的原始信息量的大??;典型冗余分析是指原始變量與典型變量之間的相關(guān)性分析。( )10.對變量進(jìn)行相應(yīng)分析時(shí),應(yīng)首先檢驗(yàn)變量之間的獨(dú)立性,只有當(dāng)變量不獨(dú)立時(shí),進(jìn)行相應(yīng)分析才有意義。( )二以下是對一對二維變量的典型相關(guān)分析的結(jié)果,請根據(jù)結(jié)果回答下列問題。 表1 Canonical Correlations1.7882.054表2 Test that remaining correlations are zero Wilk's Chi-SQ DF Sig.1 .378 20.930 4.000 .0002 .99
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 甘肅省消防安全重點(diǎn)單位界定與分級(jí)標(biāo)準(zhǔn)
- 結(jié)合事故案例
- 安全生產(chǎn)感想心得體會(huì)
- 稀疏數(shù)據(jù)填充技術(shù)-洞察及研究
- 餐飲連鎖標(biāo)準(zhǔn)化體系-洞察闡釋
- 全球化背景下的農(nóng)業(yè)技術(shù)貿(mào)易壁壘研究-洞察闡釋
- 智慧城市規(guī)劃中的智能照明系統(tǒng)
- 量子互聯(lián)網(wǎng)的多層架構(gòu)與協(xié)議設(shè)計(jì)-洞察闡釋
- 公司安全生產(chǎn)全套管理制度
- 安全生產(chǎn)監(jiān)護(hù)人的職責(zé)
- 急性胃腸炎的診斷與治療
- UL4703標(biāo)準(zhǔn)中文版-2020光伏線UL中文版標(biāo)準(zhǔn)
- 酒店前臺(tái)案例分析
- 消防應(yīng)急通信培訓(xùn)
- 消防應(yīng)急通信保障
- XX小學(xué)預(yù)防未成年人違法犯罪工作制度
- 火災(zāi)自動(dòng)報(bào)警系統(tǒng)查驗(yàn)報(bào)告
- 業(yè)務(wù)傭金提成協(xié)議書模板
- GB/T 29469-2024潔凈室及相關(guān)受控環(huán)境性能及合理性評(píng)價(jià)
- 國家開放大學(xué)《城市管理學(xué)》作業(yè)-“城市病”表現(xiàn)及其治理
- 甄嬛傳電子版劇本第01-10集
評(píng)論
0/150
提交評(píng)論