多元統(tǒng)計分析填空和簡答(一)_第1頁
多元統(tǒng)計分析填空和簡答(一)_第2頁
多元統(tǒng)計分析填空和簡答(一)_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、仁多元分析研究的是多個隨機(jī)變量及其相互關(guān)系的統(tǒng)計總體。2多元統(tǒng)計中常用的統(tǒng)計量有:樣本均值、樣 本方差、樣本協(xié)方差和樣本相關(guān)系數(shù)。3 協(xié)方差和相關(guān)系數(shù)僅僅是變量間離散程度的 一種度量,并不能刻畫變量間可能存在的關(guān)聯(lián)程 度。4 人們通過各種實踐,發(fā)現(xiàn)變量之間的相互關(guān)系可以分成相關(guān)和不相關(guān)兩種類型。5 總離差平方和可以分解為回歸離差平方和和剩余離差平方和兩個部分,各自的自由度為 p和n-p-1 ,其中回歸離差平方和在總離差平方和中所占比重越大,則線性回歸效果越顯著。7 偏相關(guān)系數(shù)是指多元回歸分析中,當(dāng)其他變 量固定后,給定的兩個變量之間的的相關(guān)系數(shù)。8 . Spss中回歸方程的建模方法有一元線形回

2、 歸、多元線形回歸、嶺回歸、多對多線形回歸等。9 主成分分析是通過適當(dāng)?shù)淖兞刻鎿Q,使新變 量成為原變量的綜合變量,并尋求相關(guān)性的一種 方法。10 -主成分分析的基本思想是: 設(shè)法將原來眾 多具有一定相關(guān)性(比如P個指標(biāo)),重 新組合成一組新的互相無關(guān)的綜合指標(biāo) 來代替原來的指標(biāo)。11 主成分的協(xié)方差矩陣為對角矩陣。12 主成分表達(dá)式的系數(shù)向量是相關(guān)系數(shù)矩陣的特征向量。13 原始變量協(xié)方差矩陣的特征根的統(tǒng)計含義是原始數(shù)據(jù)的相關(guān)系數(shù)。14 原始數(shù)據(jù)經(jīng)過標(biāo)準(zhǔn)化處理,轉(zhuǎn)化為均值為0 ,方差為1 的標(biāo)準(zhǔn)值,且其協(xié)方差矩陣與相 關(guān)系數(shù)矩陣相等。15 樣本主成分的總方差等于1 。16 .變量按相關(guān)程度為,在

3、相關(guān)性很強程度下, 主成分分析的效果較好。仃在經(jīng)濟(jì)指標(biāo)綜合評價中,應(yīng)用主成分分析法,則評價函數(shù)中的權(quán)數(shù)為方差貢獻(xiàn)度。19.因子分析是把每個原始變量分解為兩部分因素,一部分是公共因子,另一部分為特殊因子。20變量共同度是指因子載荷矩陣中第i行元素的平方和。21 公共因子方差與特殊因子方差之和為1。22 -聚類分析是建立一種分類方法,它將一批樣哂或變量按照它們在性質(zhì)上的親疏程度進(jìn)行科學(xué)的分 類。23. Q型聚類法是按樣品進(jìn)行聚類,R型聚類法是按變量進(jìn)行聚類。24 - R型聚類統(tǒng)計量通常采用具有代表性的變量。25 -在聚類分析中需要對原始數(shù)據(jù)進(jìn)行無量綱化處理,以消除不同量綱或數(shù)量級的影響,達(dá)到數(shù)據(jù)間

4、 可同度量的目的。 常用的無量綱化方法有以下幾種: 中心化變換、規(guī)格化變換、標(biāo)準(zhǔn)化變換、對數(shù)變換。26 .六種Q型聚類方法分別為最短距離法、最長距 離法、中間距離法、重心法、類平均法、可變類平 均法28判別分析是要解決在研究對象已分成若干類的 情況下,確定新的觀測數(shù)據(jù)屬于已知類別中哪一類 的多元統(tǒng)計方法。29用判別分析方法處理問題時,通常以判別函數(shù)作為衡量新樣本點與各已知組別接近程度的指標(biāo)。30.進(jìn)行判別分析時,通常指定一種判別規(guī)則,用 來判定新樣本的歸屬,常見的判別準(zhǔn)則有 Fisher準(zhǔn) 則、貝葉斯準(zhǔn)則。33 - Fisher判別法就是要找一個由p個變量組成的線性判別函數(shù),使得各自組內(nèi)點的離

5、差盡可能接近, 而不同組間點的盡可能疏遠(yuǎn)。簡述多元統(tǒng)計分析的作用。能夠簡化數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu);能夠進(jìn)行分類和 組合;能夠研究指標(biāo)之間的依存關(guān)系;進(jìn)行預(yù)測; 進(jìn)行假設(shè)檢驗。簡述逐步回歸分析萬法的基本原理。原理是從一個自變量出發(fā),依照自變量對因變 量的影響顯著性大小,從大到小逐個弓I入回歸方 程,同時,在逐個自變量選入回歸方程的過程中, 如果發(fā)現(xiàn)先前被弓I入的自變量在其后由于某些自 變量的弓I入而失去其重要性時,可以從回歸方程中 隨時予以剔除。弓I入一個變量或剔除一個變量,為 逐步回歸的一步,每步都要進(jìn)行顯著性檢驗,以便 保證每次弓I入變量前回歸方程中只包括顯著性變 量,這個過程反復(fù)進(jìn)行,直到既無不顯

6、著變量從回 歸方程中剔除,又無顯著變量需要選入回歸方程時 為止。提取樣本主成分的原則。Fi于F不相關(guān)。(2) F1是X ,X 2Xp的一切線 性組合中方差最大的,F(xiàn)2是與F1不相關(guān)的X1 ,X2Xp 一切線性組合中方差最大。Fp是與F1 , Fp-1不相關(guān)的X1 ,X 1.Xp 一切線性組合中方差最大。思考主成分分析法的應(yīng)用。首先,主成分分析可以用于系統(tǒng)評估;其次, 在經(jīng)濟(jì)統(tǒng)計研究中,除了經(jīng)濟(jì)效益的綜合評價研究 外,對不同地區(qū)經(jīng)濟(jì)發(fā)展水平的評價研究,不同地 區(qū)經(jīng)濟(jì)發(fā)展競爭力的評價研究,人民生活水平、生活質(zhì)量的評價研究,等等都可以用主成分分析方法BAYES判別法和FISHER判別法的比較進(jìn)行研究

7、;另外,主成分分析除了用于系統(tǒng)評估 研究領(lǐng)域外,還可以與回歸分析結(jié)合,進(jìn)行主成 分回歸分析,以及利用主成分分析進(jìn)行挑選變 量,選擇變量子集合的研究。簡述囚子分析的基本思想。因子分析是通過變量(或樣品)的相關(guān)系數(shù) 矩陣內(nèi)部結(jié)構(gòu)的研究, 找出存在于所有變量 (或 樣品)中具有共性的因素, 并綜合為少數(shù)幾個新 變量,把原始變量表示成少數(shù)幾個綜合變量的線 性組合,以再現(xiàn)原始變量與綜合變量之間的相關(guān) 關(guān)系。其中,這里的少數(shù)幾個綜合變量一般是不 可觀測指標(biāo),通常稱為公共因子。簡述系統(tǒng)聚類法的基本思想及王要步驟。聚類分析是將樣品或變量按照它們在性質(zhì)上的親疏程度進(jìn)行分類的多元統(tǒng)計分析方法。聚類分析時,用來描述

8、樣品或變量的親疏程度通常 有兩個途徑,一是把每個樣品或變量看成是多維 空間上的一個點,在多維坐標(biāo)中,定義點與點, 類和類之間的距離,用點與點間距離來描述樣品 或變量之間的親疏程度;另一個是計算樣品或變 量的相似系數(shù),用相似系數(shù)來描述樣品或變量之 間的親疏程度簡述系統(tǒng)聚類分析法。是在樣品距離的基礎(chǔ)上定義類與類的距離, 首先將n個樣品自成一類,然后每次將具有最 小距離的兩個類合并,合并后再重新計算類與類 之間的距離,再并類,這個過程一直持續(xù)到所有 的樣品都?xì)w為一類為止。這種聚類方法稱為系統(tǒng) 聚類法。根據(jù)并類過程所做的樣品并類過程圖稱 為聚類譜系圖。16 簡述聚類分析和判別分析的區(qū)別和聯(lián)系。 一 |

9、區(qū)別:判別分析與聚類分析不同。判別分析 是在已知研究對象分成若干類型(或組別)并已 取得各種類型的一批已知樣品的觀測數(shù)據(jù), 在此 基礎(chǔ)上根據(jù)某些準(zhǔn)則建立判別式,然后對未知類型 的樣品進(jìn)行判別分類。聚類分析,并對于一批合定 樣品要劃分的類型事先不知道,正需要聚類分析來 綜合確定類型的。聯(lián)系:判別分析與聚類分析往往聯(lián)合使用,往往是專職能部門類分析,再進(jìn)行判別新樣品屬于哪 一類。建立判別式判別。判別分析的基本步驟。步驟:(1)選擇自變量或組變量,并計算各組 單變量描述的計量,對判別分析所要求的前提能定 進(jìn)行統(tǒng)計檢驗;(2)推導(dǎo)判別系數(shù)組出標(biāo)準(zhǔn)化或未標(biāo)準(zhǔn)化的典則判別函數(shù)系數(shù),并進(jìn)行安著性檢驗;(3)建

10、立 Fisher判別模型,根據(jù) Bayes規(guī)則和Fisher規(guī)則進(jìn)行判別組合;4)進(jìn)行樣本回判分析,對判別系數(shù)的結(jié)果進(jìn)行分析;(5)輸出結(jié)果,根據(jù)實際情況分析出結(jié)果,做出結(jié)論。Fisher判別:又稱典則判別,該方法的基本思想是投影,即將原來在R維空間的自變量組合投影到維度較低的 D維空間上去,然后在 D維空間再進(jìn)行分類。其優(yōu)勢在于對分布和方差沒有什么限制,應(yīng)用范圍廣泛。Bayes判別:就是利用經(jīng)驗信息,基本思想是認(rèn) 為所有D個類別都是空間中互斥的子城,每個觀測 都是空間中的一點。其優(yōu)點在于進(jìn)行多類別判別, 但是它要求總體呈多元正態(tài)分布。距離判別法基本思想 :根據(jù)已知分類的數(shù)據(jù),計算 樣品與各類

11、之間的“距離”,根據(jù)樣品到類之間的“距 離”大小判別,樣品到那個類的“距離”最小,判 樣品屬于哪個類。Fisher判別法的基本思想|:從多個總體(類)抽取 一定的樣本,借助方差分析的思想,建立p個指標(biāo)的線性判別函數(shù),把待判樣品代入線性判別函數(shù), 然后與臨界值比較,就可判樣品屬于哪個類。Bayes判別法的基本思想:對多個總體(類)要求 有一定的認(rèn)識,禾U用借Bayes公式計算樣品到每個 總體(類)的概率,比較概率的大小,樣品到那個 總體(類)的概率最大,就判樣品屬于哪個總體(類)。因子分析的基本思想 :把每個研究變量分解為幾個影響因素變量,將每個原始變量分解成兩部分因素,一部分是由所有變量共同具

12、有的少數(shù)幾個公共因子組成的,另一部分是 每個變量獨自具有的因素,即特殊因子。聯(lián)系:(1)因子分析是主成分分析的推廣,是主 成分分析的逆問題。(2)二者都是以降維為目 的,都是從協(xié)方差矩陣或相關(guān)系數(shù)矩陣出發(fā)。區(qū)別:(1)主成分分析模型是原始變量的線性組 合,是將原始變量加以綜合、歸納,僅僅是變量變 換;而因子分析是將原始變量加以分解,描述原始 變量協(xié)方差矩陣結(jié)構(gòu)的模型;只有當(dāng)提取的公因子個數(shù)等于原始變量個數(shù)時,因子分析才對應(yīng)變量變 換。(2)主成分分析,中每個主成分對應(yīng)的系數(shù)是 唯一確定的;因子分析中每個因子的相應(yīng)系數(shù)即因 子載荷不是唯一的。(3)因子分析中因子載荷的不 唯一性有利于對公因子進(jìn)行

13、有效解釋;而主成分分 析對提取的主成分的解釋能力有限。因子分析的基本步驟|(1)因子分析的前提條件鑒定(2)因子提?。?)因子旋轉(zhuǎn)(4)計算因子得分主成分分析概念及兒何意義概念(思想):主成分分析就是設(shè)法將原來指標(biāo) 重新組合成一組新的互相無關(guān)的幾個綜合指標(biāo)來 代替原來指標(biāo)。同時根據(jù)實際需要從中可取幾個較少的綜合指標(biāo)盡可能多地反映原來的指標(biāo)的信息幾何意義:1,,n).檢驗主成分分析的過程也就是坐標(biāo)旋轉(zhuǎn)的過程,各主成分表達(dá)式就是新坐標(biāo)系與原坐標(biāo)系的轉(zhuǎn)換 關(guān)系,新坐標(biāo)系中各坐標(biāo)軸的方向就是原始數(shù)據(jù) 方差最大的方向。(1) H0:卩0 (卩0為已知向量),H1:卩工卩0(2)取檢驗統(tǒng)計量(3)按傳統(tǒng)的

14、檢驗方法,對給定的顯著水平a ,查臨界值表得入a是根據(jù)一批樣品的多個觀測指標(biāo),具體地找出一些能夠度量樣品或指標(biāo)之間相似程度的統(tǒng) 計量,然后利用統(tǒng)計量將樣品或指標(biāo)進(jìn)行歸類。 把相似的樣品或指標(biāo)歸為一類,把不相似的歸為其他類。直到把所有的樣品(或指標(biāo))聚合完畢. 典型相天基本思想和王成分分析非常相似。首先在每組變量中找出變量的線性組合,使得兩組的線性組合之間具有最大的相關(guān)系數(shù)。然后選取和最初挑選的這對線性組合不相關(guān)的線性組合, 使其配對,并選取相關(guān)系數(shù)最大的一對,如此繼續(xù)下去,直到兩組變量之間的相關(guān)性被提取完畢 為此。被選出的線性組合配對稱為典型變量,它們的相關(guān)系數(shù)稱為典型相關(guān)系數(shù)。典型相關(guān)系數(shù)度

15、量了這兩組變量之間聯(lián)系的強度。簡述典型相關(guān)分析的分析方法和典型變量選取 具體冥施步驟(4) 由樣本值計算 X及T20值,若T20 Xa ,則否定H否則H相容.(1) 計算相關(guān)系數(shù)陣 R(2) 求典型相關(guān)系數(shù)及典型變量(3) 典型相關(guān)系數(shù)的顯著性檢驗(1) 兩個總體的距離判別法:這兩個總體、G分別抽取m和n2個樣品,每個樣品測量p個指標(biāo),計算X 到 G、G 總體的距離。X G D (X , G) 0對一切j工I ;待判 若有一個 W=0。當(dāng)?shù)?刀(2刀(k)互不相等時:X G,若 W(X) 0對一切j工I ;待判 若有一個 W/=0L已知時均值向量的檢驗(1 )寫出檢驗假設(shè), H:卩=卩0 H 典型相關(guān)分析是研究兩組變量之間相關(guān)關(guān) 系的統(tǒng)計方法:卩工卩0 (2)檢 驗統(tǒng)計量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論