




已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第第 3 3 章章 多元正態(tài)總體的假設(shè)檢驗與方差分析多元正態(tài)總體的假設(shè)檢驗與方差分析 從本章開始 我們開始轉(zhuǎn)入多元統(tǒng)計方法和統(tǒng)計模型的學(xué)習(xí) 統(tǒng)計學(xué)分析處理的對象是帶 有隨機性的數(shù)據(jù) 按照隨機排列 重復(fù) 局部控制 正交等原則設(shè)計一個試驗 通過試驗結(jié)果 形成樣本信息 通常以數(shù)據(jù)的形式 再根據(jù)樣本進行統(tǒng)計推斷 是自然科學(xué)和工程技術(shù)領(lǐng)域 常用的一種研究方法 由于試驗指標(biāo)常為多個數(shù)量指標(biāo) 故常設(shè)試驗結(jié)果所形成的總體為多元 正態(tài)總體 這是本章理論方法研究的出發(fā)點 所謂統(tǒng)計推斷就是根據(jù)從總體中觀測到的部分?jǐn)?shù)據(jù)對總體中我們感興趣的未知部分作出推 測 這種推測必然伴有某種程度的不確定性 需要用概率來表明其可靠程度 統(tǒng)計推斷的任務(wù) 是 觀察現(xiàn)象 提取信息 建立模型 作出推斷 統(tǒng)計推斷有參數(shù)估計和假設(shè)檢驗兩大類問題 其統(tǒng)計推斷目的不同 參數(shù)估計問題回答諸 如 未知參數(shù)的值有多大 之類的問題 而假設(shè)檢驗回答諸如 未知參數(shù)的值是嗎 之類的問題 本章主要討論多元正態(tài)總體的假設(shè)檢驗方法及其實際應(yīng)用 我們將對一元正態(tài)總 體情形作一簡單回顧 然后將介紹單個總體均值的推斷 兩個總體均值的比較推斷 多個總 體均值的比較檢驗和協(xié)方差陣的推斷等 3 13 1 一元正態(tài)總體情形的回顧一元正態(tài)總體情形的回顧 一 假設(shè)檢驗 在假設(shè)檢驗問題中通常有兩個統(tǒng)計假設(shè) 簡稱假設(shè) 一個作為原假設(shè) 或稱零假設(shè) 另一個作為備擇假設(shè) 或稱對立假設(shè) 分別記為和 1 顯著性檢驗 為便于表述 假定考慮假設(shè)檢驗問題 設(shè) 來自總體的樣本 我們要檢驗假設(shè) 3 1 原假設(shè)與備擇假設(shè)應(yīng)相互排斥 兩者有且只有一個正確 備擇假設(shè)的意思是 一 旦否定原假設(shè) 我們就選擇已準(zhǔn)備的假設(shè) 當(dāng)已知時 用統(tǒng)計量 在原假設(shè)成立下 統(tǒng)計量服從正態(tài)分布 通過查表 查得的上 分位點 對于檢驗問題 3 1 1 我們制定這樣一個檢驗規(guī)則 簡稱檢驗 當(dāng)時 拒絕 當(dāng)時 接受 3 2 我們稱為臨界值 是的上分位點 不同的臨界值代表不同的檢驗 稱拒絕原 假設(shè)的統(tǒng)計量的范圍為拒絕域 稱接受的統(tǒng)計量的范圍為接受域 因此給出一個 檢驗 就是給出一個拒絕域 2 兩類錯誤 由于樣本具有隨機性 因此在根據(jù)樣本進行判斷時 有可能犯兩種類型的錯誤 一類錯誤 是 原假設(shè)本來正確 但按檢驗規(guī)則卻作出了拒絕的判斷 這類錯誤稱為第一類錯誤 棄真錯誤 其發(fā)生的概率稱為犯第一類錯誤的概率 另一類錯誤時 原 假設(shè)本來不正確 但按檢驗規(guī)則卻作出了接收的判斷 這類錯誤稱為第二類錯誤 存 偽錯誤 其發(fā)生的概率稱為犯第二類錯誤的概率 記為 同時控制這兩類錯誤是困難的 當(dāng)時在樣本容量固定的條件下 要使和同時減小 通常是不可能的 在假設(shè)檢驗的應(yīng)用中 由奈曼 NEYMAN 與皮爾遜 PEARSON 提出了一個原則 即在控制犯第一類錯誤的概率條件下 盡量使犯第二類錯誤的概率小 這種檢驗問題 稱為顯著性檢驗問題 根據(jù)這一原則 原假設(shè)受到保護 不至于被輕易拒絕 一旦檢驗結(jié)果拒 絕了原假設(shè) 則表明拒絕的理由是充分的 如果接受了原假設(shè) 則只是表明拒絕的理由還不充 分 未必意味著原假設(shè)就是正確的 所以 在實際問題中 為了通過樣本觀測值對某一猜測取 得強有力的支持 通稱我們把這一猜測的否定作為原假設(shè) 而把猜測本身作為備擇假設(shè) 3 關(guān)于檢驗的值 下面 我們再介紹進行檢驗的另一種方式 值 我們就以 3 1 1 的檢驗問題為例來 加以說明 對于樣本 我們通過統(tǒng)計量 計算出 是一確定值 這里的是 樣本觀測值的均值 再由統(tǒng)計量服從正態(tài)分布 計算為檢驗的值 由于等價于 所以檢驗規(guī)則可以表述為 當(dāng)時 拒絕 當(dāng)時 接受 接受 3 3 上述值的檢驗規(guī)則與 3 1 2 的檢驗結(jié)果相比含有更豐富的信息 值越小 拒絕原 假設(shè)的理由就充分 通常 SAS 等軟件的計算機輸出一般只給出值 由你自己給定的值來 判斷檢驗結(jié)果 二 單一變量假設(shè)檢驗的回顧 1 單個正態(tài)總體均值的檢驗 考慮假設(shè)檢驗問題 設(shè) 來自總體的樣本 我們要檢驗 假設(shè) 1 總體方差已知 構(gòu)造統(tǒng)計量 在原假設(shè)成立下 服從正態(tài)分布 可得這樣一個檢驗規(guī)則 當(dāng)時 拒絕 當(dāng)時 接受 2 總體方差未知 構(gòu)造統(tǒng)計量 在原假設(shè)成立下 服從自由度為的 分布可得這樣一個檢驗規(guī) 則 當(dāng)時 拒絕 當(dāng)時 接受 3 1 4 2 兩個正態(tài)總體均值的比較檢驗 考慮假設(shè)檢驗問題 3 1 5 設(shè)是取自總體的容量為的樣本 是取自 的容量為的樣本 給定顯著性水平 1 兩個總體方差和已知 構(gòu)造檢驗統(tǒng)計量 3 1 6 在原假設(shè)成立下 服從正態(tài)分布 檢驗規(guī)則為 當(dāng)時 拒絕 當(dāng)時 接受 2 兩個總體方差和都未知 但 用樣本方差代替 構(gòu)造檢驗統(tǒng)計量 在原假設(shè)成立下 服從正態(tài)分布 檢驗規(guī)則為 當(dāng)時 拒絕 當(dāng)時 接受 3 多個正態(tài)總體均值的比較檢驗 方差分析 設(shè)個正態(tài)總體分別為 從個總體取 個獨立樣本如下 考慮假設(shè)檢驗問題 假設(shè)成立條件下 構(gòu)造檢驗統(tǒng)計量為 這里稱為組間平方和 稱為組內(nèi)平方和 稱為總平方和 其中 給定檢驗水平 查分布表 使 可確定出臨界值 再利用樣本值計算出值 若 則拒絕 否則不能拒絕 附注 多元假設(shè)檢驗與附注 多元假設(shè)檢驗與 SASSAS 過程過程 本章的主要內(nèi)容是多元假設(shè)檢驗和方差分析 其中的計算一般都很復(fù)雜 可用國際上著名 的專業(yè)軟件 SAS 軟件計算 SAS 中有 GLM ANOVA 和 NESTED 等過程可用方差分析 其中 GLM 過程最常用 SAS 的 GLM 過程采用了一般線性模型 在方差分析問題中 變量 是示性變量 即只取 0 或 1 的變量 GLM 過程對每一因 子的每一水平 通過 CLASS 語句產(chǎn)生 1 個示性變量 也稱分類變量 GLM 過程主要有四個語句 PROC GLM CLASS MODEL 和 LSMEANS 語句 PROC GLM 語句語句 用以調(diào)用 GLM 過程 有許多選項 一般形式是 Proc glm data 數(shù)據(jù)集名稱 outstat 輸出的統(tǒng)計量 order formatted freq data internal CLASS 語句語句 說明哪些變量是分類變量 方差分析中的因素都是分類變量 如 Class V1 V2 V3 此語句指示計算機把因子 V1 V2 V3 作為分類變量 可以是字符型變量或數(shù)字型變量 如果是字符型變量 長度限于 10 個字符以內(nèi) MODEL 語句語句 語句中等號前是響應(yīng)變量 如 Model Y A 單因子 ANOVA Model Y A B C 主效應(yīng)模型 Model Y A B A B 含交互效應(yīng)的因子模型 Model Y1 Y2 A B 多因子方差模型 MANOVA LSMEANS 語句語句 用以求待估參數(shù)的最小二乘估計 Lsmeans A B A B MANOVA 語句語句 用以說明是做多元方差分析 3 23 2 均值等于常數(shù)向量的檢驗均值等于常數(shù)向量的檢驗 在經(jīng)濟生產(chǎn) 管理決策中的很多實際問題 通常要選取多個指標(biāo)進行考察 根據(jù)歷史數(shù)據(jù) 將項指標(biāo)的歷史平均水平記作 考慮新的項指標(biāo)平均值是否與歷史數(shù)據(jù)記載的平均值 有明顯差異 若有差異 進一步分析差異主要在哪些指標(biāo)上 先看下面的實例 例 3 1 測量 20 名健康女性排汗量 鈉含量 鉀含量得表 3 1 問健康女性 的均值是不是 4 50 10 表 3 1 20 名健康女性排汗量 鈉含量 鉀含量數(shù)據(jù) 排汗量鈉含量鉀含量 3 748 59 3 5 765 18 0 3 847 210 9 3 253 212 0 3 155 59 7 4 636 17 9 2 424 814 0 7 233 17 6 6 747 48 5 5 454 111 3 3 936 912 7 4 558 812 3 3 527 89 8 4 540 28 4 1 513 510 1 8 556 47 1 4 571 68 2 6 552 810 9 4 144 111 2 5 540 99 4 例 3 1 的數(shù)學(xué)模型就是 服從要根據(jù) 20 個樣品做復(fù)合檢驗 一般的 我們考慮維正態(tài)分布均值等于常數(shù)的檢驗問題 為取自維 正態(tài)總體的一個樣本 要檢驗 3 4 其中為已知維向量 對于這樣一個檢驗問題 分為以下兩種情形 一 協(xié)方差陣已知條件下 均值的檢驗 作出假設(shè)后 需要構(gòu)造一個合適的統(tǒng)計量 要檢驗的假設(shè)在形式上同一維情形是一樣的 在一維時構(gòu)造的統(tǒng)計量為且在成立時 服從正態(tài)分布 依照一維情形 由于成立時服從維正態(tài)分布 若記 為非奇異對稱陣 則有 服從但用來確定拒絕域不方便 因此 改選用統(tǒng)計量 3 5 當(dāng)成立時 服從 分布 對給定的 從 求出 當(dāng)時 要先求 這需要大量的計算 實際計算時 可以不必求 出 只要令 即 3 6 求解方程組 3 2 3 求出Y后 則 二 協(xié)方差陣未知條件下均值的檢驗 假設(shè)檢驗問題仍然是 其中為已知維向量 在 回顧一元情況 在原假設(shè)成立下 服從自由度為的 分布 在維正態(tài)情況下 當(dāng)協(xié)方差已知時 選用時統(tǒng)計量為 現(xiàn)用樣本協(xié)方差代替總體協(xié)方差陣 令 統(tǒng)計量的分布是一元統(tǒng)計中 分布的推廣 最早由 HOTELLING 導(dǎo)出 在上一章中 我 們已經(jīng)給出了這個定義 可以直接用它作為檢驗的統(tǒng)計量 分布已被仔細(xì)研究過 1 及 5 的分位點已經(jīng)列成專表 讀者可在 3 中找到這個表 也可以利用 HOTELLING 分布的 性質(zhì) 證明參見朱道元 P210 當(dāng)不成立時 有變大的趨勢 對給定的 從 求出 當(dāng)時 拒絕 否則接受 例 3 1 測量 20 名健康女性排汗量 鈉含量 鉀含量得表 3 1 問健康女性 的均值是不是 4 50 10 解 建立 用 SAS MATEMATICA MATLAB 等軟件都可算出 所以否定原假設(shè) 即在 0 10 顯著水平下拒絕 例 3 1 也可用下列 SAS 程序計算 data hanye input x1 x3 y1 x1 4 y2 x2 50 y3 x3 10 a 1 cards 3 7 48 59 3 5 7 65 18 0 3 8 47 210 9 3 2 53 212 0 3 1 55 59 7 4 6 36 17 9 2 4 24 814 0 7 2 33 17 6 6 7 47 48 5 5 4 54 111 3 3 9 36 912 7 4 5 58 812 3 3 5 27 89 8 4 5 40 28 4 1 5 13 510 1 8 5 56 47 1 4 5 71 68 2 6 5 52 810 9 4 1 44 111 2 5 5 40 99 4 proc glm model y1 y3 a noint manova h a printe printh run 執(zhí)行此程序后得到的輸出中主要的是最后一個表 H Type III SSCP Matrix for a E Error SSCP Matrix S 1 M 0 5 N 7 5 Statistic Value F Value Num DF Den DF Pr F Wilks Lambda 0 66112774 2 90 3 17 0 0649 Pillai s Trace 0 33887226 2 90 3 17 0 0649 Hotelling Lawley Trace 0 51256699 2 90 3 17 0 0649 Roy s Greatest Root 0 51256699 2 90 3 17 0 0649 可見 P 值為 0 0649 所以否定原假設(shè) 即在 0 10 顯著水平下拒絕 在實際工作中 一元檢驗與多元檢驗可以聯(lián)合使用 多元的檢驗具有概括和全面的優(yōu)點 而一 元的檢驗容易發(fā)現(xiàn)各指標(biāo)之間的關(guān)系和差異 兩者的結(jié)合能給統(tǒng)計人員提供更多的統(tǒng)計分析信 息 3 33 3 兩總體均值的比較檢驗兩總體均值的比較檢驗 例 3 2 為了研究日美兩國在華企業(yè)對中國經(jīng)營環(huán)境的評價是否存在差異 從兩國在華企 業(yè)對中國的政治 經(jīng)濟 法律 文化等環(huán)境打分 得表 3 2 試分析日美兩國在華企業(yè)對中國 經(jīng)營環(huán)境的評價是否存在差異 表 3 2 日美兩國在華企業(yè)對中國經(jīng)營環(huán)境的評價 美國企業(yè)號政治環(huán)境 X1經(jīng)濟環(huán)境 X2法律環(huán)境 X3文化環(huán)境 X4 美 1 65352560 美 2 75502055 美 3 60453565 美 4 75404070 美 5 70303050 美 6 55403565 美 7 60453060 美 8 65402560 美 9 60503070 美 10 55553575 日本企業(yè)號政治環(huán)境 Y1經(jīng)濟環(huán)境 Y2法律環(huán)境 Y3文化環(huán)境 Y4 日 1 55554065 日 2 50604570 日 3 45453575 日 4 50505070 日 5 55503075 日 6 60404560 日 7 65554575 日 8 50653580 日 9 40453065 日 10 45504570 假設(shè)服從 服從 下 且有 10 對樣品 要做復(fù)合檢驗 一般情況下 我們考慮為取自維正態(tài)總體的一個樣本 為取自維正態(tài)總體的一個樣本 假定兩組樣本相互獨立 且 一 有共同已知的協(xié)差陣時 對于例 3 2 提出的問題 可歸類為假設(shè)檢驗問題 其中為已知維向量 在一維情形下 用了統(tǒng)計量 與前面相似的思路 在維時 選用 統(tǒng)計量 當(dāng)成立時 服從 分布 對給定的顯著性水平 從 求出 當(dāng)時 拒絕 當(dāng)0 但未知 要檢驗的假設(shè) 為 其中為已知維向量 記 采用統(tǒng)計量為 定理 3 2 若 成立 則 證明參見朱道元 P217 定理 3 2 可用于用做兩總體復(fù)合檢驗 根據(jù)定理 3 2 當(dāng)成立時 統(tǒng)計量 當(dāng)不成立時 有變大的趨勢 對給定的 從 求出 當(dāng)時 拒絕 否則接受 以上有關(guān)的統(tǒng)計量在成立時所服從的分布的相應(yīng)證明都比較復(fù)雜 這里我們只敘述了 有關(guān)結(jié)論 沒有給出證明 可參看第二章的相關(guān)內(nèi)容 這些統(tǒng)計量同一維相應(yīng)的統(tǒng)計量均有相 似之處 對比兩者的形式有助于理解和應(yīng)用 例 3 2 的解 作假設(shè) 所以日美兩國在華企業(yè)對中國經(jīng)營環(huán)境的評價存在顯著差異 例 3 2 可用如下 SAS 程序?qū)崿F(xiàn) data wu1 input no pol ecn leg cul cou cards 美1 65352560 a 美2 75502055 a 美3 60453565 a 美4 75404070 a 美5 70303050 a 美6 55403565 a 美7 60453060 a 美8 65402560 a 美9 60503070 a 美10 55 55 3575 a 日1 55554065 j 日2 50604570 j 日3 45453575 j 日4 50505070 j 日5 55503075 j 日6 60404560 j 日7 65554575 j 日8 50603580 j 日9 40453065 j 日10 45 50 4570 j proc glm class cou model pol ecn leg cul cou ss3 manova h cou printe printh run 執(zhí)行此程序后得到的輸出中主要的是最后一個表 H Type III SSCP Matrix for cou E Error SSCP Matrix S 1 M 1 N 6 5 Statistic Value F Value Num DF Den DF Pr F Wilks Lambda 0 37607734 6 22 4 15 0 0037 Pillai s Trace 0 62392266 6 22 4 15 0 0037 Hotelling Lawley Trace 1 65902752 6 22 4 15 0 0037 Roy s Greatest Root 1 65902752 6 22 4 15 0 0037 由此可見 p 值是 0 0037 因而日美兩國在華企業(yè)對中國經(jīng)營環(huán)境的評價存在顯著差異 3 43 4 多個總體均值向量的比較檢驗多個總體均值向量的比較檢驗 在研究作物栽培時 要考慮播種期 品種 土質(zhì) 施肥方式 灌溉方式對產(chǎn)量的影響 在 化學(xué)反應(yīng)中要觀察原料成分 劑量 催化劑 溫度 壓力 攪拌速度等對得率的影響 在很多 應(yīng)用領(lǐng)域尤其是科學(xué)研究中 都遇到過類似的問題 常涉及許多因素 這類問題要分析出影響 最 大 的因素 就是比較各種因素對試驗結(jié)果所起的作用問題 作為影響試驗結(jié)果的每一因 素或因素的某一水平或某一方案 且試驗結(jié)果都形成一個隨機總體 這樣 比較各種因素對試 驗結(jié)果所起的作用問題就變成對各種因素的試驗結(jié)果所形成的總體的比較問題 由于試驗指標(biāo)常為多元指標(biāo) 故常設(shè)試驗結(jié)果所形成的總體為多元正態(tài)總體 此外 我們 按照隨機排列 重復(fù) 局部控制 正交等原則設(shè)計一個試驗 除要考察的因素外 其他試驗條 件均要求一致 即要考察的試驗因素的試驗結(jié)果都是同協(xié)方差陣的且相互獨立的多元正態(tài)總體 因而 各因素對試驗結(jié)果影響的結(jié)果的比較 就變成了多個同協(xié)方差陣的多元正態(tài)總體均值向 量的比較 統(tǒng)計上解決兩個以上同協(xié)方差陣多元正態(tài)總體均值向量比較的方法叫做多元方差分 析 多個總體均值向量的比較檢驗 特別是多元方差分析正是本節(jié)的內(nèi)容 這類方法在經(jīng)濟管 理 系統(tǒng)控制 生物醫(yī)藥等許多領(lǐng)域有著廣泛的應(yīng)用 這里先看一個具體實例 3 4 1 提出問題 例 3 3 為了研究某種疾病 對三組人測量 第 1 組是 20 至 35 歲女性 第 2 組是 20 至 25 歲 男性 第 3 組是 30 至 55 歲男性 每組取 20 個人 測量第 I 組的第 J 人 4 個指標(biāo)是 脂蛋 白 甘油三脂 脂蛋白 前脂蛋白 測量結(jié)果見表 3 3 問三組人的指標(biāo)間有沒有顯著差別 表 3 3 脂蛋白 甘油三脂 脂蛋白 前脂蛋白數(shù)據(jù) 2607540183101223021320643917 200723417310603518260593711 240874518190402715360882826 1706539172256534162951003612 2701103924170653716270653221 20513034232108231173801143621 190692715280673718240554210 200464515210383617260553420 25011721202806530232601102920 2001072820200764017295733321 22513036112007639202401143818 21012526172809426113101033218 1706431141906033173301122111 2707633132955530163451272420 1906034162701252421250622216 2808120182801203218260592119 31011925152406232202251003430 270573182806929203451203618 2506731143707030203601072523 26013539292804037172501173616 問題中的 3 組人的測量值 每個隨機向量有 4 個指標(biāo) 即 4 維隨機 向量 例 3 3 要從每個總體 20 個樣品值出發(fā) 檢驗是否成立 3 4 2單因素方差分析的數(shù)學(xué)模型 方差分析的目的在于找出自變量與因變量之間的線性關(guān)系 或自變量對因變量的實驗效果 方差分析是一種處理實驗數(shù)據(jù)的方法 考察一個被稱為因變量或相依變量 dependent variable 的連續(xù)響應(yīng)變量 又稱反應(yīng)變量 Response Variable 其數(shù)值則是連續(xù)的 它在由分 類變量識別的幾種試驗條件下被測量 這些分類變量被稱為自變量 獨立變量 independent variable 定性變量 Qualitative Variable 或分類變量 Classification Variable 其數(shù)值多半 是不連續(xù)的 這些分類變量的水平組合形成試驗設(shè)計的單元 例如 某個試驗要測量男人和女 人的重量變化 因變量 他們采取了三種不同的減肥方法 這個設(shè)計的 6 個單元由性別 男 女 和減肥方法 A B C 6 種組合形成 一項試驗有多個影響因素 因素也可以看成是一種變量 其取值不是數(shù) 而是水平 例如 產(chǎn)地 是一個變量 它取的值是 北京 上海 南京 等 這種變量稱為屬性變量 定 性變量或分類變量 如果只有一個因素在發(fā)生變化 其他因素保持不變 則稱為單因素試驗 與之對應(yīng)的方差分析 稱為單因素方差分析 我們所考察的 影響產(chǎn)品指標(biāo)的因素 如產(chǎn)地 溫度 也稱為因子 用大寫字母 A B C 表示 因素所能處的狀況 如甲 乙 丙 60 65 70 75 稱為因素的水平 簡稱為水平 水平常以表示 一般地 假設(shè)因素 A 有 k 個水平 對第 個水平進行試驗 獨立觀察次 整個試驗共作了次 且完全隨機排列 設(shè)的第次觀察的試驗指標(biāo)為維向量 假設(shè) 1 同一個水平下得到的觀測值 由于實 驗過程中各種偶然因素的干擾及測量誤差所致 每次實驗中這些偶然因素的總和 稱為實驗誤差 它們是方差相同的零均值正態(tài)隨機變量 2 所有誤差相互獨立 3 由于水平的不同 可能會給一個定量的確定性的影響 其大小是未知的 假定 令 于是有模型 其中稱為總體均值向量 為的主效應(yīng)向量 為的第次觀察的隨機誤差向量 根據(jù)假設(shè)相互獨立且均服從 判斷這個因素的影響是否顯著就是要檢驗假設(shè) 不全為 0 3 7 設(shè)第 I 組樣本均值 總均值 樣本組內(nèi)差 樣本組間差 對于該檢驗問題的統(tǒng)計量 取 WILKS 統(tǒng)計量 定理 3 3 若 則服從 WILKS 分布 證明參見朱道元第 177 頁 例 3 3 為了研究某種疾病 對三組人測量 第 1 組是 20 至 35 歲女性 第 2 組是 20 至 25 歲男 性 第 3 組是 30 至 55 歲男性 每組取 20 個人 測量第 I 組的第 J 人 4 個指標(biāo)是 脂蛋白 甘油三脂 脂蛋白 前脂蛋白 測量結(jié)果見表 3 3 問三組人的指標(biāo)間有沒有顯著差別 解 這兒有 3 個總體 建立假設(shè) 計算三總體樣本均值 計算組內(nèi)差 計算組間差 計算總方差 計算統(tǒng)計量 查得 0 6621 所以高度顯著否定 故三組人身體指標(biāo)有顯著差異 3 53 5 總體協(xié)差陣相等的檢驗總體協(xié)差陣相等的檢驗 本章第三節(jié)和第四節(jié)中 總假定不同總體的方差是相同的 這一假定是否合理 在一些 問題中應(yīng)當(dāng)加以證明 3 5 1 一個正態(tài)總體協(xié)方差陣的檢驗 設(shè)為取自維正態(tài)總體的一個樣本 未知 且 首先 我們考慮假設(shè)檢驗問題 所構(gòu)造的檢驗統(tǒng)計量為 其中 然后 我們考慮假設(shè)檢驗問題 因為 所以存在非奇異矩陣 使得 令 則 因此檢驗等價于 此時構(gòu)造檢驗統(tǒng)計量為 其中 給定檢驗水平 因為直接有的分布計算臨界值很困難 所以通常采用的近似分布 在成立時 的極限分布是 因此當(dāng) 由樣本值計算出 值 若 即 則拒絕 否則不能拒絕 3 5 2 多個協(xié)方差陣相等檢驗 剛才討論的檢驗是一個正態(tài)總體協(xié)方差陣的檢驗 是檢驗當(dāng)前協(xié)方差陣與過去是 否一樣 在一些實際問題中 可能會遇到多個正態(tài)總體的協(xié)方差陣是否相等的問題 設(shè)有個正態(tài)總體分別為 且未知 從第 個總體中取個樣本 這里為總樣本容量 我們考慮假設(shè)檢驗問題為 不全相等 構(gòu)造檢驗統(tǒng)計量為 其中 按照 Bartlett 的建議 記 得到修正的檢驗統(tǒng)計量 則在成立時 的極限分布是 其中 例 3 4有甲 乙兩品種 取得如表 3 4 所示的兩個二元正態(tài)樣本 試檢驗 表 3 4 方差陣檢驗數(shù)據(jù) 觀察值和 甲 300 23 232 5 217 25 100 43 286 10 320 17 1455 123 385109 3417 26085 乙 200 50 150 43 333 83 150 41 283 73 383 80 350 86 300 100 2149 556 635167 42044 161638 解 由于 故 由于 故應(yīng)拒絕 即認(rèn)為有顯著差異 3 63 6 獨立性檢驗獨立性檢驗 一個隨機向量 若其中兩子向量相互獨立 則可化為兩個低維隨即向量 處理 給統(tǒng)計分析帶來極大的便利 因此檢驗一個隨機向量的子向量之間是否獨立是參數(shù)假設(shè) 檢驗中的重大課題 而當(dāng) 時 相互獨立 互不 相關(guān) 這時 的獨立性檢驗可歸結(jié)為參數(shù)假設(shè)檢驗 一般情況下 設(shè) 正定 將分割成個子向量 其中的維數(shù)為 將與也作相應(yīng)的剖分 檢驗子向量之間的相互獨立
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)培訓(xùn)課件人員講解
- 企業(yè)培訓(xùn)工會知識課件
- 企業(yè)垃圾分類培訓(xùn)課件
- 電力設(shè)施沉降監(jiān)測與安全運行合同
- 機場候機廳場地租賃及商業(yè)合作合同
- 小區(qū)大門設(shè)計建造方案
- 廠房進度計劃安排方案
- 物聯(lián)網(wǎng)項目定金擔(dān)保協(xié)議
- 服裝服飾店轉(zhuǎn)讓及品牌代理銷售合同
- 國際汽車貿(mào)易代理合同范本
- 2025-2030年中國野生動物保護行業(yè)市場需求分析及投資發(fā)展前景預(yù)測研究報告
- 課件:DeepSeek教師培訓(xùn):從工具到伙伴的教育變革
- 2025光伏直流電纜技術(shù)規(guī)范
- 腎動態(tài)彈丸式注射流程
- 法蘭加工合同協(xié)議
- 公司合同知識培訓(xùn)課件
- 成都市錦江區(qū)2023年七年級《英語》下冊期末試卷與參考答案
- 工程勘察設(shè)計實施要點
- 備戰(zhàn)2025年中考英語時文閱讀2(含答案)
- 2025-2031年中國庚二酸行業(yè)市場深度研究及投資策略研究報告
- 農(nóng)戶果樹租賃合同范例
評論
0/150
提交評論