




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第七章 假設(shè)檢驗假設(shè)檢驗的基本原理總體參數(shù)假設(shè)檢驗非參數(shù)檢驗第一節(jié) 假設(shè)檢驗的基本原理假設(shè)檢驗的基本原理假設(shè)檢驗的規(guī)則與兩類錯誤檢驗功效一、假設(shè)檢驗的基本原理假設(shè)檢驗是統(tǒng)計推斷的另一項重要組成部分,是參數(shù)估計的延續(xù),是對參數(shù)估計在統(tǒng)計上的驗證與補充。它首先對考察總體的分布形式或總體的某些未知參數(shù)事先做出某些假設(shè),然后根據(jù)檢驗對象構(gòu)造合適的檢驗統(tǒng)計量并經(jīng)過數(shù)理統(tǒng)計分析,確定在假設(shè)下,該檢驗統(tǒng)計量的抽樣分布;在給定的顯著性水平下,從抽樣分布中得出鑒別對原先假設(shè)的拒絕域和接受域的臨界值;之后由所抽取的樣本資料計算樣本統(tǒng)計量,并將樣本統(tǒng)計量與臨界統(tǒng)計量進(jìn)行比較,從而對所提出的原假設(shè)做出統(tǒng)計判斷:是接受
2、還是拒絕原假設(shè)。也就是從樣本中所蘊含的信息來對總體情況進(jìn)行判斷。假設(shè)檢驗所遵循的推斷依據(jù)是統(tǒng)計中的“小概率原理”:小概率事件在一次試驗中幾乎是不會發(fā)生的。舉個例子來說,在10000件的產(chǎn)品中,如果只有1件是次品,那么可以得知,在一次試驗中隨機抽取1件產(chǎn)品,它為次品的概率就為01.01,此概率是非常小的?;蛘呤钦f,在一次隨機抽樣試驗中,次品幾乎是不會被抽到的。反過來,如果從這批產(chǎn)品中隨機抽取1件,恰好是次品,那么,我們就有理由懷疑該批產(chǎn)品的次品率不是很小,否則就不會那么容易地抽到次品。因此,有足夠的理由否認(rèn)該批產(chǎn)品的次品率很低的假設(shè)。通常概率要多大才能算得上是小概率呢?假設(shè)檢驗中把這個小概率稱為
3、顯著性水平 ,其取值的大小與我們能否做出正確判斷有著相當(dāng)大的關(guān)系。然而, 的取值并沒有固定的標(biāo)準(zhǔn),只能根據(jù)實際需要來確定。一般地, 取0.085(5),對于一些比較嚴(yán)格的情況,例如在一些高精密質(zhì)量檢驗的假設(shè)檢驗中,它可以取0.01或者更小。 越小,所做出的拒絕原假設(shè)的判斷的說服力就越強。當(dāng)然,不管 有多么地小,也不能代表小概率事件沒有發(fā)生的可能,這也正是假設(shè)檢驗與數(shù)學(xué)上“反證法”的不同之處。所以,對于拒絕或者接受,都只是統(tǒng)計意義上的,并不是完全意義上的。這一點在學(xué)習(xí)假設(shè)檢驗過程中是容易被疏忽的。事先建立假設(shè),是假設(shè)檢驗中關(guān)鍵的一項工作。它包括原假設(shè)和備選假設(shè)兩部分。原假設(shè)是建立在假定原來總體沒
4、有發(fā)生變化的基礎(chǔ)之上的,也就是總體參數(shù)沒有顯著變化。備選假設(shè)是原假設(shè)的對立,是在否認(rèn)原假設(shè)之后所要接受的內(nèi)容,通常這是我們真正感興趣的一個判斷。例如在上面的例子中,如果想確認(rèn)次品率是否為0.01,我們可以分別建立原假設(shè)和備選假設(shè)為: h0:0=0.01%, h1:00.01% ;如果我們想確認(rèn)次品率是否大于(小于)0.01,那么對應(yīng)的備選假設(shè)為: h1:0>0.01% (或0<0.01% ),原假設(shè)與前面相同。由此可見,備選假設(shè)與原假設(shè)的建立不是隨意的,而是要根據(jù)研究的需要來確定的。應(yīng)當(dāng)指出,在假設(shè)檢驗中,相對而言,當(dāng)原假設(shè)被拒絕時,我們能夠以較大的把握肯定備選假設(shè)的成立;而當(dāng)原假
5、設(shè)不能被拒絕時,我們并不能斷定原假設(shè)確實成立。例如,當(dāng)給定的為0.01時,如果檢驗統(tǒng)計量的取值落入其發(fā)生概率不超過0.04但又大于0.01的區(qū)域時,我們不能拒絕原假設(shè)。但事實上,在原假設(shè)成立的前提下,其發(fā)生的概率最多只有0.04,因此難以斷定原假設(shè)成立。如果將顯著水平定為0.05,則原假設(shè)就會被拒絕。假設(shè)檢驗按照所檢驗內(nèi)容的不同,可以分為參數(shù)檢驗和非參數(shù)檢驗。對已知總體分布的某個未知參數(shù)進(jìn)行的檢驗,稱為參數(shù)檢驗;對總體的分布形式進(jìn)行的檢驗,則稱為非參數(shù)檢驗。本章將分別對這兩類檢驗進(jìn)行介紹。二、假設(shè)檢驗的規(guī)則與兩類錯誤(一)假設(shè)檢驗的規(guī)則綜合上面假設(shè)檢驗的原理分析,給出假設(shè)檢驗的步驟:1根據(jù)實際
6、應(yīng)用問題確定合適的原假設(shè) h0和備選假設(shè)h1;2確定檢驗統(tǒng)計量,通過數(shù)理統(tǒng)計分析確定該統(tǒng)計量的抽樣分布;3給定檢驗的顯著性水平 ,在原假設(shè)成立的條件下,結(jié)合備選假設(shè)的定義,由檢驗統(tǒng)計量的抽樣分布情況求出相應(yīng)的臨界值,該臨界值為原假設(shè)的接受域與拒絕域的分界值;4從樣本資料計算檢驗的樣本統(tǒng)計量,并將其與臨界值進(jìn)行比較,判斷是否接受或拒絕原假設(shè)。上面步驟中,對檢驗統(tǒng)計量抽樣分布的確認(rèn)屬于高深的概率數(shù)理統(tǒng)計的研究內(nèi)容,本處我們不作探討。從檢驗程序我們可以看出,統(tǒng)計量的取值范圍可以分為接受域和拒絕域兩個區(qū)域。拒絕域正就是統(tǒng)計量取值的小概率區(qū)域。按照我們將這個拒絕域安排在所檢驗統(tǒng)計量的抽樣分布的某一側(cè)還是
7、兩端,可以將檢驗分為單側(cè)檢驗和雙側(cè)檢驗。單側(cè)檢驗中,又可以根據(jù)拒絕域,是在左側(cè)還是在右側(cè)而分為左側(cè)檢驗和右側(cè)檢驗。對于上述的情況,我們可以通過服從檢驗統(tǒng)計量的分布圖來形象表示: 圖7-1 雙側(cè)檢驗與單側(cè)檢驗圖中的陰影部分為拒絕域,對應(yīng)的分別是雙側(cè)、左單側(cè)、右單側(cè)檢驗。實際應(yīng)用中,是采用雙側(cè)檢驗還是單側(cè)檢驗?單側(cè)檢驗中,是采用左單側(cè)還是右單側(cè)呢?例如,某公司采取了新的銷售方案,我們想檢驗新方案下銷售收入是否與實施前的有差異,即是否等同于原來的銷售收入水平,對該情況的檢驗就是雙側(cè)檢驗。如果我們想檢驗新方案下的銷售收入水平是否有所提高,此時檢驗就轉(zhuǎn)化為單側(cè)檢驗了,而且是右側(cè)檢驗。同理,如果想檢驗收入
8、水平是否低于實施前的收入水平,就要采用單側(cè)檢驗中的左側(cè)檢驗。也就是說,選用雙側(cè)、左側(cè)或右側(cè)檢驗時,要結(jié)合備選假設(shè)來考慮。又如,前面提到的次品率的例子中,如果備選假設(shè)為 h1:00.01% ,就是雙側(cè)檢驗;如果備選假設(shè)為h1:0<(或>) 0.01% ,就是屬于左(右)單側(cè)檢驗。在檢驗規(guī)則中,我們經(jīng)常碰到兩種重要的檢驗方法: z檢驗與t檢驗。1z檢驗。又稱為正態(tài)分布檢驗,該檢驗認(rèn)為所檢驗的統(tǒng)計量服從正態(tài)分布。例如,從正態(tài)分布總體中抽取一個樣本,則樣本均值 服從正態(tài)分布 ;從一般非正態(tài)分布總體中抽樣,當(dāng)樣本容量 n很大時,樣本均值 近似地服從正態(tài)分布 ,其中 , , 為總體標(biāo)準(zhǔn)差。因為
9、統(tǒng)計量 n(0,1) ,所以,我們可以利用標(biāo)準(zhǔn)正態(tài)分布來進(jìn)行檢驗。根據(jù)給定的顯著性水平,從標(biāo)準(zhǔn)正態(tài)分布的臨界表中查得臨界值 ,將 z統(tǒng)計量的取值與臨界值比較來判斷能否拒絕原假設(shè)。2 t檢驗。在檢驗中,當(dāng)總體的標(biāo)準(zhǔn)差 未知時,需要用樣本標(biāo)準(zhǔn)差 來代替,從而構(gòu)成統(tǒng)計量 。同樣,從 t分布的臨界表中查得臨界值 ,并將樣本統(tǒng)計量的 值與其比較做出判斷。(二) p值檢驗在上面的檢驗步驟中,判斷最后是接受原假設(shè)還是拒絕原假設(shè)依據(jù)是,計算的樣本統(tǒng)計量的數(shù)值與檢驗統(tǒng)計量的臨界值的大小比較。此外,我們也可以根據(jù)計算的概率值p來判斷能否拒絕原假設(shè),這就是p值檢驗。現(xiàn)在在眾多流行的統(tǒng)計計量軟件中(如sas,spss
10、,excel等),最后的結(jié)果表中都給出了p值。p值檢驗的原理:建立原假設(shè)后,在假定原假設(shè)成立的情況下,參照備選假設(shè),可以計算出檢驗統(tǒng)計量超過或者小于(還要依照分布的不同、單側(cè)檢驗、雙側(cè)檢驗的差異而定)由樣本所計算出的檢驗統(tǒng)計量的數(shù)值的概率,這便是p值;而后將此p值與事先給出的顯著性水平 進(jìn)行比較,如果p值小于,也就是說,原假設(shè)對應(yīng)的為小概率事件,根據(jù)上述的“小概率原理”,我們就可以否定原假設(shè),而接受對應(yīng)的備選假設(shè)。如果 p 值大于 ,我們不就能否定原假設(shè)。例如,對應(yīng)上面的 檢驗中,如果是雙側(cè)檢驗,根據(jù)上面的說明,可以計算 ,若 p,那么我們就可以否認(rèn)原假設(shè),反之不能否定原假設(shè)。 p值檢驗與前面
11、介紹的方法得出的結(jié)論是一致的。(三)兩類錯誤在假設(shè)檢驗中,對假設(shè)的檢驗判斷是依據(jù)樣本實際資料所計算的統(tǒng)計量的值與臨界值的比較來做出的。由于樣本的隨機性、樣本信息的分散性等原因,這種合理的“以偏概全”式的假設(shè)檢驗,總是無法讓我們百分百的肯定所做出結(jié)論的正確性。也就是說,我們有可能會做出錯誤的判斷,這種風(fēng)險是客觀存在的。例如,實際上依據(jù)真實總體情況,我們應(yīng)該接受原假設(shè)h0,但根據(jù)樣本信息,卻做出拒絕h0的錯誤結(jié)論,稱這種錯誤為“棄真”錯誤;此外,我們也可能犯這樣的錯誤:實際的總體情況是應(yīng)該拒絕原假設(shè),而我們卻接受了它,稱此為“納偽”錯誤。對于上述的兩類錯誤,我們都希望能盡量減少其發(fā)生的概率。因此需
12、要對它們的概率進(jìn)行簡要分析。在假設(shè)中,我們給出了顯著性水平(概率值),在“小概率事件是幾乎不會發(fā)生的”原理上,如果樣本資料的信息與總體信息之間的差異出現(xiàn)的概率小于等于 ,那么可以認(rèn)為在一次試驗中該事件不會發(fā)生(發(fā)生的可能性很?。瑥亩覀兙途芙^了原假設(shè)。這就是說,有的可能性發(fā)生原假設(shè)是真實的卻被拒絕的情況。所以顯著性水平就是我們犯“棄真”錯誤的可能性大小。 越小,則犯“棄真”錯誤的可能性就越小。因而,可以根據(jù)實際需要對顯著性水平加以控制,一般取 =0.05(或者=0.1 ),這就保證犯“棄真”錯誤的可能性不超過5(或者1)。如果要求更加嚴(yán)格, 可取更小的數(shù)值。通常記為犯“納偽”錯誤的可能性大小
13、。由于兩類錯誤是一對矛盾,在其他條件不變的情況下,減少犯“棄真”錯誤的可能性( ),勢必增大犯“納偽”錯誤的可能性( ),也就是說, 的大小和顯著性水平的大小成相反方向變化。兩類錯誤發(fā)生的概率 的相對關(guān)系可由下面的圖形來表示:圖7-2 兩類錯誤從圖7-2中,我們也可以看出,當(dāng)真實分布與待判別分布越遠(yuǎn)離時,在一定下,將越?。灰簿褪钦f,當(dāng)差別比較明顯時,我們犯錯誤的可能性會更小,反之亦然。假設(shè)三、檢驗功效由于為犯“納偽”錯誤的可能性大小,或者說 表示出現(xiàn)接受不真實的原假設(shè)的結(jié)論的概率,那么1- 就是指出現(xiàn)拒絕不真實的原假設(shè)的概率。若1- 的數(shù)值越接近于1,表明不真實的原假設(shè)幾乎都能夠被拒絕。誠然,
14、如果1- 的數(shù)值接近于0,表明犯“納偽”錯誤的可能性很大。因此, 1- 可以用來表明所做假設(shè)檢驗工作好壞的一個指標(biāo),我們稱之為檢驗功效。它的數(shù)值表明我們做出正確決策的概率為1- 。一個好的檢驗法則總是希望犯兩類錯誤的可能性與都很小,但是這在一般場合下是很難實現(xiàn)的。要使得小,必然導(dǎo)致大,若要使 小,必導(dǎo)致增大。在實際檢驗中,一般首先控制犯“棄真”錯誤的概率,也就是事先給出的顯著性水平的數(shù)值盡量地小,在其它條件不變的情況下,增加犯“納偽”錯誤的可能性,即增大,從而使得檢驗功效(1- )減弱。在此情況下,如何增強檢驗功效?解決的唯一辦法只有增大樣本容量,這樣既能保證滿足取得較小的 ,又能取得較小的值
15、,一舉兩得。然而實際上樣本容量的取得是有限制的,只能根據(jù)實際來確定。第二節(jié) 總體參數(shù)假設(shè)檢驗總體均值的假設(shè)檢驗兩個總體均值之差的檢驗總體成數(shù)的假設(shè)檢驗總體均值的假設(shè)檢驗兩個正態(tài)總體方差比的檢驗總體參數(shù)假設(shè)檢驗就是檢驗已知分布形式(本節(jié)主要考慮正態(tài)分布)的總體的某些參數(shù)(例如均值或者方差)是否與事先所做的假設(shè)存在顯著性差異,又稱為顯著性檢驗。主要包括對總體均值和總體方差的假設(shè)檢驗。本節(jié)分各種情況對這兩方面的檢驗進(jìn)行介紹。一、總體均值的假設(shè)檢驗總體均值的假設(shè)檢驗就是檢驗由樣本信息所推斷的當(dāng)前總體均值是否與事先假設(shè)的總體均值存在顯著性差異。設(shè)樣本x1,x2,xn來自于正態(tài)總體n(,2 ),樣本均值為
16、 ,樣本的標(biāo)準(zhǔn)差為s2 ,對于均值的檢驗問題。(一)總體方差2已知對于雙側(cè)檢驗,建立的假設(shè)為:h0:=0, h1:0其中 為一個給定已知的常數(shù)。對于左(右)單側(cè)檢驗來說,建立的假設(shè)為:h0:=0, h1:<(或>)0可以利用上面介紹過的z檢驗法,構(gòu)造檢驗統(tǒng)計量 (7.1)在原假設(shè)成立的條件下,該統(tǒng)計量的分布為:z n(0,1)。從而在給定的顯著性水平下,我們可從標(biāo)準(zhǔn)正態(tài)分布表中查得臨界值 (對應(yīng)于左、右單側(cè)檢驗的臨界值分別為- z1-和z1-)。根據(jù)樣本資料及假設(shè),計算出樣本統(tǒng)計量的值z。這樣,我們便可以得出原假設(shè)的拒絕域為: (對雙側(cè)檢驗而言)z<-z1-(對于左單側(cè)檢驗而
17、言)z>z1-(對于右單側(cè)檢驗而言)當(dāng)z值處于拒絕域中時,我們就可拒絕原假設(shè),否則不能拒絕原假設(shè)。(二)總體方差2未知總體方差2未知時對于均值的假設(shè)檢驗,類似上面方差2已知時的做法。對于雙側(cè)檢驗,建立的假設(shè)為:h0:=0, h1:0對于左(右)單側(cè)檢驗來說,建立的假設(shè)為: h0:=0, h1:<(或>)0只是在構(gòu)造檢驗統(tǒng)計量時,不是利用z檢驗法。而是在原假設(shè)成立的條件下,利用t檢驗法,構(gòu)造檢驗統(tǒng)計量t(n-1)(7.2)其中 為樣本標(biāo)準(zhǔn)差。t統(tǒng)計量就是用樣本標(biāo)準(zhǔn)差s來代替z統(tǒng)計量中未知的總體標(biāo)準(zhǔn)差。對于臨界值,在t分布表中查得臨界值 (雙側(cè)檢驗)、 -t1-(n-1) (左單
18、側(cè)檢驗)、 t1-(n-1) (右單側(cè)檢驗)。根據(jù)樣本資料及假設(shè),計算出樣本統(tǒng)計量的值t。這樣,可以得出對原假設(shè)的拒絕域為:樣本統(tǒng)計量的值t滿足(雙側(cè)檢驗)t<-t1-(n-1)(左單側(cè)檢驗)t>t1-(n-1)(右單側(cè)檢驗)當(dāng)t值落入拒絕域,就拒絕原假設(shè),否則不能拒絕原假設(shè)。這里應(yīng)該注意的是,在實際中不能夠確定總體是否滿足正態(tài)分布,但是樣本容量n很大。根據(jù)中心極限定理,該總體分布近似服從正態(tài)分布,對該總體均值的檢驗可以依據(jù)上面的總體方差未知的程序來進(jìn)行。對于小樣本情況,我們也是根據(jù)上面的t檢驗來進(jìn)行?!纠?-1】為了考察某種類型的電子元件的使用壽命情況,假定該電子元件使用壽命的分
19、布為正態(tài)分布。而且根據(jù)歷史記錄得知該分布的參數(shù)為:平均使用壽命為100(小時),標(biāo)準(zhǔn)差 =10(小時)。現(xiàn)在隨機抽取100個該類型的元件,測得平均壽命為102(小時),給定顯著性水平=0.05 ,問該類型的電子元件的使用壽命是否有明顯的提高。解:此題為單側(cè)檢驗,且是右單側(cè)檢驗。以表示元件的平均使用壽命(小時),則(1)建立假設(shè)h0:= 100,即平均使用壽命無明顯變化;h1:>100 ,即使用壽命有明顯提高。(2)確定檢驗統(tǒng)計量及其分布 n(0,1)(3)確定臨界值右單側(cè)檢驗的臨界值為z 。由于給定的顯著性水平=0.05,那么雙側(cè)概率水平為20.050.1,則f(z )=1-0.1=0.
20、9,查正態(tài)分布表得到z =1.645,即為臨界值。(4)計算樣本統(tǒng)計量并判斷根據(jù)樣本資料,計算樣本統(tǒng)計量:由于計算的樣本統(tǒng)計量z>1.645,所以拒絕原假設(shè)h0 ,可以認(rèn)為該類型的電子元件的使用壽命確實有所提高。【例7-2】在上例中,如果抽出的100個樣本元件,測得其平均使用壽命為98(小時),其余條件相同,試問該類型元件的使用壽命是否有顯著性下降。解:此例為左單側(cè)檢驗問題。(1)建立的假設(shè)檢驗為h0:=100,無明顯變化; h1:<100 ,有顯著性下降。(2)確定檢驗統(tǒng)計量及其分布在原假設(shè)成立下,檢驗統(tǒng)計量為: n(0,1)(3)確定臨界值此時左側(cè)臨界值為- z,根據(jù)上面的結(jié)果
21、,得到臨界值為-z=-1.645(4)計算樣本統(tǒng)計量并做出判斷:樣本統(tǒng)計量為:由于-z<-1.645 ,所以拒絕原假設(shè)h0 ,說明該類型元件的使用壽命有顯著性下降?!纠?-3】某糖果生產(chǎn)基地,生產(chǎn)的標(biāo)準(zhǔn)是每袋糖果的凈重為500(克)。今從一批生產(chǎn)中抽出10袋,實際測得每袋糖果的凈重(克)為:512 503 498 507 496 489 499 501 496 506給定顯著性水平=0.01,試問該批的生產(chǎn)是否正常。解:該例中,所檢驗問題是糖果凈重是否符合500克的標(biāo)準(zhǔn),屬于雙側(cè)檢驗問題。(1)建立假設(shè)h0:=500, h1: 500(2)確定臨界值由于是雙側(cè)檢驗,所以應(yīng)該有兩個臨界值:
22、上臨界值、下臨界值。又因總體的標(biāo)準(zhǔn)差未知,需要用樣本標(biāo)準(zhǔn)差s來代替,因此,統(tǒng)計量服從的是自由度=n-1的t分布,而非正態(tài)分布。此例中n=10, =0.01 ,則自由度=10-1=9 ,查t分布表得到,上臨界值t/2()=t0.005(9)=3.25,由于分布的對稱性,下臨界值為t/2()=t0.005(9)=3.25。(3)計算樣本統(tǒng)計量在計算樣本統(tǒng)計量之前需要先計算樣本均值和樣本標(biāo)準(zhǔn)差:樣本均值: (克)樣本標(biāo)準(zhǔn)差: (克)檢驗的樣本統(tǒng)計量:(4)判斷:根據(jù)樣本計算的統(tǒng)計量t=0.335-3.25,3-25,所以不能拒絕原假設(shè),也即,在99的置信度下,可以認(rèn)為該批生產(chǎn)正常?!纠?-4】承上例
23、,假定所要檢驗的是該批生產(chǎn)是否顯著地高于標(biāo)準(zhǔn)。解:這樣檢驗問題就變?yōu)閱蝹?cè)檢驗了,而且是右單側(cè)問題。(1)建立假設(shè)h0:500, h1:>500(2)確定臨界值由于是屬于單側(cè)檢驗,所以只有一個臨界值;n=10,=0.01,查表得到該臨界值為 t ()=t0.01(9)=2.821(3)計算樣本統(tǒng)計量跟上例的計算一樣,此處略,得到樣本統(tǒng)計量t=0.335 (4)判斷由于實際的樣本統(tǒng)計量t=0.335 <臨界值t0.01(9)=2.821 ,所以不能拒絕原假設(shè),可以認(rèn)為該類生產(chǎn)沒有顯著地高于標(biāo)準(zhǔn)。該結(jié)論與上例的結(jié)論相符。二、兩個總體均值之差的檢驗兩個總體均值之差的檢驗,就是對兩個不同總體
24、的均值之間的差異性是否顯著所進(jìn)行的檢驗。為了分析的簡化與方便,我們假定x是取自于均值為x 、方差為的正態(tài)總體x的一個樣本,y是取自于均值為 y 、方差為 的正態(tài)總體y的一個樣本,樣本容量分別為 ,且假定此兩樣本相互獨立。 、為對應(yīng)的樣本均值與樣本方差,顯著性水平為。下面我們分總體方差已知和未知兩種情況,來分析總體均值的差異顯著性檢驗。(一)兩總體方差 已知 雙側(cè)檢驗原假設(shè)為h0:x=y,備選假設(shè)為 h1:xy根據(jù)上面的假定和抽樣分布理論,我們可以得到: n(0,1) (7.3)所以在原假設(shè)成立下,構(gòu)造的檢驗統(tǒng)計量為: n(0,1) (7.4)在顯著性水平下,我們查標(biāo)準(zhǔn)正態(tài)分布表得到臨界值 。將
25、樣本資料代入所構(gòu)造的檢驗統(tǒng)計量,得到樣本統(tǒng)計量z。若 ,則拒絕原假設(shè);反之,則不能拒絕原假設(shè)。 左單側(cè)檢驗原假設(shè)為h0:x=y,備選假設(shè)為 h1:x<y此時可從標(biāo)準(zhǔn)正態(tài)分布表查得的臨界值為z1- 。檢驗的拒絕域為: z<-z1-。 右單側(cè)檢驗原假設(shè)為h0:x=y ,備選假設(shè)變?yōu)閔1:x<y此時的臨界值也為z1-。檢驗的拒絕域為: z>z1- 。(二)兩總體方差 未知但相等在兩方差未知但相等的情況下,我們根據(jù)抽樣分布理論知: t(n1+n2-2) (7.5)對于雙、單側(cè)檢驗,原假設(shè)都是相同的,均為h0:x=y。只是在雙側(cè)檢驗時,備選假設(shè)h1:xy ;在左單側(cè)檢驗時,備選假
26、設(shè)為h1:x<y ;在右單側(cè)檢驗時,備選假設(shè)為h1:x>y 。在原假設(shè)成立的情況下,根據(jù)上面的公式,我們可以構(gòu)造如下的檢驗統(tǒng)計量: t(n1+n2-2) (7.6)可以根據(jù)樣本資料的數(shù)據(jù),計算樣本檢驗統(tǒng)計量的數(shù)值。對于雙側(cè)檢驗,可以從t分布表中查得臨界值 ,此時原假設(shè)的拒絕域為: 。反之就不能拒絕原假設(shè)。對于左、右單側(cè)檢驗,從 分布表中查得臨界值t1-(n1+n2-2);左單側(cè)檢驗拒絕原假設(shè)的范圍是:t<- t1-(n1+n2-2)。右單側(cè)檢驗拒絕原假設(shè)的范圍為:t<- t1-(n1+n2-2)。若t在拒絕域之外,則不能拒絕原假設(shè)?!纠?-5】將某小學(xué)一年級學(xué)生隨機分為
27、兩組,對其中一組運用新型的教學(xué)方式,稱為新型組,另一組按照傳統(tǒng)的教學(xué)方式稱為傳統(tǒng)組。經(jīng)過六個月后,對該年級學(xué)生進(jìn)行成績測試。假設(shè)兩組成績的總體標(biāo)準(zhǔn)差相同。從新型組抽取31名學(xué)生,求得其平均成績?yōu)?8.06,標(biāo)準(zhǔn)差為9.36;同樣的,從傳統(tǒng)組抽取31名,求得的平均成績?yōu)?6.30,標(biāo)準(zhǔn)差為10.12。假設(shè)兩組成績的總體標(biāo)準(zhǔn)差相同。比較兩組學(xué)生的平均成績是否有顯著性差異。解:此題屬于在兩總體方差未知(但是假定兩方差相等)下,檢驗兩組均值是否有差異的問題。依題意有,(1)建立假設(shè)。h0:x=y,備選假設(shè)h1:xy ;(2)構(gòu)造檢驗統(tǒng)計量為t (n+n2-2) 其中由于相等的標(biāo)準(zhǔn)差未知,我們用來估計。
28、(3)確定臨界值。從t分布表中查得臨界值 。(4)計算樣本統(tǒng)計量及判斷。將樣本資料代入檢驗統(tǒng)計量得到 因而有 ,不能拒絕原假設(shè),即兩組的均值沒有顯著性差異。三、總體成數(shù)的假設(shè)檢驗成數(shù)是反應(yīng)現(xiàn)象數(shù)量結(jié)構(gòu)的指標(biāo)。例如就業(yè)率、升學(xué)率、產(chǎn)品合格率等等。要考察總體成數(shù)是否發(fā)生顯著性變化,可以通過樣本成數(shù)來對其進(jìn)行假設(shè)檢驗。與對總體均值的假設(shè)檢驗類似,總體成數(shù)的假設(shè)檢驗包括單樣本和多樣本(本處只考慮兩樣本情況)總體成數(shù)檢驗。(一)單樣本成數(shù)檢驗當(dāng)樣本容量比較大時,按照中心極限定理,分布以正態(tài)分布為極限。因而,對總體成數(shù)的假設(shè)檢驗可以借助正態(tài)分布來進(jìn)行。建立假設(shè): ,構(gòu)建的檢驗統(tǒng)計量為 (7.7)服從標(biāo)準(zhǔn)正
29、態(tài)分布,即 z n(0,1)其中,p代表樣本的成數(shù),代表總體的成數(shù)。, 對于顯著性水平 ,可以通過查標(biāo)準(zhǔn)正態(tài)分布表,得到臨界值 。從樣本數(shù)據(jù)中計算得出 樣本成數(shù)p代入檢驗統(tǒng)計量,得到樣本統(tǒng)計量 z。將樣本統(tǒng)計量與臨界值進(jìn)行比較,若 ,則拒絕原假設(shè);反之則不能拒絕原假設(shè)。當(dāng)然,如果對應(yīng)的原假設(shè)是單邊的,即h0: (或)0,則對應(yīng)的臨界值是z1-。若 ,則拒絕原假設(shè);反之,則不能拒絕原假設(shè)。我們以例子來說明單樣本成數(shù)檢驗的過程。【例7-6】某牌子的冰箱生產(chǎn)商聲明,其產(chǎn)品在該地區(qū)的市場占有率為60。為了檢驗該說法的正確與否,我們在該地區(qū)隨機調(diào)查了100名購買了冰箱的消費者,其中有57人購買的是該牌子
30、的冰箱,試問該生產(chǎn)商的聲明是否可靠?(=0.05)解:經(jīng)分析,本例屬于雙側(cè)檢驗。樣本市場占有率 (1)建立假設(shè): h0:=60%, h1:60%(2)檢驗統(tǒng)計量: n(0,1)(3)計算臨界值:在5的顯著性水平下,從標(biāo)準(zhǔn)正態(tài)分布表中可以查得臨界值為: (4)計算樣本統(tǒng)計量及判斷: 樣本統(tǒng)計量 ,因而,我們不能拒絕原假設(shè),即生產(chǎn)商的聲明是可靠的。(二)兩個樣本總體成數(shù)差的檢驗如果要考察兩個總體的成數(shù)之間是否有顯著性差異,可以用兩樣本總體成數(shù)差檢驗。假定對應(yīng)兩總體的樣本容量分別為n1、n2,當(dāng) n1、n2都比較大時,我們可以構(gòu)造如下的檢驗統(tǒng)計量,該檢驗統(tǒng)計量服從標(biāo)準(zhǔn)正態(tài)分布。 n(0,1) (7.
31、8)若建立的原假設(shè)為 h0:1=2,相應(yīng)的臨界值為 ;若建立的原假設(shè)為h0:1(或)2,則相應(yīng)的臨界值為z1- 。能否拒絕原假設(shè)的判斷規(guī)則如前面所述?!纠?-7】考察專業(yè)股票分析師和普通股民對整個股票市場走勢的判斷是否存在顯著性差異。在100名的專業(yè)股票分析師中,有55的人認(rèn)為股票市場將上升,在150名普通股民中,有48的持相同觀點。試問,專業(yè)分析師和普通股民的觀點是否存在顯著性差異( =0.05)。解:根據(jù)題設(shè),已知 。建立原假設(shè) ,備選假設(shè) 根據(jù)樣本資料計算檢驗統(tǒng)計量的值從標(biāo)準(zhǔn)正態(tài)分布表查出=0.05時的臨界值為 。因為 ,所以不能拒絕原假設(shè)。四、正態(tài)總體方差的假設(shè)檢驗方差是反映現(xiàn)象在數(shù)量
32、上變異程度的指標(biāo),反映變化的均衡程度。對于正態(tài)總體方差的檢驗主要有兩種:一是檢驗總體方差是否顯著等于某一給定的確定值;二是檢驗總體方差是否顯著性地在某個給定的范圍內(nèi)。在參數(shù)估計中,我們已經(jīng)知道,可以用樣本方差 是總體方差 2的無偏估計。樣本方差計算公式中的( n-1)為自由度,說明樣本中有(n-1)個樣本單位的取值是可以獨立確定的,這是由于分子中 的約束使得獨立的樣本單位少了一個。所建立的原假設(shè)為 ,備選假設(shè)為 檢驗統(tǒng)計量為: (7.9)或者是 (7.10)在原假設(shè)成立的條件下,該統(tǒng)計量服從自由度為n-1 的 分布,即 (7.11)2 分布曲線全部處于第一象限,其中唯一參數(shù)是自由度。當(dāng)自由度大
33、于30時,分布曲線接近于正態(tài)分布。圖7-3為 2 分布曲線的演示圖。圖7-3 2分布圖如圖中所示,有 。根據(jù)顯著性水平和自由度n-1,查 2分布表可以得到臨界值 。若檢驗統(tǒng)計量 ,則拒絕原假設(shè);反之不能拒絕原假設(shè)。【例7-8】已知生產(chǎn)某型號的螺釘廠,在正常條件下,其螺釘長度服從正態(tài)分布 n(4.0,0.04) (單位為厘米)?,F(xiàn)在我們對某日生產(chǎn)的螺釘隨機抽取6個,測得其長度為4.1,3.6,3.8,4.2,4.1,3.9,試問該日生產(chǎn)的螺釘總體標(biāo)準(zhǔn)差是否正常? (=0.05)解:可以計算出樣本標(biāo)準(zhǔn)差 ,該假設(shè)檢驗的過程如下:(1)建立假設(shè): , ;(2)檢驗統(tǒng)計量: ;(3)臨界值:從 2分布
34、表可得到臨界值 ;(4)計算樣本統(tǒng)計量及其判斷。 所以,不能拒絕原假設(shè),可以認(rèn)為該日生產(chǎn)的螺釘總體標(biāo)準(zhǔn)差正常。五、兩個正態(tài)總體方差比的檢驗假定有兩個樣本,分別為 , ,兩樣本容量分別為 n1 和n2,且相互獨立。其中 分別為兩正態(tài)分布總體的均值和方差。又 分別為兩樣本方差,下面分兩情況對方差比 進(jìn)行檢驗。 (一)兩總體均值 x 、y已知在兩總體均值已知的情況下,我們用樣本方差去估計兩總體的方差 。此時樣本方差的計算式子如下: 和 式中,兩個樣本方差的分母(自由度)都為各自的樣本容量。根據(jù)抽樣分布理論知: , ,且統(tǒng)計量 (7.12)即統(tǒng)計量 f服從f 分布。 建立假設(shè): 。對于雙側(cè)檢驗, 。在
35、原假設(shè)成立下,檢驗統(tǒng)計量為: (7.13)根據(jù)顯著性水平 和自由度,查 f分布表可以得到兩個臨界值:。若樣本統(tǒng)計量 f滿足: ,那么就可在 概率水平下拒絕原假設(shè)。反之,如果計算的樣本統(tǒng)計量值在區(qū)域 之中,那么我們就不能拒絕原假設(shè)。對于左單側(cè)檢驗,建立的備選假設(shè)為 ,據(jù)以判斷的臨界值為 ,拒絕域為樣本統(tǒng)計量 。對于右單側(cè)檢驗,建立的備選假設(shè)為 ,據(jù)以判斷的臨界值為 ,拒絕域為樣本統(tǒng)計量 。(二)兩樣本均值 x 、y未知在兩總體均值未知下,我們用如下計算式子的樣本方差去估計兩總體的方差 : 和 式中, , 分別為兩樣本平均值,兩個樣本方差的分母(自由度)都為各自的樣本容量減去1。由于 , ,有統(tǒng)計
36、量 (7.14)從而可將其作為檢驗統(tǒng)計量。 建立的原假設(shè)為 ,在原假設(shè)成立的情況下,檢驗統(tǒng)計量 (7.15)對于雙側(cè)檢驗,備選假設(shè)為 ,當(dāng)樣本統(tǒng)計量 或 時,拒絕原假設(shè);反之則不能拒絕原假設(shè)。 對于左單側(cè)檢驗,備選假設(shè)為 ,據(jù)以判斷的臨界值為 ,拒絕域為樣本統(tǒng)計量 。對于右單側(cè)檢驗,備選假設(shè)為 ,據(jù)以判斷的臨界值為 ,拒絕域為樣本統(tǒng)計量 。 【例7-9】為了比較兩個地區(qū)(甲、乙)居民人均月收入不平均的差異,分別在兩個地區(qū)調(diào)查8戶和7戶的人均月收入為(假設(shè)收入都服從正態(tài)分布):試問甲區(qū)的人均月收入的不均衡性是否不大于乙區(qū)的。 解:人均月收入的不均衡性可以用方差(或者是標(biāo)準(zhǔn)差)來表征,因而問題就轉(zhuǎn)
37、化為檢驗兩地區(qū)人均月收入方差(標(biāo)準(zhǔn)差)的差異性。從調(diào)查的樣本資料中,我們可以得到 , , ,(1)建立假設(shè): , (2)檢驗統(tǒng)計量: (3)臨界值:從 分布表中查得臨界值為 (4)樣本統(tǒng)計量的計算及判斷:所以不能拒絕原假設(shè),即不能認(rèn)為甲區(qū)的人均月收入波動較小。第三節(jié) 非參數(shù)檢驗非參數(shù)檢驗概述 2檢驗符號檢驗等級相關(guān)秩和檢驗游程檢驗 等級相關(guān)一、非參數(shù)檢驗概述前面介紹的各種假設(shè)檢驗都是在總體分布形式已知或者假定總體分布的前提下做出判斷。但在實際問題中,可能無法獲知或者不一定很了解總體的分布類型,而只能通過樣本來檢驗關(guān)于總體分布的假設(shè)。這種檢驗方法稱為非參數(shù)檢驗。非參數(shù)檢驗是相對于參數(shù)檢驗而言的,
38、是檢驗總體分布函數(shù)的統(tǒng)計方法。兩種檢驗方法具有共同點:都對總體的某種數(shù)量關(guān)系、特征做出假設(shè),都建立原假設(shè)和備選假設(shè),都是根據(jù)實際樣本統(tǒng)計量與臨界值的比較做出對假設(shè)的判斷。其區(qū)別在于:參數(shù)檢驗需要對總體分布做某些限制性的假定,該假定要求總體的分布類型是已知的,未知的只有分布中的某些參數(shù)是否發(fā)生變動,而且大多檢驗是建立在高斯等人的正態(tài)分布理論上。如果對總體的分布不了解或者了解很少,那么參數(shù)檢驗的結(jié)果會更加不可靠,甚至?xí)l(fā)生很大偏差。而非參數(shù)檢驗卻不依賴于對總體分布或參數(shù)的知識,不對總體分布加以限制性的假定,亦稱為自由分布檢驗。由此可見,非參數(shù)檢驗與傳統(tǒng)的參數(shù)檢驗比較有一些優(yōu)缺點:對檢驗的限制更少,
39、更加避免先見偏差,具有較好的穩(wěn)健性;可以在更少樣本資料要求的情況下進(jìn)行,在一定程度上彌補有些實際中樣本資料不足等的缺陷;可以彌補上述參數(shù)檢驗中碰到的無法運用的屬性資料問題,然而,同時也就可能損失了其中所包含的另外信息。二、 2檢驗2 檢驗是利用 2 分布的原理,通過對樣本數(shù)據(jù)進(jìn)行分析來對樣本所屬的總體情況進(jìn)行判斷的一種檢驗方法。在第一節(jié)中,我們也用過 2 檢驗,不過是在了解總體的分布類型的情況下來應(yīng)用的。本小節(jié)中將介紹 2 檢驗在非參數(shù)檢驗中的應(yīng)用,包括分布擬合檢驗和獨立性檢驗。(一)分布擬合檢驗在實際中,往往并非總是知道所研究總體的分布狀況,但卻可以得到取自于該總體的樣本。那么,就期望根據(jù)來
40、自于該總體的樣本資料信息去推斷、檢驗總體分布是否與指定分布吻合。該檢驗的假設(shè)為 , 其中 f(x)為總體的分布函數(shù), f0(x)是某個事先假定的總體分布函數(shù)。2檢驗的步驟為:(1)建立假設(shè): , 。(2)將樣本資料數(shù)據(jù)值按區(qū)間進(jìn)行適當(dāng)?shù)膭澐郑悍譃?m個區(qū)間,各個區(qū)間的分界值為 xi,其中 ,同時應(yīng)保證各個區(qū)間互不相容。(3)計算在各個樣本區(qū)間內(nèi)的實際頻數(shù) ( ),也即為樣本數(shù)值落在各個區(qū)間的樣本個數(shù)。當(dāng)原假設(shè) h0為真時,計算落在各個區(qū)間的理論概率值: ,從而計算出各個區(qū)間的理論頻率數(shù)為 npi。其中 n為樣本容量。(4)調(diào)整區(qū)間:由于該檢驗要求樣本容量 n足夠大,以及 npi不能太小。根據(jù)經(jīng)
41、驗,一般要求 n50,npi>5 。如果npi5,則將npi5的樣本合并。(5)構(gòu)造并計算統(tǒng)計量:當(dāng)原假設(shè)為真時,樣本實際頻數(shù)fi應(yīng)該與理論頻數(shù)npi接近,即 不應(yīng)太大。根據(jù)k皮爾遜的研究,可以構(gòu)造如下的檢驗統(tǒng)計量 (7.12)其中 k為待估計的參數(shù)個數(shù)。其余符號含義與上述同。(6)計算臨界值:在給定顯著性水平 下,查2 分布表得到臨界值 。這樣就得到拒絕原假設(shè)的值域: (7)進(jìn)行判斷:如果計算的樣本統(tǒng)計量2 確實大于 ,那么就可以拒絕原假設(shè),否則不能拒絕原假設(shè)?!纠?-10】欲檢驗?zāi)硞€骰子是否均勻,可以通過檢驗各個點數(shù)的出現(xiàn)是否是隨機的。我們隨機投出骰子102次,將得到的點數(shù)記錄下來;
42、出現(xiàn)各個點數(shù)的次數(shù)見表7-3。解:記各個點數(shù)出現(xiàn)的次數(shù)為x ,其分布未知,依據(jù)題意我們可以對其分布建立假設(shè),即h0:x服從均勻分布,也即 x的分布滿足 , ; h1:x不服從均勻分布。在原假設(shè)下,各個點數(shù)出現(xiàn)的期望頻數(shù)均為 (次)。根據(jù)(7.16)式可以得到:查表得到臨界值為 , 因而,我們不能拒絕原假設(shè),可以認(rèn)為該骰子是均勻的。(二)獨立性檢驗顧名思義,該檢驗主要是考察多個變量之間是否有關(guān)聯(lián),如果變量之間沒有關(guān)聯(lián)性,那么就說變量之間是相互獨立的。這里的變量主要是指定類、定序資料。為了分析變量之間的關(guān)聯(lián)性,需要將資料整理成列聯(lián)表的形式。列聯(lián)表是多行多列縱橫交錯所形成的一個表體。我們以例子說明列聯(lián)表的形式以及如何將獨立性檢驗化為列聯(lián)表并進(jìn)行檢驗分析的程序?!纠?-11】抽樣調(diào)查某地區(qū)500名待業(yè)人員,這些人員中文化程度為高中及以上的有104人(男44人),初中的有96人(男36人),小學(xué)及以下的有300人(男140人)。問此調(diào)查結(jié)果能否說明待業(yè)人員中的文化程度與性別是相互獨立的。解:根據(jù)調(diào)查結(jié)果,我們可將數(shù)據(jù)整理成列聯(lián)表,見表7-4。列聯(lián)表中,括號內(nèi)的數(shù)值為該處的期望值,其計算方法為:該格
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 濰坊學(xué)院《Hadoop綜合實訓(xùn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 智慧城市安全網(wǎng)的國際比較與啟示
- 學(xué)習(xí)動力與團(tuán)隊協(xié)作能力的關(guān)系探討
- 湖南工業(yè)職業(yè)技術(shù)學(xué)院《琴法2》2023-2024學(xué)年第二學(xué)期期末試卷
- 南京郵電大學(xué)通達(dá)學(xué)院《風(fēng)力發(fā)電原理》2023-2024學(xué)年第二學(xué)期期末試卷
- 青島科技大學(xué)《體育俱樂部管理與營銷》2023-2024學(xué)年第二學(xué)期期末試卷
- 寧波大學(xué)《統(tǒng)計機器學(xué)習(xí)及應(yīng)用實踐》2023-2024學(xué)年第二學(xué)期期末試卷
- 江西建設(shè)職業(yè)技術(shù)學(xué)院《水工材料試驗設(shè)計》2023-2024學(xué)年第二學(xué)期期末試卷
- 教育與金融的完美結(jié)合兒童財商啟蒙計劃的新篇章
- 宣城職業(yè)技術(shù)學(xué)院《中醫(yī)筋傷學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 【博物館文創(chuàng)營銷方案2600字】
- 參加科級干部培訓(xùn)班心得體會
- 2023年鍍層和化學(xué)覆蓋層技術(shù)要求規(guī)范(鋁合金化學(xué)導(dǎo)電氧化)
- 分體空調(diào)施工方案及分體空調(diào)施工組織設(shè)計
- 隧道微臺階開挖施工工法實用文檔
- 朝代歌幼兒園教案
- TCL股份有限公司股份組織架構(gòu)
- 管 制 刀 具課件
- 文學(xué)翻譯及實例
- 生物多樣性保護(hù)與建設(shè)項目可行性研究報告
- 健康減肥調(diào)脂降糖
評論
0/150
提交評論