《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)_第1頁
《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)_第2頁
《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)_第3頁
《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)_第4頁
《統(tǒng)計(jì)學(xué)》第3章參數(shù)估計(jì)_第5頁
已閱讀5頁,還剩143頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1第第5章章 參數(shù)估計(jì)參數(shù)估計(jì)3. 1 參數(shù)估計(jì)概述參數(shù)估計(jì)概述 參數(shù)估計(jì)是統(tǒng)計(jì)推斷的基本方法之一。我們把刻劃總體X的某些特征的常數(shù)稱為參數(shù),最常用的參數(shù)是總體X的數(shù)學(xué)期望和方差。假如總體XN( ),則X的分布是由參數(shù)和2確定的,其中,=E(X),2 =D(X)。 2 , 在實(shí)際問題中,總體X的參數(shù)是未知的,例如紗廠細(xì)紗機(jī)上的斷頭次數(shù)XP(),如果求每只紗綻在某一時(shí)間間隔內(nèi)斷頭的次數(shù)為K的概率,就需要先確定參數(shù),才能求出所求的概率。又如,燈泡廠生產(chǎn)的燈泡,由經(jīng)驗(yàn)知其壽命XN( ),但是由于生產(chǎn)過程中各種隨機(jī)因素的影響,生產(chǎn)出來的燈泡的壽命是不一致的,為了保證燈泡的質(zhì)量,必須進(jìn)行抽樣檢查,根據(jù)樣

2、本所提供的信息,對(duì)總體X的分布做出估計(jì),也即對(duì)參數(shù),2做出估計(jì)。這類問題稱為參數(shù)估計(jì)問題。 2 , 參數(shù)估計(jì)問題,就是要從樣本出發(fā)構(gòu)造一些統(tǒng)計(jì)量作為總體某些參數(shù)的估計(jì)量,當(dāng)取得一個(gè)樣本值時(shí),就以相應(yīng)的統(tǒng)計(jì)量的值作為總體參數(shù)的估計(jì)值。例如,常以統(tǒng)計(jì)量 作為總體數(shù)學(xué)期望的估計(jì)量。當(dāng)要估計(jì)某批燈泡的平均壽命時(shí),就從該批燈泡中隨機(jī)地抽取若干個(gè),分別測出其壽命,以這些測量數(shù)據(jù)的平均值作為該批燈泡的平均壽命的估計(jì)值。 X 設(shè)總體X的分布函數(shù)的類型已知,但是其中有一個(gè)或多個(gè)參數(shù)未知,設(shè)X1,X2,X3,Xn為總體X的容量為n的樣本。參數(shù)估計(jì)就是討論如何由樣本X1,X2,X3,Xn提供的信息對(duì)未知參數(shù)作出估計(jì)

3、,以及討論如何建立一些準(zhǔn)則對(duì)所作出的估計(jì)進(jìn)行評(píng)價(jià) 。 一般是建立適當(dāng)?shù)慕y(tǒng)計(jì)量 (X1,X2,X3,Xn),當(dāng)樣本觀察值為x1,x2,x3,xn時(shí),如果以 (x1,x2,x3,xn)作為總體分布中未知參數(shù)的估計(jì)值,這樣的估計(jì)方法叫做點(diǎn)估計(jì),如果總體分布函數(shù)中有t個(gè)未知參數(shù),則要建立t個(gè)估計(jì)量作為t個(gè)未知參數(shù)的估計(jì)量。 參數(shù)估計(jì)的形式分為兩類:點(diǎn)估計(jì)和區(qū)間估計(jì)。由估計(jì)量的觀察值作為未知參數(shù)的估計(jì)值,這種作法稱為點(diǎn)估計(jì)或定值估計(jì)。而有時(shí)并不要求對(duì)參數(shù)作定值估計(jì),只要求估計(jì)出未知參數(shù)的一個(gè)所在范圍,并指出參數(shù)被包含在該范圍的概率,這種方法稱為區(qū)間估計(jì),進(jìn)行參數(shù)估計(jì)并不一定要預(yù)先知道總體的分布類型。有時(shí)

4、,雖然未知總體的分布類型,但仍可對(duì)總體的某些數(shù)字特征作出估計(jì)。 3. 2 參數(shù)的點(diǎn)估計(jì) 點(diǎn)估計(jì)方法很多,本節(jié)介紹最常見的矩估計(jì)法和極大似然法。一、矩估計(jì)法 由大數(shù)定律可知,樣本分布函數(shù)依概率收斂于總體分布函數(shù),樣本均值依概率收斂于總體均值,我們自然會(huì)想到,是否能用有關(guān)的樣本矩來估計(jì)總體分布的相應(yīng)矩呢?統(tǒng)計(jì)實(shí)踐表明,這個(gè)方法是可取的,這種用樣本矩來估計(jì)總體分布參數(shù)的方法稱為矩估計(jì)法,通常,用樣本 均值來估計(jì)總體的均值,用樣本方差S2來估計(jì)總體的方差。 X【例3.1】試用矩估計(jì)法對(duì)總體 XN( )的參數(shù),2作出估計(jì)。 2 ,解: 因E(X)=,D(X)=2設(shè)X1,X2,Xn為X的一個(gè)樣本,其 樣本

5、均值為,樣本方差為S2。 令E(X)= ,D(X)=S2,即得的估計(jì)量為 , 。 X22SX【例5.2】設(shè)X1,X2,Xn是取自總 體X的樣本,已知X的概率密度為: 其他 ,010 ,),(1XXXf) 1(試用矩估計(jì)法估計(jì)總體參數(shù) 。解: 由于 樣本均值為 ,令E(X)= ,得: , 從而總體 參數(shù)的矩估計(jì)為 ,其 中 。 1),()(dxXxfXEX 1XX1niiXnX11XX【例5.3】X1,X2,Xn為總體XB(N,P)的樣本,其中N,P為未知參數(shù),試用矩估計(jì)法估計(jì)參數(shù)N及P。 解: E(X)=NP D(X)=NP(1-P) 樣本均值與方差分別為 ,S2。 令 E(X)= D(X)=

6、S2 XX即 解得N、P的矩估計(jì)量為 ,其 中 , 。 2)1(SPNPXNPXSPSXXN2221niiXnX11niiXXnS122)(11二、極大似然估計(jì)法 先考察兩個(gè)簡單的例子。 【例3.4】某同學(xué)與一位男獵人一起外出打獵,只見一只野雞在前方竄過,只聽一聲槍響,野雞被他們兩人中某一位一槍命中,試推測這一發(fā)命中的子彈是誰打的,答案是簡單的,既然只發(fā)一槍且命中,而男獵人的命中的概率一般大于這位同學(xué)命中的概率,因此可以認(rèn)為這一槍是男獵人射中的。 【例3.5】假定在一個(gè)箱子里放著黑、白兩種球共4只,且知道這兩種球的數(shù)目之比為13,但不知道究竟哪一種顏色的球多。 設(shè)黑球所占的比例為P,由上述假定

7、推知P僅可能取1/4和3/4這兩個(gè)值,現(xiàn)在采用有放回抽樣的方法,從箱子中隨機(jī)地抽取三個(gè)球,觀察到球的顏色為黑、白、黑,你會(huì)對(duì)箱子中的黑球數(shù)作出什么推斷呢?即你認(rèn)為P的值是1/4,還是3/4? 直觀上覺得P=3/4(即箱子中黑球數(shù)為3)更可信,因?yàn)楫?dāng)P=1/4時(shí)抽到這樣一個(gè)具體樣本的概率為1/41/4 3/43/4 1/4=3/641/4=3/64,當(dāng)P=3/4時(shí),抽到這樣一個(gè)具體樣本的概率為3/43/4 1/41/4 3/4=9/643/4=9/64,由于9/643/649/643/64,因此在觀察到上述樣本中的三個(gè)球的顏色之后,覺得P=3/4更可信,即你傾向于認(rèn)為箱子中放有三個(gè)黑球,這里體現(xiàn)

8、了極大似然法的基本思想。 現(xiàn)在我們來闡明極大似然法的基本原理。 設(shè)總體X的概率密度為 ,它只含一個(gè)未知參數(shù) (若X是離散型 ,表示概率 ),X1,X2,X3,Xn是取自X的樣本,x1, x2, x3, ,xn為樣本觀察值。X1,X2,X3,,Xn的聯(lián)合密度等于 ,顯然,對(duì)于樣本的 一組觀察值x1, x2, x3, ,xn,),(xf),(xfxXPniixf1),(它是 的函數(shù),記作 并稱為似然函數(shù) ),()(321nxxxxLLLniixf1),( 當(dāng) 已知時(shí),似然函數(shù)描述了樣本取得樣本觀察值x1, x2, x3,xn的可能性。同樣,當(dāng)一組樣本觀察值取定時(shí)(即抽樣完成時(shí)),要問它最大可能取自

9、什么樣的總體(即總體的參數(shù) 應(yīng)等于什么時(shí)的可能性最大),也要從似然函數(shù) 的極大化中求出相應(yīng)的 值來,這個(gè)值就是 的一個(gè)估計(jì)值。于是,我們可以給出極大似然估計(jì)的定義。 )(LL 定義3. 1 設(shè)總體的概率密度為 ,其中 是未知參數(shù),x1,x2,xn為X的一組樣本觀察值。若能求得觀察值的某個(gè)函數(shù) ,使得似然函數(shù)取極大值,即 ,則稱 為 的一個(gè)極大似然估計(jì)值,其相應(yīng)的統(tǒng)計(jì)量 ,稱為參數(shù) 的極大似然估計(jì)量。 ),(xf),(321nxxxx),(max),(2121nnxxxLxxxL),(21nxxx 由定義3.1可知,求總體參數(shù) 的極大似然估計(jì)值 的問題,就是求似然函數(shù) L( )的極大值問題。在L

10、( )可微時(shí),要使L( )取極大值 必須滿足(3.1)從上式可解得 的極大似然估計(jì)值。 0ddL 由于lnL( )與L( )有相同的極值點(diǎn),而且,求lnL( )的極值點(diǎn)更為容易,所以常用下式 (3. 2)來代替(3.1)式。方程(3.1)或(3.2)都稱為似然方程。 0)(lnLdd當(dāng)似然函數(shù)包含多個(gè)參數(shù)時(shí),即: ),(21nLLninixf121),( 若L關(guān)于各參數(shù)的偏導(dǎo)數(shù)存在,則 j的極大似然估計(jì) 一般可由方程組: 或 解得。上面方程組稱 為似然方程組。 ),(21njjxxx), 2 , 1(0),(21njLnj0),(ln21njL注意 上面的討論中,我們沒有提到似函數(shù) 取極大值的

11、充分條件,對(duì)于具體的函數(shù)可作驗(yàn)證。 )(L 【例3.6】設(shè)總體X服從參數(shù)為 的泊松分布,求參數(shù) 的極大似然估計(jì)量。 解 設(shè)X1,X2,X3,Xn是來自X的樣本, 則 niixnnniixXeXeLi11) !(!)( niiXxnnL1) !(lnln)(ln 令 的極大似然估計(jì)量為 。 其中 為樣本均值。 0)(lnXnnLXX【例3.7】設(shè)總體XN ,其中 及 是未知參數(shù),如果取得樣本觀測值為x1, x2, ,xn,求參數(shù) 及 的極大似然估計(jì)值。 ),(2解: 似然函數(shù)為: nixieL12)(2221niixne122)(2121niixnnL122)(21ln2ln2ln 對(duì) 及 求偏

12、導(dǎo)數(shù),并讓它們等于零,得: niiniinxLxL123120)(1ln0)(1ln解此方程組,即得 及 的極大似然估計(jì)值為: xxnnii11Sxxnnii12)(1 【例3.8】設(shè)總體X服從均勻分布 ,求參數(shù) 與 的極大似然估計(jì)量 ,21U12解 設(shè)X1,X2,Xn是X的樣本,則 其它 , 0, 2 , 1,)(1),(211221nixLin)ln(),(ln1221 nL從而有 0),(ln12121nL0),ln(12221n顯然由此方程組解不出1與2,現(xiàn)利用定義求1與2的極大似然估計(jì)量,因?yàn)椋?其它 , 0,)(1),(22111221nnxxxL其它 , 0,)(12)()2()

13、1(112nnxxx又 ,即 的極大似然估計(jì)量分別為 。nnnxx)(1)(1) 1 ()(12),(),()() 1 (21nxxLL21,)() 1 (,nxx在對(duì)總體參數(shù)做出估計(jì)時(shí)并非所有的估計(jì)量都是優(yōu)良的,從而產(chǎn)生了評(píng)價(jià)估計(jì)量是否優(yōu)良的標(biāo)準(zhǔn)。對(duì)于點(diǎn)估計(jì)量來說,一個(gè)好的估計(jì)量有如下三個(gè)標(biāo)準(zhǔn): 1無偏性 如果樣本統(tǒng)計(jì)量的期望值等于該統(tǒng)計(jì)量所估計(jì)的總體參數(shù),則這個(gè)估計(jì)量叫做無偏估計(jì)量。這是一個(gè)好的估計(jì)量的一個(gè)重要條件。用樣本平均數(shù)作為總體平均數(shù)的點(diǎn)估計(jì)量,就符合這一要求。無偏性也就是沒有系統(tǒng)的偏差,它是從平均意義講的,即如果這種估計(jì)方法重復(fù)進(jìn)行,則從估計(jì)量所獲得的平均數(shù)等于總體參數(shù)。顯然,如

14、果說一個(gè)估計(jì)量是無偏的,并不是保證用于單獨(dú)一次估計(jì)中沒有隨機(jī)性誤差,只是沒有系統(tǒng)性的偏差而已。若以代表被估計(jì)的總體參數(shù),代表的無偏估計(jì)量,則用數(shù)學(xué)式表示為: )(E 我們知道,總體參數(shù)中最重要的一個(gè)參數(shù)是總體平均數(shù) ,樣本平均數(shù) 是它的一個(gè)無偏估計(jì)量,即 。另外,樣本方差也是總體方差的無偏估計(jì)量。 X)(XE2一致性 當(dāng)樣本容量n增大時(shí),如果估計(jì)量越來越 接近總體參數(shù)的真值時(shí),就稱這個(gè)估計(jì)量為一致估計(jì)量。估計(jì)量的一致性是從極限意義上講的,它適用于大樣本的情況。如果一個(gè)估計(jì)量是一致估計(jì)量,那么,采用大樣本就更加可靠。當(dāng)然,在樣本容量n增大時(shí),估計(jì)量的一致性會(huì)增強(qiáng),但調(diào)查所需的人力、物力也相應(yīng)增加

15、。 3有效性 有效性的概念是指估計(jì)量的離散程度。如果兩個(gè)估計(jì)量都是無偏的,其中方差較小的(對(duì)給定的樣本容量而言)就可認(rèn)為相對(duì)來說是更有效的。嚴(yán)格地說,如果 和 是 的兩個(gè)無偏估計(jì)量,它們的相對(duì)有效性按下述比率決定:其中, 是較小的方差。 12212212以上這三個(gè)標(biāo)準(zhǔn)并不是孤立的,而應(yīng)該聯(lián)系起來看。如果一個(gè)估計(jì)量滿足這三個(gè)標(biāo)準(zhǔn),這個(gè)估計(jì)量就是一個(gè)好的估計(jì)量。數(shù)理統(tǒng)計(jì)已證明,用樣本平均數(shù)來估計(jì)總體平均數(shù)和用樣本比率來估計(jì)總體比率時(shí),它們是無偏的,一致的和有效的。3. 3 參數(shù)的區(qū)間估計(jì)參數(shù)的區(qū)間估計(jì)一、區(qū)間估計(jì)的概念 對(duì)未知參數(shù)來說,我們除了關(guān)心它的點(diǎn)估計(jì)外,往往還希望估計(jì)出它的一個(gè)范圍,以及這

16、個(gè)范圍覆蓋參數(shù)真值的可靠程度,這種范圍通常用區(qū)間的形式給出,這種區(qū)間就叫參數(shù)的置信區(qū)間。 定義3. 2 設(shè)總體分布含有一個(gè)未知參數(shù), 若由樣本確定的兩個(gè)統(tǒng)計(jì)量(X1,X2,X3,Xn)與 (X1,X2,X3,Xn),對(duì)于給定數(shù)值 ,滿足 (3. 3) )10(1),(),(2121nnXXXXXXP 則稱隨機(jī)區(qū)間 為的一個(gè) 雙側(cè)置信區(qū)間, 稱為雙側(cè)置信下(上)限,1- 稱為置信水平或置信度。 ),()%1(100)((3.3)式表示置信區(qū)間 包含未知參數(shù) 真值的概率是1- ,若反復(fù)抽樣多次(每次樣本容量相等),每組樣本觀察值確定一個(gè)區(qū)間 ,每個(gè)這樣的區(qū)間或者包含 的真值,或者不包含 的真值,按

17、貝努利定理,在所有這些區(qū)間中,包含 真值的約占 ,不包含真值的僅占 左右。 ),(),()%1 (100%100 當(dāng) 和 時(shí), 稱為置信區(qū)間觀察值,也稱為置信區(qū)間。 ),(321nxxxx),(321nxxxx),( 在有些問題中,我們關(guān)心的是未知參數(shù)至少有多大(如設(shè)備元件使用的壽命),或不超過多大(如產(chǎn)品的次品率),因此下面給出單側(cè)置信區(qū)間的概念。 定義3.4 在定義3.3中,如果將(3.3)式改成 1),(1),(2121nnXXXPXXXP 則稱 或 為單側(cè)置信區(qū)間, 和 分別稱為單側(cè)置信下限與單側(cè)置信上限。 ),(21nxxx),(,(21nxxx 評(píng)價(jià)一個(gè)置信區(qū)間的好與壞有兩個(gè)標(biāo)準(zhǔn),

18、一是精度,即 越小精度越高,也就越好。另一個(gè)是置信度,即 越大越好。我們當(dāng)然希望 盡可能地小,同時(shí)希望 盡可能地大,但是當(dāng)樣本容量n固定時(shí),精度與置信度不可能同時(shí)提高。 PP 因?yàn)楫?dāng)精度提高時(shí)即 變小時(shí),( )覆蓋真值 的可能性也變小,從而降低了置信度,相反,當(dāng)置信度增大時(shí), 必然也增大,從而降低了精度,在實(shí)際問題中,一般是根據(jù)實(shí)際問題的需要,先選定置信度為1- ,然后再通過增加樣本容量n提高精度。 (1)構(gòu)造一個(gè)隨機(jī)變量g()(含待估計(jì)的未知參數(shù),分布已知); (2)給定置信水平 ,使 ; ) 10(11)(bgaP (3)從不等式 中解出 即 得的 置信區(qū)間 ; (4)將xi代替 中的xi

19、, 即得觀察區(qū)間。 bga)(21:1),(21),(21 假設(shè)總體XN( ),構(gòu)造 與 的置信區(qū)間有重要的實(shí)用意義,而且有關(guān)結(jié)果是完滿的。 2,2一、均值的置信區(qū)間 從總體X中取樣本(X1,X2,Xn),設(shè)樣本值為(x1, x2, x3, ,xn) 由于 niinNXnX12),(1隨機(jī)變量很明顯,統(tǒng)計(jì)量Z的分布函數(shù)不依賴于未知參數(shù)。 ) 1 , 0 (/NnXZ 設(shè)已給定對(duì)的區(qū)間估計(jì)置信度為1- 令 為Z的雙側(cè) 點(diǎn)) 解不等式(關(guān)于 ): 得 12/2/ZZZP2/(Z2/2/ZZZnZXnZX2/2/ 從而所求的100(1- )%置信區(qū)間為 將樣本平均值 取其觀察值 ,則 100(1-

20、)%的置信區(qū)間為 ),(2/2/nZXnZXXniixnx11)(2/nZx【例3.9】某廠質(zhì)量管理部門的負(fù)責(zé)人希望估計(jì)移交給接受部門的5500包原材料的平均重量,一個(gè)由250包原材料組成的隨機(jī)樣本所給出的平均值 =65千克。總體標(biāo)準(zhǔn)差 =15千克。試構(gòu)造總體未知的平均值的置信區(qū)間,假定95%的置信區(qū)間已能令人滿意,并假定總體為正態(tài)分布 x解:(1)樣本平均值=65千克 (2)由1- =0.95, /2=0.025,查標(biāo)準(zhǔn)正態(tài)分布表得 (3)寫出置信區(qū)間= = = (63. 14, 66. 86)96. 1025. 02/ ZZ)(2/nZx)2501596. 165(于是,我們有95%的把握

21、說總體平均值介于63.14和66.86千克之間。 注意 在很多情況下,我們遇到的總體為非正態(tài)分布,但中心極限定理告訴我們,當(dāng)樣本容量n足夠大,無論總體服從什么分布,的柚樣分布將近似地服從正態(tài)分布,因此當(dāng)樣本取自總體方差已知的非正態(tài)分布時(shí),我們?nèi)钥梢杂?公式來近似求出總體平均值的置信區(qū)間。 x)(2/nZxn2 未知時(shí),求的置信區(qū)間 n稍微留意上述求得的的置信區(qū)間,不難發(fā)現(xiàn)只有在 已知時(shí)方法才可行。如果 未知,則可用樣本方差S2代替總體方差 ,從而根據(jù)統(tǒng)計(jì)量: 2222t1/nTnSXTn對(duì)給定的置信水平1- ,令n可解得的1- 置信區(qū)間為12/2/tTtP) 1(2/nSntXn將 、S2分別

22、取其觀察值n則的1- 置信區(qū)間為X2121)(11,1niiniixxnsxnx) 1(2/nsntxn例3. 10 為了估計(jì)一分鐘一次廣告的平均費(fèi)用,抽出了15電視臺(tái)的隨機(jī)樣本。樣本的 平 均 值 = 2 0 0 0 元 , 其 中 標(biāo) 準(zhǔn) 差S=1000元。假定所有被抽樣的這類電視臺(tái)服從正態(tài)分布,試構(gòu)造總體平均值的95%的置信區(qū)間。x解:(1)樣本均值與方差分別為 =2000元,S=1000元 (2)由1- =0.95,得 /2=0.025, n-1=14,查t分布表,得 x14. 2)14() 1(025. 02/tntn(3)寫出置信區(qū)間:n顯然我們有95%的把握說明,總體平均數(shù)處在

23、1447.5元和2552.5元之間。 )15100014. 22000()(2/nStx= =(1447.5, 2552. 5)注意 當(dāng) 未知但樣本容量n30,即大樣本時(shí),可用標(biāo)準(zhǔn)正態(tài)分布近似地當(dāng)作t分布。因此,在實(shí)際工作中,只有在小樣本的情況下,即樣本容量n30時(shí),才應(yīng)用t分布,而對(duì)于大樣本,則通常采用正態(tài)分布來構(gòu)造總體平均數(shù)的置信區(qū)間。另外,根據(jù)中心極限定理,從非正態(tài)總體中抽樣時(shí),只要能夠抽取大樣本,那么,樣本平均數(shù)的抽樣分布就會(huì)服從正態(tài)分布。這時(shí),我們也就能夠用 來構(gòu)造置信區(qū)間,但由于 是未 知的,因此,只能用 來構(gòu)造置信區(qū)間。 )(2/nZx)(2/nSZx二、方差 2的置信區(qū)間n設(shè)X

24、1,X2,X3,Xn是總體XN( , 2)的一個(gè)樣本,其觀察值為x1,x2,x3,xn。因?yàn)樵谝话闱闆r下,總體的均值是未知的,所以我們只討論均值 未知時(shí),對(duì) 2的區(qū)間估計(jì)。要對(duì) 2進(jìn)行區(qū)間估計(jì),須考慮樣本方差S2,由 分布理論知隨機(jī)變量 ) 1() 1(2222nSn2n對(duì)于給定的置信水平1- 1- ,有 1)1() 1(22/222/1nnPn由此得 2的置信水平為1- 的置信區(qū)間為 n而 標(biāo)準(zhǔn)差的置信水平為1- 的置信區(qū)間是 ) 1(1,) 1() 1(22/1222/2nxSnnxSn) 1(1,) 1(122/122/nxSnnxSn例3.11 某制造廠的一名生產(chǎn)管理人員需要知道完成某

25、件工作所需的時(shí)間。為此他進(jìn)行了一項(xiàng)研究,得出一個(gè)適于分析的31個(gè)觀察值組成的隨機(jī)樣本,從樣本數(shù)據(jù)算出的方差為0.3小時(shí),試問: (1)構(gòu)造方差 2的95%的置信區(qū)間(2)構(gòu)造 的95%的置信區(qū)間 (3)構(gòu)造置信區(qū)間時(shí)作了何種假定? 解:(1)S2=0.3,自由度= n-1 = 31-1=30 查 分布表得: 從而求得0.19162 0.5360 因此,我們有95%的把握說2落在0.1916和0.5360之間的范圍內(nèi)。 979.46)30()30(2025. 022/791.16)30()30(2975. 022/12(2)其總體標(biāo)準(zhǔn)差的置信區(qū)間為: 0. 4377 30),可用S12,S22、

26、分別代替12、22 ,于是可用區(qū)間 作為1-2的近似的1- 置信區(qū)間。 )(2221212/21nSnSZXX3 未知時(shí),求1-2的置信區(qū)間,則t分布理論知其中 22221)2(11)()(21212121nntnnSxxTw2) 1() 1(212222112nnSnSnSw 在給定的置信水平1- 的條件下,有 由此可得1-2的置信水平為1- 的置信區(qū)間 當(dāng) 及Sw取樣本觀察值時(shí),置信區(qū)間為 1)2() 2(212/212/nntTnntP)11)2(21212/21nnSnntXXw21,XX)11)2(21212/21nnSnntxxwn【例3.13】某銀行負(fù)責(zé)人想知道存戶存入兩家銀行的

27、錢數(shù),他從每一家銀行各抽選了一個(gè)由25個(gè)存戶組成的隨機(jī)樣本。樣本平均值如下:銀行A: =450元;銀行B: =325元。兩個(gè)總體均服從方差分別為A2=750和B2=850的正態(tài)分布。試構(gòu)造A-B的95%的置信區(qū)間。 AxBxn解 由于兩個(gè)總體均服從正態(tài)分布,因此 也服從正態(tài)分布,從而計(jì)算總體均值之差的置信區(qū)間可用: 這個(gè)公式。 BAXX )(222/BBAABAnnZXX已知 12=750,22=850, =450, =325,所以所求的置信區(qū)間為: 這意味著有95%的把握認(rèn)為總體均值之差在109.32元和140.68元之間。 : AxBx96. 1025. 02/ZZ68.140,32.10

28、9258502575096. 1325450n【例3.14】某工廠中有兩臺(tái)生產(chǎn)金屬棒的機(jī)器。一個(gè)隨機(jī)樣本由機(jī)器A生產(chǎn)的11根金屬棒組成,另一個(gè)隨機(jī)樣本由機(jī)器B生產(chǎn)的21根金屬棒組成。兩個(gè)樣本分別給出兩臺(tái)機(jī)器所生產(chǎn)金屬棒的長度數(shù)據(jù)如下:n =6. 10英寸, =5.95英寸,SA2=0.018, SB2 =0. 020。假定兩個(gè)總體近似服從正態(tài)分布,且總體方差相等,試構(gòu)造A-B的95%的置信區(qū)間。 AxBxn解 019. 022111020. 0) 121(018. 0) 111(2) 1() 1(222BABBAAwnnSnSnS1- =95%, =0.05,查t分布表得t /2= t0.02

29、5(30)=2.042 所以所求置信區(qū)間為: =(0.05, 0.25) )211111019. 0042. 295. 510. 6(4兩個(gè)總體均不服從正態(tài)分布且方差未知 對(duì)于一般不服從正態(tài)分布的兩個(gè)總體,我們往往根據(jù)中心極限定理采用大樣本抽樣方法。如果兩個(gè)總體方差未知,就用S1和S2分別作為1和2的估計(jì)值,當(dāng)n1和n2足夠大時(shí),1-2的置信水平為1- 的近似置信區(qū)間為: )(2221212/21nSnSZXXn【例3.15】東大和西大兩所大學(xué)某學(xué)期期末英語考試采用同一試題,東大認(rèn)為該校學(xué)生英語考試成績能比西大高出10分,為了證實(shí)這一說法,主管部門從兩校各抽取一個(gè)隨機(jī)樣本并得到如下數(shù)據(jù):n東=

30、75人,n西=80人, 東=78. 6分, 西=73.8 分,S東=8.2分,S西=7. 4分。試在95%的置信度下確定兩校平均分?jǐn)?shù)之差的置信區(qū)間。 xx解: 分1- =0.95, =0. 025,查標(biāo)準(zhǔn)正態(tài)分布表得,從而其置信區(qū)間為:(78. 6 73. 8 1. 96 1. 26)=(2.3, 7.3) 226. 1804 . 7752 . 82222西西東東nSnS96. 1025. 02/ ZZ 因此,我們有95%的把握說東大、西大兩校英語考試成績之差在2.3分和7.3分之間。這一結(jié)果說明東大的平均成績確實(shí)高于西大,但并未高出10分。 二、二正態(tài)總體方差比的置信區(qū)間 n在實(shí)際工作中還常

31、常需要比較兩個(gè)總體的方差。例如,在選擇產(chǎn)品時(shí),我們通常需要方差較小的產(chǎn)品,因?yàn)榉讲钶^小的產(chǎn)品的質(zhì)量比較均勻。比較兩個(gè)總體方差的大小,可以將兩個(gè)方差相比,當(dāng)兩個(gè)方差相等時(shí)其比值為1。但兩個(gè)總體方差12和22都是未知的,所以需要通過兩個(gè)樣本方差來加以比較推斷。 n設(shè)二正態(tài)總體XN (1,12)與YN (2,22),其中的參數(shù)均未知,它們相互獨(dú)立的兩個(gè)樣本的容量分別為n1, n2,樣本方差為S12與S22,現(xiàn)在求其方差比12/22的置信區(qū)間n由 分布理論知 2)1()1()1()1(22222221221211nSnnSnn從而 n于是,對(duì)給定的置信水平為1- ,有: ) 1, 1(/) 1/()

32、1() 1/() 1(2122212221222222121211nnFSSnSnnSnF1)1, 1() 1, 1(212/212/1nnFFnnFP所以 12/22的置信水平為1- 的置信區(qū)間為: (此處利用了公式: ) ) 1, 1(),1, 1(122/2221122/12221nnFSSnnFSS),(1),(12121nnFnnFn【例3.16】為了比較用兩種不同方法生產(chǎn)的某種產(chǎn)品的壽命,進(jìn)行一項(xiàng)試驗(yàn)。試驗(yàn)中抽選了由方法1生產(chǎn)的16個(gè)產(chǎn)品組成一個(gè)隨機(jī)樣本,其方差為1200小時(shí)。又抽選了用方法2生產(chǎn)的21個(gè)產(chǎn)品組成另一個(gè)隨機(jī)樣本,得出的方差為800小時(shí)。試以95%的置信度估計(jì)12/2

33、2的置信區(qū)間 解:由于S12=1200,S22=800,S12 S223623. 076. 21)15,20(1) 1, 1(57. 2)20,15() 1, 1(025. 0212/1025. 0212/FnnFFnnF從而所求的置信區(qū)間為:即: 0.58 12/220.05,就要采用有限總體修正系數(shù),從而P的區(qū)間估計(jì)公式為: 1)1 (2/NnNnPPZPn【例3.17】某一大公司的人事處長希望知道本公司內(nèi)專業(yè)不對(duì)口的職員究竟占多大比例。于是,他從2000名具有大專以上學(xué)歷的職員中隨機(jī)抽取了一個(gè)由150人組成的樣本進(jìn)行研究,結(jié)果表明,其中有45人說他們從事的工作與所學(xué)專業(yè)不對(duì)口。試在95.

34、 5%的置信度下構(gòu)造出專業(yè)不對(duì)口人員所占真正比例的置信區(qū)間。 n解:由于樣本容量很大,n=150, n =45/150=0.3, 和 都大于5,故可用正態(tài)分布逼近。但又由于抽樣比重 n ,n故需用有限總體修正系數(shù)計(jì)算Sp,則 PPn)1 (Pn05. 0075. 02000150Nn =(0.228, 0.372) 計(jì)算結(jié)果表明,我們有95. 5%的把握說,該公司具有大專以上學(xué)歷的人員中,有22.8%37.2%的 人專業(yè)不對(duì)口。 1)1 (2/NnNnPPZP120001502000150)3 .01 (3 .023 .0(二、兩個(gè)總體比例之差的區(qū)間估計(jì) n為了估計(jì)兩個(gè)總體比例之差P1-P2,

35、我們可從每一個(gè)總體中各抽一個(gè)隨機(jī)樣本,并利用兩個(gè)樣本比例之差 。這樣就可以按通常的方式構(gòu)造出一個(gè)區(qū)間的估計(jì)值。我們知道,當(dāng)n1和n2都很大,即大樣本,而且總體比例不太接近0或1時(shí),兩個(gè)獨(dú)立樣本 的抽樣分布近似服從正態(tài)分布,其平均值為P1-P2,標(biāo)準(zhǔn)差為: 21PP 21PP n因?yàn)镻1和P2皆未知,所以標(biāo)準(zhǔn)差應(yīng)通過下式來估計(jì): 222111)1 ()1 (21nPPnPPPP222111)1 ()1 (21nPPnPPSPPn于是上述條件下P1-P2的100(1- )%的置信區(qū)間由下式給出: 2221112/21)1 ()1 ()(nPPnPPZPPn【例3.18】某企業(yè)有兩個(gè)車間,分別用A和

36、B表示。為了降低廢品率,該企業(yè)對(duì)車間B的工人首先進(jìn)行業(yè)務(wù)培訓(xùn)。3個(gè)月后,該企業(yè)負(fù)責(zé)人對(duì)兩個(gè)車間的產(chǎn)品質(zhì)量進(jìn)行了檢驗(yàn)。從車間A抽取了200件產(chǎn)品,從車間B抽取了220件產(chǎn)品。查得廢品率A車間為 ,B車間為 ,試在95%的把握程度下,構(gòu)造兩個(gè)廢品率之間的置信區(qū)間。 %15AP%3BPn解: BBBAAAPPnPPnPPSBA)1 ()1 (220)03. 01 (03. 0200)15. 01 (15. 00277. 0 nZ /2=Z0.025=1.96,從而其區(qū)間估計(jì)為:(0.15-0.03 1. 96 0. 0277)=(0.066, 0.174) 根據(jù)這一結(jié)果,我們有95%的把握說,車間A和車間B的廢品率之差為6. 6%17. 4%。這說明,車間B人員的業(yè)務(wù)培訓(xùn)收到了效果。 n以上所舉的例子中,都假定樣本容量已定。在實(shí)際設(shè)計(jì)抽樣方案中有一個(gè)重要的問題,就是在特定的情況下,應(yīng)該用多大的樣本?如果使用一個(gè)比需要大的樣本,就會(huì)浪費(fèi)資料;如果樣本太小,就不能達(dá)到分析的目的。 事實(shí)上,決定樣本大小的因素有以下三點(diǎn): (1)受總體方差2數(shù)值大小的影響??傮w方差大,抽樣誤差大,則應(yīng)多抽一些樣本容量,反之,則可少抽一些。當(dāng)然,當(dāng)總體方差為0時(shí),那么只需抽出其中一個(gè)就能代表總體。問題是實(shí)際工作中我們往往不知道總體方差,因而必

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論