




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1第五章第五章 抽樣推斷抽樣推斷 和參數(shù)估計和參數(shù)估計全及總量指標的推算兩總體參數(shù)的估計一個總體參數(shù)的估計一般問題參數(shù)估計樣本容量的確定抽樣極限誤差抽樣平均誤差抽樣和抽樣分布抽樣推斷2 . 51 . 52學習目標學習目標l區(qū)分總體分布、樣本分布、抽樣分布,理解抽樣分布與總體分布的關系,掌握單總體參數(shù)推斷時樣本統(tǒng)計量的分布,掌握雙總體參數(shù)推斷時樣本統(tǒng)計量的分布l抽樣誤差的含義及計算l樣本容量的確定方法(純隨機抽樣)l估計量與估計值的概念l點估計與區(qū)間估計的區(qū)別l評價估計量優(yōu)良性的標準l抽樣平均數(shù)和抽樣成數(shù)的區(qū)間估計方法(純隨機抽樣)l一個總體參數(shù)的區(qū)間估計方法;兩個總體參數(shù)的區(qū)間估計方法35.1
2、 抽樣推斷抽樣推斷l(xiāng)5.1.1 抽樣和抽樣分布l5.1.2 抽樣平均誤差l5.1.3 抽樣極限誤差l5.1.4 樣本容量的確定45.1.1 5.1.1 抽樣和抽樣分布抽樣和抽樣分布l抽樣:從總體中抽取部分單位,并進行實際調查,以推斷總體。由概率抽樣和非概率抽樣l抽樣推斷就是按照隨機抽樣的原則,從總體中抽出一部分單位作為樣本,并利用樣本的實際資料計算樣本指標值,然后根據(jù)樣本指標對總體的數(shù)量特征(總體指標)做出具有一定可靠程度的估計和判斷的一種統(tǒng)計分析方法。l總體和樣本;樣本容量和樣本個數(shù)l參數(shù)和統(tǒng)計量l估計量和估計值51、抽樣推斷的過程、抽樣推斷的過程總體算術平均數(shù)算術平均數(shù)x統(tǒng)計量統(tǒng)計量用來推
3、斷總體參數(shù)的統(tǒng)計量稱為用來推斷總體參數(shù)的統(tǒng)計量稱為估計量估計量(estimator), 其取值稱其取值稱為為估計值估計值(estimate) 。 同一個參數(shù)可以有多個不同的估計量。同一個參數(shù)可以有多個不同的估計量。參數(shù)是唯一的,但參數(shù)是唯一的,但估計量(統(tǒng)計量)是隨機變量估計量(統(tǒng)計量)是隨機變量,取值是不確,取值是不確定的。定的。 ?參數(shù)參數(shù)6. . 2 2、抽樣推斷的理論基礎、抽樣推斷的理論基礎 建立在概率論的大數(shù)定律和中心極限定理的基礎上。建立在概率論的大數(shù)定律和中心極限定理的基礎上。 大數(shù)定律大數(shù)定律:當樣本容量足夠大時:當樣本容量足夠大時,樣本平均數(shù)與總體平均樣本平均數(shù)與總體平均數(shù)的
4、偏差小于任意正數(shù)的可能性趨近與數(shù)的偏差小于任意正數(shù)的可能性趨近與1的概率。是抽樣的概率。是抽樣推斷的推斷的前提前提。 中心極限定理中心極限定理:只要在樣本容量充分大的條件下:只要在樣本容量充分大的條件下,無論無論全及總體的變量分布是否屬于正態(tài)分布全及總體的變量分布是否屬于正態(tài)分布,其抽樣平均數(shù)也其抽樣平均數(shù)也趨近于正態(tài)分布。幫我們正確測算樣本平均數(shù)與總體平趨近于正態(tài)分布。幫我們正確測算樣本平均數(shù)與總體平均數(shù)間的誤差,樣本平均數(shù)推斷總體平均數(shù)的可靠程度均數(shù)間的誤差,樣本平均數(shù)推斷總體平均數(shù)的可靠程度是我們推斷的主要是我們推斷的主要依據(jù)依據(jù)。73、3種不同性質的分布種不同性質的分布l總體分布:總體
5、中各元素的觀測值所形成的相對頻數(shù)分布,常常是未知的,假定它服從某種分布l樣本分布:從總體中抽取一個容量為n的樣本,由這n個觀測值形成的相對頻數(shù)分布,又稱經驗分布。當樣本容量逐漸n增大時,樣本分布逐漸接近于總體分布l抽樣分布:某個樣本統(tǒng)計量的概率分布,從理論上說就是在重復選取容量為n的樣本時,由該統(tǒng)計量的所有可能取值形成的相對頻數(shù)分布。提供了樣本統(tǒng)計量長遠而穩(wěn)定的信息,是進行推斷的理論基礎,也是抽樣推斷科學性的重要依據(jù)。84、抽樣分布的幾個要點l抽樣分布是樣本統(tǒng)計量的分布,統(tǒng)計量是樣本的函數(shù),由于不同的樣本計算出來的統(tǒng)計量的值不同,因此統(tǒng)計量是一個隨機變量l樣本數(shù)據(jù)的統(tǒng)計分布是可以直接觀測的,最
6、直觀的方式是直方圖,可以用來對總體分布進行檢驗。l現(xiàn)實中不可能將所有樣本都抽出來,抽樣分布一般利用概率統(tǒng)計的理論推導得出,即抽樣分布實際上是一種理論分布。l在統(tǒng)計推斷中總體的分布一般是未知的,不可觀測的(常常被假設為正態(tài)分布)。l在參數(shù)估計中,所關心的總體參數(shù)主要有均值、比例、方差。因此一般用樣本的均值、比例、方差來推斷總體的均值、比例和方差95 5、一個總體參數(shù)推斷時樣本統(tǒng)計量、一個總體參數(shù)推斷時樣本統(tǒng)計量的抽樣分布:的抽樣分布:以均值為例以均值為例 設一個總體含有4 個個體,標志值分別為X1=1、X2=2、X3=3 、X4=4 。5 . 2x625. 02x10所有樣本均值的均值和方差所有
7、樣本均值的均值和方差l樣本均值的均值(數(shù)學期望)等于總體均值樣本均值的均值(數(shù)學期望)等于總體均值l樣本均值的方差:反映樣本平均數(shù)與總體平均數(shù)的樣本均值的方差:反映樣本平均數(shù)與總體平均數(shù)的平均誤差程度平均誤差程度, ,樣本均值的方差等于總體方差的樣本均值的方差等于總體方差的1/1/n n。5 . 2160 . 45 . 10 . 11MxniixnMxnixix222122625. 016) 5 . 20 . 4() 5 . 20 . 1 ()((M為樣本數(shù)目)為樣本數(shù)目)11樣本均值的抽樣分布與中心極限定理樣本均值的抽樣分布與中心極限定理x5x50 x5 . 2x12中心極限定理中心極限定理
8、(central limit theorem)xnx13單一總體樣本統(tǒng)計量的抽樣分布單一總體樣本統(tǒng)計量的抽樣分布樣本均值樣本均值樣本比例樣本比例樣本方差樣本方差正態(tài)分布正態(tài)分布非正態(tài)分布非正態(tài)分布正態(tài)分布正態(tài)分布分布分布p2x2s14樣本的抽樣分布樣本的抽樣分布(8)l單一總體l樣本均值l樣本比例l樣本方差l兩個總體l兩樣本均值差l兩樣本比例差l兩樣本方差比) 1() 1()1 ()1 (,()1 (,(22222nsnNnnNpNnnNx) 1, 1()1 ()1 (,()(),()(21222122211121212221212121nnFssnnNppnnNxx155.1.2 抽樣平均誤
9、差:抽樣平均誤差:統(tǒng)計量的標統(tǒng)計量的標 準誤(準誤(Standard Error)l又叫標準誤差,樣本統(tǒng)計量的抽樣分布的標準差,是根據(jù)樣本統(tǒng)計量計算的,反映統(tǒng)計量的離散程度。測度了用樣本統(tǒng)計量估計總體參數(shù)的精確程度l描述統(tǒng)計分析時軟件一般會輸出這一結果。l當計算標準誤時涉及的總體參數(shù)未知時,用樣本統(tǒng)計量代替計算的標準誤,稱為估計的標準誤l影響抽樣品均誤差的因素不重復抽樣重復抽樣122,22,NnNnnpxpxnsx各種方式下的抽樣平均誤差16l抽樣極限誤差:抽樣極限誤差:又叫又叫最大允許誤差(allowable error)是指抽樣指標與總體指標之間抽樣誤差允許的可能范圍。 置信區(qū)間=l抽樣極
10、限誤差:是人為確定的,是調查者在相應的置信度下可以容忍的誤差水平。l基于概率估計要求,抽樣極限誤差x或 p通常需要以抽樣平均誤差x或p為標準單位來衡量。l抽樣誤差的概率度:把抽樣極限誤差x或p 分別除以x或p得相對數(shù)z,表示誤差范圍為抽樣平均誤差的z倍。 z是測量抽樣估計可靠程度的一個參數(shù)。5.1.3 抽樣極限誤差(抽樣極限誤差( )pxxx;pppxxpxxzzzz;17已知 由概率論可知 服從標準正態(tài)分布,即:有以下關系式成立:一般稱, 為置信度,可靠程度等,反映估計結果的可信程度。若事先給定一個置信度,則可根據(jù)標準正態(tài)分布找到其對應的臨界值 。進而計算抽樣誤差抽樣誤差的概率表述),(2N
11、xxxZ) 1 , 0( NZ1)(2ZxPx2ZxxZx2118抽樣估計的置信度抽樣估計的置信度l 抽樣估計的置信度抽樣估計的置信度:又稱抽樣估計的概率保證程度又稱抽樣估計的概率保證程度,是表明樣本指標與總體指標的誤差不超過是表明樣本指標與總體指標的誤差不超過一定范圍一定范圍的概率保證程度,它一般用的概率保證程度,它一般用 F(z)表示表示 。( )( )( )( )()()()()xxxppppxxXzF zxzXxzF zpzF zpzpzF zPPPPPP19關于置信度含義的說明樣本均值的抽樣分布樣本均值的抽樣分布1、在所有的置信區(qū)間中,有(1-)*100% 的區(qū)間包含總體真實值。2、
12、對于計算得到的一個具體區(qū)間,“這個區(qū)間包含總體真實值”這一結論有(1-) *100%的可能是正確的。3、說“總體均值有95%的概率落入某一區(qū)間”是不嚴格的,因為總體均值是非隨機的 。 = 1 - /2 /2X_x_x205.2 參數(shù)估計參數(shù)估計5.2.1 參數(shù)估計的一般問題參數(shù)估計的一般問題5.2.2 一個總體參數(shù)的區(qū)間估計一個總體參數(shù)的區(qū)間估計5.2.3 兩個總體參數(shù)的區(qū)間估計兩個總體參數(shù)的區(qū)間估計5.2.4 全及總量指標的推算全及總量指標的推算215.2.1 參數(shù)估計的一般問題參數(shù)估計的一般問題(一)科學的估計方法具備的條件(一)科學的估計方法具備的條件(二)點估計(二)點估計(三)評價估
13、計量的標準(三)評價估計量的標準(四)區(qū)間估計(四)區(qū)間估計22(一)科學的估計方法具備的條件(一)科學的估計方法具備的條件l要有合適的統(tǒng)計量作為估計量l要有合理的允許誤差范圍l要有一個可接受的置信度,即概率保證程度23(二)點估計(二)點估計(point estimate)l用樣本的估計量的某個取值直接作為總體參數(shù)的估計值l例如:用樣本均值直接作為總體均值的估計;用兩個樣本均值之差直接作為總體均值之差的估計l缺陷:無法給出估計值接近總體參數(shù)程度的信息,不能反映估計的誤差和精確程度l雖然在重復抽樣條件下,點估計的均值可望等于總體真值,但由于樣本是隨機的,抽出一個具體的樣本得到的估計值很可能不同
14、于總體真值l一個點估計量的可靠性是由它的抽樣標準誤差來衡量的,這表明一個具體的點估計值無法給出估計的可靠性的度量 24l無偏性無偏性(unbiasedness) :估計量抽樣分布的數(shù)學期望等于被估計的總體參數(shù)。即(三)評價估計量的標準(三)評價估計量的標準Xx )(25l一致性一致性(consistency) :隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數(shù)。即1)(limXxpn評價估計量的標準評價估計量的標準2612(efficiency) 評價估計量的標準評價估計量的標準)()(221227(四)區(qū)間估計(四)區(qū)間估計(interval estimate)l利用樣本統(tǒng)計量和抽樣
15、分布估計總體參數(shù)的可能區(qū)間。在點估計的基礎上,給出總體參數(shù)估計的一個區(qū)間(樣本統(tǒng)計量加減抽樣誤差)范圍。關鍵是將抽樣誤差 求解。若 已知,則區(qū)間可表示為:l根據(jù)樣本統(tǒng)計量的抽樣分布能夠對樣本統(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量。比如,某班級平均分數(shù)在7585之間,置信水平是95%x置信水平=1x),(xxxx28區(qū)間估計的圖示區(qū)間估計的圖示置信區(qū)間與置信水平置信區(qū)間與置信水平 29置信水平置信水平l或置信系數(shù):將構造置信區(qū)間的步驟重復很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平 l表示為 (1 - 。 是總體參數(shù)未在區(qū)間內的比例。l如用95%的置信水平得到某班學生考試成績
16、的置信區(qū)間為7585。不能表述為7585這個區(qū)間以95%的概率包含全班學生平均考試成績的真值,或全班學生的平均考試成績以95%的概率落在7585之間l常用的置信水平值有 99%, 95%, 90%l相應的相應的 為0.01,0.05,0.10l相應的相應的 為1.65,1.96,2.5830置信區(qū)間置信區(qū)間 (confidence interval)l置信水平為95%的置信區(qū)間:用某種方法構造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值。l總體參數(shù)的真值是固定且未知,用樣本構造的區(qū)間則是不固定的,即置信區(qū)間是一個隨機區(qū)間。一個置信區(qū)間就像是為捕獲未知參數(shù)而撒出去的網(wǎng),不是所有撒網(wǎng)的地點都能捕獲
17、到參數(shù)。只能用概率表示在多次抽樣得到的區(qū)間中大概有多少個區(qū)間包含了參數(shù)的真值。l實際估計時只抽一個樣本,此時所構造的是與該樣本相聯(lián)系的一定置信水平下的置信區(qū)間,是一特定區(qū)間,因此無法知道它是否包含總體參數(shù)的真值。所以只能希望該區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個。31置信區(qū)間置信區(qū)間 ( (95%95%的置信區(qū)間的置信區(qū)間) )32例例1 1:l從某廠生產的5000只燈泡中,隨機不重復抽取100只,對其使用壽命進行調查,調查結果如表又該廠質量規(guī)定使用壽命在3000小時以下為不合格品。使用壽命(小時)使用壽命(小時) 產品數(shù)量(只)產品數(shù)量(只) 3000 3000以下以下3000 4000
18、3000 40004000 50004000 5000 5000 5000以上以上2 2303050501818合合 計計100100要求:要求:(1)按不重復抽樣方法,以95.45%的概率保證程度估計該批燈泡的平均使用壽命; (2)按不重復抽樣方法,以68.27%的置信度估計該批燈泡的合格率。33(1 1)N = 5000 = 5000 n = 100 100 F(z) = 95.45 = 95.45% z = 2 2. . 解:解:樣本平均數(shù):樣本平均數(shù):xfxf時4 43 34 40 00 00 04 43 34 40 0( (小小) )1 10 00 0樣本標準差:樣本標準差:xxff
19、s2() 5 53 34 44 40 00 00 00 07 73 31 1. .0 02 26 67 71 10 00 0分析分析34. . 總體平均壽命所在的置信區(qū)間為總體平均壽命所在的置信區(qū)間為: :xXxz時4 43 34 40 01 14 44 4. .7 74 4( (小小) )= =11xxxnnNNnnzs時7 73 31 1. .0 02 27 76 61 10 00 01 17 72 2. .3 37 75 50 00 00 01 10 00 02 27 72 2. .3 37 71 14 44 4. .7 74 4( (小小) )樣本平均壽樣本平均壽命的抽樣平命的抽樣平均
20、誤差:均誤差: 即可以即可以95.4595.45%的概率保證程度估計該批燈泡的平均的概率保證程度估計該批燈泡的平均使用壽命在使用壽命在4484.744484.744195.264195.26小時之間。小時之間。分析分析35. . 樣本合格率:樣本合格率: (2 2) n1 = 98 98 n = 100 100 F(z) = 68.27 = 68.27 z = 1 11npn9 98 80 0. .9 98 81 10 00 0樣本合格率的抽樣平均誤差:樣本合格率的抽樣平均誤差:(1)1()pppPPnnNz 0 0. .9 98 80 0. .0 02 21 10 00 01 10 0. .
21、0 01 14 41 10 00 05 50 00 00 01 10 0. .0 01 14 40 0. .0 01 14 4 ( () )總體合格率所在的置信區(qū)間為總體合格率所在的置信區(qū)間為: :pPpz0 0. .9 98 80 0. .0 01 14 4 即可以即可以68.2768.27%的概率保證程度估計該批燈泡的合格的概率保證程度估計該批燈泡的合格率率96.696.6 99.499.4之間。之間。分析分析36例例2 l 對某批成品按不重復抽樣方法抽選對某批成品按不重復抽樣方法抽選200200件檢查,其中廢品件檢查,其中廢品8 8件,又知樣本容量為成品總量的件,又知樣本容量為成品總量的
22、(1(120)20)。以。以9595的把握程度估的把握程度估計該批成品的廢品率范圍。計該批成品的廢品率范圍。l解:解:N = 4000 = 4000 n = = 200 200 n1 = = 8 8 F(z) = 95 = 95 z = 1.96= 1.961(1)1()ppppnpnPPnnNzpz廢品率 品率 42.6542.658 80.040.042002000.040.9610.040.961(1)0.0135(1)0.013520020200201.960.01350.026561.960.01350.02656P =P =37影響區(qū)間寬度的因素影響區(qū)間寬度的因素l總體數(shù)據(jù)的離散程
23、度,用來測度l樣本容量l置信水平 (1 - ),影響 z 的大小nx385.2.2 5.2.2 一個總體參數(shù)的區(qū)間估計一個總體參數(shù)的區(qū)間估計) 1() 1()1 ()1 (,()1 (,(22222nsnNnnNpNnnNx單一總體參數(shù)推斷時單一總體參數(shù)推斷時樣本統(tǒng)計量的抽樣分布樣本統(tǒng)計量的抽樣分布391 1、樣本近似服從正態(tài)分布的情形、樣本近似服從正態(tài)分布的情形2 2、樣本近似服從、樣本近似服從t分布的情形分布的情形(一)總體均值的區(qū)間估計(一)總體均值的區(qū)間估計401 1、樣本為正態(tài)分布的情形、樣本為正態(tài)分布的情形l假定條件(具備其中之一)l總體服從正態(tài)分布,方差已知(無論大樣本還是小樣本
24、)l如果不是正態(tài)分布,大樣本時可由正態(tài)分布來近似 (n 30)l使用正態(tài)分布統(tǒng)計量 z) 1 , 0( Nnxz代替)未知用若snZx(241例例125袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.342分析分析28.109,44.10192.336.105251096.136.1052nzx36.105x43例例236個投保人年齡的數(shù)據(jù)個投保人年齡的數(shù)據(jù) 233539
25、27364436424643313342534554472434283936444039493834485034394548453244分析分析63.41,37.3713.25.393677.7645.15.392nszx5 .39x77. 7s45例例3:用:用SPSS進行區(qū)間估計進行區(qū)間估計 兒童電視節(jié)目的贊助商希望了解兒童每周看電視的時間。下面是對100名兒童進行隨機調查的結果(小時)。計算平均看電視時間95%的置信區(qū)間。39.719.534.727.0 41.315.120.531.318.317.021.529.915.016.4 36.823.424.128.923.424.440
26、.646.423.639.4 35.519.529.331.220.634.915.531.638.938.7 27.226.514.715.628.424.043.920.629.19.5 21.042.413.932.829.832.933.038.028.720.6 19.738.637.117.015.123.421.021.829.321.3 22.823.432.511.343.830.815.823.220.333.5 30.037.824.426.929.027.727.122.036.123.0 22.126.522.926.930.225.223.835.321.635.7
27、 30.822.724.521.926.550.346SPSS輸出結果(數(shù)據(jù):輸出結果(數(shù)據(jù):tv.xls)操作:分析操作:分析-描述統(tǒng)計描述統(tǒng)計-探索探索統(tǒng)計量標準誤均值27.191.8373均值的 95% 置信區(qū)間下限25.530上限28.8525% 修整均值26.977中值26.500方差70.104標準差8.3728極小值9.5極大值50.3472 2、樣本服從、樣本服從t分布的情形分布的情形l假定條件:總體為正態(tài)分布,且方差未知是小樣本 (n 5)l使用正態(tài)分布統(tǒng)計量 z) 1 , 0()1 (Nnpznppzp)-1 (251例例1 1%35.74%,65.55%35. 9%651
28、00%)651%(6596. 1%65)1 (2nppzp52例例2解:顯然有解:顯然有 因此因此可以用正態(tài)分布進行估計??梢杂谜龖B(tài)分布進行估計。 /2=1.6450215. 0217. 0995)217. 01(217. 0645. 1217. 0)1(2 nppZp 結論:我們有90的把握認為悉尼青少年中每天都抽煙的青少年比例在19.55%23.85%之間。5)1(, 5 pnpn 2006年對悉尼995名青少年的隨機調查發(fā)現(xiàn),有216人每天都抽煙。試估計悉尼青少年中每天都抽煙的青少年比例的90%的置信區(qū)間。53SPSS的計算結果的計算結果在SPSS中將“是否吸煙”輸入為取值為1和0的屬性
29、變量,權數(shù)分別為216和779。計算這一變量均值的置信區(qū)間即為比例的置信區(qū)間。統(tǒng)計量標準誤均值.2171.01308均值的 90% 置信區(qū)間 下限 .1956上限.23865% 修整均值.1857中值.0000方差.1700標準差.4123極小值.0000極大值1.000054(三)總體方差的區(qū)間估計(三)總體方差的區(qū)間估計l假設總體服從正態(tài)分布。l總體方差 的點估計量為s2,樣本方差服從自由度為(n-1)的 分布,且211222nsn2222212) 1(sn111122122222nsnnsn化簡:2x55例例 25袋食品的重量袋食品的重量 單位:單位:g112.5101.0103.010
30、2.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.356分析分析4011.12)24() 1(2975. 0212n3641.39)24() 1(2025. 022n39.18083.564011.1221.931253641.3921.931252257一個總體參數(shù)的區(qū)間估計一個總體參數(shù)的區(qū)間估計(小小結結)均值均值比例比例方差方差大樣本大樣本小樣本小樣本大樣本大樣本 2 2分布分布Z Z分布分布Z Z分布分布t t分布分布Z Z
31、分布分布已知2未知258一個總體參數(shù)的區(qū)間估計一個總體參數(shù)的區(qū)間估計(小結小結)59(四)未來觀察值的預測區(qū)間估計(四)未來觀察值的預測區(qū)間估計16只只燈泡使用壽命的數(shù)據(jù)燈泡使用壽命的數(shù)據(jù) 15101520148015001450148015101520148014901530151014601460147014701nx60(四)未來觀察值的預測區(qū)間估計(四)未來觀察值的預測區(qū)間估計0)(1xxEnnnxxDn112221nstx112) 1(11) 1 , 0(1111ntnsxxtNnxxznn61例題分析例題分析161177.24131. 21490625.2.3 5.2.3 兩個總體
32、參數(shù)的兩個總體參數(shù)的 區(qū)間估計區(qū)間估計)1,1()1()1(,()(),()(21222122211121212221212121nnFssnnNppnnNxx(一)兩總體均值之差的區(qū)間估計(一)兩總體均值之差的區(qū)間估計(二)兩總體比例之差的區(qū)間估計(二)兩總體比例之差的區(qū)間估計(三)兩總體方差之比的區(qū)間估計(三)兩總體方差之比的區(qū)間估計63(一)兩總體均值之差的區(qū)間估計(一)兩總體均值之差的區(qū)間估計獨立樣本獨立樣本配對樣本配對樣本641 1、獨立大樣本、獨立大樣本l假定條件(具備其中之一)兩個總體都服從正態(tài)分布若不是正態(tài)分布, 當n130和n230時可以用正態(tài)分布近似l使用正態(tài)分布統(tǒng)計量 z
33、l1,2已知時,兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為) 1 , 0()()(2221212121Nnnxxz222121221)(nnzxx2221,ss65例例 兩個樣本的有關數(shù)據(jù)兩個樣本的有關數(shù)據(jù) 中學中學1中學中學2n1=46n1=33S1=5.8 S2=7.2861x782x66分析分析)97.10,03. 5(97. 28332 . 7468 . 596. 1)7886()(22222121221nsnszxx672、獨立小樣本,、獨立小樣本,方差未知但相等方差未知但相等l假定條件兩個總體都服從正態(tài)分布兩個獨立的小樣本(n130和n230)兩總體方差未知且相等1=2l
34、總體方差的合并估計量2) 1() 1(212222112nnsnsnspl兩個樣本均值之差的標準化后服從)2(11)()(21212121nntnnsxxtp21221221112nnsnntxxp68例例兩個方法組裝產品所需的時間兩個方法組裝產品所需的時間 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.569分析分析5 .321x996.1521s8 .282x358.1922s677.1721212358.19) 112(996
35、.15) 112(2ps56. 37 . 3121121677.170739. 2) 8 .285 .32(703、獨立小樣本,、獨立小樣本,方差未知且不等(方差未知且不等(1 1) l假定條件兩個總體都服從正態(tài)分布,且是小樣本(n130和n230)兩個總體方差未知且不相等:12n1=n2=n222121212212nsnsnntxx713、獨立小樣本,、獨立小樣本,方差未知且不等(方差未知且不等(2 2) l假定條件兩個總體都服從正態(tài)分 布 , 且 是 小 樣 本(n130和n230)兩個總體方差未知且不相等:12n1n2l使用統(tǒng)計量)()()(2221212121vtnsnsxxt2221
36、21221)(nsnsvtxx1222221121212222121nnsnnsnsnsvl兩個總體均值之差1-2在1- 置信水平下的置信區(qū)間為72例例兩個方法組裝產品所需的時間兩個方法組裝產品所需的時間 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.273例題分析例題分析5 .321x996.1521s875.272x014.2322s13188.13188014.2311212996.158014.2312996.15222v433. 4625. 48014.
37、2312996.151604. 2)875.275 .32(744、匹配樣本、匹配樣本l假定條件:兩個總體各觀察值的配對差服從正態(tài)分布l兩個總體均值之差d =1-2在1- 置信水平下的置信區(qū)間為l兩個匹配的大樣本(n1 30和n2 30)l兩個匹配的小樣本(n1 30和n2 30)nzdd2nsntdd) 1(275例例 10名學生兩套試卷的得分名學生兩套試卷的得分 學生編號學生編號試卷試卷A試卷試卷B差值差值d17871726344193726111489845691741754951-2768551387660169857781055391676分析分析11101101dniindd53.
38、 61)(12dniidndds67. 4111053. 62622. 211) 1(2nsntdd77(二)兩個總體比例之差的區(qū)間估計(二)兩個總體比例之差的區(qū)間估計l假定條件兩個總體服從二項分布可以用正態(tài)分布來近似兩個樣本是獨立的l兩個總體比例之差1- 2在1- 置信水平下的置信區(qū)間為222111221)1 ()1 (nppnppzpp78例例79分析分析%32.19,%68. 6%32. 6%13400%)321 (%32500%)451 (%4596. 1%32%4580(三)兩個總體方差比的區(qū)間估計(三)兩個總體方差比的區(qū)間估計l用兩個樣本的方差比來判斷如果S12/ S22接近于1,
39、1,說明兩個總體方差很接近如果S12/ S22遠離1 1, ,說明兩個總體方差之間存在差異l總體方差比在1-置信水平下的置信區(qū)間為22222212121FssFF212221222122221FssFss),(1),(2122121nnFnnF81例題分析例題分析5201x26021s4802x28022s82分析分析505.028026098.1280260222183兩個總體參數(shù)的區(qū)間估計兩個總體參數(shù)的區(qū)間估計(小小結結)均值差均值差比例差比例差方差比方差比獨立大樣本獨立大樣本獨立小樣本獨立小樣本匹配樣本匹配樣本獨立大樣本獨立大樣本 1 12 2、 2 22 2已知已知 1 12 2、 2
40、 22 2未知未知Z Z分布分布 1 12 2= = 2 22 2 1 12 2 2 22 2正態(tài)總體正態(tài)總體F F分布分布Z Z分布分布t t分布分布t t分布分布t分布分布Z分布分布845.2.4 樣本容量樣本容量n n的確定的確定l重復純隨機抽樣l不重復純隨機抽樣需要考慮問題:需要考慮問題: (1)(1)要求什么樣的精度?即我們想構造多寬的區(qū)間?要求什么樣的精度?即我們想構造多寬的區(qū)間? (2)(2)對于構造的置信區(qū)間來說,想要多大的置信度?對于構造的置信區(qū)間來說,想要多大的置信度?即我們想要多大的可靠度?即我們想要多大的可靠度?852(1)(1)pppxxxzzznnPPz PPzznn 22222樣本容量樣本容量n n的確定的確定l重復隨機抽樣重復隨機抽樣l不重復抽樣不重復抽樣(1)(1)(1)(1)(1)ppxxnNzznnNNzPPnNz PPznnNNz PP 22
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 物聯(lián)網(wǎng)數(shù)據(jù)集成與大數(shù)據(jù)分析優(yōu)化-洞察及研究
- 廣東省陽山中學2025屆高一化學第二學期期末綜合測試模擬試題含解析
- 2025屆安徽亳州闞疃金石中學高二化學第二學期期末學業(yè)水平測試試題含解析
- 湖北省黃岡八模2025屆高二下化學期末檢測試題含解析
- 移動應用在藥膏購買中的應用-洞察闡釋
- 邊緣計算驅動的智能安裝方案-洞察闡釋
- 食品安全數(shù)據(jù)可視化與風險預警系統(tǒng)-洞察闡釋
- 通信開銷最小化策略-洞察及研究
- 消費者情感與品牌共鳴-洞察闡釋
- 風險管理市場動態(tài)分析-洞察闡釋
- 《數(shù)字貿易》課程教學大綱
- 會展策劃考試試題及答案
- 2025零基礎應用DeepSeek手冊
- 建筑節(jié)能與環(huán)保培訓課件
- 微弱的光亮(2024年山東煙臺中考語文試卷記敘文閱讀試題)
- 2024高考物理一輪復習專題93機械振動和機械波練習含解析新人教版
- 廣西現(xiàn)代物流集團招聘筆試沖刺題2025
- 中職班主任班級管理經驗分享
- 大學英語六級大綱詞匯正序版
- 《計算機圖形學》課后習題參考答案
- 初三第一學期家長會
評論
0/150
提交評論