




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、抽樣調(diào)查-不等概抽樣培訓(xùn)課程二、不等概抽樣的種類1 1、放回不等概抽樣、放回不等概抽樣首先給整體的每一個(gè)單元賦予一個(gè)確定的首先給整體的每一個(gè)單元賦予一個(gè)確定的入樣概率通常是不相等的,然后在總體中入樣概率通常是不相等的,然后在總體中對每個(gè)單元按入樣概率進(jìn)行抽樣,抽取出來的對每個(gè)單元按入樣概率進(jìn)行抽樣,抽取出來的樣本單元記錄后又放回總體,再進(jìn)行下一次的樣本單元記錄后又放回總體,再進(jìn)行下一次的抽樣,很顯然每次抽樣都是獨(dú)立的。抽樣,很顯然每次抽樣都是獨(dú)立的。NiiiiiMMMMZ10 放回不等概抽樣中,最常用的是按照整體單放回不等概抽樣中,最常用的是按照整體單元的規(guī)模大小來確定單元在每次抽樣時(shí)的入樣概
2、元的規(guī)模大小來確定單元在每次抽樣時(shí)的入樣概率,假設(shè)總體中第率,假設(shè)總體中第i個(gè)單元的規(guī)模度量為個(gè)單元的規(guī)模度量為 ,總,總體的總規(guī)模為體的總規(guī)模為 每次抽樣中,第每次抽樣中,第i個(gè)單個(gè)單元被抽中的概率用元被抽中的概率用 表示,其中表示,其中iMNiiMM10iZ 這種不等概抽樣稱作放回的與規(guī)模大小成比這種不等概抽樣稱作放回的與規(guī)模大小成比例的概率抽樣例的概率抽樣probability proportional to size),簡稱簡稱PPS抽樣。實(shí)際問題中,總體單元大小的度抽樣。實(shí)際問題中,總體單元大小的度量往往不止一個(gè),比方企業(yè)員工數(shù)量、產(chǎn)值、銷量往往不止一個(gè),比方企業(yè)員工數(shù)量、產(chǎn)值、銷售
3、量、利潤等都可以度量企業(yè)規(guī)模的大小。售量、利潤等都可以度量企業(yè)規(guī)模的大小。 PPS抽樣的實(shí)施主要有兩種方法:代碼法和抽樣的實(shí)施主要有兩種方法:代碼法和拉希里拉希里L(fēng)ahiri)法,下面我們用一個(gè)實(shí)例分別介法,下面我們用一個(gè)實(shí)例分別介紹這兩種方法。紹這兩種方法。代碼數(shù),將代碼數(shù)累加得到0M每次抽樣0M都產(chǎn)生一個(gè)1,之間的隨機(jī)數(shù),設(shè)為m那么代碼m所對應(yīng)的單元被抽中。(如果iM不是整數(shù),則乘以某個(gè)倍數(shù)。)1 1代碼法代碼法 在PPS抽樣中,賦予每個(gè)單元與相等的iM 10累計(jì)累計(jì) 10代碼代碼123456789100.614.51.513.77.815103.661.16145151377815010
4、0366011615116630338153163166772773816715115216616730330438138253153263163266766872772873873.8738_iMiMiM【例5.1】設(shè)某個(gè)總體有N=10個(gè)單元,相應(yīng)的單元大小 及其代碼數(shù)如下表,我們要在其中產(chǎn)生一個(gè)n=3的樣本.iM先在先在1,7381,738中產(chǎn)生一個(gè)隨機(jī)數(shù)為中產(chǎn)生一個(gè)隨機(jī)數(shù)為354,354,再再在在1,7381,738中產(chǎn)生第二個(gè)隨機(jī)數(shù)為中產(chǎn)生第二個(gè)隨機(jī)數(shù)為553,553,最后最后產(chǎn)生第三個(gè)隨機(jī)產(chǎn)生第三個(gè)隨機(jī)493493。那么它們所對應(yīng)的第。那么它們所對應(yīng)的第5 5,7 7,6 6號單元被
5、抽中。號單元被抽中。2 2拉希里法拉希里法,max1iNimM令 每次抽樣都分別產(chǎn)生M一個(gè)1,N之間的隨機(jī)數(shù) i 及1,之間的隨機(jī)數(shù)m如果mMi則第i個(gè)單元被抽中;否則,重抽一組( i, m ).在例5.1中,.10,150NM在1,10和1,150中分別產(chǎn)生( i, m ):(3,121),3M=15 121, 舍棄,重抽;m(8,50),8M=36 50, 舍棄,重抽;m(7,77),7M=100 77,第7號單元入樣;m(5,127),5M78 127, 舍棄,重抽;m(4,77),4M137 77, 第4號單元入樣;m(9,60),9M60 60,第9號單元入樣。m因此,第因此,第,7
6、, 9,7, 9號單元被抽中。號單元被抽中。2 2、不放回不等概抽樣、不放回不等概抽樣每次在總體中對每個(gè)單元按入樣概率進(jìn)行抽樣,每次在總體中對每個(gè)單元按入樣概率進(jìn)行抽樣,抽取出來的樣本單元不放回總體,對總體中剩下的抽取出來的樣本單元不放回總體,對總體中剩下的單元進(jìn)行下一次抽樣。不放回不等概抽樣的效率比單元進(jìn)行下一次抽樣。不放回不等概抽樣的效率比放回時(shí)的效率高,但是樣本不獨(dú)立會加大抽樣實(shí)施、放回時(shí)的效率高,但是樣本不獨(dú)立會加大抽樣實(shí)施、參數(shù)估計(jì)及精度計(jì)算的難度。參數(shù)估計(jì)及精度計(jì)算的難度。對于不放回不等概抽樣,樣本的抽取可以有以下幾對于不放回不等概抽樣,樣本的抽取可以有以下幾種方法:種方法:1 1
7、逐個(gè)抽取法。每次從總體未被抽中的單元中逐個(gè)抽取法。每次從總體未被抽中的單元中以一定的概率取一個(gè)樣本單元。以一定的概率取一個(gè)樣本單元。2 2重抽法。以一定的概率逐個(gè)進(jìn)行放回抽樣,重抽法。以一定的概率逐個(gè)進(jìn)行放回抽樣,如果抽到重復(fù)單元,那么放棄所有抽到的單元,重新抽如果抽到重復(fù)單元,那么放棄所有抽到的單元,重新抽取。取。3 3全樣本抽取法。對總體每個(gè)單元分別按一定全樣本抽取法。對總體每個(gè)單元分別按一定概率決定其是否入樣。這種方法的樣本量是隨機(jī)的,事概率決定其是否入樣。這種方法的樣本量是隨機(jī)的,事先不能確定。先不能確定。4 4系統(tǒng)抽樣法。將總體單元按某種順序排列,系統(tǒng)抽樣法。將總體單元按某種順序排列
8、,根據(jù)樣本量確定抽樣間距根據(jù)樣本量確定抽樣間距k,k,在在11,kk中產(chǎn)生一個(gè)隨機(jī)數(shù)。中產(chǎn)生一個(gè)隨機(jī)數(shù)。5.2 放回不等概抽樣一、只抽取一個(gè)樣本單元n=1)的不等概抽樣 為了便于了解不等概抽樣的根本思想,我們先看一個(gè)總體,只抽取一個(gè)樣本單元的例子。 【例】一個(gè)城市有四個(gè)超市營業(yè)面積從100平方米到1000平方米不等見下表,我們的目標(biāo)是通過抽取一家超市來估計(jì)這四個(gè)超市上個(gè)月的總營銷量。通常超市面積越大那么銷售量越大,因此,我們選擇的入樣概率與超市的營業(yè)面積成正比。超市營業(yè)面積(平方米)(萬元)A1001/1611B2002/1620C3003/1624D100010/16245總計(jì)1600130
9、0iZiY四個(gè)超市的背景數(shù)據(jù)四個(gè)超市的背景數(shù)據(jù)iYiZ:第:第i i個(gè)超市的包含概率,個(gè)超市的包含概率, :第:第i i個(gè)超市的銷售量個(gè)超市的銷售量 如果超市的營業(yè)面積近似正比于超市的銷售額,那么超市A的銷售額就占所有超市銷售額的1/16,因此超市A的銷售額乘以權(quán)重16包含概率的倒數(shù)可以近似地估計(jì)所有超市的銷售額。因此,樣本量為1的不等概抽樣的總體總值估計(jì)量為:SiiiiSiiZyywYiiZw1式中式中樣本樣本A1/161117615375B2/162016019600C3/162412829584D10/162453928464iZiySY2)(YYS四個(gè)四個(gè)n=1n=1可能的不等概樣本及
10、其估計(jì)量可能的不等概樣本及其估計(jì)量從上表可以算出:萬元)。(3003921610128163160162176161)(SiiYZYE.1424884641610295841631960016215367161)()()(22YYZYYEYVSii可見不等概抽樣的總體總值估計(jì)量是無偏的可見不等概抽樣的總體總值估計(jì)量是無偏的 我們用同一個(gè)例題將不等概抽樣與簡單隨機(jī)抽樣作一比較,以此認(rèn)識不等概抽樣的意義。 與n=1的簡單隨機(jī)抽樣相比,簡單隨機(jī)抽樣的樣本NZZii41,41所有可能的樣本見下表所有可能的樣本見下表樣本樣本A1/4114465536B1/4208048400C1/4249641616D
11、1/4245980462400iZiySRSY2)(YYSRS四個(gè)可能的簡單隨機(jī)樣本的數(shù)據(jù)及其估計(jì)量四個(gè)可能的簡單隨機(jī)樣本的數(shù)據(jù)及其估計(jì)量我們來計(jì)算簡單隨機(jī)抽樣的估計(jì)量方差我們來計(jì)算簡單隨機(jī)抽樣的估計(jì)量方差154488)462400416164840065536(41)(SRSYV 前面按不等概抽樣的估計(jì)量方差為前面按不等概抽樣的估計(jì)量方差為 14248 14248, 是無偏估計(jì),期望為是無偏估計(jì),期望為300300萬元,但是其方差萬元,但是其方差大于不等概抽樣,這是因?yàn)椴坏雀懦闃永昧溯o大于不等概抽樣,這是因?yàn)椴坏雀懦闃永昧溯o助信息,即與銷售額相關(guān)的超市面積。助信息,即與銷售額相關(guān)的超市面
12、積。SRSY二、一般有放回不等概抽樣niiiHHzynY11 對于放回不等概抽取樣本容量為對于放回不等概抽取樣本容量為n n的樣本,總體總值的樣本,總體總值的估計(jì)量為樣本中所有的估計(jì)量為樣本中所有 的平均,我們得到漢森的平均,我們得到漢森赫維慈赫維慈(Hansen-Hurwitz)(Hansen-Hurwitz)估計(jì)估計(jì) :iiZy /上式是總體總值的無偏估計(jì)上式是總體總值的無偏估計(jì)如果采用的是如果采用的是PPSPPS抽樣,即抽樣,即 ,則,則0MMZiiniiiniiiHHMynMzynY1011 上面估計(jì)量是上面估計(jì)量是n n個(gè)獨(dú)立觀測的平均,因此每個(gè)個(gè)獨(dú)立觀測的平均,因此每個(gè)單元的總值估
13、計(jì)量方差是:單元的總值估計(jì)量方差是:21)(YZYZiiNii:的方差為HHYNiiiiHHYZYZnYV12)(1)(:)(的無偏估計(jì)為HHYVniHHiiHHYxynnYv12)(111)(niHHiiMYmynnM12020)() 1(【例5.2】某部門要了解所屬8500家生產(chǎn)企業(yè)當(dāng)月完成的利潤,該部門手頭已有一份上年各企業(yè)完成產(chǎn)量的報(bào)告,將其匯總得到所屬企業(yè)上年完成產(chǎn)量為3676萬噸.考慮到時(shí)間緊,準(zhǔn)備采用抽樣調(diào)查來推算當(dāng)月完成的利潤.根據(jù)經(jīng)驗(yàn),企業(yè)的產(chǎn)量和利潤相關(guān)性比較強(qiáng),且企業(yè)的特點(diǎn)是規(guī)模和管理水平差異比較大,通常大企業(yè)的管理水平較高,因此采用與上年產(chǎn)量成比例的PPS抽樣,從所屬企
14、業(yè)中抽出一個(gè)樣本量為30的樣本,調(diào)查結(jié)果如下表.不等概抽樣例題不等概抽樣例題imiyiimiyiimiyi138.2310926106.501900191.510213.7010241115.00864208.008030.7513127.00172128.421367242.85301316.001045229.01384552.0011021412.30220230.7548065.00600153.864600246.00311710.802901615.8023702528.43928482.00430179.00940269.9784298.819921821.00640276.20
15、510樣本單元的有關(guān)數(shù)據(jù)紅色數(shù)字表示被兩次抽到,紅色數(shù)字表示被兩次抽到,mimi為企業(yè)上年完成的產(chǎn)量,為企業(yè)上年完成的產(chǎn)量,yiyi為企業(yè)當(dāng)月完成的產(chǎn)量。為企業(yè)當(dāng)月完成的產(chǎn)量。 要根據(jù)以上調(diào)查結(jié)果估計(jì)該部門所屬企業(yè)當(dāng)月完成的利潤,并給出95%置信度下的相對誤差.如果要求在相同條件下相對誤差到達(dá)20%,所需的樣本量應(yīng)該是多少?解:由上述條件知由上述條件知3676,300Mn估計(jì)當(dāng)月完成的利潤為:75708710niiiHHmynMY174118)()(8 . 53031700514)() 1()(20120HHHHHHniiiHHYvYsMYmynnMYvHHY方差及標(biāo)準(zhǔn)差的估計(jì)%4575708
16、717411896. 1)(HHHHYYstr在置信度為在置信度為95%95%時(shí)時(shí), ,對應(yīng)的對應(yīng)的t=1.96, t=1.96, 的相對誤差的相對誤差HHY 因此,在置信度仍為因此,在置信度仍為95%95%、相對誤差時(shí)、相對誤差時(shí) ,所需樣本量為:所需樣本量為:%201r15230)2 . 045. 0(22121nrrn三、有放回不等概整群抽樣 在群規(guī)模不等的整群抽樣中,如果群的規(guī)模差異較大,各個(gè)群對總體的影響會產(chǎn)生很大差異。這時(shí)可以采用不等概方式抽取群。其好處是把群的規(guī)模作為抽取樣本的輔助信息,提高了估計(jì)的精度,而且方差估計(jì)有比較簡單的形式。下面主要討論以PPS抽樣抽取群的情況。 每次按
17、每次按 的概率抽取第的概率抽取第i i個(gè)群,由于群內(nèi)的單元全部參與調(diào)查,個(gè)群,由于群內(nèi)的單元全部參與調(diào)查,第第i i個(gè)群的總值為:個(gè)群的總值為:), 2 , 1(0NiMMZii.1iMiijiyy 根據(jù)上節(jié)講到的漢森根據(jù)上節(jié)講到的漢森赫維茨估計(jì)量,赫維茨估計(jì)量,PPSPPS整群整群抽樣的總體總值估計(jì)量為:抽樣的總體總值估計(jì)量為:yMMynMZynYniiiniii01011我們知道,這是一個(gè)無偏估計(jì)。我們知道,這是一個(gè)無偏估計(jì)。估計(jì)量的方差是:估計(jì)量的方差是:21021)()(1)(YYMnMYZYZnYViNiiiiNii估計(jì)量方差的估計(jì)為:估計(jì)量方差的估計(jì)為:212021)() 1()(
18、) 1(1)(yynnMYZynnYviniiini【例【例5.35.3】 某企業(yè)欲估計(jì)上季度每位職工的平均病某企業(yè)欲估計(jì)上季度每位職工的平均病假天數(shù)。該企業(yè)共有假天數(shù)。該企業(yè)共有8 8個(gè)分廠工人數(shù)資料見下表,個(gè)分廠工人數(shù)資料見下表,現(xiàn)用不等概整群抽樣擬抽取三個(gè)分廠為樣本,并以現(xiàn)用不等概整群抽樣擬抽取三個(gè)分廠為樣本,并以95%95%的置信度計(jì)算其置信區(qū)間。有關(guān)數(shù)據(jù)及抽樣過程的置信度計(jì)算其置信區(qū)間。有關(guān)數(shù)據(jù)及抽樣過程如下:如下:分廠編號分廠編號職工人數(shù)職工人數(shù)累積區(qū)間累積區(qū)間1120011200245012011650321001651375048603751461052840461174506
19、191074519360739093619750832009751129508 8個(gè)分廠的職工人數(shù)資料個(gè)分廠的職工人數(shù)資料【解】 采用采用PPSPPS抽樣,利用隨機(jī)數(shù)表在數(shù)字抽樣,利用隨機(jī)數(shù)表在數(shù)字 1 11295012950之間隨機(jī)抽取之間隨機(jī)抽取3 3個(gè)數(shù),分別是個(gè)數(shù),分別是0201102011, 07972 07972和和1028110281,于是,于是3 3分廠、分廠、6 6分廠和分廠和8 8分廠入分廠入選樣本。用選樣本。用 分別表示三個(gè)分廠職工分別表示三個(gè)分廠職工的病假天數(shù),調(diào)查結(jié)果為:的病假天數(shù),調(diào)查結(jié)果為:321,yyy.5790,4160,4320321yyy431. 2)32
20、0097901910416021004320(3111110niiniiiynMynMYy同樣可求得估計(jì)量方差的估計(jì)值為:同樣可求得估計(jì)量方差的估計(jì)值為:0356. 0)() 1(1)()(2120yynnMYvyvnii其其95%的置信區(qū)間為:的置信區(qū)間為:80. 2 ,06. 237. 043. 20356. 096. 143. 2【評價(jià)】【評價(jià)】 對于群規(guī)模不等的整群抽樣,采用不等對于群規(guī)模不等的整群抽樣,采用不等概概PPS抽樣,可以得到總體目標(biāo)量的無偏估計(jì),估計(jì)抽樣,可以得到總體目標(biāo)量的無偏估計(jì),估計(jì)量和估計(jì)量方差都有比較簡明的形式,估計(jì)的效率量和估計(jì)量方差都有比較簡明的形式,估計(jì)的效
21、率也比較高,確實(shí)是值得優(yōu)先采用的方法。但是此方也比較高,確實(shí)是值得優(yōu)先采用的方法。但是此方法使用的條件是:在抽取樣本前,要了解有關(guān)群規(guī)法使用的條件是:在抽取樣本前,要了解有關(guān)群規(guī)模大小的信息。此外,抽樣過程比等概整群抽樣更模大小的信息。此外,抽樣過程比等概整群抽樣更為復(fù)雜。為復(fù)雜。5.3 多階段有放回不等概抽樣一、兩階段有放回不等概抽樣一、兩階段有放回不等概抽樣 抽樣方法:對初級單元進(jìn)行抽樣時(shí),先確定每個(gè)抽樣方法:對初級單元進(jìn)行抽樣時(shí),先確定每個(gè)初級單元的入樣概率。對被抽中的初級單元,再抽初級單元的入樣概率。對被抽中的初級單元,再抽取取 個(gè)二級單元。如果某個(gè)初級單元被抽中屢次,個(gè)二級單元。如果
22、某個(gè)初級單元被抽中屢次,那么將這那么將這 個(gè)二級單元放回,重新抽取個(gè)二級單元放回,重新抽取 個(gè)二級單個(gè)二級單元。元。當(dāng)然,這兩個(gè)樣本中的二級單元可能會有重復(fù)。在當(dāng)然,這兩個(gè)樣本中的二級單元可能會有重復(fù)。在實(shí)際調(diào)查時(shí),對重復(fù)的二級單元只調(diào)查一次,但計(jì)實(shí)際調(diào)查時(shí),對重復(fù)的二級單元只調(diào)查一次,但計(jì)算的時(shí)候,應(yīng)該按照被抽中的次數(shù)進(jìn)行重復(fù)計(jì)算。算的時(shí)候,應(yīng)該按照被抽中的次數(shù)進(jìn)行重復(fù)計(jì)算。imimim總體總值的估計(jì):先構(gòu)造初級單元總值總體總值的估計(jì):先構(gòu)造初級單元總值 的無偏的無偏估計(jì)估計(jì) 然后利用漢森然后利用漢森-赫魏茨估計(jì)量對總體總值赫魏茨估計(jì)量對總體總值Y進(jìn)行估計(jì):進(jìn)行估計(jì):iYiYniiiHHZY
23、nY11)()(1)(1221NiiiiiNiiHHZYVYZYZnYV21)() 1(1)(HHniiiHHYZYnnYv特別地特別地 記總體中所有二級單元數(shù)為記總體中所有二級單元數(shù)為 ,如果抽樣時(shí),如果抽樣時(shí)每個(gè)初級單元被抽中的概率與其擁有的二級單元數(shù)成每個(gè)初級單元被抽中的概率與其擁有的二級單元數(shù)成比例,即初級單元被抽中的概率為比例,即初級單元被抽中的概率為 第二第二階段對二級單元進(jìn)行簡單隨機(jī)抽樣,則階段對二級單元進(jìn)行簡單隨機(jī)抽樣,則 ,樣本,樣本是自加權(quán)的,對總體總值的估計(jì)為:是自加權(quán)的,對總體總值的估計(jì)為:0M,/0MMZiimmi2120110100)() 1(yynnM)Yvynm
24、MynMyMYniiPPSnimjijniiHH 在實(shí)際調(diào)查中,如果初級單元大小不相等,人們通常喜歡在第一階段時(shí)按放回的與二級單元成比例的PPS抽樣,第二階段抽樣那么進(jìn)行簡單隨機(jī)抽樣,且每個(gè)初級單元的二級單元樣本都相同,這樣得到的樣本是自加權(quán)的,估計(jì)量的形式非常簡單。【例5.4 】某小區(qū)擁有某小區(qū)擁有10座高層建筑,每座高層建筑擁座高層建筑,每座高層建筑擁有的樓層數(shù)如下表有的樓層數(shù)如下表高層建筑高層建筑ABCDEFGHIJ樓層樓層1212161510161018162010座高層建筑的層數(shù) 我們用兩階段抽樣方法抽出我們用兩階段抽樣方法抽出10個(gè)樓層進(jìn)行調(diào)查,個(gè)樓層進(jìn)行調(diào)查,第一階段抽樣為放回的
25、按與每層建筑擁有的樓層成第一階段抽樣為放回的按與每層建筑擁有的樓層成比例的不等概抽取比例的不等概抽取5座建筑,第二階段按簡單隨機(jī)抽座建筑,第二階段按簡單隨機(jī)抽樣對每座建筑抽取兩個(gè)樓層。對樣對每座建筑抽取兩個(gè)樓層。對10個(gè)樓層居民人數(shù)個(gè)樓層居民人數(shù)的調(diào)查結(jié)果如下,試對小區(qū)總居民數(shù)進(jìn)行估計(jì),并的調(diào)查結(jié)果如下,試對小區(qū)總居民數(shù)進(jìn)行估計(jì),并給出估計(jì)的誤差。給出估計(jì)的誤差。初級樣本序號初級樣本序號12345居民數(shù)居民數(shù)18,1215,1819,1316,1016,11被選中的高層建筑序號及被選中的高層建筑序號及10個(gè)樓層的居民數(shù)個(gè)樓層的居民數(shù)【解】.625.9776)() 1()(8 .14145214
26、6214614825145.148,145, 2, 51200110110yynnMYvMYyymnMYyMmnniinimjijnimjij二、多階段有放回不等概抽樣 略) 參看教材P1745.3 不放回不等概抽樣一、PS 抽樣不放回不等概抽樣: 我們知道,假設(shè)采用放回抽樣,對總體參數(shù)的估計(jì)及其方差估計(jì)比較簡單,但樣本單元中可能有單元被抽中屢次.因此,放回抽樣得到的樣本其代表性比不放回抽樣差.在相同樣本量的條件下,放回抽樣的估計(jì)精度較低. 不放回不等概抽樣是指不放回的與單元大小成比例的概率抽樣.包含概率: 在不放回不等概抽樣中,每個(gè)單元入樣的概率 及任意兩個(gè)單元同時(shí)入樣的概率 統(tǒng)稱為包含概率
27、.iij對固定的 n ,包含概率滿足下面等式:nNii1iNijijn) 1( ) 1(211nnNiNijij如果每個(gè)單元入樣概率與其大小iM嚴(yán)格成比例,0MMZii記則對于固定的 n ,有iinZ 這時(shí),我們簡稱這種情形的抽樣為嚴(yán)格的PS抽樣。求得,只有在 n=2 時(shí)才有一些實(shí)用的方法。嚴(yán)格的PS抽樣實(shí)施起來非常復(fù)雜, 不易ij二、赫魏慈湯普森估計(jì)量 對于不放回不等概抽樣,其總體總量Y的估計(jì)是:赫魏慈湯普森估計(jì):niiiHTyY1i為第i個(gè)單元的包含概率.其中如果), 2 , 1(0Nii則YYHT是的無偏估計(jì),它的方差為:NiNijjijijiijiNiiiHTyyYYV12121)(如
28、果 n 固定,則21)()(jjiiNiNijijjiHTYYYV【例5.3】假設(shè)有5個(gè)居委會,每個(gè)居委會的住戶數(shù)X,但常住居民人數(shù)未知,我們從這5個(gè)居委會抽出兩個(gè)來估計(jì)常住居民的總?cè)藬?shù),調(diào)查數(shù)據(jù)如下表.i住戶數(shù)(X)常住人數(shù)(Y)包含概率( )140011000.822506000.532005000.441002400.2550800.110002520-i上面表中的包含概率為上面表中的包含概率為: :01XXnXXniNiiii 從從5 5個(gè)居委會中不放回地抽出個(gè)居委會中不放回地抽出2 2個(gè)居委會個(gè)居委會, ,無論是無論是不放回不等概抽樣還是簡單隨機(jī)抽樣不放回不等概抽樣還是簡單隨機(jī)抽樣,
29、 ,共有共有1010種不同種不同的樣本的樣本, ,我們用這些樣本分別利用霍維茨我們用這些樣本分別利用霍維茨湯普森估湯普森估計(jì)計(jì)算及簡單隨機(jī)抽樣簡單估計(jì)計(jì)算對總量的估計(jì)計(jì)計(jì)算及簡單隨機(jī)抽樣簡單估計(jì)計(jì)算對總量的估計(jì), ,計(jì)算結(jié)果列于下表計(jì)算結(jié)果列于下表. .樣本1,2257542501,3262540001,4257533501,5217529502,3245027502,4240021002,5200017003,4245018503,5205014504,52000800psYsrsY不同估計(jì)量的估計(jì)結(jié)果 從理論上來說從理論上來說, , 和和 都是無偏的都是無偏的, ,它們的它們的均值是均值是
30、2520.2520. 本例題的結(jié)果表明:不放回不等概赫魏慈本例題的結(jié)果表明:不放回不等概赫魏慈湯湯普森估計(jì)量比簡單隨機(jī)抽樣簡單估計(jì)更精確,其原普森估計(jì)量比簡單隨機(jī)抽樣簡單估計(jì)更精確,其原因是因是X X 和和Y Y 之間有較強(qiáng)的相關(guān)關(guān)系。之間有較強(qiáng)的相關(guān)關(guān)系。psYsrsY三、n不同情況下的嚴(yán)格PS抽樣我們在上面提到的嚴(yán)格PS抽樣,就是指 n 固定、嚴(yán)格不放回、包含概率i與單元大小成比例。即iinZ下面分別介紹一種適合于n=2和n2情形的嚴(yán)格的 抽樣。PS21iZ1 1、 的情形的情形在總體中只抽兩個(gè)單元,通常用逐個(gè)抽取法來保證抽樣是不放回的。我們可以采用幾種不同的抽樣方法。對總體所有的單元,如
31、果有 就可以采用布魯爾方法。2n布魯爾抽樣方法:按與iiiZZZ21)1 (成比例的概率抽取第一個(gè)單元,記為j ,按與jiZZ1成比例的概率抽取剩下的N-1個(gè)單元中抽取第二個(gè)單元.布魯爾方法的包含概率為:iiZ2NiiijijijiijZZZZZZ1)211)(21)(21 ()1 (4 對于總體總量估計(jì)可采用赫魏慈湯普森估計(jì)量:)(21jjiijjiiBZyZyyyY2)()(jjiiijijjiHTygsyyYv【例5.7】對于例5.6,如果抽樣是按布魯爾方法的,那么其所有可能樣本的包含概率如下表:樣本樣本1,225750.348791,326250.265741,425750.12457
32、1,521750.060902,324500.091352,424000.040482,520000.019383,424500.029073,520500.013844,520000.00588psYij我們可以按下述公式總體均值的估計(jì)及其方差:ijpspsYYE)(ijpspsYYYV2)()(2. n 2的情形一般采用水野法,也是一種逐個(gè)抽取方法,它以概率一般采用水野法,也是一種逐個(gè)抽取方法,它以概率,1) 1(nNnnNZNnZiii=1,2,N抽取第一個(gè)樣本單元抽取第一個(gè)樣本單元, ,在剩下的在剩下的N-1N-1個(gè)單元中個(gè)單元中, ,不放回不放回等概地抽出等概地抽出n-1n-1個(gè)樣本單元。為了保證每個(gè)個(gè)樣本單元。為了保證每個(gè)要求每個(gè)單元的大小滿足:要求每個(gè)單元的大小滿足:0iZ) 1() 1(0NnMnMi四、幾種非嚴(yán)格PS抽樣1.耶茨格隆迪逐個(gè)抽取法:每次都以與未入樣的單元的iZiZ成比例的概率抽樣,即以抽取第一個(gè)單元,不妨記被抽中的單元為第1個(gè);11ZZi以在剩下的N-1個(gè)單元中抽取第二個(gè)樣本單元;不妨記被抽中的單元為第2個(gè);以211ZZZi
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 傳染病防控的試題及答案全解
- 自考行政管理2025年試題及答案分享
- 行政管理環(huán)境適應(yīng)試題及答案
- 不同類型藥物的配伍與禁忌試題及答案
- 行政法學(xué)與社會變革的互動分析試題及答案
- 行政管理學(xué)科試題及答案分享
- 2025年通識教育衛(wèi)生資格考試試題及答案
- 經(jīng)濟(jì)法概論考試簡明框架試題及答案
- 雙向理解2025年護(hù)士試題及答案
- 深入看待自考行政管理的試題與答案
- 2024年計(jì)算機(jī)考試-ISTQB認(rèn)證考試近5年真題附答案
- 設(shè)備、材料供應(yīng)方案
- 2025屆高考英語:閱讀理解及完型??贾攸c(diǎn)高頻(帶音標(biāo))500詞素材
- 環(huán)保督察課件教學(xué)課件
- 2024年五年級英語下冊 Module 8 Unit 2 I made a kite教案 外研版(三起)
- DL∕T 1396-2014 水電建設(shè)項(xiàng)目文件收集與檔案整 理規(guī)范
- DL∕T 1250-2013 氣體絕緣金屬封閉開關(guān)設(shè)備帶電超聲局部放電檢測應(yīng)用導(dǎo)則
- T-CSAE 176-2021 電動汽車電驅(qū)動總成噪聲品質(zhì)測試評價(jià)規(guī)范
- 《新能源汽車地下停放場所消防安全管理規(guī)范》編制說明
- SL+336-2006水土保持工程質(zhì)量評定規(guī)程
- 信息化戰(zhàn)爭的論文3000字(合集三篇)
評論
0/150
提交評論