g3.109912.3抽樣方法、總體分布的估計(jì)doc_第1頁(yè)
g3.109912.3抽樣方法、總體分布的估計(jì)doc_第2頁(yè)
g3.109912.3抽樣方法、總體分布的估計(jì)doc_第3頁(yè)
g3.109912.3抽樣方法、總體分布的估計(jì)doc_第4頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、12.3抽樣方法、總體分布的估計(jì)一、知識(shí)梳理(一)抽樣1. 簡(jiǎn)單隨機(jī)抽樣: 設(shè)一個(gè)總體的個(gè)體數(shù)為 N如果通過逐個(gè)抽取的方法從中抽取一個(gè)樣本,且每次抽取時(shí)各個(gè)個(gè)體被抽到的概率相等,就稱這樣的抽樣為簡(jiǎn)單隨機(jī)抽樣用簡(jiǎn)單隨機(jī)抽樣從含有N 個(gè)個(gè)體的總體中抽取一個(gè)容量為n的樣本時(shí),每次抽取一個(gè)個(gè)體時(shí)任一個(gè)體被抽到的概率為1 ;在整個(gè)抽樣過程N(yùn)中各個(gè)個(gè)體被抽到的概率為n ; 簡(jiǎn)單隨機(jī)抽樣的特點(diǎn)是,逐個(gè)抽取,且各N個(gè)個(gè)體被抽到的概率相等;簡(jiǎn)單隨機(jī)抽樣方法, 體現(xiàn)了抽樣的客觀性與公平性,是其他更復(fù)雜抽樣方法的基礎(chǔ) (4). 簡(jiǎn)單隨機(jī)抽樣的特點(diǎn): 它是不放回抽樣;它是逐個(gè)地進(jìn)行抽??;它是一種等概率抽樣簡(jiǎn)單抽樣常用

2、方法:(1)抽簽法:先將總體中的所有個(gè)體 (共有 N 個(gè))編號(hào)(號(hào)碼可從 1 到 N),并把號(hào)碼寫在形狀、大小相同的號(hào)簽上(號(hào)簽可用小球、卡片、紙條等制作) ,然后將這些號(hào)簽放在同一個(gè)箱子里, 進(jìn)行均勻攪拌, 抽簽時(shí)每次從中抽一個(gè)號(hào)簽,連續(xù)抽取 n 次,就得到一個(gè)容量為 n 的樣本適用范圍:總體的個(gè)體數(shù)不多時(shí)優(yōu)點(diǎn):抽簽法簡(jiǎn)便易行,當(dāng)總體的個(gè)體數(shù)不太多時(shí)適宜采用抽簽法(2)隨機(jī)數(shù)表法 : 隨機(jī)數(shù)表抽樣 “三步曲”:第一步, 將總體中的個(gè)體編號(hào);第二步,選定開始的數(shù)字;第三步,獲取樣本號(hào)碼2.系統(tǒng)抽樣 : 當(dāng)總體中的個(gè)體數(shù)較多時(shí),可將總體分成均衡的幾個(gè)部分,然后按預(yù)先定出的規(guī)則, 從每一部分抽取一

3、個(gè)個(gè)體, 得到需要的樣本, 這種抽樣叫做系統(tǒng)抽樣 系統(tǒng)抽樣的步驟: 采用隨機(jī)的方式將總體中的個(gè)體編號(hào) 為簡(jiǎn)便起見,有時(shí)可直接采用個(gè)體所帶有的號(hào)碼, 如考生的準(zhǔn)考證號(hào)、 街道上各戶的門牌號(hào),等等為將整個(gè)的編號(hào)分段 (即分成幾個(gè)部分),要確定分段的間隔k 當(dāng)Nn( N為總體中的個(gè)體的個(gè)數(shù), n 為樣本容量)是整數(shù)時(shí), k= N ; 當(dāng) N 不是整數(shù)時(shí),nn通過從總體中剔除一些個(gè)體使剩下的總體中個(gè)體的個(gè)數(shù)N 能被 n 整除,這時(shí)k= N . 在第一段用簡(jiǎn)單隨機(jī)抽樣確定起始的個(gè)體編號(hào)l按照事先確定的規(guī)n則抽取樣本(通常是將 l 加上間隔 k,得到第 2 個(gè)編號(hào) l +k, 第 3 個(gè)編號(hào) l +2k,

4、這樣繼續(xù)下去,直到獲取整個(gè)樣本)系統(tǒng)抽樣適用于總體中的個(gè)體數(shù)較多的情況,它與簡(jiǎn)單隨機(jī)抽樣的聯(lián)系在于:將總體均分后的每一部分進(jìn)行抽樣時(shí),采用的是簡(jiǎn)單隨機(jī)抽樣;與簡(jiǎn)單隨機(jī)抽樣一樣,系統(tǒng)抽樣是等概率抽樣,它是客觀的、公平的總體中的個(gè)體數(shù)恰好能被樣本容量整除時(shí),可用它們的比值作為系統(tǒng)抽樣的間隔;當(dāng)總體中的個(gè)體數(shù)不能被樣本容量整除時(shí), 可用簡(jiǎn)單隨機(jī)抽樣先從總體中剔除少量個(gè)體,使剩下的個(gè)體數(shù)能被樣本容量整除在進(jìn)行系統(tǒng)抽樣3.分層抽樣 : 當(dāng)已知總體由差異明顯的幾部分組成時(shí),為了使樣本更充分地反映總體的情況,常將總體分成幾部分,然后按照各部分所占的比例進(jìn)行抽樣,這種抽樣叫做分層抽樣,所分成的部分叫做層常用的

5、抽樣方法及它們之間的聯(lián)系和區(qū)別:類別共同點(diǎn)各自特點(diǎn)相互聯(lián)系適用范圍簡(jiǎn)單隨機(jī)從總體中逐個(gè)抽取總體中的個(gè)數(shù)比較抽樣少抽樣過程中將總體均勻分成幾在起始部分抽樣個(gè)部分,按照事先確總體中的個(gè)數(shù)比較系統(tǒng)抽樣每個(gè)個(gè)體被時(shí)采用簡(jiǎn)單隨機(jī)定的規(guī)則在各部分多抽取的概率抽樣抽取是相同的各層抽樣時(shí)采用將總體分成幾層,分總體由差異明顯的分層抽樣簡(jiǎn)單抽樣或者相層進(jìn)行抽取幾部分組成同抽樣不放回抽樣和放回抽樣: 在抽樣中,如果每次抽出個(gè)體后不再將它放回總體,稱這樣的抽樣為 不放回抽樣 ;如果每次抽出個(gè)體后再將它放回總體,稱這樣的抽樣為放回抽樣 隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣都是不放回抽樣(二)總體分布1.總體:在數(shù)理統(tǒng)計(jì)中,通常

6、把被研究的對(duì)象的全體叫做總體.2.頻率分布:用樣本估計(jì)總體,是研究統(tǒng)計(jì)問題的基本思想方法,樣本中所有數(shù)據(jù)(或數(shù)據(jù)組)的頻數(shù)和樣本容量的比,就是該數(shù)據(jù)的頻率.所有數(shù)據(jù)(或數(shù)據(jù)組)的頻率的分布變化規(guī)律叫做樣本的頻率分布 .可以用樣本 頻率表 、樣本頻率分布 條形圖 或頻率分布 直方圖來表示 .3.總體分布:從總體中抽取一個(gè)個(gè)體,就是一次隨機(jī)試驗(yàn),從總體中抽取一個(gè)容量為n的樣本, 就是進(jìn)行了 n 次試驗(yàn), 試驗(yàn)連同所出現(xiàn)的結(jié)果叫隨機(jī)事件, 所有這些事件的概率分布規(guī)律稱為總體分布 .4. 總體密度曲線 : 樣本容量越大, 所分組數(shù)越多, 各組的頻率就越接近于總體在相應(yīng)各組取值的概率 設(shè)想樣本容量無限增

7、大, 分組的組距無限縮小, 那么頻率分布直方圖就會(huì)無限接近于一條光滑曲線 , 這條曲線叫做 總體密度曲線 頻率 /組距總體密度曲線單位Oab它反映了總體在各個(gè)范圍內(nèi)取值的概率根據(jù)這條曲線,可求出總體在區(qū)間 (a,b內(nèi)取值的概率等于總體密度曲線,直線x a,x b 及 x 軸所圍圖形的面)=積二、基礎(chǔ)訓(xùn)練1.一個(gè)總體中共有 10個(gè)個(gè)體,用簡(jiǎn)單隨機(jī)抽樣的方法從中抽取一容量為3 的樣本,則某特定個(gè)體入樣的概率是C3B.3C. 3D.1A.C103109810102.( 2004 年江蘇, 6)某校為了了解學(xué)生的課外閱讀情況,隨機(jī)調(diào)查了50 名學(xué)生,得到他們?cè)谀骋惶旄髯哉n外閱讀所用時(shí)間的數(shù)據(jù),結(jié)果用下

8、面的條形圖表示.根據(jù)條形圖可得這50 名學(xué)生這一天平均每人的課外閱讀時(shí)間為B人數(shù) (人)20151050 0.5 1.01.5 2.0時(shí)間 (小時(shí) )A.0.6 hB.0.9 hC.1.0 hD.1.5 h3.一個(gè)年級(jí)有12 個(gè)班,每個(gè)班有50 名同學(xué),隨機(jī)編號(hào)為 1 50 號(hào),為了了解他們?cè)谡n外的興趣愛好,要求每班的33 號(hào)學(xué)生留下來參加閱卷調(diào)查,這里運(yùn)用的抽樣方法是DA. 分層抽樣法B. 抽簽法C.隨機(jī)數(shù)表法D. 系統(tǒng)抽樣法4.為調(diào)查參加運(yùn)動(dòng)會(huì)的1000 名運(yùn)動(dòng)員的年齡情況,從中抽查了100名運(yùn)動(dòng)員的年齡,就這個(gè)問題來說,下列說法正確的是A.1000 名運(yùn)動(dòng)員是總體B. 每個(gè)運(yùn)動(dòng)員是個(gè)體C

9、.抽取的 100 名運(yùn)動(dòng)員是樣本D. 樣本容量是 100解析:這個(gè)問題我們研究的是運(yùn)動(dòng)員的年齡情況.因此應(yīng)選 D.答案: D5.一個(gè)容量為n 的樣本,分成若干組,已知某數(shù)的頻數(shù)和頻率分別為40、 0.125,則 n的值為A.640B.320C.240D.160解析: 40 =0.125, n=320.故選 B.n答案: B6.某單位有老年人27 人,中年人54 人,青年人81 人,為了調(diào)查他們的健康狀況,需從他們中抽取一個(gè)容量為36 的樣本,在簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣這三種方法中較合適的抽樣方法是_.解析:要研究的總體里各部分情況差異較大,因此用分層抽樣.答案:分層抽樣5.某班學(xué)生在一

10、次數(shù)學(xué)考試中成績(jī)分布如下表:分?jǐn)?shù)段 0,80) 80, 90)90,100)人數(shù)256分?jǐn)?shù)段100 ,110) 110,120 ) 120, 130)人數(shù)8126分?jǐn)?shù)段 130, 140) 140, 150)人數(shù)42那么分?jǐn)?shù)在 100,110)中的頻率和分?jǐn)?shù)不滿110 分的累積頻率分別是 _、_(精確到0.01) .解析:由頻率計(jì)算方法知:總?cè)藬?shù)=45.分?jǐn)?shù)在 100,110)中的頻率為8=0.178 0.18.45分?jǐn)?shù)不滿 110 分的累積頻率為25 68=21 0.47.4545答案: 0.180.47三、例題剖析【例 1】 ( 2004 年湖南, 5)某公司在甲、乙、丙、丁四個(gè)地區(qū)分別有

11、150 個(gè)、 120 個(gè)、180 個(gè)、 150 個(gè)銷售點(diǎn) .公司為了調(diào)查產(chǎn)品銷售的情況,需從這600 個(gè)銷售點(diǎn)中抽取一個(gè)容量為 100 的樣本,記這項(xiàng)調(diào)查為;在丙地區(qū)中有20 個(gè)特大型銷售點(diǎn),要從中抽取7 個(gè)調(diào)查其銷售收入和售后服務(wù)情況,記這項(xiàng)調(diào)查為.則完成、這兩項(xiàng)調(diào)查宜采用的抽樣方法依次是A. 分層抽樣法,系統(tǒng)抽樣法B. 分層抽樣法,簡(jiǎn)單隨機(jī)抽樣法C.系統(tǒng)抽樣法,分層抽樣法D. 簡(jiǎn)單隨機(jī)抽樣法,分層抽樣法剖析:此題為抽樣方法的選取問題.當(dāng)總體中個(gè)體較多時(shí)宜采用系統(tǒng)抽樣;當(dāng)總體中的個(gè)體差異較大時(shí),宜采用分層抽樣;當(dāng)總體中個(gè)體較少時(shí),宜采用隨機(jī)抽樣.依據(jù)題意,第項(xiàng)調(diào)查應(yīng)采用分層抽樣法、第項(xiàng)調(diào)查應(yīng)

12、采用簡(jiǎn)單隨機(jī)抽樣法.故選 B.答案: B評(píng)述:采用什么樣的抽樣方法要依據(jù)研究的總體中的個(gè)體情況來定.【例 2】 ( 2004 年福建, 15)一個(gè)總體中有100 個(gè)個(gè)體,隨機(jī)編號(hào)為0, 1, 2,99,依編號(hào)順序平均分成10 個(gè)小組,組號(hào)依次為1, 2, 3, 10.現(xiàn)用系統(tǒng)抽樣方法抽取一個(gè)容量為 10 的樣本,規(guī)定如果在第1 組隨機(jī)抽取的號(hào)碼為m,那么在第 k 小組中抽取的號(hào)碼個(gè)位數(shù)字與m+k 的個(gè)位數(shù)字相同 .若 m=6 ,則在第 7 組中抽取的號(hào)碼是 _.剖析:此問題總體中個(gè)體的個(gè)數(shù)較多,因此采用系統(tǒng)抽樣.按題目中要求的規(guī)則抽取即可 . m=6, k=7 ,m+k=13 ,在第7 小組中

13、抽取的號(hào)碼是 63.答案: 63評(píng)述:當(dāng)總體中個(gè)體個(gè)數(shù)較多而差異又不大時(shí)可采用系統(tǒng)抽樣.采用系統(tǒng)抽樣在每小組內(nèi)抽取時(shí)應(yīng)按規(guī)則進(jìn)行 .【例 3】 把容量為100 的某個(gè)樣本數(shù)據(jù)分為10 組,并填寫頻率分布表,若前七組的累積頻率為 0.79,而剩下三組的頻數(shù)成公比大于2 的整數(shù)等比數(shù)列, 則剩下三組中頻數(shù)最高的一組的頻數(shù)為 _.剖析:已知前七組的累積頻率為 0.79,而要研究后三組的問題, 因此應(yīng)先求出后三組的頻率之和為 1 0.79=0.21 ,進(jìn)而求出后三組的共有頻數(shù),或者先求前七組共有頻數(shù)后,再計(jì)算后三組的共有頻數(shù).由已知知前七組的累積頻數(shù)為0.79 × 100=79 ,故后三組共

14、有的頻數(shù)為21,依題意a (1q3 )21) =21. a1=1, q=4.后三組頻數(shù)最高的一組的頻數(shù)為16.1q=21, a1( 1+q+q答案: 16評(píng)述:此題剖析只按第二種思路給出了解答,你能按第一種思路來解嗎?【例 4】 對(duì)某電子元件進(jìn)行壽命追蹤調(diào)查,情況如下:壽命( h)100 200200 300300400400 500500 600個(gè) 數(shù)2030804030( 1)列出頻率分布表;( 2)畫出頻率分布直方圖和累積頻率分布圖;( 3)估計(jì)電子元件壽命在100 400 h 以內(nèi)的概率;( 4)估計(jì)電子元件壽命在400 h 以上的概率 .剖析:通過本題可掌握總體分布估計(jì)的各種方法和步

15、驟.解:( 1)頻率分布表如下:壽命( h)頻 數(shù)頻 率累積頻率100200200.100.10200300300.150.25300400800.400.65400500400.200.85500600300.151合 計(jì)2001( 2)頻率分布直方圖如下:頻率組距100200300400 5 00600壽命 ( h)累積頻率1. 000. 800. 600. 400. 20100200 300 400 500 600 壽命 ( h)( 3)由累積頻率分布圖可以看出,壽命在 100 400 h 內(nèi)的電子元件出現(xiàn)的頻率為0.65,所以我們估計(jì)電子元件壽命在100 400 h 內(nèi)的概率為 0.6

16、5.( 4)由頻率分布表可知,壽命在400 h 以上的電子元件出現(xiàn)的頻率為0.20+0.15=0.35 ,故我們估計(jì)電子元件壽命在400 h 以上的概率為 0.35.評(píng)述:畫頻率分布條形圖、直方圖時(shí)要注意縱、橫坐標(biāo)軸的意義.【例 5】 某批零件共 160 個(gè),其中,一級(jí)品 48 個(gè),二級(jí)品64 個(gè),三級(jí)品 32 個(gè),等外品 16 個(gè) .從中抽取一個(gè)容量為 20 的樣本 .請(qǐng)說明分別用簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣和分層抽樣法抽取時(shí)總體中的每個(gè)個(gè)體被取到的概率均相同.【例 6】一個(gè)容量為100 的樣本,數(shù)據(jù)的分組和各組的一些相關(guān)信息如下:分 組頻數(shù)頻 率累積頻率 12, 15)6 15, 18)0.08

17、 18, 21)0.30 21, 24)21 24, 27)0.69 27, 30)1630,330.10 33, 36)1.00合 計(jì)1001.00( 1)完成上表;( 2)畫出頻率分布直方圖和累積頻率分布圖;( 3)根據(jù)累積頻率分布圖,總體中小于22 的樣本數(shù)據(jù)大約占多大的百分比?四、同步練習(xí)g3.1099抽樣方法、總體分布的估計(jì)1某公司甲、乙、丙、丁四個(gè)地區(qū)分別有150 個(gè)、 120 個(gè)、 180 個(gè)、 150 個(gè)銷售點(diǎn)公司為了調(diào)查產(chǎn)品銷售的情況,需從這 600 個(gè)銷售點(diǎn)中抽取一個(gè)容量為100 的樣本, 記這項(xiàng)調(diào)查為;在丙地區(qū)中有20 個(gè)特大型銷售點(diǎn),要從中抽取7 個(gè)調(diào)查其收入和售后服務(wù)

18、等情況,記這項(xiàng)調(diào)查為 則完成、 這兩項(xiàng)調(diào)查宜采用的抽樣方法依次是( B)( A) 分層抽樣法,系統(tǒng)抽樣法( B) 分層抽樣法,簡(jiǎn)單隨機(jī)抽樣法(C ) 系統(tǒng)抽樣法,分層抽樣法( D ) 簡(jiǎn)單隨機(jī)抽樣法,分層抽樣法2已知樣本方差由 s21102,求得,則 x1 x2x1050(xi 5)10 i 13設(shè)有 n 個(gè)樣本 x1 , x2 , xn ,其標(biāo)準(zhǔn)差為 sx ,另有 n 個(gè)樣本 y1 , y2 , yn ,且 yk3xk5(k1,2, n) ,其標(biāo)準(zhǔn)差為 sy ,則下列關(guān)系正確的是(B )( A) sy 3sx 5( B) sy3sx(C ) s3s(D ) sy3sx5yx4某校為了了解學(xué)生

19、的課外閱讀情況,隨機(jī)調(diào)查了50人數(shù) (人)名學(xué)生, 得到他們?cè)谀骋惶旄髯哉n外閱讀所用時(shí)間的數(shù)據(jù),結(jié)果用右側(cè)的條形圖表示. 根據(jù)條形圖可20得這 50 名學(xué)生這一天平均每人的課外閱讀時(shí)間為15(B)(A) 0.6 小時(shí)( B)(C) 1.0 小時(shí)( D)100.9 小時(shí)51.5 小時(shí)5 x 是 x1, x2, x100 的平均數(shù), a 是 x1, x2, x40 的平00.51.01.52.0時(shí)間 (小時(shí) )均數(shù), b 是 x41 , x42 , x100的平均數(shù), 則 x , a , b40a60b之間的關(guān)系為 x1006某校有老師 200 人,男學(xué)生1200 人,女學(xué)生 1000 人 .現(xiàn)用分層抽樣的方法從所有師生中抽取一個(gè)容量為 n 的樣本;已知從女學(xué)生中抽取的人數(shù)為80 人,則 n1127一個(gè)總體中有100 個(gè)個(gè)體,隨機(jī)編號(hào)0, 1,2, 99,依編號(hào)順序平均分成10 個(gè)小組,組號(hào)依次為1,2, 3, 10.現(xiàn)用系統(tǒng)抽樣方法抽取一個(gè)容量為10 的樣本,規(guī)定如果在第 1 組隨機(jī)抽取的號(hào)碼為m ,那么在第 k 組中抽取的號(hào)碼個(gè)位數(shù)字與mk 的個(gè)位數(shù)字相同,若 m 6 ,則在第 7 組中抽取的號(hào)碼是638在樣本的頻率分布直方圖中,共有11個(gè)小長(zhǎng)方形,若中間一個(gè)小長(zhǎng)方形的面積等于其他 10個(gè)小長(zhǎng)方形的面積之和的1 ,且樣本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論