自考概率論與數(shù)理統(tǒng)計(jì)_第1頁(yè)
自考概率論與數(shù)理統(tǒng)計(jì)_第2頁(yè)
自考概率論與數(shù)理統(tǒng)計(jì)_第3頁(yè)
自考概率論與數(shù)理統(tǒng)計(jì)_第4頁(yè)
自考概率論與數(shù)理統(tǒng)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一章 統(tǒng)計(jì)量及其抽樣分布6.1總體與樣本6.1.1總體與個(gè)體在一個(gè)統(tǒng)計(jì)問題中,我們把研究對(duì)象的全體稱為總體,構(gòu)成總體的每個(gè)成員稱為個(gè)體。對(duì)多數(shù)實(shí)際問題。總體中的個(gè)體是一些實(shí)在的人或物。比如,我們要研究某大學(xué)的學(xué)生身高情況,則該大學(xué)的全體學(xué)生構(gòu)成問題的總體,而每一個(gè)學(xué)生即是一個(gè)個(gè)體。事實(shí)上,每個(gè)學(xué)生有許多特征:性別、年齡、身高、體重、民族、籍貫等。而在該問題中,我們關(guān)心的只是該校學(xué)生的身高如何,對(duì)其他的特征暫不予以考慮。這樣,每個(gè)學(xué)生(個(gè)體)所具有的數(shù)量指標(biāo)值身高就是個(gè)體,而將所有身高全體看成總體。這樣一來,若拋開實(shí)際背景,總體就是一堆數(shù),這堆數(shù)中有大有小,有的出現(xiàn)的機(jī)會(huì)多,有的出現(xiàn)的機(jī)會(huì)少,

2、因此用一個(gè)概率分布去描述和歸納總體是恰當(dāng)?shù)?。從這個(gè)意義上看,總體就是一個(gè)分布,而其數(shù)量指標(biāo)就是服從這個(gè)分布的隨機(jī)變量。以后說“從總體中抽樣”與“從某分布中抽樣”是同一個(gè)意思。例6-1考察某廠的產(chǎn)品質(zhì)量,將其產(chǎn)品只分為合格品與不合格品,并以0記合格品,以1記不合格品,則總體該廠生產(chǎn)的全部合格品與不合格品由0或1組成的一堆數(shù)。若以p表示這堆數(shù)中1的比例(不合格品率),則該總體可由一個(gè)二點(diǎn)分布表示:不同的p反映了總體間的差異。例如,兩個(gè)生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品總體分布為:我們可以看到,第一個(gè)工廠的產(chǎn)品質(zhì)量?jī)?yōu)于第二個(gè)工廠。實(shí)際中,分布中的不合格品率是未知的,如何對(duì)之進(jìn)行估計(jì)是統(tǒng)計(jì)學(xué)要研究的問題。6.1

3、.2樣本為了了解總體的分布,我們從總體中隨機(jī)地抽取n個(gè)個(gè)體,記其指標(biāo)值為x1,x2,xn,則x1,x2,xn稱為總體的一個(gè)樣本,n稱為樣本容量,或簡(jiǎn)稱樣本量,樣本中的個(gè)體稱為樣品。我們首先指出,樣本具有所謂的二重性:一方面,由于樣本是從總體中隨機(jī)抽取的,抽取前無法預(yù)知它們的數(shù)值,因此,樣本是隨機(jī)變量,用大寫字母X1,X2,Xn表示;另一方面,樣本在抽取以后經(jīng)觀測(cè)就有確定的觀測(cè)值,因此,樣本又是一組數(shù)值。此時(shí)用小寫字母x1,x2,xn表示是恰當(dāng)?shù)摹:?jiǎn)單起見,無論是樣本還是其觀測(cè)值,本書中樣本一般均用x1,x2,xn表示,讀者應(yīng)能從上下文中加以區(qū)別。例6-2啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640g

4、,由于隨機(jī)性,事實(shí)上不可能使得所有的啤酒凈含量均為640g ,現(xiàn)從某廠生產(chǎn)的啤酒中隨機(jī)抽取10瓶測(cè)定其凈含量,得到如下結(jié)果: 641635640637642638645643639640這是一個(gè)容量為10的樣本的觀測(cè)值。對(duì)應(yīng)的總體為該廠生產(chǎn)的瓶裝啤酒的凈含量。【答疑編號(hào):10060101針對(duì)該題提問】從總體中抽取樣本時(shí),為使樣本具有代表性,抽樣必須是隨機(jī)抽樣。通??梢杂秒S機(jī)數(shù)表來實(shí)現(xiàn)隨機(jī)抽樣。還要求抽樣必須是獨(dú)立的,即每次的結(jié)果互不影響。在概率論中,在有限總體(只有有限個(gè)個(gè)體的總體)中進(jìn)行有放回抽樣,是獨(dú)立的隨機(jī)抽樣;然而,若為不放回抽樣,則是不獨(dú)立的抽樣。但 當(dāng)總體容量N很大但樣本容量n較小

5、時(shí),不放回抽樣可以近似地看做放回抽樣,即可近似看做獨(dú)立隨機(jī)抽樣。下面,我們假定抽樣方式總滿足獨(dú)立隨機(jī)抽樣的條件。從總體中抽取樣本可以有不同的抽法,為了能由樣本對(duì)總體做出較可靠的推斷,就希望樣本能很好地代表總體。這就需要對(duì)抽樣方法提出一些要求,最常用的 “簡(jiǎn)單隨機(jī)抽樣”有如下兩個(gè)要求:(1)樣本具有隨機(jī)性,即要求總體中每一個(gè)個(gè)體都有同等機(jī)會(huì)被選入樣本,這便意味著每一樣品xi與總體X有相同的分布。(2)樣本要有獨(dú)立性,即要求樣本中每一樣品的取值不影響其他樣品的取值,這意味著x1,x2,xn相互獨(dú)立。用簡(jiǎn)單隨機(jī)抽樣方法得到的樣本稱為簡(jiǎn)單隨機(jī)樣本,也簡(jiǎn)稱樣本。除非特別指明,本書中的樣本皆為簡(jiǎn)單隨機(jī)樣本

6、。于是,樣本x1,x2,xn可以看成是相互獨(dú)立的具有同一分布的隨機(jī)變量,其共同分布即為總體分布。 設(shè)總體X具有分布函數(shù)F(x), x1,x2,xn為取自該總體的容量為n的樣本,則樣本聯(lián)合分布函數(shù)為:若總體具有密度函數(shù)f(x),則樣本的聯(lián)合密度函數(shù)為若總體X為離散型隨機(jī)變量,則樣本的(聯(lián)合)概率函數(shù)為顯然,通常說的樣本分布是指多維隨機(jī)變量(x1,x2,xn)的聯(lián)合分布。例6-3為估計(jì)一物件的重量,用一架天平重復(fù)測(cè)量n次,得樣本x1,x2,xn,由于是獨(dú)立重復(fù)測(cè)量,x1,x2,xn是簡(jiǎn)單隨機(jī)樣本??傮w的分布即x1的分布(x1,x2,xn分布相同)。由于稱量誤差是均值(期望)為零的正態(tài)變量,所以x1

7、可認(rèn)為服從正態(tài)分布N(,2)(X1等于物件重量)加上稱量誤差,即x1的概率密度為這樣,樣本分布密度為。 【答疑編號(hào):10060102針對(duì)該題提問】例6-4設(shè)某種電燈泡的壽命X服從指數(shù)分布E(),其概率密度為:則來自這一總體的簡(jiǎn)單隨機(jī)樣本x1,x2,xn的樣本分布密度為【答疑編號(hào):10060103針對(duì)該題提問】例6-5考慮電話交換臺(tái)一小時(shí)內(nèi)的呼喚次數(shù)X。求來自這一總體的簡(jiǎn)單隨機(jī)樣本x1,x2,xn的樣本分布?!敬鹨删幪?hào):10060104針對(duì)該題提問】解由概率論知識(shí),X服從泊松分布P(),其概率函數(shù),(其中x是非負(fù)整數(shù)0,1,2,k,中的一個(gè))。從而,簡(jiǎn)單隨機(jī)樣本x1,x2,xn的樣本分布為:6.

8、2統(tǒng)計(jì)量及其分布6.2.1 統(tǒng)計(jì)量與抽樣分布樣本來自總體,樣本的觀測(cè)值中含有總體各方面的信息,但這些信息較為分散,有時(shí)顯得雜亂無章。為將這些分散在樣本中有關(guān)總體的信息集中起來以反映總體的各種特征,需要對(duì)樣本進(jìn)行加工。最常用的加工方法是構(gòu)造樣本的函數(shù),不同的函數(shù)反映總體的不同特征。 定義6-1 設(shè)x1,x2,xn為取自某總體的樣本,若樣本函數(shù)TT(x1,x2,xn)中不含有任何未知參數(shù),則稱T為統(tǒng)計(jì)量。統(tǒng)計(jì)量的分布稱為抽樣分布。按照這一定義,若x1,x2,xn為樣本,則,都是統(tǒng)計(jì)量,而當(dāng),2未知時(shí), 等均不是統(tǒng)計(jì)量。6.2.2樣本均值及其抽樣分布定義6-2 設(shè)x1,x2,xn為取自某總體的樣本,

9、其算術(shù)平均值稱為樣本均值,一般用表示,即。例6-6 某單位收集到20名青年人某月的娛樂支出費(fèi)用數(shù)據(jù):7984 8488 92 93 94 97 98 99100 101101102102 108110113118125 則該月這20名青年的平均娛樂支出為【答疑編號(hào):10060105針對(duì)該題提問】對(duì)于樣本均值的抽樣分布,我們有下面的定理。 定理6-1設(shè)x1,x2,xn是來自某個(gè)總體X的樣本, 為樣本均值。(1)若總體分布為N(2),則的精確分布為;(2)若總體X分布未知(或不是正態(tài)分布),且E(X)=,D(X)=2,則當(dāng)樣本容量n較大時(shí),的漸近分布為,這里的漸近分布是指n較大時(shí)的近似分布。證明(

10、1)由于為獨(dú)立正態(tài)變量線性組合,故仍服從正態(tài)分布。另外, 故 (2)易知為獨(dú)立、同分布的隨機(jī)變量之和,且 。由中心極限定理, ,其中(x)為標(biāo)準(zhǔn)正態(tài)分布。這表明n較大時(shí)的漸近分布為。6.2.3樣本方差與樣本標(biāo)準(zhǔn)差  定義6-3設(shè)x1,x2,xn為取自某總體的樣本,則它關(guān)于樣本均值的平均偏差平方和 稱為樣本方差,其算術(shù)根稱為樣本標(biāo)準(zhǔn)差。相對(duì)樣本方差而言,樣本標(biāo)準(zhǔn)差通常更有實(shí)際意義,因?yàn)樗c樣本均值具有相同的度量單位。在上面定義中,n為樣本容量,稱為偏差平方和,它有3個(gè)不同的表達(dá)式:事實(shí)上,偏差平方和的這3個(gè)表達(dá)式都可用來計(jì)算樣本方差。例6-7在例6-6中,我們已經(jīng)算得,其樣本方差與樣本

11、標(biāo)準(zhǔn)差為,。方法二s=11.57 31【答疑編號(hào):10060201針對(duì)該題提問】通常用第二種方法計(jì)算s2方便許多。下面的定理給出樣本均值的數(shù)學(xué)期望和方差以及樣本方差的數(shù)學(xué)期望,它不依賴于總體的分布形式。這些結(jié)果在后面的討論中是有用的。  定理6-2設(shè)總體X具有二階矩,即E(x)=,D(X)=2<+x1,x2,xn為從該總體得到的樣本,和s2分別是樣本均值和樣本方差,則 此定理表明,樣本均值的均值與總體均值相同,而樣本均值的方差是總體方差的。證明由于(1)(2)故(6.3.3)式成立。下證(6.3.4),注意到 ,而 ,于是 ,兩邊各除以n-1,即得(6.3.4)式。值得讀者注意

12、的是:本定理的結(jié)論與總體服從什么分布無關(guān)。6.2.4樣本矩及其函數(shù)樣本均值和樣本方差的更一般的推廣是樣本矩,這是一類常見的統(tǒng)計(jì)量。  定義6-4設(shè)x1,x2,xn是樣本,則統(tǒng)計(jì)量(6.3.5)稱為樣本k階原點(diǎn)矩,特別地,樣本一階原點(diǎn)矩就是樣本均值。統(tǒng)計(jì)量 (6.3.6) 稱為樣本k階中心矩。常見的是k=2的場(chǎng)合,此時(shí)稱為二階樣本中心矩。本書中我們將其記為sn2,以區(qū)別樣本方差S2。 6.2.5極大順序統(tǒng)計(jì)量和極小順序統(tǒng)計(jì)量  定義6-5設(shè)總體X具有分布函數(shù)F(x),分布密度f(x), x1,x2,xn為其樣本,我們分別稱X(1)=minx1,x2,xn,x(n)=maxx1

13、,x2,xn為極小順序統(tǒng)計(jì)量和極大順序統(tǒng)計(jì)量。定理6-3若x(1),x(n)分別為極小、極大順序統(tǒng)計(jì)量,則(1)x(1)的分布函數(shù)F1(x)=1-(1-F(x)n,x(1)的分布密度f1(x)=n-(1-F(x)n-1f(x) (2)x(n)的分布函數(shù)Fn(x)=F(x)n,x(n)的分布密度fn(x)=nF(x)n-1f(x) 證明 先求出x(1)及x(n)的分布函數(shù)F1(x)及Fn(x):,分別對(duì)F1(x),F(xiàn)n(x)求導(dǎo)即得6.2.6正態(tài)總體的抽樣分布有很多統(tǒng)計(jì)推斷是基于正態(tài)總體的假設(shè)的,以標(biāo)準(zhǔn)正態(tài)變量為基石而構(gòu)造的三個(gè)著名統(tǒng)計(jì)量(其抽樣分布分別為x2分布,t分布和F分布)在實(shí)踐中有著廣

14、泛的應(yīng)用。這是因?yàn)檫@三個(gè)統(tǒng)計(jì)量不僅有明確背景,而且其抽樣分布的密度函數(shù)有“明確的表達(dá)式”,它們被稱為統(tǒng)計(jì)中的“三大抽樣分布”。1. x2分布(卡方分布)  定義6-6設(shè)X1,X2,Xn獨(dú)立同分布于標(biāo)準(zhǔn)正態(tài)分布N(0,1),則x2=x12+xn2的分布稱為自由度為n的x2分布,記為x2 x2(n)。x2(n)分布的密度函數(shù)見圖6-4當(dāng)隨機(jī)變量x2 x2(n)時(shí),對(duì)給定的(0<<1),稱滿足px2>x2(n)=的x2(n)是自由度為n的開方分布的分位數(shù)。分位數(shù)x2(n)可以從附表4中查到。例如n=10,=0.05,那么從附表4中查得x2(10)=18.307p(x)2&

15、gt;x20.05(10)=px2>18.307=0.05注:請(qǐng)讀者注意x2x2(n)時(shí),n是自由度,不是容量。2.F分布  定義6-7 設(shè)x1x2(m),x2x2(n)X1與X2獨(dú)立,則稱的分布是自由度為m與n的F分布,記為FF(m,n),其中m稱為分子自由度,n稱為分母自由度。自由度為m與n的F分布的密度函數(shù)的圖像是一個(gè)只取非負(fù)值的偏態(tài)分布(見圖6-5)。當(dāng)隨機(jī)變量FF(m,n)時(shí),對(duì)給定的(0<<1),稱滿足PF>F(m,n)=的數(shù)F(m,n)是自由度為m與n的F分布的分位數(shù)。當(dāng)FF(m,n)時(shí),有下面性質(zhì)(不證),這說明(6.3.8)對(duì)小的,分位為F(

16、m,n)可以從附表5中查到,而分位數(shù)F1-(m,n)則可通過(6.3.8)式得到?!纠?-8】若取m=10,則n=5,=0.05,那么從附表5上(m=n1,n=n2)查得F0.05(10,5)=4.74利用(6.3.8 )式可得到【答疑編號(hào):10060202針對(duì)該題提問】3.t分布  定義6-8 設(shè)隨機(jī)變量與X1與X2獨(dú)立且X1N(0,1),X2X2(n),則稱的分布為自由度為n的t的分布,記為tt(n).t分布密度函數(shù)的圖像是一個(gè)關(guān)于縱軸對(duì)稱的分布(圖6-6),與標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)形態(tài)類似,只是峰比標(biāo)準(zhǔn)正態(tài)分布低一些,尾部的概率比標(biāo)準(zhǔn)正態(tài)分布的大一些。圖6-6 t分布與N(0,

17、1)的密度函數(shù)當(dāng)隨機(jī)變量tt(n)時(shí),稱滿足Pt>t(n)=的t(n)是自由度為n的t分布的分位數(shù),分位數(shù)t(n)可以從附表3中查到,例如當(dāng)n=10, =0.05時(shí),從附表3上查得t0.05(10)=1.8125由于t分布的密度函數(shù)關(guān)于0對(duì)稱,故其分位數(shù)有如下關(guān)系:t1-(n)=- t(n)例如,t0.95(10)=-t0.05(10)=-1.8125當(dāng)n很大時(shí),(n30),t分布可以用N(0,1)近似P(t>-t)=1-,p(t>t1-)=1-,t1-=-t4.一些重要結(jié)論來自一般正態(tài)總體的樣本均值 和樣本方差S2的抽樣分布是應(yīng)用最廣的抽樣分布,下面我們加以介紹。  定理6-4 設(shè)X1,X2,Xn是來自正態(tài)總體N(,2)的樣本,其樣本均值和樣本方差分別為:則有(1)與s2相互獨(dú)立;(2)特別,若(不證)推論:設(shè),21=22=2并記則(不證)本章小結(jié)本章的基本要求是(一)知道總體、樣本、簡(jiǎn)單樣本和統(tǒng)計(jì)量的概念(二)知道統(tǒng)計(jì)量和s2的下列性質(zhì)。E(s2)=2(三)若x的分布函數(shù)為F(x),分布函數(shù)為f(x),則樣本(x1,x2,xn)的聯(lián)合分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論