統(tǒng)計(jì)知識(shí)點(diǎn)及常見題型_第1頁(yè)
統(tǒng)計(jì)知識(shí)點(diǎn)及常見題型_第2頁(yè)
統(tǒng)計(jì)知識(shí)點(diǎn)及常見題型_第3頁(yè)
統(tǒng)計(jì)知識(shí)點(diǎn)及常見題型_第4頁(yè)
統(tǒng)計(jì)知識(shí)點(diǎn)及常見題型_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)知識(shí)點(diǎn)及常見題型1 .總體和樣本:在統(tǒng)計(jì)學(xué)中,把研究對(duì)象的全體叫做總體.把每個(gè)研究對(duì)象叫做個(gè)體.把總體中個(gè)體的總數(shù)叫做總體容量.為了研究總體H的有關(guān)性質(zhì),一般從總體中隨機(jī)抽取一部分:為,工?,-一,五研究,我們稱它為樣本.其中個(gè)體的個(gè)數(shù)稱為樣本容量.2 .簡(jiǎn)單隨機(jī)抽樣,也叫純隨機(jī)抽樣。就是從總體中不加任何分組、劃類、排隊(duì)等,完全隨機(jī)地抽取調(diào)查單位。特點(diǎn)是:每個(gè)樣本單位被抽中的可能性相同(概率相等),樣本的每個(gè)單位完全獨(dú)立,彼此間無(wú)一定的關(guān)聯(lián)性和排斥性。簡(jiǎn)單隨機(jī)抽樣是其它各種抽樣形式的基礎(chǔ)。通常只是在總體單位之間差異程度較小和數(shù)目較少時(shí),才采用這種方法。3 .簡(jiǎn)單隨機(jī)抽樣常用的方法:(1)抽

2、簽法;隨機(jī)數(shù)表法;計(jì)算機(jī)模擬法;使用統(tǒng)計(jì)軟件直接抽取。在簡(jiǎn)單隨機(jī)抽樣的樣本容量設(shè)計(jì)中,主要考慮:總體變異情況;允許誤差范圍;概率保證程度。4 .抽簽法:(1)給調(diào)查對(duì)象群體中的每一個(gè)對(duì)象編號(hào);(2)準(zhǔn)備抽簽的工具,實(shí)施抽簽(3)對(duì)樣本中的每一個(gè)個(gè)體進(jìn)行測(cè)量或調(diào)查例:請(qǐng)調(diào)查你所在的學(xué)校的學(xué)生做喜歡的體育活動(dòng)情況。5 .隨機(jī)數(shù)表法:例:利用隨機(jī)數(shù)表在所在的班級(jí)中抽取10位同學(xué)參加某項(xiàng)活動(dòng)。1 .系統(tǒng)抽樣(等距抽樣或機(jī)械抽樣):把總體的單位進(jìn)行排序,再計(jì)算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個(gè)樣本采用簡(jiǎn)單隨機(jī)抽樣的辦法抽取。K(抽樣距離)=N(總體規(guī)模)/n(樣本規(guī)模)前提條件:總體

3、中個(gè)體的排列對(duì)于研究的變量來(lái)說(shuō),應(yīng)是隨機(jī)的,即不存在某種與研究變量相關(guān)的規(guī)則分布。可以在調(diào)查允許的條件下,從不同的樣本開始抽樣,對(duì)比幾次樣本的特點(diǎn)。如果有明顯差別,說(shuō)明樣本在總體中的分布承某種循環(huán)性規(guī)律,且這種循環(huán)和抽樣距離重合。2 .系統(tǒng)抽樣,即等距抽樣是實(shí)際中最為常用的抽樣方法之一。因?yàn)樗鼘?duì)抽樣框的要求較低,實(shí)施也比較簡(jiǎn)單。更為重要的是,如果有某種與調(diào)查指標(biāo)相關(guān)的輔助變量可供使用,總體單元按輔助變量的大小順序排隊(duì)的話,使用系統(tǒng)抽樣可以大大提高估計(jì)精度。1 .分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標(biāo)志(性別、年齡等)劃分成若干類型或?qū)哟?,然后再在各個(gè)類型或?qū)哟沃胁捎煤?jiǎn)單隨機(jī)

4、抽樣或系用抽樣的辦法抽取一個(gè)子樣本,最后,將這些子樣本合起來(lái)構(gòu)成總體的樣本。兩種方法:1 .先以分層變量將總體劃分為若干層,再按照各層在總體中的比例從各層中抽取。2 .先以分層變量將總體劃分為若干層,再將各層中的元素按分層的順序整齊排列,最后用系統(tǒng)抽樣的方法抽取樣本。2 .分層抽樣是把異質(zhì)性較強(qiáng)的總體分成一個(gè)個(gè)同質(zhì)性較強(qiáng)的子總體,再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進(jìn)而代表總體。分層標(biāo)準(zhǔn):(1)以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn)。(2)以保證各層內(nèi)部同質(zhì)性強(qiáng)、各層之間異質(zhì)性強(qiáng)、突出總體內(nèi)在結(jié)構(gòu)的變量作為分層變量。(3)以那些有明顯分層區(qū)分的變量作為分層變

5、量。3 .分層的比例問題:(1)按比例分層抽樣:根據(jù)各種類型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比重來(lái)抽取子樣本的方法。(2)不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會(huì)非常少,此時(shí)采用該方法,主要是便于對(duì)不同層次的子總體進(jìn)行專門研究或進(jìn)行相互比較。如果要用樣本資料推斷總體時(shí),則需要先對(duì)各層的數(shù)據(jù)資料進(jìn)行加權(quán)處理,調(diào)整樣本中各層的比例,使數(shù)據(jù)恢復(fù)到總體中各層實(shí)際的比例結(jié)構(gòu)。2、樣本均值:XJ2,樣本標(biāo)準(zhǔn)差:s*xn(XiX)2 (X2 X)2(xn X)23.差用樣本估計(jì)總體時(shí),如果抽樣的方法比較合理,那么樣本可以反映總體的信息,但從樣本得到的信息會(huì)有偏在隨機(jī)抽樣中,這種偏差是不可

6、避免的。雖然我們用樣本數(shù)據(jù)得到的分布、均值和標(biāo)準(zhǔn)差并不是總體的真正的分布、均值和標(biāo)準(zhǔn)差,而只是一個(gè)估計(jì),但這種估計(jì)是合理的,特別是當(dāng)樣本量很大時(shí),它們確實(shí)反映了總體的信息。4.(1)如果把一組數(shù)據(jù)中的每一個(gè)數(shù)據(jù)都加上或減去同一個(gè)共同的常數(shù),標(biāo)準(zhǔn)差不變(2)如果把一組數(shù)據(jù)中的每一個(gè)數(shù)據(jù)乘以一個(gè)共同的常數(shù)k,標(biāo)準(zhǔn)差變?yōu)樵瓉?lái)的k倍(3)一組數(shù)據(jù)中的最大值和最小值對(duì)標(biāo)準(zhǔn)差的影響,區(qū)間(73s,x3s)的應(yīng)用;“去掉一個(gè)最高分,去掉一個(gè)最低分”中的科學(xué)道理1、概念:(1)回歸直線方程(2)回歸系數(shù)2.回歸直線方程的應(yīng)用(1)描述兩變量之間的依存關(guān)系;利用直線回歸方程即可定量描述兩個(gè)變量間依存的數(shù)量關(guān)系(

7、2)利用回歸方程進(jìn)行預(yù)測(cè);把預(yù)報(bào)因子(即自變量X)代入回歸方程對(duì)預(yù)報(bào)量(即因變量丫)進(jìn)行估計(jì),即可得到個(gè)體Y值的容許區(qū)間。(3)利用回歸方程進(jìn)行統(tǒng)計(jì)控制規(guī)定丫值的變化,通過(guò)控制X的范圍來(lái)實(shí)現(xiàn)統(tǒng)計(jì)控制的目標(biāo)。如已經(jīng)得到了空氣中NO2的濃度和汽車流量間的回歸方程,即可通過(guò)控制汽車流量來(lái)控制空氣中NO2的濃4.應(yīng)用直線回歸的注意事項(xiàng)(1)做回歸分析要有實(shí)際意義;(2)回歸分析前,最好先作出散點(diǎn)圖;(3)回歸直線不要外延。題型一選擇合適的抽樣方法簡(jiǎn)單隨機(jī)抽樣,也叫純隨機(jī)抽樣。就是從總體中不加任何分組、劃類、排隊(duì)等,完全隨機(jī)地抽取調(diào)查單位系統(tǒng)抽樣(等距抽樣或機(jī)械抽樣):把總體的單位進(jìn)行排序,再計(jì)算出抽樣

8、距離,然后按照這一固定的抽樣距離抽取樣本。第一個(gè)樣本采用簡(jiǎn)單隨機(jī)抽樣的辦法抽取。分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標(biāo)志(性別、年齡等)劃分成若干類型或?qū)哟?,然后再在各個(gè)類型或?qū)哟沃胁捎煤?jiǎn)單隨機(jī)抽樣或系用抽樣的辦法抽取一個(gè)子樣本,最后,將這些子樣本合起來(lái)構(gòu)成總體的樣本。1 .現(xiàn)有以下兩項(xiàng)調(diào)查:某裝訂廠平均每小時(shí)大約裝訂圖書362冊(cè),要求檢驗(yàn)員每小時(shí)抽取40冊(cè)圖書,檢查其裝訂質(zhì)量狀況;某市有大型、中型與小型的商店共1500家,三者數(shù)量之比為1:5:9.為了調(diào)查全市商店每日零售額情況,抽取其中15家進(jìn)行調(diào)查.完成、這兩項(xiàng)調(diào)查宜采用的抽樣方法依次是()A.簡(jiǎn)單隨機(jī)抽樣法,分層抽樣

9、法B.分層抽樣法,簡(jiǎn)單隨機(jī)抽樣法C.分層抽樣法,系統(tǒng)抽樣法D.系統(tǒng)抽樣法,分層抽樣法2 .某社區(qū)有400個(gè)家庭,其中高等收入家庭120戶,中等收入家庭180戶,低收入家庭100戶.為了調(diào)查社會(huì)購(gòu)買力的某項(xiàng)指標(biāo),要從中抽取一個(gè)容量為100的樣本記作;某校高一年級(jí)有12名女排球運(yùn)動(dòng)員,要從中選出3人調(diào)查學(xué)習(xí)負(fù)擔(dān)情況,記作;那么,完成上述2項(xiàng)調(diào)查應(yīng)采用的抽樣方法是()A.用隨機(jī)抽樣法,用系統(tǒng)抽樣法B.用分層抽樣法,用隨機(jī)抽樣法C.用系統(tǒng)抽樣法,用分層抽樣法D.用分層抽樣法,用系統(tǒng)抽樣法題型二:系統(tǒng)抽樣剔除個(gè)體數(shù)計(jì)算當(dāng)系統(tǒng)抽樣中樣本總量除以樣本容量不是整數(shù)時(shí),需要用簡(jiǎn)單隨機(jī)抽樣法剔除部分個(gè)體,剔除個(gè)體

10、的數(shù)量=樣本總量一組距冰羊本容量。例.若總體中含有1650個(gè)個(gè)體,現(xiàn)在要采用系統(tǒng)抽樣,從中抽取一個(gè)容量為35的樣本,分段時(shí)應(yīng)從總體中隨機(jī)剔除個(gè)個(gè)體,編號(hào)后應(yīng)均分為_段,每段有個(gè)個(gè)體.5,35,47題型三:分層抽樣有關(guān)計(jì)算樣本容量一一一人,-、一一人八、,-分層抽樣特點(diǎn):各層抽樣比例=總體抽樣比例=以/*目,每層抽取個(gè)體數(shù)量=該層個(gè)體總量對(duì)由樣比例??傮w容量經(jīng)典例題:某校高中部有三個(gè)年級(jí),其中高三有學(xué)生1000人,現(xiàn)采用分層抽樣法抽取一個(gè)容量為185的樣本,已知在高一年級(jí)抽取了75人,高二年級(jí)抽取了60人,則高中部共有多少學(xué)生?15 : 3 : 2.為了了解該單位職員的某種情況,采用分層抽樣方法

11、抽出一個(gè)容量為A.20B.30C. 40n的樣本,樣本中業(yè)務(wù)人員人數(shù)為30,則此樣本的容量D . 80題型四:頻率分布直方圖畫法步驟作頻率分布直方圖分布的步驟求極差(即一組數(shù)據(jù)中最大值與最小值的差)決定組距與組數(shù),一般樣本容量越大組數(shù)越多,經(jīng)常分為512組, 將數(shù)據(jù)分組,通過(guò)唱票計(jì)算各組的頻數(shù)列頻率分布表,根據(jù)各組頻數(shù)計(jì)算頻率,列出頻率分布表組距盡量取整。畫出頻率分布直方圖,橫軸只畫最小值與最大值之間部分,縱軸表示頻率的值 組距題型五:由頻率分布直方圖估計(jì)眾數(shù)、平均數(shù)、中位數(shù)由頻率分布直方圖估計(jì)眾數(shù):一般先計(jì)算各部分小矩形的面積,找到面積最大的矩形,取該矩形橫邊中點(diǎn)對(duì)應(yīng)的數(shù)即為所求由頻率分布直

12、方圖估計(jì)平均數(shù):般利用平均數(shù)公式xx1 p1x2 p2xn pn來(lái)計(jì)算,其中x n表示第n個(gè)矩形橫邊中點(diǎn)對(duì)應(yīng)的數(shù),pn表示第n個(gè)矩形的面積。由頻率分布直方圖估計(jì)中位數(shù):就是平分直方圖面積且垂直于橫軸的直線 積不足0.5時(shí),中位數(shù)=下一個(gè)矩形橫邊左端點(diǎn)+ 5刀3耳X組 該小矩形面積對(duì)應(yīng)的數(shù)。前n個(gè)小矩形面題型六:頻率分布表中未知量計(jì)算各組頻數(shù)之和=樣本容量,各組頻率之和 =1,各組頻數(shù)砌率=樣本容量數(shù)據(jù)落在某區(qū)間的概率 W間包括的各組頻率之和經(jīng)典例題:為了了解小學(xué)生的體能情況,抽取了某小學(xué)同年級(jí)部分學(xué)生進(jìn)行跳繩測(cè)試,將所得的數(shù)據(jù)整理后畫出頻率分布直方圖(如下圖),已知圖中從左到右的前三個(gè)小組的頻

13、率分別是0.1, 0.3, 0.4.第一小組的頻數(shù)是5.(1)求第四小組的頻率和參加這次測(cè)試的學(xué)生人數(shù);(2)在這次測(cè)試中,學(xué)生跳繩次數(shù)的中位數(shù)落在第幾小組內(nèi)?(3)參加這次測(cè)試跳繩次數(shù)在100次以上為優(yōu)秀,試估計(jì)該校此年級(jí)跳繩成績(jī)優(yōu)秀率是多少?試估計(jì)該年級(jí)學(xué)生平均跳繩次數(shù),中位數(shù)、眾數(shù) 練習(xí)一.2005年降雨量的概率如下表所示:“頻率,、一噌一 0100, 200(1)求年降雨重在組距范圍內(nèi)的概率;(2)求年降雨量在150, 200300范圍內(nèi)的概率;求年降雨量不在150,300范圍內(nèi)的概率;(4)求年降廊練習(xí)區(qū)的量在年降雨量/mm* *概率0. 120. 2549.5 /4.5 99.5

14、124.5 1490. 16.5次數(shù)0. 14范圍內(nèi)的概率.量在 100, 3002.某地年降水下列范練習(xí).某單位業(yè)務(wù)人員、管理人員、后勤服務(wù)人員人數(shù)之比依次為圍內(nèi)的概率如下表所示A . 0.41B . 0.45C. 0.55D. 0.67練習(xí)3. (2014重慶文17)(本小題滿分 13分.(I)小問4分,(II)小問4分,(III )小問5分)20名學(xué)生某次數(shù)學(xué)考試成績(jī)(單位:分)的頻率分布直方圖如圖所示:洞穿高考預(yù)測(cè)題六年降水量(單位:mm)100,150)150,200)200,250)250,300)概率0.120.250.160.14則年降水量在150,300(mm)范圍內(nèi)的概率為

15、()(I)求頻率分布直方圖中a的值;(II)分別求出成績(jī)落在50,60與60, 70中的學(xué)生人數(shù);(III)從成績(jī)?cè)?0,70的學(xué)生中任選2人,求此2人的成績(jī)都在60,70中的概率題型七:用平均數(shù)和方差判斷產(chǎn)品質(zhì)量、成績(jī)好壞、產(chǎn)量高低等平均數(shù)和方差(標(biāo)準(zhǔn)差)都是反映數(shù)據(jù)離散程度的工具。成績(jī)好壞、產(chǎn)量高低等指標(biāo)首先看平均數(shù)越高越好,當(dāng)平均數(shù)相近或相同時(shí),可以用方差(標(biāo)準(zhǔn)差)來(lái)刻畫樣本的穩(wěn)定性題型八:求線性相關(guān)的兩個(gè)變量的回歸直線方程,并作出適當(dāng)預(yù)測(cè)第一步:作散點(diǎn)圖第二步:求回歸方程第三步:代值計(jì)算求線性回歸方程系數(shù)公式:n為yii 1n2xi 1nx y2nxn_(Xi x)(yi y),, y bx.(X x)2i 1重要結(jié)論正相關(guān)則b>0,負(fù)相關(guān)則少(bv 0) | b個(gè)單位b<0,當(dāng)解釋變量增加一個(gè)單位時(shí),預(yù)報(bào)變量相應(yīng)增加(b>0)或減臺(tái)ybx,(x,y)稱為樣本點(diǎn)的中心,此點(diǎn)一定在回歸直線上。用回歸直線方程計(jì)算出的y值不是真實(shí)值,真實(shí)值在計(jì)算值的左右,可能大,可能小也可能相等。相關(guān)指數(shù)R2用來(lái)刻畫擬合效果,R2的值越大,擬合效果越好,反之則越差,一般選擇R2值大的模型。對(duì)R2值理解:相關(guān)指數(shù)R2弋0.997說(shuō)明x可以解釋y的99.7%的變化。經(jīng)典例題:10.有10名同學(xué)高一(x)和高二(v)的數(shù)學(xué)成績(jī)?nèi)缦拢壕忠怀煽?jī)x747172

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論