高考數(shù)學(xué)總復(fù)習(xí)專題系列——統(tǒng)計(jì).板塊三.莖葉圖.學(xué)生版_第1頁
高考數(shù)學(xué)總復(fù)習(xí)專題系列——統(tǒng)計(jì).板塊三.莖葉圖.學(xué)生版_第2頁
高考數(shù)學(xué)總復(fù)習(xí)專題系列——統(tǒng)計(jì).板塊三.莖葉圖.學(xué)生版_第3頁
高考數(shù)學(xué)總復(fù)習(xí)專題系列——統(tǒng)計(jì).板塊三.莖葉圖.學(xué)生版_第4頁
高考數(shù)學(xué)總復(fù)習(xí)專題系列——統(tǒng)計(jì).板塊三.莖葉圖.學(xué)生版_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余4頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、板塊三.莖葉圖mwie 知識內(nèi)容一.隨機(jī)抽樣1 .隨機(jī)抽樣:滿足每個(gè)個(gè)體被抽到的機(jī)會是均等的抽樣,共有三種經(jīng)常采用的隨機(jī)抽樣方法:簡單隨機(jī)抽樣:從元素個(gè)數(shù)為 N的總體中不放回地抽取容量為n的樣本,如果每一次抽取時(shí)總體中的各個(gè)個(gè)體有相同的可能性被抽到,這種抽樣方法叫做簡單隨機(jī)抽樣.抽出辦法:抽簽法:用紙片或小球分別標(biāo)號后抽簽的方法.隨機(jī)數(shù)表法:隨機(jī)數(shù)表是使用計(jì)算器或計(jì)算機(jī)的應(yīng)用程序生成隨機(jī)數(shù)的功能生成的一張數(shù)表.表中每一位置出現(xiàn)各個(gè)數(shù)字的可能性相同.隨機(jī)數(shù)表法是對樣本進(jìn)行編號后,按照一定的規(guī)律從隨機(jī)數(shù)表中讀數(shù),并取出相應(yīng)的樣本的 方法.簡單隨機(jī)抽樣是最簡單、最基本的抽樣方法.系統(tǒng)抽樣:將總體分成

2、均衡的若干部分,然后按照預(yù)先制定的規(guī)則,從每一部分抽取一個(gè)個(gè)體,得到所需要的樣本的抽樣方法.抽出辦法:從元素個(gè)數(shù)為 N的總體中抽取容量為 n的樣本,如果總體容量能被樣本容量整除,設(shè)k =N ,先對總體進(jìn)行編號,號碼從 1到N ,再從數(shù)字1到k中隨機(jī)抽取一個(gè)數(shù)s作為起始 n數(shù),然后順次抽取第s+k, s+2k,(|,s+(n -1)k個(gè)數(shù),這樣就得到容量為 n的樣本.如果總體容量不能被樣本容量整除,可隨機(jī)地從總體中剔除余數(shù),然后再按系統(tǒng)抽樣方法進(jìn)行抽樣.系統(tǒng)抽樣適用于大規(guī)模的抽樣調(diào)查,由于抽樣間隔相等,又被稱為等距抽樣.分層抽樣:當(dāng)總體有明顯差別的幾部分組成時(shí),要反映總體情況,常采用分層抽樣,使

3、總 體中各個(gè)個(gè)體按某種特征分成若干個(gè)互不重疊的幾部分,每一部分叫做層,在各層中按層在 總體中所占比例進(jìn)行簡單隨機(jī)抽樣,這種抽樣方法叫做分層抽樣.分層抽樣的樣本具有較強(qiáng)的代表性,而且各層抽樣時(shí),可靈活選用不同的抽樣方法,應(yīng) 用廣泛.2 .簡單隨機(jī)抽樣必須具備下列特點(diǎn):簡單隨機(jī)抽樣要求被抽取的樣本的總體個(gè)數(shù)N是有限的.簡單隨機(jī)樣本數(shù)n小于等于樣本總體的個(gè)數(shù) N .簡單隨機(jī)樣本是從總體中逐個(gè)抽取的.簡單隨機(jī)抽樣是一種不放回的抽樣.簡單隨機(jī)抽樣的每個(gè)個(gè)體入樣的可能性均為-.N3 .系統(tǒng)抽樣時(shí),當(dāng)總體個(gè)數(shù) N恰好是樣本容量n的整數(shù)倍時(shí),取k=-;n若N不是整數(shù)時(shí),先從總體中隨機(jī)地剔除幾個(gè)個(gè)體,使得總體中

4、剩余的個(gè)體數(shù)能被樣本容量nn整除.因?yàn)槊總€(gè)個(gè)體被剔除的機(jī)會相等,因而整個(gè)抽樣過程中每個(gè)個(gè)體被抽取的機(jī)會仍然相二.頻率直方圖列出樣本數(shù)據(jù)的頻率分布表和頻率分布直方圖的步驟:計(jì)算極差:找出數(shù)據(jù)的最大值與最小值,計(jì)算它們的差; 決定組距與組數(shù):取組距,用氤決定組數(shù);決定分點(diǎn):決定起點(diǎn),進(jìn)行分組;列頻率分布直方圖:對落入各小組的數(shù)據(jù)累計(jì),算出各小數(shù)的頻數(shù),除以樣本容量,得到 各小組的頻率.頻率,、一繪制頻率分布直方圖:以數(shù)據(jù)的值為橫坐標(biāo),以的值為縱坐標(biāo)繪制直方圖, 知小長方形的面積=組距 X?空=頻率.組距頻率分布折線圖:將頻率分布直方圖各個(gè)長方形上邊的中點(diǎn)用線段連接起來,就得到頻率分布折線圖,一般把

5、折線圖畫成與橫軸相連,所以橫軸左右兩端點(diǎn)沒有實(shí)際意義.總體密度曲線:樣本容量不斷增大時(shí),所分組數(shù)不斷增加,分組的組距不斷縮小,頻率分布直方圖可以用一條光滑曲線 y = f (x)來描繪,這條光滑曲線就叫做總體密度曲線.總體密度曲線精確地反映了一個(gè)總體在各個(gè)區(qū)域內(nèi)取值的規(guī)律.三.莖葉圖制作莖葉圖的步驟:將數(shù)據(jù)分為 莖”、葉”兩部分;將最大莖與最小莖之間的數(shù)字按大小順序排成一列,并畫上豎線作為分隔線;將各個(gè)數(shù)據(jù)的 葉”在分界線的一側(cè)對應(yīng)莖處同行列出.四.統(tǒng)計(jì)數(shù)據(jù)的數(shù)字特征用樣本平均數(shù)估計(jì)總體平均數(shù);用樣本標(biāo)準(zhǔn)差估計(jì)總體標(biāo)準(zhǔn)差.數(shù)據(jù)的離散程序可以用極差、方差或標(biāo)準(zhǔn)差來描述.極差又叫全距,是一組數(shù)據(jù)的

6、最大值和最小值之差,反映一組數(shù)據(jù)的變動幅度; 樣本方差描述了一組數(shù)據(jù)平均數(shù)波動的大小,樣本的標(biāo)準(zhǔn)差是方差的算術(shù)平方根.一般地,設(shè)樣本的元素為 Xi ,X2,|, Xn樣本的平均數(shù)為X ,定義樣本方差為s2 =(X1 X)2 (x X)2 HI (Xn 一為2 n樣本標(biāo)準(zhǔn)差 s = j(X-X)2±(X2-X)2±IH二(Xn-X)2簡化公式:s2 =(X12 +x; +|+x;) -nX2. n五.獨(dú)立性檢驗(yàn)1 .兩個(gè)變量之間的關(guān)系;常見的有兩類:一類是確定性的函數(shù)關(guān)系;另一類是變量間存在關(guān)系,但又不具備函數(shù)關(guān)系 所要求的確定性,它們的關(guān)系是帶有一定隨機(jī)性的.當(dāng)一個(gè)變量取值

7、一定時(shí),另一個(gè)變量的 取值帶有一定隨機(jī)性的兩個(gè)變量之間的關(guān)系叫做相關(guān)關(guān)系.2 .散點(diǎn)圖:將樣本中的 n個(gè)數(shù)據(jù)點(diǎn)(為,y)(i =1,2,|, n)描在平面直角坐標(biāo)系中,就得到了 散點(diǎn)圖.散點(diǎn)圖形象地反映了各個(gè)數(shù)據(jù)的密切程度,根據(jù)散點(diǎn)圖的分布趨勢可以直觀地判斷分析兩個(gè) 變量的關(guān)系.3 .如果當(dāng)一個(gè)變量的值變大時(shí),另一個(gè)變量的值也在變大,則這種相關(guān)稱為正相關(guān);此時(shí), 散點(diǎn)圖中的點(diǎn)在從左下角到右上角的區(qū)域.反之,一個(gè)變量的值變大時(shí),另一個(gè)變量的值由大變小,這種相關(guān)稱為負(fù)相關(guān).此時(shí),散點(diǎn) 圖中的點(diǎn)在從左上角到右下角的區(qū)域.散點(diǎn)圖可以判斷兩個(gè)變量之間有沒有相關(guān)關(guān)系.4 .統(tǒng)計(jì)假設(shè):如果事件A與B獨(dú)立,這

8、時(shí)應(yīng)該有 P(AB) =P(A)P(B),用字母H。表示此式,即Ho :P(AB) =P(A)P(B),稱之為統(tǒng)計(jì)假設(shè).5 .胃(讀作朱方”)統(tǒng)計(jì)量:統(tǒng)計(jì)學(xué)中有一個(gè)非常有用的統(tǒng)計(jì)量,它的表達(dá)式為z2 =0122二n四_,用它的大小可以用ni n2 .n in 2來決定是否拒絕原來的統(tǒng)計(jì)假設(shè) Ho ,如果好的值較大,就拒絕Ho ,即認(rèn)為A與B是有關(guān)的. 片統(tǒng)計(jì)量的兩個(gè)臨界值: 3.841、6.635;當(dāng) 片A3.841時(shí),有95%的把握說事件 A與B有關(guān); 當(dāng)好下6.635時(shí),有99%的把握說事件 A與B有關(guān);當(dāng) / < 3.841時(shí),認(rèn)為事件 A與B是無 關(guān)的.獨(dú)立性檢驗(yàn)的基本思想與反證

9、法類似,由結(jié)論不成立時(shí)推出有利于結(jié)論成立的小概率事件發(fā) 生,而小概率事件在一次試驗(yàn)中通常是不會發(fā)生的,所以認(rèn)為結(jié)論在很大程度上是成立的.1 .獨(dú)立性檢驗(yàn)的步驟:統(tǒng)計(jì)假設(shè):H。;列出2M2聯(lián)表;計(jì)算片統(tǒng)計(jì)量;查對臨界值表,作出判斷.2,幾個(gè)臨界值:P(片 > 2.706 )定0.10, P(72 > 3.841) 之0.05 , P(片 > 6.635)上0.01 .2 M2聯(lián)表的獨(dú)立性檢驗(yàn):如果對于某個(gè)群體有兩種狀態(tài),對于每種狀態(tài)又有兩個(gè)情況,這樣排成一張 2M2的表,如下:狀態(tài)B狀態(tài)B合計(jì)狀態(tài)A»1n12n1十狀態(tài)An21n22n2 +n書n卡n如果有調(diào)查得來的四

10、個(gè)數(shù)據(jù) nn , n12, n21,12,并希望根據(jù)這樣的4個(gè)數(shù)據(jù)來檢驗(yàn)上述的兩種狀態(tài)A與B是否有關(guān),就稱之為 2父2聯(lián)表的獨(dú)立性檢驗(yàn).六.回歸分析1 .回歸分析:對于具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法叫做回歸分析,即回歸分析 就是尋找相關(guān)關(guān)系中這種非確定關(guān)系的某種確定性.回歸直線:如果散點(diǎn)圖中的各點(diǎn)都大致分布在一條直線附近,就稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.2 .最小二乘法:記回歸直線方程為:y? = a+bx,稱為變量Y對變量x的回歸直線方程,其中 a, b叫做回歸系 數(shù).?是為了區(qū)分Y的實(shí)際值y ,當(dāng)x取值x時(shí),變量Y的相應(yīng)觀察值為y ,而直線上對應(yīng)于 為的

11、 縱坐標(biāo)是y? = a +bxi .設(shè)x,Y的一組觀察值為(為,y), i=1,2/ll,n,且回歸直線方程為y? = a+bx,當(dāng)x取值為時(shí),Y的相應(yīng)觀察值為y-差yi y?(i =1,2,川,n)刻畫了實(shí)際觀察值 y與回歸直 線上相應(yīng)點(diǎn)的縱坐標(biāo)之間的偏離程度,稱這些值為離差.我們希望這n個(gè)離差構(gòu)成的總離差越小越好,這樣才能使所找的直線很貼近已知點(diǎn). n記Q =£ (y -a -b%)2 ,回歸直線就是所有直線中Q取最小值的那條.i生這種使 離差平方和為最小”的方法,叫做最小二乘法.用最小二乘法求回歸系數(shù)a , b有如下的公式:n'、'何-nxy? = 1, a?=

12、ybX,其中a,b上方加 入”,表示是由觀察值按最小二乘法求得的回- 2 2、K - nx i 1 歸系數(shù).3 .線性回歸模型:將用于估計(jì)y值的線,f函數(shù)a+bx作為確定性函數(shù);y的實(shí)際值與估計(jì)值之間的誤差記為 名,稱之為隨機(jī)誤差;將 y=a+bx + s稱為線性回歸模型.產(chǎn)生隨機(jī)誤差的主要原因有:所用的確定性函數(shù)不恰當(dāng)即模型近似引起的誤差;忽略了某些因素的影響,通常這些影響都比較小; 由于測量工具等原因,存在觀測誤差.4 .線性回歸系數(shù)的最佳估計(jì)值:利用最小二乘法可以得到夕,的計(jì)算公式為 nn工(X -x)(yi -y) z Xiyi -nxy_ 1n _ 1 nb = i- n n

13、7;n1, ? =y bx ,其中 x=-£ x , y =-Z yi2-22n i in ij工(x -x) 工 x -n(x)-i 1i I由此得到的直線 ?=i?+bx就稱為回歸直線,此直線方程即為線性回歸方程.其中 ?,b分別 為a, b的估計(jì)值,今稱為回歸截距,b稱為回歸系數(shù),?稱為回歸值.5 .相關(guān)系數(shù): nn工(x -x)(yi -y)Z xiyi -nxyr : i1=ynnnn億(xi -x)2 W (yi -y)2d x2 -n(x)2)(Z y2 -n(y)2),i 1i 4:Y i 4i 46 .相關(guān)系數(shù)r的性質(zhì): |r性1;|r |越接近于1, x, y的線

14、性相關(guān)程度越強(qiáng);|r |越接近于0, x, y的線性相關(guān)程度越弱.可見,一條回歸直線有多大的預(yù)測功能,和變量間的相關(guān)系數(shù)密切相關(guān).7 .轉(zhuǎn)化思想:根據(jù)專業(yè)知識或散點(diǎn)圖,對某些特殊的非線性關(guān)系,選擇適當(dāng)?shù)淖兞看鷵Q,把非線性方程轉(zhuǎn) 化為線性回歸方程,從而確定未知參數(shù).8 . 一些備案回歸(regression) 一詞的來歷:回歸”這個(gè)詞英國統(tǒng)計(jì)學(xué)家 Francils Galton提出來的.1889年,他在研究祖先與后代的身高之間的關(guān)系時(shí)發(fā)現(xiàn),身材較高的父母,他們的孩子也較高, 但這些孩子的平均身高并沒有他們父母的平均身高高;身材較矮的父母,他們的孩子也較矮,但這些孩子的平均身高卻比他們父母的平均身

15、高高.Galton把這種后代的身高向中間值靠近的趨勢稱為回歸現(xiàn)象”.后來,人們把由一個(gè)變量的變化去推測另一個(gè)變量的變化的方法稱為回 歸分析.回歸系數(shù)的推導(dǎo)過程:Q =E (yi -a) -bK 2 =E y: -2aZ y +na2 -2bZ 匯 +2abZ x +b2E x2=na2 +2a(bZ xi -Z y) +b2Z x2 -2bZ xiyi +2 y2 ,2n把上式看成a的二次函數(shù),a2的系數(shù)n >0 , 因此當(dāng)a = -2(b' x yi)二yi -b、xi時(shí)取最小值.同理,把Q的展開式按b的降哥排列,看成 b的二次函數(shù),當(dāng)b =£ x y -aZ x時(shí)取

16、最小值.解得:bunxiyi -nxyi j乙(Xi x)( y y)2_2i -nx(x -X)其中y =卜yi n9.對相關(guān)系數(shù)提出統(tǒng)計(jì)假設(shè)X =1£ x是樣本平均數(shù) nr進(jìn)行相關(guān)性檢驗(yàn)的步驟:H。:變量x, y不具有線性相關(guān)關(guān)系;如果以95%的把握作出推斷,那么可以根據(jù) 性檢驗(yàn)的臨界值表中查出一個(gè)r的臨界值r0.05計(jì)算樣本相關(guān)系數(shù)r ;1 0.95 = 0.05與n 2(n是樣本容量)在相關(guān)(其中1 0.95=0.05稱為檢驗(yàn)水平);作出統(tǒng)計(jì)推斷:若|)0.05,則否定He表明有95%的把握認(rèn)為變量y與x之間具有線性 相關(guān)關(guān)系;若|r性0.05 ,則沒有理由拒絕H。,即就目前

17、數(shù)據(jù)而言, 沒有充分理由認(rèn)為變量 y與 x之間具有線性相關(guān)關(guān)系.說明:對相關(guān)系數(shù)r進(jìn)行顯著性檢驗(yàn),一般取檢驗(yàn)水平a =0.05,即可靠程度為95%.這里的r指的是線性相關(guān)系數(shù),r的絕對值很小,只是說明線性相關(guān)程度低,不一定不相關(guān),可能是非線性相關(guān)的某種關(guān)系.這里的r是對抽樣數(shù)據(jù)而言的.有時(shí)即使|r|=1,兩者也不析時(shí),不能就數(shù)據(jù)論數(shù)據(jù),要結(jié)合實(shí)際情況進(jìn)行合理解釋.典例分析題型一莖葉圖【例1】(2010豐臺二模)甲、乙兩名運(yùn)動員的 5次測試成績?nèi)缦聢D所示設(shè)& , S2分別表示甲、乙兩名運(yùn)動員測試成績的標(biāo)準(zhǔn)差,定是線性相關(guān)的.故在統(tǒng)計(jì)分X , X2分別表示甲、乙兩名A. X =x2 , &

18、amp; <82B. X =x2 , & >82C.X > x2 , si >s2D. X = x2 ,運(yùn)動員測試成績的平均數(shù),則有(si 二 s2【例2】(2010宣武二模)隨機(jī)抽取某中學(xué)甲,乙兩班各10名同學(xué),測量他們的身高(單位:cm),獲得身高數(shù)據(jù)的莖葉圖如圖 ,則下列關(guān)于甲,乙兩班這 10名同學(xué)身高的結(jié)論正確的是(A.B.)甲班同學(xué)身高的方差較大甲班同學(xué)身高的平均值較大C.甲班同學(xué)身高的中位數(shù)較大D.甲班同學(xué)身高在175以上的人數(shù)較多甲班乙班189 9 1016 15【例3】(2010天津高考)甲、乙兩人在 10天中每天加工零件的個(gè)數(shù)用莖葉圖表示如下圖

19、,中間一列的數(shù)字表示零件個(gè)數(shù)的十位數(shù),兩邊的數(shù)字表示零件個(gè)數(shù)的個(gè)位數(shù),則這 10天甲、乙兩人日加工零件的平均數(shù)分別為 和.甲9 80 1320115女19712 14 2 43 0 2 053 1545267857【例4】右圖是某賽季甲、乙兩名籃球運(yùn)動員每場比賽得分的莖葉圖,368 2479 314則甲、乙兩人這幾場比賽得分的中位數(shù)之和是()A. 62B. 63C. 64 D. 65【例5】 在某五場籃球比賽中,甲、乙兩名運(yùn)動員得分的莖葉圖如右.下列說法正確的是01231234021089A.在這五場比賽中,甲的平均得分比乙好,且甲比乙穩(wěn)定 B.在這五場比賽中,甲的平均得分比乙好,但乙比甲穩(wěn)定 C.在這五場比賽中,乙的平均得分比甲好,且乙比甲穩(wěn)定 D.在這五場比賽中,乙的平均得分比甲好,但甲比乙穩(wěn)定【例6】(2009年福建12)作品A88 9 992 3x214某校開展愛我海西、愛我家鄉(xiāng)”攝影比賽,9位評 委為參賽作品A給出的分?jǐn)?shù)如莖葉圖所示,記分員 在去掉一個(gè)最高分和一個(gè)最低分后, 算得平均分為 91,復(fù)核員在復(fù)核時(shí),發(fā)現(xiàn)有一個(gè)數(shù)字(莖葉

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論