高考數學二輪復習專題7 第2講 統(tǒng)計、統(tǒng)計案例_第1頁
高考數學二輪復習專題7 第2講 統(tǒng)計、統(tǒng)計案例_第2頁
高考數學二輪復習專題7 第2講 統(tǒng)計、統(tǒng)計案例_第3頁
高考數學二輪復習專題7 第2講 統(tǒng)計、統(tǒng)計案例_第4頁
高考數學二輪復習專題7 第2講 統(tǒng)計、統(tǒng)計案例_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1 / 39 第第 2 講講 統(tǒng)計、統(tǒng)計案例統(tǒng)計、統(tǒng)計案例 考情研析 1.以選擇題、填空題的形式考查隨機抽樣、樣本的數字特征、統(tǒng)計圖表、回歸方程、獨立性檢驗等 2.概率與統(tǒng)計的交匯問題是高考的熱點,以解答題形式出現,難度中等. 核心知識回顧核心知識回顧 1.三種抽樣方法的特點 簡單隨機抽樣:操作簡便,適合總體個數較少的抽樣 分層抽樣:按比例抽樣 系統(tǒng)抽樣:等距抽樣 2必記公式 數據 x1,x2,x3,xn的數字特征公式: (1)平均數: x 01x1x2x3xnn. (2)方差:s2 021n(x1 x)2(x2 x)2(xn x)2. (3)標準差: s 03 1n(x1 x)2(x2 x)

2、2(xn x)2. 3重要性質及結論 (1)頻率分布直方圖的三個結論 小長方形的面積 01 組距頻率組距頻率; 各小長方形的面積之和等于 1; 小長方形的高 02頻率組距,所有小長方形高的和為1組距. (2)回歸直線方程:一組具有線性相關關系的數據(x1,y1),(x2,y2),(xn, yn) 其 回 歸 方 程 y 03 bx a, 其 過 樣 本 點 中 心 04 ( x,2 / 39 y)其中bi1n (xi x)(yi y)i1nx2in x2,a yb x. (3)獨立性檢驗 k2n(adbc)2(ab)(cd)(ac)(bd)(其中 nabcd,n為樣本容量). 熱點考向探究熱點

3、考向探究 考向 1 抽樣方法 例 1 (1)從編號為 001,002,500 的 500 個產品中用系統(tǒng)抽樣的方法抽取一個樣本,已知樣本中編號最小的兩個編號分別為 007,032,則樣本中最大的編號應該為( ) a480 b481 c482 d483 答案 c 解析 樣本中編號最小的兩個編號分別為 007,032, 樣本數據組距為 32725,則樣本容量為5002520,則對應的號碼數 x725(n1),當 n20 時,x取得最大值,此時 x72519482.故選 c. (2)(2020 海南省高三三模)某地 a,b,c 三所學校分別有教師 72,144,216人當地教育部門組織教研活動,計劃

4、用分層抽樣的方法從這三所學校的教師中抽取若干人組成領導小組,若從學校 b 抽取 8 名教師,則從學校 a 和 c 共抽取的教師人數為_. 答案 16 解析 設從學校 a 和 c 分別抽取的教師人數為 x 和 y,由題意可知x7281443 / 39 y216,所以 x4,y12,xy16. 系統(tǒng)抽樣與分層抽樣的求解方法 (1)系統(tǒng)抽樣的最基本特征是“等距性”,每組內所抽取的號碼需要依據第一組抽取的號碼和組距唯一確定每組抽取樣本的號碼依次構成一個以第一組抽取的號碼 m為首項,組距 d為公差的等差數列an,第 k組抽取樣本的號碼 akm(k1)d. (2)分層抽樣的關鍵是根據樣本特征的差異進行分層

5、,實質是等比例抽樣,求解此類問題需先求出抽樣比樣本容量與總體容量的比,則各層所抽取的樣本容量等于該層個體總數與抽樣比的乘積在每層抽樣時,應采用簡單隨機抽樣或系統(tǒng)抽樣進行 1(2020 天津市紅橋區(qū)二模)某校三個社團的人員分布如下表(每名同學只能參加一個社團):學校要對這三個社團的活動效果進行抽樣調查,按分層抽樣的方法從社團成員中抽取 30人,結果武術社被抽出 12 人,則這三個社團總人數為_. 武術社 攝影社 圍棋社 高一 45 30 a 高二 15 10 20 答案 150 解析 設三個社團共有 x 人,由分層抽樣的定義和方法可得30 x124515,解得 x150,所以這三個社團共有 15

6、0人 2某公司生產 a,b,c 三種不同型號的轎車,產量之比依次為 234,為檢驗該公司的產品質量,用分層抽樣的方法抽取一個容量為 n 的樣本,若樣本中 a種型號的轎車比 b種型號的轎車少 8輛,則 n( ) a96 b72 c48 d36 答案 b 4 / 39 解析 由題意,得29n39n8,n72.選 b. 考向 2 用樣本估計總體 例 2 (1)“幸福感指數”是指某個人主觀地評價他對自己目前生活狀態(tài)的滿意程度的指標,常用區(qū)間0,10內的一個數來表示,該數越接近 10 表示滿意程度越高,現隨機抽取 6 位小區(qū)居民,他們的幸福感指數分別為 5,6,7,8,9,5,則這組數據的中位數是( )

7、 a5 b5.5 c6.5 d7 答案 c 解析 將該組數據從小到大排列為 5,5,6,7,8,9.所以這組數據的中位數是6726.5.故選 c. (2)甲、乙兩名學生在 5 次數學考試中的成績統(tǒng)計如下: 甲:74 82 91 88 95 乙:77 86 78 92 77 若 x甲, x乙分別表示甲、乙兩人的平均成績,則下列結論正確的是( ) a. x甲 x乙,乙比甲穩(wěn)定 b x甲 x乙,甲比乙穩(wěn)定 c. x甲 x乙,乙比甲穩(wěn)定 d x甲 x乙 因為 s2甲15(12)2(4)252229254, s2乙15(5)242(4)2102(5)236.4, 所以 s2甲s2乙,故乙比甲穩(wěn)定故選 a

8、. (3)(多選)(2020 山東省泰安市高三一模)某調查機構對全國互聯網行業(yè)進行調5 / 39 查統(tǒng)計,得到整個互聯網行業(yè)從業(yè)者年齡分布餅狀圖、90 后從事互聯網行業(yè)崗位分布條形圖,則下列結論正確的是( ) 注:90 后指 1990 年及以后出生,80 后指 19801989 年之間出生.80 前指1979年及以前出生 a互聯網行業(yè)從業(yè)人員中從事技術和運營崗位的人數占總人數的三成以上 b互聯網行業(yè)中從事技術崗位的人數超過總人數的 20% c互聯網行業(yè)中從事運營崗位的人數 90后比 80 前多 d互聯網行業(yè)中從事技術崗位的人數 90后比 80后多 答案 abc 解析 由整個互聯網行業(yè)從業(yè)者年齡

9、分布餅狀圖、90 后從事互聯網行業(yè)崗位分布條形圖得到:56%(39.6%17%)31.696%30%,所以互聯網行業(yè)從業(yè)人員中從事技術和運營崗位的人數占總人數的三成以上,故 a 正確;由整個互聯網行業(yè)從業(yè)者年齡分布餅狀圖、90 后從事互聯網行業(yè)崗位分布條形圖得到:56%39.6%22.176%20%,所以互聯網行業(yè)中從事技術崗位的人數超過總人數的 20%,故 b 正確;由整個互聯網行業(yè)從業(yè)者年齡分布餅狀圖、90 后從事互聯網行業(yè)崗位分布條形圖得到:17%56%9.52%,所以互聯網行業(yè)中從事運營崗位的人數 90 后比 80 前多,故 c 正確;由整個互聯網行業(yè)從業(yè)者年齡分布餅狀圖、90 后從事

10、互聯網行業(yè)崗位分布條形圖得到:互聯網行業(yè)中從事技術崗位的人數 90 后不一定比 80后多,故 d錯誤故選 abc. (4)(2020 天津市河北區(qū)二模)某班同學進行社會實踐,對25,55歲的人群隨6 / 39 機抽取 n人進行了生活習慣是否符合低碳觀念的調查,若生活習慣符合低碳觀念的稱為“低碳族”,否則稱為“非低碳族”,得到如下統(tǒng)計表和各年齡段人數頻率分布直方圖,則圖表中的 p,a的值分別為( ) 組數 分組 低碳族的人數 占本組的頻率 第一組 25,30) 120 0.6 第二組 30,35) 195 p 第三組 35,40) 100 0.5 第四組 40,45) a 0.4 第五組 45,

11、50) 30 0.3 第六組 50,55 15 0.3 a0.79,20 b0.195,40 c0.65,60 d0.975,80 答案 c 解析 由題意,得 n1200.60.0451000,a10000.0350.460.p19510001(0.040.040.030.020.01)50.65.故選 c. 用樣本估計總體 (1)在表示樣本數據的過程中,學會列頻率分布表、畫頻率分布直方圖、頻率折線圖,體會它們各自的特點 (2)理解樣本數據標準差的意義和作用,學會計算數字特征(如平均數、標準差),并作出合理的解釋 7 / 39 (3)會用樣本估計總體的思想,會用樣本的頻率分布估計總體分布,會用

12、樣本的基本數字特征估計總體的基本數字特征;初步體會樣本頻率分布和數字特征的隨機性 1為比較甲、乙兩名高二學生的數學素養(yǎng),對課程標準中規(guī)定的數學六大素養(yǎng)進行指標測驗(指標值滿分為 5 分,分值高者為優(yōu)),根據測驗情況繪制了如圖所示的六大素養(yǎng)指標雷達圖,則下面敘述正確的是( ) a乙的數據分析素養(yǎng)優(yōu)于甲 b乙的數學建模素養(yǎng)優(yōu)于數學抽象素養(yǎng) c甲的六大素養(yǎng)整體水平優(yōu)于乙 d甲的六大素養(yǎng)中數據分析最差 答案 c 解析 根據雷達圖得到如下數據: 數學抽象 邏輯推理 數學建模 直觀想象 數學運算 數據分析 甲的得分 4 5 4 5 4 5 乙的得分 3 4 3 3 5 4 由數據可知選 c. 2(2020

13、 廣東省惠州市三模)惠州市某學校一位班主任需要更換手機語音月卡套餐,該教師統(tǒng)計自己 1至 8月的月平均通話時間,其中有 6 個月的月平均通話時間分別為 520,530,550,610,650,660(單位:分鐘),有 2 個月的數據未統(tǒng)計出來根據以上數據,該教師這 8 個月的月平均通話時間的中位數大小不可能是( ) 8 / 39 a580 b600 c620 d640 答案 d 解析 當另外兩個月的平均通話時間都小于 530(分鐘)時,中位數為5305502540(分鐘),當另外兩個月的平均通話時間都大于 650(分鐘)時,中位數為6106502630(分鐘),所以這 8 個月的月平均通話時間

14、的中位數大小的取值區(qū)間為540,630故選 d. 3(2020 山東省泰安市四模)某藥廠選取若干名志愿者進行臨床試驗,所有志愿者的舒張壓數據(單位:kpa)的分組區(qū)間為12,13),13,14),14,15),15,16),16,17,將其按從左到右的順序分別編號為第一組,第二組,第五組,如圖是根據試驗數據制成的頻率分布直方圖,已知第一組與第二組共有 20人,則第三組中的人數為_. 答案 18 解析 由直方圖可得,分布在第一組與第二組共有 20 人,分布在第一組與第二組的頻率分別為 0.24,0.16,設總的人數為 n,則20n0.240.160.4,所以n50.所以第三組中的人數為 500.

15、3618. 考向 3 回歸分析與獨立性檢驗 角度 1 回歸分析在實際中的應用 例 3 某市地產數據研究所的數據顯示,2019 年該市新建住宅銷售均價走勢如下圖所示,3 月至 7 月房價上漲過快,政府從 8 月開始采取宏觀調控措施,109 / 39 月份開始房價得到很好的抑制 (1)地產數據研究所發(fā)現,3 月份至 7 月份的各月均價 y(萬元/平方米)與月份x 之間具有較強的線性相關關系,試建立 y 關于 x 的回歸方程;政府若不調控,依此相關關系預測 12 月份該市新建住宅銷售均價; (2)地產數據研究所在 2019 年的 12 個月中,隨機抽取三個月的數據作樣本分析,若關注所抽三個月份的所屬

16、季度,記所屬季度的個數為 x,求 x的分布列和數學期望 參考數據:5i1xi25,5i1yi5.36,5i1 (xi x)(yi y)0.64; 回歸方程ybxa中斜率和截距的最小二乘法估計公式分別為:bni1 (xi x)(yi y)ni1 (xi x)2,a yb x. 解 (1) 月份 x 3 4 5 6 7 均價 y 0.95 0.98 1.11 1.12 1.20 計算可得 x5, y1.072,5i1 (xi x)210, 所以b0.64100.064,a yb x1.0720.06450.752. 所以從 3 月份至 7月份 y關于 x的回歸方程為y0.064x0.752. 將

17、x12 代入回歸方程,得y0.064120.7521.52, 所以預測 12 月份該市新建住宅的銷售均價約為 1.52萬元/平方米 (2)根據題意,x的可能取值為 1,2,3. p(x1)c14c312155,p(x3)c34c13c13c13c3122755, 10 / 39 p(x2)1p(x1)p(x3)2755, 所以 x的分布列為 x 1 2 3 p 155 2755 2755 因此,x的數學期望 e(x)1155227553275513655. 在分析實際中兩個變量的相關關系時,可根據樣本數據作出散點圖來確定兩個變量之間是否具有相關關系,若具有線性相關關系,則可通過線性回歸方程估計

18、或預測變量的值 近年來隨著互聯網的高速發(fā)展,舊貨交易市場也得以快速發(fā)展某網絡舊貨交易平臺對 2019 年某種機械設備的線上交易進行了統(tǒng)計,得到如圖所示的頻率分布直方圖和散點圖現把直方圖中各組的頻率視為概率,用 x(單位:年)表示該設備的使用時間,y(單位:萬元)表示其相應的平均交易價格 (1)已知 2019 年在此網絡舊貨交易平臺成交的該種機械設備為 100 臺,現從11 / 39 這 100 臺設備中,按分層抽樣抽取使用時間 x(12,20的 4 臺設備,再從這 4 臺設備中隨機抽取 2 臺,求這 2臺設備的使用時間都在(12,16的概率; (2)由散點圖分析后,可用 yebxa作為此網絡舊

19、貨交易平臺上該種機械設備的平均交易價格 y關于其使用時間 x的回歸方程 x y z i110 xiyi i110 xizi i110 x2i 5.5 8.7 1.9 301.4 79.75 385 表中 zln y, z110i110zi. 根據上述相關數據,求 y關于 x的回歸方程; 根據上述回歸方程,求當使用時間 x15 時,該種機械設備的平均交易價格的預報值(精確到 0.01) 附:對于一組數據(u1,v1),(u2,v2),(un,vn),其回歸直線 vu的斜率和截距的最小二乘估計分別為i110uivin uvi110u2in u2, v u. 參考數據:e0.551.733,e0.9

20、50.3867,e1.850.1572. 解 (1)由圖 1 中頻率分布直方圖可知,從 2019 年成交的該種機械設備中使用時間 x(12,16的臺數為 10040.0312,使用時間 x(16,20的臺數為10040.014, 按分層抽樣所抽取的 4 臺中,使用時間 x(12,16的設備有 3 臺,分別記為 a,b,c; 使用時間 x(16,20的設備有 1臺,記為 d, 從這 4 臺設備中隨機抽取 2 臺的結果為(a,b),(a,c),(a,d),(b,c),(b,d),(c,d),共有 6 種等可能出現的結果,其中這 2 臺設備的使用時間都在(12,16的結果為(a,b),(a,c),(

21、b,c),共有 3 種,故所求事件的概率為12 / 39 3612. (2)由題意得 zln yln ebxabxa, bi110 xizi10 xzi110 x2i10 x279.75105.51.9385105.520.3, a zb x1.90.35.53.55, z 關于 x的線性回歸方程為z0.3x3.55, y關于 x的回歸方程為ye0.3x3.55. 由知,當使用時間 x15 時,ye0.3153.550.39,故該種機械設備的平均交易價格的預報值為 0.39 萬元 角度 2 獨立性檢驗在實際中的應用 例 4 (1)(多選)(2020 山東省煙臺市模擬)某校計劃在課外活動中新增攀

22、巖項目,為了解學生喜歡攀巖和性別是否有關,面向學生開展了一次隨機調查,其中參加調查的男女生人數相同,并繪制了如圖所示的等高條形圖,則( ) p(k2k0) 0.05 0.01 k0 3.841 6.635 參考公式:k2n(adbc)2(ab)(cd)(ac)(bd),nabcd. a參與調查的學生中喜歡攀巖的男生人數比喜歡攀巖的女生人數多 b參與調查的女生中喜歡攀巖的人數比不喜歡攀巖的人數多 13 / 39 c若參與調查的男女生人數均為 100 人,則有 99%的把握認為喜歡攀巖和性別有關 d無論參與調查的男女生人數為多少,都有 99%的把握認為喜歡攀巖和性別有關 答案 ac 解析 對于 a

23、,因為參加調查的男女生人數相同,而男生中喜歡攀巖的占80%,女生中喜歡攀巖的占 30%,所以參與調查的學生中喜歡攀巖的男生人數比喜歡攀巖的女生人數多,所以 a 正確;對于 b,參與調查的女生中喜歡攀巖的人數占 30%,不喜歡攀巖的人數占 70%,所以參與調查的女生中喜歡攀巖的人數比不喜歡攀巖的人數少,所以 b 錯誤;對于 c,若參與調查的男女生人數均為 100人,根據圖表,列出 22 列聯表如下: 喜歡 不喜歡 總計 男 80 20 100 女 30 70 100 總計 110 90 200 所以 k2200(80702030)21109010010050009950.5056.635, 所以

24、有 99%的把握認為喜歡攀巖和性別有關,所以 c 正確;對于 d,如果不確定參與調查的男女生人數,無法計算是否有 99%的把握認為喜歡攀巖和性別有關,所以 d錯誤故選 ac. (2)(2020 山東省淄博市模擬)新生兒某疾病要接種三次疫苗免疫(即 0,1,6 月齡),假設每次接種之間互不影響,每人每次接種成功的概率相等為了解新生兒該疾病疫苗接種劑量與接種成功之間的關系,現進行了兩種接種方案的臨床試驗:10 g/次劑量組與 20 g/次劑量組,試驗結果如表: 接種成功 接種不成功 總計(人) 10 g/次劑量組 900 100 1000 20 g/次劑量組 973 27 1000 14 / 39

25、 總計(人) 1873 127 2000 根據數據說明哪種方案接種效果好?并判斷能否有 99.9%的把握認為該疾病疫苗接種成功與兩種接種方案有關? 以頻率代替概率,若選用接種效果好的方案,參與該試驗的 1000 人的成功人數比此劑量只接種一次的成功人數平均提高多少人? 參考公式:k2n(adbc)2(ab)(cd)(ac)(bd),其中 nabcd. 參考附表: p(k2k0) 0.050 0.010 0.001 k0 3.841 6.635 10.828 解 由于兩種接種方案都是 1000 人接受臨床試驗,接種成功人數 10 g/次劑量組 900 人,20 g/次劑量組 973人,且 973

26、900, 所以方案 20 g/次劑量組接種效果好; 計算 k22000(90027100973)210001000187312744.80610.828, 所以有 99.9%的把握認為該疾病疫苗接種成功與兩種接種方案有關 假設 20 g/次劑量組臨床試驗接種一次成功的概率為 p, 由數據知,三次接種成功的概率為97310000.973,不成功的概率為2710000.027, 由于三次接種之間互不影響,每人每次接種成功的概率相等, 所以(1p)30.027,解得 p0.7; 設參與試驗的 1000 人此劑量只接種一次成功的人數為 x, 顯然 xb(1000,0.7),e(x)10000.7700

27、, 參與試驗的 1000 人此劑量只接種一次成功的人數平均為 700人, 且 973700273, 試驗選用 20 g/次劑量組方案,參與該試驗的 1000 人比此劑量只接種一次的成功人數平均提高 273 人 獨立性檢驗的關鍵 15 / 39 (1)根據 22 列聯表準確計算 k2,若 22 列聯表沒有列出來,要先列出此表 (2)k2的觀測值 k 越大,對應假設事件 h0成立的概率越小,h0不成立的概率越大 某市自 2020 年 5 月啟動對“車不讓人行為”處罰以來,斑馬線前機動車搶行不文明行為得以根本改變,但作為交通重要參與者的行人,闖紅燈通行卻頻有發(fā)生,帶來了較大的交通安全隱患,同時也使機

28、動車的通暢率降低該市交警部門在某十字路口根據以往的檢測數據,得到行人闖紅燈的概率約為 0.4,并從穿越該路口的行人中隨機抽取了 200 人進行調查,對是否存在闖紅燈情況得到22列聯表如下: 30歲以下 30歲以上 合計 闖紅燈 60 未闖紅燈 80 合計 200 近期,為了整頓“行人闖紅燈”這一項不文明及違法行為,交警部門在該十字路口試行了對闖紅燈行人進行經濟處罰,并在試行經濟處罰后從穿越該路口的行人中隨機抽取了 200 人進行調查,得到下表: 處罰金額(單位:元) 5 10 15 20 闖紅燈的人數 50 40 20 0 將統(tǒng)計數據所得頻率代替概率,完成下列問題 (1)將 22 列聯表填寫完

29、整(不需寫出填寫過程),并根據表中數據分析,在未試行對闖紅燈行人進行經濟處罰前,是否有 99.9%的把握認為闖紅燈與年齡有關; (2)當處罰金額為 10元時,行人闖紅燈的概率會比不進行處罰降低多少; (3)結合調查結果,談談如何治理行人闖紅燈現象 參考公式:k2n(adbc)2(ab)(cd)(ac)(bd),其中 nabcd. 16 / 39 參考數據: p(k2k0) 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 1.132 2.072 2.706 3.841 5.024 6.635 7.879 10.828 解 (1) 30歲以下 30歲以

30、上 合計 闖紅燈 20 60 80 未闖紅燈 80 40 120 合計 100 100 200 k2200(40206080)210010080120100333.33310.828. 有 99.9%的把握認為闖紅燈與年齡有關 (2)未進行處罰前,行人闖紅燈的概率為 0.4,進行處罰 10 元后,行人闖紅燈的概率為40200150.2, 降低了 0.2. (3)根據調查數據顯示,行人闖紅燈與年齡有明顯關系,可以針對 30 歲以上人群開展“道路安全”宣傳教育;由于處罰可以明顯降低行人闖紅燈的概率,所以可以進行適當處罰來降低行人闖紅燈的概率 真題真題押題押題 真題檢驗 1(2020 全國卷)某校一

31、個課外學習小組為研究某作物種子的發(fā)芽率 y 和溫度 x(單位:)的關系,在 20 個不同的溫度條件下進行種子發(fā)芽實驗,由實驗數據(xi,yi)(i1,2,20)得到下面的散點圖: 17 / 39 由此散點圖,在 10 至 40 之間,下面四個回歸方程類型中最適宜作為發(fā)芽率 y和溫度 x的回歸方程類型的是( ) ayabx byabx2 cyabex dyabln x 答案 d 解析 由散點圖分布可知,散點圖分布在一個對數型函數圖象的附近,因此最適宜作為發(fā)芽率 y和溫度 x的回歸方程類型的是 yabln x故選 d. 2(2020 全國卷)設一組樣本數據 x1,x2,xn的方差為 0.01,則數

32、據10 x1,10 x2,10 xn的方差為( ) a0.01 b0.1 c1 d10 答案 c 解析 因為數據 axib(i1,2,n)的方差是數據 xi(i1,2,n)的方差的 a2倍,所以所求數據的方差為 1020.011.故選 c. 3(2020 全國卷)在一組樣本數據中,1,2,3,4 出現的頻率分別為 p1,p2,p3,p4,且4i1pi1,則下面四種情形中,對應樣本的標準差最大的一組是( ) ap1p40.1,p2p30.4 bp1p40.4,p2p30.1 cp1p40.2,p2p30.3 dp1p40.3,p2p30.2 答案 b 解析 對于 a,該組數據的平均數為 xa(1

33、4)0.1(23)0.42.5, 方差為 s2a(12.5)20.1(22.5)20.4(32.5)20.4(42.5)20.118 / 39 0.65; 對于 b,該組數據的平均數為 xb(14)0.4(23)0.12.5, 方差為 s2b(12.5)20.4(22.5)20.1(32.5)20.1(42.5)20.41.85; 對于 c,該組數據的平均數為 xc(14)0.2(23)0.32.5, 方差為 s2c(12.5)20.2(22.5)20.3(32.5)20.3(42.5)20.21.05; 對于 d,該組數據的平均數為 xd(14)0.3(23)0.22.5, 方差為 s2d(

34、12.5)20.3(22.5)20.2(32.5)20.2(42.5)20.31.45. 因此,b 項這一組樣本數據的標準差最大故選 b. 4(2020 江蘇高考)已知一組數據 4,2a,3a,5,6 的平均數為 4,則 a 的值是_. 答案 2 解析 數據 4,2a,3a,5,6 的平均數為 4, 42a3a5620,解得 a2. 5(2020 新高考卷)為加強環(huán)境保護,治理空氣污染,環(huán)境監(jiān)測部門對某市空氣質量進行調研,隨機抽查了 100 天空氣中的 pm2.5 和 so2濃度(單位:g/m3),得下表: so2 pm2.5 0,50 (50,150 (150,475 0,35 32 18

35、4 (35,75 6 8 12 (75,115 3 7 10 (1)估計事件“該市一天空氣中 pm2.5 濃度不超過 75,且 so2濃度不超過150”的概率; (2)根據所給數據,完成下面的 22列聯表: so2 0,150 (150,475 19 / 39 pm2.5 0,75 (75,115 (3)根據(2)中的列聯表,判斷是否有 99%的把握認為該市一天空氣中 pm2.5濃度與 so2濃度有關? 附:k2n(adbc)2(ab)(cd)(ac)(bd). p(k2k) 0.050 0.010 0.001 k 3.841 6.635 10.828 解 (1)由表格中的數據可知,該市 10

36、0 天中,空氣中的 pm2.5 濃度不超過75,且 so2濃度不超過 150 的天數有 32618864天, 所以該市一天空氣中 pm2.5 濃度不超過 75,且 so2濃度不超過 150 的概率為641000.64. (2)由所給數據,可得 22列聯表為 so2 pm2.5 0,150 (150,475 0,75 64 16 (75,115 10 10 (3)根據 22 列聯表中的數據可得 k2n(adbc)2(ab)(cd)(ac)(bd)100(64101610)280207426 36004817.4846.635, 所以有 99%的把握認為該市一天空氣中 pm2.5 濃度與 so2濃

37、度有關 6(2020 全國卷)某學生興趣小組隨機調查了某市 100 天中每天的空氣質量等級和當天到某公園鍛煉的人次,整理數據得到下表(單位:天): 鍛煉人次 空氣質量等級 0,200 (200,400 (400,600 1(優(yōu)) 2 16 25 20 / 39 2(良) 5 10 12 3(輕度污染) 6 7 8 4(中度污染) 7 2 0 (1)分別估計該市一天的空氣質量等級為 1,2,3,4的概率; (2)求一天中到該公園鍛煉的平均人次的估計值(同一組中的數據用該組區(qū)間的中點值為代表); (3)若某天的空氣質量等級為 1 或 2,則稱這天“空氣質量好”;若某天的空氣質量等級為 3 或 4,

38、則稱這天“空氣質量不好”根據所給數據,完成下面的22 列聯表,并根據列聯表,判斷是否有 95%的把握認為一天中到該公園鍛煉的人次與該市當天的空氣質量有關? 人次400 人次400 空氣質量好 空氣質量不好 附:k2n(adbc)2(ab)(cd)(ac)(bd). p(k2k) 0.050 0.010 0.001 k 3.841 6.635 10.828 解 (1)由頻數分布表可知,該市一天的空氣質量等級為 1 的概率為216251000.43,空氣質量等級為 2 的概率為510121000.27,空氣質量等級為 3的概率為6781000.21,空氣質量等級為 4的概率為7201000.09.

39、 (2)由頻數分布表可知,一天中到該公園鍛煉的平均人次的估計值為100203003550045100350. (3)22 列聯表如下: 人次400 人次400 空氣質量好 33 37 空氣質量不好 22 8 21 / 39 k2100(3383722)2554570305.8203.841, 因此,有 95%的把握認為一天中到該公園鍛煉的人次與該市當天的空氣質量有關 7(2020 全國卷)某廠接受了一項加工業(yè)務,加工出來的產品(單位:件)按標準分為 a,b,c,d 四個等級加工業(yè)務約定:對于 a 級品、b 級品、c 級品,廠家每件分別收取加工費 90 元,50 元,20 元;對于 d 級品,廠

40、家每件要賠償原料損失費 50 元該廠有甲、乙兩個分廠可承接加工業(yè)務甲分廠加工成本費為 25 元/件,乙分廠加工成本費為 20 元/件廠家為決定由哪個分廠承接加工業(yè)務,在兩個分廠各試加工了 100件這種產品,并統(tǒng)計了這些產品的等級,整理如下: 甲分廠產品等級的頻數分布表: 等級 a b c d 頻數 40 20 20 20 乙分廠產品等級的頻數分布表: 等級 a b c d 頻數 28 17 34 21 (1)分別估計甲、乙兩分廠加工出來的一件產品為 a級品的概率; (2)分別求甲、乙兩分廠加工出來的 100 件產品的平均利潤,以平均利潤為依據,廠家應選哪個分廠承接加工業(yè)務? 解 (1)由表中數

41、據可知,甲廠加工出來的一件產品為 a 級品的概率為401000.4,乙廠加工出來的一件產品為 a級品的概率為281000.28. (2)甲分廠加工 100 件產品的總利潤為 40(9025)20(5025)20(2025)20(5025)1500 元, 所以甲分廠加工 100 件產品的平均利潤為 15元/件 乙分廠加工 100 件產品的總利潤為 28(9020)17(5020)34(2020)21(5020)1000 元, 22 / 39 所以乙分廠加工 100 件產品的平均利潤為 10元/件 故廠家應選擇甲分廠承接加工業(yè)務 8(2020 全國卷)某沙漠地區(qū)經過治理,生態(tài)系統(tǒng)得到很大改善,野生

42、動物數量有所增加為調查該地區(qū)某種野生動物的數量,將其分成面積相近的 200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取 20 個作為樣區(qū),調查得到樣本數據(xi,yi)(i1,2,20),其中 xi和 yi分別表示第 i 個樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動物的數量,并計算得20i1xi60,20i1yi1200,20i1 (xix)280,20i1 (yi y)29000,20i1 (xi x) (yi y)800. (1)求該地區(qū)這種野生動物數量的估計值(這種野生動物數量的估計值等于樣區(qū)這種野生動物數量的平均數乘以地塊數); (2)求樣本(xi,yi)(i1,2,20)的相關系數

43、(精確到 0.01); (3)根據現有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大為提高樣本的代表性以獲得該地區(qū)這種野生動物數量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由 附:相關系數 rni1 (xi x)(yi y)ni1 (xi x)2ni1 (yi y)2, 21.414. 解 (1)每個樣區(qū)野生動物數量的平均數為12020i1yi120120060,地塊數為200,所以該地區(qū)這種野生動物數量的估計值為 2006012000. (2)樣本(xi,yi)的相關系數為 r20i1 (xi x)(yi y)20i1 (xi x)220i1 (yi y)28008090002 230

44、.94. (3)由于各地塊間植物覆蓋面積差異很大,為提高樣本數據的代表性,應采用分層抽樣, 先將植物覆蓋面積按優(yōu)、中、差分成三層, 在各層內按比例抽取樣本, 23 / 39 在每層內用簡單隨機抽樣法抽取樣本即可 金版押題 9光伏發(fā)電是利用太陽能電池及相關設備將太陽光能直接轉化為電能近幾年在國內出臺的光伏發(fā)電補貼政策的引導下,某地光伏發(fā)電裝機量急劇上漲,如下表: 年份 2012 年 2013 年 2014 年 2015 年 2016年 2017 年 2018 年 2019 年 年份 代碼 x 1 2 3 4 5 6 7 8 新增光 伏裝機 量 y兆瓦 0.4 0.8 1.6 3.1 5.1 7.

45、1 9.7 12.2 某位同學分別用兩種模型:ybx2a,ydxc 進行擬合,得到相應的回歸方程并進行殘差分析,殘差圖如下(注:殘差等于 yiyi): 經過計算得i18 (xi x)(yi y)72.8,i18 (xi x)242,i18 (ti t )(yi y)686.8,i18 (ti t )23570,其中 tix2i, t 18i18ti. (1)根據殘差圖,比較模型,的擬合效果,應該選擇哪個模型?并簡要說明理由; (2)根據(1)的判斷結果及表中數據建立 y 關于 x 的回歸方程,并預測該地區(qū)24 / 39 2021年新增光伏裝機量是多少?(在計算回歸系數時精確到 0.01) 附:

46、回歸直線的斜率和截距的最小二乘估計公式分別為 bi18 (xi x)(yi y)i18 (xi x)2,a yb x. 解 (1)選擇模型. 理由如下:根據殘差圖可以看出,模型的估計值和真實值比較接近,模型的殘差值相對較大一些,所以模型的擬合效果相對較好 (2)由(1)可知,y關于 x 的回歸方程為ybx2a, 令 tx2, 則ybta. 由所給數據可得 t 18i18ti18(1491625364964)25.5. y18i18yi18(0.40.81.63.15.17.19.712.2)5, 所以bi18 (ti t )(yi y)i18 (ti t )2686.835700.19, a

47、yb t 50.1925.50.16, 所以 y關于 x的回歸方程為y0.19x20.16, 當 x10 時,y0.191020.1619.16, 故預測該地區(qū) 2021 年新增光伏裝機量為 19.16兆瓦 專題作業(yè)專題作業(yè) 25 / 39 一、選擇題:在每小題給出的四個選項中,只有一項是符合題目要求的 1(2020 山東菏澤一中模擬)空氣質量指數 aqi 是用來反映空氣質量狀況的,aqi越小,表明空氣質量越好,其對應關系如下表: aqi 050 51100 101150 151200 201300 300 空氣質量 優(yōu) 良 輕度污染 中度污染 重度污染 嚴重污染 下圖是某市今年某月 1 日至

48、 20 日的 aqi折線圖 下列敘述錯誤的是( ) a這 20 天的 aqi的中位數略高于 100 b這 20天中空氣質量為中度污染及以上的天數占14 c該市該月的前半個月的空氣質量越來越好 d總體來說,該市該月上旬的空氣質量比中旬的空氣質量好 答案 c 解析 對于 a,將這 20 天的 aqi 從小到大排序后,第 10 個數據略小于100,第 11 個數據約為 120,因為中位數是這兩個數據的平均數,所以中位數略高于 100,故 a 正確;對于 b,這 20 天中,aqi 大于 150 的有 5 天,故空氣質量為中度污染及以上的天數占14,故 b 正確;對于 c,由題中折線圖可知,這 20天

49、中,前 5 天空氣質量越來越好,從 6 日開始至 15 日空氣質量越來越差,故 c錯誤;對于 d,由題中折線圖可知,上旬 aqi 大部分在 100 以下,中旬 aqi 大部分在 100 以上,故該市該月上旬的空氣質量比中旬的好,故 d正確故選 c. 2(2020 山東濰坊模擬)為慶祝中華人民共和國成立 70 周年,我國于 2019年 10 月 1日在北京天安門廣場舉行了大型閱兵儀式在此次活動中,共有 15 個26 / 39 徒步方隊,32 個裝備方隊,12 個空中梯隊,官兵約 15000 名通過天安門廣場接受黨和人民的檢閱若按照方隊個數進行分層抽樣,從徒步方隊與空中梯隊中共選出 18 個方隊,

50、則選出的空中梯隊的個數為( ) a12 b10 c8 d6 答案 c 解析 空中梯隊所占的比例為12151249,故選出的空中梯隊的個數為18498,故選 c. 3某考察團對 10 個城市的職工人均工資 x(千元)與人均消費 y(千元)進行調查統(tǒng)計,得出 y 與 x 具有線性相關關系,且回歸方程為y0.6x1.2.若某城市職工人均工資為 5 千元,估計該城市職工人均消費額占人均工資收入的百分比為( ) a66% b67% c79% d84% 答案 d 解析 y 與 x 具有線性相關關系,滿足回歸方程y0.6x1.2,該城市職工人均工資為 x5,可以估計該城市的職工人均消費水平y(tǒng)0.651.24

51、.2,可以估計該城市職工人均消費額占人均工資收入的百分比為4.2584%. 4(2019 全國卷)演講比賽共有 9 位評委分別給出某選手的原始評分,評定該選手的成績時,從 9 個原始評分中去掉 1 個最高分、1 個最低分,得到 7 個有效評分.7 個有效評分與 9個原始評分相比,不變的數字特征是( ) a中位數 b平均數 c方差 d極差 答案 a 解析 中位數是將 9個數據從小到大或從大到小排列后,處于中間位置的數據,因而去掉 1個最高分和 1個最低分,不變的是中位數,平均數、方差、極差27 / 39 均受影響故選 a. 5一個樣本容量為 10 的樣本數據,它們組成一個公差不為 0 的等差數列

52、an,若 a38,且 a1,a3,a7成等比數列,則此樣本的平均數和中位數分別是( ) a13,12 b13,13 c12,13 d13,14 答案 b 解析 設等差數列an的公差為 d(d0),因為 a1,a3,a7成等比數列,a38,所以 a1a7a2364,即(82d)(84d)64,2dd20,又 d0,故 d2,故樣本數據為 4,6,8,10,12,14,16,18,20,22,平均數為(422)51013,中位數為1214213. 6(2020 山東省濟南市高三 6 月針對性訓練)“平均增長量”是指一段時間內某一數據指標增長量的平均值,其計算方法是將每一期增長量相加后,除以期數,即

53、ni1 (aiai1)n1.國內生產總值(gdp)被公認為是衡量國家經濟狀況的最佳指標,如表是我國 20152019 年 gdp 數據: 年份 2015 2016 2017 2018 2019 國內生產總值/萬億 68.89 74.64 83.20 91.93 99.09 根據表中數據,20152019年我國 gdp 的平均增長量為( ) a5.03 萬億 b6.04萬億 c7.55萬億 d10.07萬億 答案 c 解析 設 2015 年國內生產總值為 a168.89 萬億,則依次 a274.64 萬億,a383.20 萬億,a491.93 萬億,a599.09 萬億.20152019 年我國

54、 gdp 的平均增長量為 (74.6468.89)(83.2074.64)(91.9383.20)(99.0991.93)4 28 / 39 99.0968.89430.247.55萬億元 7.(2020 江淮十校第一次聯考)某省新高考采取的是“312”模式,“3”指“語文、數學、英語”,均為必考科目,“1”指在“物理、歷史”中任選 1 科作為考試科目,“2”指在“化學、生物、政治、地理”中任選 2 科作為考試科目,為了指導學生進行合理選科,班主任唐老師將每個學生選考科目的成績制成 5 分制的雷達圖,已知甲同學成績的雷達圖如圖所示,以全年級同學的成績?yōu)闃藴蔬M行比較,則甲同學較為理想的選科為(

55、) a物理化學地理 b物理生物地理 c歷史生物地理 d物理化學生物 答案 b 解析 由題中雷達圖得,甲同學物理、歷史、地理科目的分數高于年級平均分,生物科目的分數等于年級平均分,但物理、歷史中只能選擇 1 科為考試科目,甲同學物理比歷史更有優(yōu)勢,則甲同學較為理想的選科為物理生物地理,故選 b. 8(2020 山東省德州市二模)某中學共有 1000 人,其中男生 700 人,女生300 人,為了了解該校學生每周平均體育鍛煉時間的情況以及經常進行體育鍛煉的學生是否與性別有關(經常進行體育鍛煉是指:周平均體育鍛煉時間不少于 4小時),現在用分層抽樣的方法從中收集 200 位學生每周平均體育鍛煉時間的

56、樣本數據(單位:小時),其頻率分布直方圖如圖已知在樣本數據中,有 40 位女生的每周平均體育鍛煉時間超過 4小時,根據獨立性檢驗原理( ) 29 / 39 附:k2n(adbc)2(ab)(cd)(ac)(bd),其中 nabcd. p(k2k0) 0.10 0.05 0.01 0.005 k0 2.706 3.841 6.635 7.879 a有 95%的把握認為“該校學生每周平均體育鍛煉時間與性別無關” b有 90%的把握認為“該校學生每周平均體育鍛煉時間與性別有關” c有 90%的把握認為“該校學生每周平均體育鍛煉時間與性別無關” d有 95%的把握認為“該校學生每周平均體育鍛煉時間與性

57、別有關” 答案 b 解析 由頻率分布直方圖可知,每周平均體育鍛煉時間不少于 4 小時的頻率為 2(0.150.1250.0750.025)0.75,故經常進行體育鍛煉的學生有2000.75150 人又其中有 40 位女生的每周平均體育鍛煉時間超過 4 小時,故有 15040110 位男生經常鍛煉根據分層抽樣的方法可知,樣本中男生的人數為7001000200140,女生的人數為300100020060.列出 22列聯表如下: 男生 女生 總計 經常鍛煉 110 40 150 不經常鍛煉 30 20 50 總計 140 60 200 故 k2200(110203040)214060150503.1

58、7,因為 2.7063.17569,所以第 4 天的平均單場門票價格低于 20 元,所以 d錯誤故選 ab. 10(2020 山東嘉祥一中模擬)在某次高中學科知識競賽中,對 4000 名考生的競賽成績(單位:分)進行統(tǒng)計,得到如圖所示的頻率分布直方圖,其中分組為40,50),50,60),60,70),70,80),80,90),90,100,60 分以下視為不及格,若同一組數據用該組區(qū)間中點值作代表,則下列說法中正確的是( ) a成績在70,80)內的考生人數最多 31 / 39 b不及格的考生人數為 1000 c考生競賽成績的平均分約為 70.5分 d考生競賽成績的中位數為 75分 答案

59、abc 解析 由題中頻率分布直方圖可得,成績在70,80)內的頻率最高,因此成績在70,80)內的考生人數最多,故 a 正確;成績在40,60)內的頻率為 0.01100.015100.25,因此不及格的人數為 40000.251000,故 b 正確;考生競賽成績的平均分約為 450.1550.15650.2750.3850.15950.170.5(分),故 c 正確;因為成績在40,70)內的頻率為 0.45,在70,80)內的頻率為 0.3,所以考生競賽成績的中位數為 70100.050.371.67(分),故 d 錯誤故選 abc. 11(2020 長沙一中模擬)某大學為了解學生對學校食

60、堂服務的滿意度,隨機調查了 50 名男生和 50 名女生,每位學生對食堂的服務給出滿意或不滿意的評價,得到如下列聯表經計算 k2的觀測值 k4.762,則可以推斷出( ) 滿意 不滿意 總計 男 30 20 50 女 40 10 50 總計 70 30 100 p(k2k0) 0.100 0.050 0.010 k0 2.706 3.841 6.635 a該學校男生對食堂服務滿意的概率的估計值為35 b調研結果顯示,該學校男生比女生對食堂服務更滿意 c有 95%的把握認為對該食堂服務的評價與性別有關 d有 99%的把握認為對該食堂服務的評價與性別有關 答案 ac 32 / 39 解析 對于 a

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論