




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
專題5回歸分析例1.已知回歸方程y?A.﹣2 B.1 C.2 D.5例2.研究變量x,y得到一組樣本數(shù)據(jù),進行回歸分析,有以下結(jié)論①殘差平方和越小的模型,擬合的效果越好;②用相關(guān)指數(shù)R2來刻畫回歸效果,R2越小說明擬合效果越好;③在回歸直線方程y?=?0.2x+0.8中,當解釋變量x每增加1個單位時,預(yù)報變量④若變量y和x之間的相關(guān)系數(shù)為r=﹣0.9462,則變量y和x之間的負相關(guān)很強.以上正確說法的是.例3.下列命題中,正確的命題有.①回歸直線y?=b?x+a②用相關(guān)指數(shù)R2來刻畫回歸效果,表示預(yù)報變量對解釋變量變化的貢獻率,R2越接近于1說明模型的擬合效果越好;③殘差圖中殘差點比較均勻的落在水平的帶狀區(qū)域中,說明選用的模型比較合適;④兩個模型中殘差平方和越大的模型的擬合效果越好.例4.下列命題:①相關(guān)指數(shù)R2越小,則殘差平方和越大,模型的擬合效果越好.②對分類變量X與Y的隨機變量K2的觀測值k來說,k越小,“X與Y有關(guān)系”可信程度越大.③殘差點比較均勻地落在水平帶狀區(qū)域內(nèi),帶狀區(qū)域越寬,說明模型擬合精度越高.④兩個隨機變量相關(guān)性越強,則相關(guān)系數(shù)的絕對值越接近0.其中錯誤命題的個數(shù)為.例5.垃圾是人類日常生活和生產(chǎn)中產(chǎn)生的廢棄物,由于排出量大,成分復(fù)雜多樣,且具有污染性,所以需要無害化、減量化處理.某市為調(diào)査產(chǎn)生的垃圾數(shù)量,采用簡單隨機抽樣的方法抽取20個縣城進行了分析,得到樣本數(shù)據(jù)(xi,yi)(i=1,2,……,20),其中xi和yi分別表示第i個縣城的人口(單位:萬人)和該縣年垃圾產(chǎn)生總量(單位:噸),并計算得i=120xi=80,i=120yi=4000,i=120(xi?x)2=80,i=120(y(1)請用相關(guān)系數(shù)說明該組數(shù)據(jù)中y與x之間的關(guān)系可用線性回歸模型進行擬合;(2)求y關(guān)于x的線性回歸方程;(3)某科研機構(gòu)研發(fā)了兩款垃圾處理機器,如表是以往兩款垃圾處理機器的使用年限(整年)統(tǒng)計表:使用年限臺數(shù)款式1年2年3年4年5年甲款520151050乙款152010550某環(huán)保機構(gòu)若考慮購買其中一款垃圾處理器,以使用年限的頻率估計概率.根據(jù)以往經(jīng)驗估計,該機構(gòu)選擇購買哪一款垃圾處理機器,才能使用更長久?參考公式:相關(guān)系數(shù)r=i=1對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(xi,yi)(i=1,2,……,n),其回歸直線y?=b?x+a例6.某基地蔬菜大棚采用水培、無土栽培方式種植各類蔬菜.據(jù)統(tǒng)計該基地的西紅柿增加量y(百斤)與使用某種液體肥料x(千克)之間對應(yīng)數(shù)據(jù)為如圖所示的折線圖.(1)依據(jù)數(shù)據(jù)的折線圖,請計算相關(guān)系數(shù)r(精確到0.01),并以此判定是否可用線性回歸模型擬合y與x的關(guān)系?若是請求出回歸直線方程,若不是請說明理由;(2)過去50周的資料顯示,該地周光照量X(小時)都在30小時以上,其中不足50小時的周數(shù)有5周,不低于50小時且不超過70小時的周數(shù)有35周,超過70小時的周數(shù)有10周.蔬菜大棚對光照要求較大,某光照控制儀商家為該基地提供了部分光照控制儀,但每周光照控制儀最多可運行臺數(shù)受周光照量X限制,并有如表關(guān)系:周光照量X(單位:小時)30<X<5050≤X≤70n≥2光照控制儀最多可運行臺數(shù)542若某臺光照控制儀運行,則該臺光照控制儀周利潤為3000元;若某臺光照控制儀未運行,則該臺光照控制儀周虧損1000元.若商家安裝了5臺光照控制儀,求商家在過去50周每周利潤的平均值.附:對于一組數(shù)據(jù)(x1,y1),(x2,y2),……,(xn,yn),其相關(guān)系數(shù)公式r=i=1n(xi?x)(yi例7.湖南省從2021年開始將全面推行“3+1+2”的新高考模式,新高考對化學(xué)、生物、地理和政治等四門選考科目,制定了計算轉(zhuǎn)換T分(即記入高考總分的分數(shù))的“等級轉(zhuǎn)換賦分規(guī)則”(詳見附1和附2),具體的轉(zhuǎn)換步驟為:①原始分Y等級轉(zhuǎn)換;②原始分等級內(nèi)等比例轉(zhuǎn)換賦分.某校的一次年級統(tǒng)考中,政治、生物兩選考科目的原始分分布如表:等級ABCDE比例約15%約35%約35%約13%約2%政治學(xué)科各等級對應(yīng)的原始分區(qū)間[81,98][72,80][66,71][63,65][60,62]生物學(xué)科各等級對應(yīng)的原始分區(qū)間[90,100][77,89][69,76][66,68][63,65]現(xiàn)從政治、生物兩學(xué)科中分別隨機抽取了20個原始分成績數(shù)據(jù),作出莖葉圖:(1)根據(jù)莖葉圖,分別求出政治成績的中位數(shù)和生物成績的眾數(shù);(2)該校的甲同學(xué)選考政治學(xué)科,其原始分為82分,乙同學(xué)選考生物學(xué)科,其原始分為91分,根據(jù)賦分轉(zhuǎn)換公式,分別求出這兩位同學(xué)的轉(zhuǎn)化分;(3)根據(jù)生物成績在等級B的6個原始分和對應(yīng)的6個轉(zhuǎn)化分,得到樣本數(shù)據(jù)(Yi,Ti),請計算生物原始分Yi與生物轉(zhuǎn)換分Ti之間的相關(guān)系數(shù),并根據(jù)這兩個變量的相關(guān)系數(shù)談?wù)勀銓π赂呖歼@種“等級轉(zhuǎn)換賦分法”的看法.附1:等級轉(zhuǎn)換的等級人數(shù)占比與各等級的轉(zhuǎn)換分賦分區(qū)間等級ABCDE原始分從高到低排序的等級人數(shù)占比約15%約35%約35%約13%約2%轉(zhuǎn)換分T的賦分區(qū)間[86,100][71,85][56,70][41,55][30,40]附2:計算轉(zhuǎn)換分T的等比例轉(zhuǎn)換賦分公式:Y2?YY?Y1=T2?TT?T1.(其中:Y1,Y附3:i=16(Yi?Y)(Ti?T)=74,i=1例8.某市房管局為了了解該市市民2018年1月至2019年1月期間買二手房情況,首先隨機抽樣其中200名購房者,并對其購房面積m(單位:平方米,60≤m≤130)進行了一次調(diào)查統(tǒng)計,制成了如圖1所示的頻率分布直方圖,接著調(diào)查了該市2018年1月至2019年1月期間當月在售二手房均價y(單位:萬元/平方米),制成了如圖2所示的散點圖(圖中月份代碼1﹣13分別對應(yīng)2018年1月至2019年1月).(Ⅰ)試估計該市市民的購房面積的中位數(shù)m0;(Ⅱ)現(xiàn)采用分層抽樣的方法從購房面積位于[110,130]的40位市民中隨機抽取4人,再從這4人中隨機抽取2人,求這2人的購房面積恰好有一人在[120,130]的概率;(Ⅲ)根據(jù)散點圖選擇y?=a?+b?y?y?i=1130.0005910.000164i=1130.006050請利用相關(guān)指數(shù)R2判斷哪個模型的擬合效果更好,并用擬合效果更好的模型預(yù)測出2019年12月份的二手房購房均價(精確到0.001).【參考數(shù)據(jù)】ln2≈0.69,ln3≈1.10,ln23≈3.14,ln25≈3.22,2≈141,3≈1.73,【參考公式】R2例9.某汽車公司擬對“東方紅”款高端汽車發(fā)動機進行科技改造,根據(jù)市場調(diào)研與模擬,得到科技改造投入x(億元)與科技改造直接收益y(億元)的數(shù)據(jù)統(tǒng)計如表:x2346810132122232425y1322314250565868.56867.56666當0<x≤16時,建立了y與x的兩個回歸模型:模型①:y?=4.1x+11.8;模型②:y?=21.3x?14.4;當x>16時,確定(Ⅰ)根據(jù)下列表格中的數(shù)據(jù),比較當0<x≤16時模型①、②的相關(guān)指數(shù)R2,并選擇擬合精度更高、更可靠的模型,預(yù)測對“東方紅”款汽車發(fā)動機科技改造的投入為16億元時的直接收益.回歸模型模型①模型②回歸方程y?y?i=17182.479.2(附:刻畫回歸效果的相關(guān)指數(shù)R2=1?i=1(Ⅱ)為鼓勵科技創(chuàng)新,當科技改造的投入不少于20億元時,國家給予公司補貼收益10億元,以回歸方程為預(yù)測依據(jù),比較科技改造投入16元與20億元時公司實際收益的大小;(附:用最小二乘法求線性回歸方程y?=b?x+(Ⅲ)科技改造后,“東方紅”款汽車發(fā)動機的熱效率X大幅提高,X服從正態(tài)分布N(0.52,0.012),公司對科技改造團隊的獎勵方案如下:若發(fā)動機的熱效率不超過50%但不超過53%,不予獎勵;若發(fā)動機的熱效率超過50%但不超過53%,每臺發(fā)動機獎勵2萬元;若發(fā)動機的熱效率超過53%,每臺發(fā)動機獎勵4萬元.求每臺發(fā)動機獲得獎勵的數(shù)學(xué)期望.(附:隨機變量ξ服從正態(tài)分布N(μ,σ2),則P(μ﹣σ<ξ<μ+σ)=0.6827,P(μ﹣2σ<ξ<μ+2σ)=0.9545.)例10.某高中數(shù)學(xué)建模興趣小組的同學(xué)為了研究所在地區(qū)男高中生的身高與體重的關(guān)系,從若干個高中男學(xué)生中抽取了1000個樣本,得到如下數(shù)據(jù).數(shù)據(jù)一:身高在[170,180)(單位:cm)的體重頻數(shù)統(tǒng)計體重(kg)[50,55)[55,60)[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人數(shù)206010010080201010數(shù)據(jù)二:身高所在的區(qū)間含樣本的個數(shù)及部分數(shù)據(jù)身高x(cm)[140,150)[150,160)[160﹣170)[170﹣180)[180﹣190)平均體重y(kg)4553.66075(Ⅰ)依據(jù)數(shù)據(jù)一將下面男高中生身高在[170﹣180)(單位:cm)體重的頻率分布直方圖補充完整,并利用頻率分布直方圖估計身高在[170﹣180)(單位:cm)的中學(xué)生的平均體重;(保留小數(shù)點后一位)(Ⅱ)依據(jù)數(shù)據(jù)一、二,計算身高(取值為區(qū)間中點)和體重的相關(guān)系數(shù)約為0.99,能否用線性回歸直線來刻畫中學(xué)生身高與體重的相關(guān)關(guān)系,請說明理由;若能,求出該回歸直線方程;(Ⅲ)說明殘差平方和或相關(guān)指數(shù)R2與線性回歸模型擬合效果之間關(guān)系.(只需寫出結(jié)論,不需要計算)參考公式:b?=i=1參考數(shù)據(jù):(1)145×45+155×53.6+165×60+185×75=38608;(2)1452+1552+1652+1752+1852﹣5×1652=1000.(3)663×175=116025,664×175=116200,665×175=116375.(4)728×165=120120.例11.2019年的“金九銀十”變成“銅九鐵十”,國各地房價“跳水”嚴重,但某地二手房交易卻“逆市”而行.如圖是該地某小區(qū)2018年11月至2019年1月間,當月在售二手房均價(單位:萬元/平方米)的散點圖.(圖中月份代碼1~13分別對應(yīng)2018年11月~2019年11月)根據(jù)散點圖選擇y=a+bx和y=c+dlnx兩個模型進行擬合,經(jīng)過數(shù)據(jù)處理得到兩個回歸方程分別為y^=0.9369+0.0285y^y^i=1130.0005910.000164i=1130.006050(1)請利用相關(guān)指數(shù)R2判斷哪個模型的擬合效果更好;(2)某位購房者擬于2020年4月購買這個小區(qū)m(70≤m≤160)平方米的二手房(欲購房為其家庭首套房).若購房時該小區(qū)所有住房的房產(chǎn)證均已滿2但未滿5年,請你利用(1)中擬合效果更好的模型解決以下問題:(i)估算該購房者應(yīng)支付的購房金額;(購房金額=房款+稅費,房屋均價精確到0.001萬元/平方米)(ii)若該購房者擬用不超過100萬元的資金購買該小區(qū)一套二手房,試估算其可購買的最大面積.(精確到1平方米)附注:根據(jù)有關(guān)規(guī)定,二手房交易需要繳納若干項稅費,稅費是按房屋的計稅價格(計稅價格=房款)進行征收的.房產(chǎn)證滿2年但未滿5年的征收方式如下:首套面積90平方米以內(nèi)(含90平方米)為1%;首套面積90平方米以上且140平方米以內(nèi)(含140平方米)1.5%;首套面積140平方米以上或非首套為3%.參考數(shù)據(jù):ln2≈0.69,ln3≈1.10,ln17≈2.83,ln19≈2.94,2≈1.41,3≈1.73,17≈4.12參考公式:相關(guān)指數(shù)R2例12.某新興科技公司為了確定新研發(fā)的產(chǎn)品下一季度的營銷計劃,需了解月宣傳費x(單位:萬元)對月銷售量y(單位:千件)的影響,收集了2020年3月至2020年8月共6個月的月宣傳費x和月銷售量y的數(shù)據(jù)如表:月份345678宣傳費x5678910月銷售量y0.43.55.27.08.610.7現(xiàn)分別用模型①y?=b?(模型①和模型②的殘差分別為e?1和x5678910y0.43.55.37.08.610.7e?﹣0.60.540.280.12﹣0.24﹣0.1e?﹣0.631.712.101.63﹣0.7﹣5.42(1)根據(jù)上表的殘差數(shù)據(jù),應(yīng)選擇哪個模型來擬合月宣傳費x與月銷售量y的關(guān)系較為合適,簡要說明理由;(2)為了優(yōu)化模型,將(1)中選擇的模型殘差絕對值最大所對應(yīng)的一組數(shù)據(jù)(x,y)剔除,根據(jù)剩余的5組數(shù)據(jù),求該模型的回歸方程,并預(yù)測月宣傳費為12萬元時,該公司的月銷售量.(剔除數(shù)據(jù)前的參考數(shù)據(jù):x=7.5,y=5.9,i=16xiyi=299.8,i=16xi2參考公式:b?=i=1例13.新型冠狀病毒肺炎COVID﹣19疫情發(fā)生以來,在世界各地逐漸蔓延.在全國人民的共同努力和各級部門的嚴格管控下,我國的疫情已經(jīng)得到了很好的控制.然而,小王同學(xué)發(fā)現(xiàn),每個國家在疫情發(fā)生的初期,由于認識不足和措施不到位,感染人數(shù)都會出現(xiàn)快速的增長.如表是小王同學(xué)記錄的某國連續(xù)8天每日新型冠狀病毒感染確診的累計人數(shù).日期代碼x12345678累計確診人數(shù)y481632517197122為了分析該國累計感染人數(shù)的變化趨勢,小王同學(xué)分別用兩種模型:①y?②y?=dx+c對變量x和y的關(guān)系進行擬合,得到相應(yīng)的回歸方程并進行殘差分析,殘差圖如下(注:殘差ei=yi?yi):經(jīng)過計算得它i=18((1)根據(jù)殘差圖,比較模型①,②的擬合效果,應(yīng)該選擇哪個模型?并簡要說明理由;(2)根據(jù)(1)問選定的模型求出相應(yīng)的回歸方程(系數(shù)均保留兩位小數(shù));(3)由于時差,該國截止第9天新型冠狀病毒感染確診的累計人數(shù)尚未公布.小王同學(xué)認為,如果防疫形勢沒有得到明顯改善,在數(shù)據(jù)公布之前可以根據(jù)他在(2)問求出的回歸方程來對感染人數(shù)做出預(yù)測,那么估計該地區(qū)第9天新型冠狀病毒感染確診的累計人數(shù)是多少?附:回歸直線的斜率和截距的最小二乘估計公式分別為:b?=i=1例14.H市某企業(yè)堅持以市場需求為導(dǎo)向,合理配置生產(chǎn)資源,不斷改革、探索銷售模式.下表是該企業(yè)每月生產(chǎn)的一種核心產(chǎn)品的產(chǎn)量x(噸)與相應(yīng)的生產(chǎn)總成本y(萬元)的五組對照數(shù)據(jù).產(chǎn)量x(件)12345生產(chǎn)總成本y(萬元)3781012(Ⅰ)根據(jù)上達數(shù)據(jù),若用最小二乘法進行線性模擬,試求y關(guān)于x的線性回歸方程y?參考公式:b?=i=1(Ⅱ)記第(Ⅰ)問中所求y與x的線性回歸方程y?=b?x+a?為模型①,同時該企業(yè)科研人員利用計算機根據(jù)數(shù)據(jù)又建立了y與x請完成模型①的殘差表與殘差圖,并根據(jù)殘差圖,判斷哪一個模型更適宜作為y關(guān)于x的回歸方程?并說明理由;(Ⅲ)根據(jù)模型①中y與x的線性回歸方程,預(yù)測產(chǎn)量為6噸時生產(chǎn)總成本為多少萬元?例15.為了解某企業(yè)生產(chǎn)的某產(chǎn)品的年利潤與年廣告投入的關(guān)系,該企業(yè)對最近一些相關(guān)數(shù)據(jù)進行了調(diào)查統(tǒng)計,得出相關(guān)數(shù)據(jù)見表:年廣告投入x(萬元)23456年利潤y(十萬元)346811根據(jù)以上數(shù)據(jù),研究人員分別借助甲.乙兩種不同的回歸模型,得到兩個回歸方程,方程甲:方程甲:y?(1)=b?(x﹣1)2+2.75,方程乙:y?(1)求b?(結(jié)果精確到0.01)與c(2)為了評價兩種模型的擬合效果,完成以下任務(wù).①完成下表(備注:ei=yi?yi,ei稱為相應(yīng)于點(x年廣告投入x(萬元)23456年利潤y(十萬元)346811模型甲估計值yi殘差ei模型乙估計值yi殘差ei②分別計算模型甲與模型乙的殘差平方和Q1及Q2,并通過比較Q1,Q2的大小,判斷哪個模型擬合效果更好.專題5回歸分析例1.已知回歸方程y?A.﹣2 B.1 C.2 D.5【解析】解:當x=1時,y?=5∴方程在樣本(1,4)處的殘差是4﹣6=﹣2.故選:A.例2.研究變量x,y得到一組樣本數(shù)據(jù),進行回歸分析,有以下結(jié)論①殘差平方和越小的模型,擬合的效果越好;②用相關(guān)指數(shù)R2來刻畫回歸效果,R2越小說明擬合效果越好;③在回歸直線方程y?=?0.2x+0.8中,當解釋變量x每增加1個單位時,預(yù)報變量④若變量y和x之間的相關(guān)系數(shù)為r=﹣0.9462,則變量y和x之間的負相關(guān)很強.以上正確說法的是①③④.【解析】解:①可用殘差平方和判斷模型的擬合效果,殘差平方和越小,模型的擬合效果越好,故①正確;②用相關(guān)指數(shù)R2來刻畫回歸效果,R2越大說明擬合效果越好,故②錯誤;③在回歸直線方程y?=?0.2x+0.8中中,當解釋變量x每增加1個單位時,預(yù)報變量y?④若變量y和x之間的相關(guān)系數(shù)為r=﹣0.9462,r的絕對值趨向于1,則變量y和x之間的負相關(guān)很強,故④正確.故答案為:①③④.例3.下列命題中,正確的命題有②③.①回歸直線y?=b?x+a②用相關(guān)指數(shù)R2來刻畫回歸效果,表示預(yù)報變量對解釋變量變化的貢獻率,R2越接近于1說明模型的擬合效果越好;③殘差圖中殘差點比較均勻的落在水平的帶狀區(qū)域中,說明選用的模型比較合適;④兩個模型中殘差平方和越大的模型的擬合效果越好.【解析】解:①回歸直線y?=b?x+a?恒過樣本點中心(②用相關(guān)指數(shù)R2來刻畫回歸效果,表示預(yù)報變量對解釋變量變化的貢獻率,R2越接近于1說明模型的擬合效果越好,正確;③殘差圖中殘差點比較均勻的落在水平的帶狀區(qū)域中,說明選用的模型比較合適,正確;④兩個模型中殘差平方和越大的模型的擬合效果越差.故④錯誤,故正確的是②③,故答案為:②③例4.下列命題:①相關(guān)指數(shù)R2越小,則殘差平方和越大,模型的擬合效果越好.②對分類變量X與Y的隨機變量K2的觀測值k來說,k越小,“X與Y有關(guān)系”可信程度越大.③殘差點比較均勻地落在水平帶狀區(qū)域內(nèi),帶狀區(qū)域越寬,說明模型擬合精度越高.④兩個隨機變量相關(guān)性越強,則相關(guān)系數(shù)的絕對值越接近0.其中錯誤命題的個數(shù)為4.【解析】解:對于①,相關(guān)指數(shù)R2越小,則殘差平方和越大,此時模型的擬合效果越差,所以①錯誤;對于②,對分類變量X與Y的隨機變量K2的觀測值k來說,k越小,“X與Y有關(guān)系”可信程度越小,所以②錯誤;對于③,殘差點比較均勻地落在水平帶狀區(qū)域內(nèi),帶狀區(qū)域越寬,說明模型擬合精度越低,所以③錯誤;對于④,兩個隨機變量相關(guān)性越強,則相關(guān)系數(shù)的絕對值越接近1,所以④錯誤.綜上知,錯誤命題的序號是①②③④,共4個.故答案為:4.例5.垃圾是人類日常生活和生產(chǎn)中產(chǎn)生的廢棄物,由于排出量大,成分復(fù)雜多樣,且具有污染性,所以需要無害化、減量化處理.某市為調(diào)査產(chǎn)生的垃圾數(shù)量,采用簡單隨機抽樣的方法抽取20個縣城進行了分析,得到樣本數(shù)據(jù)(xi,yi)(i=1,2,……,20),其中xi和yi分別表示第i個縣城的人口(單位:萬人)和該縣年垃圾產(chǎn)生總量(單位:噸),并計算得i=120xi=80,i=120yi=4000,i=120(xi?x)2=80,i=120(y(1)請用相關(guān)系數(shù)說明該組數(shù)據(jù)中y與x之間的關(guān)系可用線性回歸模型進行擬合;(2)求y關(guān)于x的線性回歸方程;(3)某科研機構(gòu)研發(fā)了兩款垃圾處理機器,如表是以往兩款垃圾處理機器的使用年限(整年)統(tǒng)計表:使用年限臺數(shù)款式1年2年3年4年5年甲款520151050乙款152010550某環(huán)保機構(gòu)若考慮購買其中一款垃圾處理器,以使用年限的頻率估計概率.根據(jù)以往經(jīng)驗估計,該機構(gòu)選擇購買哪一款垃圾處理機器,才能使用更長久?參考公式:相關(guān)系數(shù)r=i=1對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(xi,yi)(i=1,2,……,n),其回歸直線y?=b?x+a【解析】解:(1)由題意知相關(guān)系數(shù)r=i=1因為y與x的相關(guān)系數(shù)接近1,所以y與x之間具有較強的線性相關(guān)關(guān)系,可用線性回歸模型進行擬合.(2)由題意可得,b?=i=1所以y?(3)以頻率估計概率,購買一臺甲款垃圾處理機器節(jié)約政府支持的垃圾處理費用X(單位:萬元)的分布列為X﹣50050100P0.10.40.30.2E(X)=﹣50×0.1+0×0.4+50×0.3+100×0.2=30(萬元)購買一臺乙款垃圾處理機器節(jié)約政府支持的垃圾處理費用Y(單位:萬元)的分布列為:Y﹣302070120P0.30.40.20.1E(Y)=﹣30×0.3+20×0.4+70×0.2+120×0.1=25(萬元)因為E(X)>E(Y),所以該縣城選擇購買一臺甲款垃圾處理機器更劃算.例6.某基地蔬菜大棚采用水培、無土栽培方式種植各類蔬菜.據(jù)統(tǒng)計該基地的西紅柿增加量y(百斤)與使用某種液體肥料x(千克)之間對應(yīng)數(shù)據(jù)為如圖所示的折線圖.(1)依據(jù)數(shù)據(jù)的折線圖,請計算相關(guān)系數(shù)r(精確到0.01),并以此判定是否可用線性回歸模型擬合y與x的關(guān)系?若是請求出回歸直線方程,若不是請說明理由;(2)過去50周的資料顯示,該地周光照量X(小時)都在30小時以上,其中不足50小時的周數(shù)有5周,不低于50小時且不超過70小時的周數(shù)有35周,超過70小時的周數(shù)有10周.蔬菜大棚對光照要求較大,某光照控制儀商家為該基地提供了部分光照控制儀,但每周光照控制儀最多可運行臺數(shù)受周光照量X限制,并有如表關(guān)系:周光照量X(單位:小時)30<X<5050≤X≤70n≥2光照控制儀最多可運行臺數(shù)542若某臺光照控制儀運行,則該臺光照控制儀周利潤為3000元;若某臺光照控制儀未運行,則該臺光照控制儀周虧損1000元.若商家安裝了5臺光照控制儀,求商家在過去50周每周利潤的平均值.附:對于一組數(shù)據(jù)(x1,y1),(x2,y2),……,(xn,yn),其相關(guān)系數(shù)公式r=i=1n(xi?x)(yi【解析】解:(1)由已知數(shù)據(jù)可得x=2+4+5+6+85因為i=15i=15i=15所以相關(guān)系數(shù)r=i=1因為r>0.75,所以可用線性回歸模型擬合y與x的關(guān)系,因為b?=i=1n(x(2)記商家周總利潤為Y元,由條件可得在過去50周里:X>70時,共有10周,只有2臺光照控制儀運行,周總利潤Y=2×3000﹣3×1000=3000元,當50≤X≤70時,共有35周,有4臺光照控制儀運行,周總利潤Y=4×3000﹣1×1000=11000元,當X<50時,共有5周,5臺光照控制儀都運行,周總利潤Y=5×3000=15000元,所以過去50周每周利潤的平均值Y=所以商家在過去50周每周利潤的平均值為9800元.例7.湖南省從2021年開始將全面推行“3+1+2”的新高考模式,新高考對化學(xué)、生物、地理和政治等四門選考科目,制定了計算轉(zhuǎn)換T分(即記入高考總分的分數(shù))的“等級轉(zhuǎn)換賦分規(guī)則”(詳見附1和附2),具體的轉(zhuǎn)換步驟為:①原始分Y等級轉(zhuǎn)換;②原始分等級內(nèi)等比例轉(zhuǎn)換賦分.某校的一次年級統(tǒng)考中,政治、生物兩選考科目的原始分分布如表:等級ABCDE比例約15%約35%約35%約13%約2%政治學(xué)科各等級對應(yīng)的原始分區(qū)間[81,98][72,80][66,71][63,65][60,62]生物學(xué)科各等級對應(yīng)的原始分區(qū)間[90,100][77,89][69,76][66,68][63,65]現(xiàn)從政治、生物兩學(xué)科中分別隨機抽取了20個原始分成績數(shù)據(jù),作出莖葉圖:(1)根據(jù)莖葉圖,分別求出政治成績的中位數(shù)和生物成績的眾數(shù);(2)該校的甲同學(xué)選考政治學(xué)科,其原始分為82分,乙同學(xué)選考生物學(xué)科,其原始分為91分,根據(jù)賦分轉(zhuǎn)換公式,分別求出這兩位同學(xué)的轉(zhuǎn)化分;(3)根據(jù)生物成績在等級B的6個原始分和對應(yīng)的6個轉(zhuǎn)化分,得到樣本數(shù)據(jù)(Yi,Ti),請計算生物原始分Yi與生物轉(zhuǎn)換分Ti之間的相關(guān)系數(shù),并根據(jù)這兩個變量的相關(guān)系數(shù)談?wù)勀銓π赂呖歼@種“等級轉(zhuǎn)換賦分法”的看法.附1:等級轉(zhuǎn)換的等級人數(shù)占比與各等級的轉(zhuǎn)換分賦分區(qū)間等級ABCDE原始分從高到低排序的等級人數(shù)占比約15%約35%約35%約13%約2%轉(zhuǎn)換分T的賦分區(qū)間[86,100][71,85][56,70][41,55][30,40]附2:計算轉(zhuǎn)換分T的等比例轉(zhuǎn)換賦分公式:Y2?YY?Y1=T2?TT?T1.(其中:Y1,Y附3:i=16(Yi?Y)(Ti?T)=74,i=1【解析】解:(1)根據(jù)莖葉圖知,政治成績的中位數(shù)為72,生物成績的眾數(shù)為73;(2)甲同學(xué)選考政治學(xué)科的等級為A,由轉(zhuǎn)換賦分公式:98?8282?81=100?T乙同學(xué)選考生物學(xué)科的等級為A,由賦分轉(zhuǎn)換公式:100?9191?90=100?T所以甲、乙兩位同學(xué)的轉(zhuǎn)換分都是87分.(3)由題意知,r=i=1說法1:等級轉(zhuǎn)換賦分公平,因為相關(guān)系數(shù)十分接近1,接近函數(shù)關(guān)系,因此高考這種“等級轉(zhuǎn)換賦分”具有公平性與合理性.說法2:等級轉(zhuǎn)換賦分法不公平,在同一等級內(nèi),原始分與轉(zhuǎn)化分是確定的函數(shù)關(guān)系,理論上原始分與轉(zhuǎn)化分的相關(guān)系數(shù)為1,在實際賦分過程中由于數(shù)據(jù)的四舍五入,使得實際的轉(zhuǎn)化分與應(yīng)得的轉(zhuǎn)化分有一定的誤差,極小部分同學(xué)賦分后會出現(xiàn)偏高或偏低的現(xiàn)象.(只要說法有道理,都可以得分).例8.某市房管局為了了解該市市民2018年1月至2019年1月期間買二手房情況,首先隨機抽樣其中200名購房者,并對其購房面積m(單位:平方米,60≤m≤130)進行了一次調(diào)查統(tǒng)計,制成了如圖1所示的頻率分布直方圖,接著調(diào)查了該市2018年1月至2019年1月期間當月在售二手房均價y(單位:萬元/平方米),制成了如圖2所示的散點圖(圖中月份代碼1﹣13分別對應(yīng)2018年1月至2019年1月).(Ⅰ)試估計該市市民的購房面積的中位數(shù)m0;(Ⅱ)現(xiàn)采用分層抽樣的方法從購房面積位于[110,130]的40位市民中隨機抽取4人,再從這4人中隨機抽取2人,求這2人的購房面積恰好有一人在[120,130]的概率;(Ⅲ)根據(jù)散點圖選擇y?=a?+b?y?y?i=1130.0005910.000164i=1130.006050請利用相關(guān)指數(shù)R2判斷哪個模型的擬合效果更好,并用擬合效果更好的模型預(yù)測出2019年12月份的二手房購房均價(精確到0.001).【參考數(shù)據(jù)】ln2≈0.69,ln3≈1.10,ln23≈3.14,ln25≈3.22,2≈141,3≈1.73,【參考公式】R2【解析】解:(I)由頻率分布直方圖,可得,前三組頻率和為0.05+0.1+0.2=0.35,前四組頻率和為0.05+0.1+0.2+025=0.6,故中位數(shù)出現(xiàn)在第四組,且m0(Ⅱ)設(shè)從位于[110,120)的市民中抽取x人,從位于[120,130]的市民中抽取y人,由分層抽樣可知:440=x30=在抽取的4人中,記3名位于[11,120)的市民為A1,A2,A3,位于[120,130]的市民為B則所有抽樣情況為:(A1,A2),(A1,A3),(A1,B),(A2,A3),(A2,B),(A3,B)共6種.而其中恰有一人在位于購房面積[120,130]的情況共有3種,故所求概率P=3(III)設(shè)模型y?=0.9369+0.0285x和y?=0.955+0.0306lnx則R12=1?顯然R1故模型y?由2019年12月份對應(yīng)的代碼為24,則y?例9.某汽車公司擬對“東方紅”款高端汽車發(fā)動機進行科技改造,根據(jù)市場調(diào)研與模擬,得到科技改造投入x(億元)與科技改造直接收益y(億元)的數(shù)據(jù)統(tǒng)計如表:x2346810132122232425y1322314250565868.56867.56666當0<x≤16時,建立了y與x的兩個回歸模型:模型①:y?=4.1x+11.8;模型②:y?=21.3x?14.4;當x>16時,確定(Ⅰ)根據(jù)下列表格中的數(shù)據(jù),比較當0<x≤16時模型①、②的相關(guān)指數(shù)R2,并選擇擬合精度更高、更可靠的模型,預(yù)測對“東方紅”款汽車發(fā)動機科技改造的投入為16億元時的直接收益.回歸模型模型①模型②回歸方程y?y?i=17182.479.2(附:刻畫回歸效果的相關(guān)指數(shù)R2=1?i=1(Ⅱ)為鼓勵科技創(chuàng)新,當科技改造的投入不少于20億元時,國家給予公司補貼收益10億元,以回歸方程為預(yù)測依據(jù),比較科技改造投入16元與20億元時公司實際收益的大?。唬ǜ剑河米钚《朔ㄇ缶€性回歸方程y?=b?x+(Ⅲ)科技改造后,“東方紅”款汽車發(fā)動機的熱效率X大幅提高,X服從正態(tài)分布N(0.52,0.012),公司對科技改造團隊的獎勵方案如下:若發(fā)動機的熱效率不超過50%但不超過53%,不予獎勵;若發(fā)動機的熱效率超過50%但不超過53%,每臺發(fā)動機獎勵2萬元;若發(fā)動機的熱效率超過53%,每臺發(fā)動機獎勵4萬元.求每臺發(fā)動機獲得獎勵的數(shù)學(xué)期望.(附:隨機變量ξ服從正態(tài)分布N(μ,σ2),則P(μ﹣σ<ξ<μ+σ)=0.6827,P(μ﹣2σ<ξ<μ+2σ)=0.9545.)【解析】解:(Ⅰ)由表格中的數(shù)據(jù),有182.4>79.2,即182.4i=1∴模型①的R2小于模型②的R2,說明模型②的刻畫效果更好.∴當x=16億元時,科技改造直接收益的預(yù)測值為y?(Ⅱ)由已知可得,x?20=0.5+2+3.5+4+55y?60=8.5+8+7.5+6+65∴a?∴當x>16億元時,y與x滿足線性回歸方程y?當x=20億元時,科技改造直接收益的預(yù)測值為y?∴當x=20億元時,實際收益的預(yù)測值為69.3+10=79.3億元>70.8億元.∴科技改造投入20億元時,公司的實際收益更大;(Ⅲ)∵P(0.52﹣0.02<X<0.52+0.02)=0.9545,∴P(X>0.50)=1+0.95452=0.97725,P(X∵P(0.52﹣0.01<X<0.52+0.01)=0.6827,∴P(X>0.53)=1?0.6827∴P(0.50<X≤0.53)=0.97725﹣0.15865=0.8186.設(shè)每臺發(fā)動機獲得的獎勵為Y(萬元),則Y的分布列為:Y024P0.022750.81860.15865∴每臺發(fā)動機獲得的獎勵的數(shù)學(xué)期望為:E(Y)=0×0.02275+2×0.8186+4×0.15865=2.2718(萬元).例10.某高中數(shù)學(xué)建模興趣小組的同學(xué)為了研究所在地區(qū)男高中生的身高與體重的關(guān)系,從若干個高中男學(xué)生中抽取了1000個樣本,得到如下數(shù)據(jù).數(shù)據(jù)一:身高在[170,180)(單位:cm)的體重頻數(shù)統(tǒng)計體重(kg)[50,55)[55,60)[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人數(shù)206010010080201010數(shù)據(jù)二:身高所在的區(qū)間含樣本的個數(shù)及部分數(shù)據(jù)身高x(cm)[140,150)[150,160)[160﹣170)[170﹣180)[180﹣190)平均體重y(kg)4553.66075(Ⅰ)依據(jù)數(shù)據(jù)一將下面男高中生身高在[170﹣180)(單位:cm)體重的頻率分布直方圖補充完整,并利用頻率分布直方圖估計身高在[170﹣180)(單位:cm)的中學(xué)生的平均體重;(保留小數(shù)點后一位)(Ⅱ)依據(jù)數(shù)據(jù)一、二,計算身高(取值為區(qū)間中點)和體重的相關(guān)系數(shù)約為0.99,能否用線性回歸直線來刻畫中學(xué)生身高與體重的相關(guān)關(guān)系,請說明理由;若能,求出該回歸直線方程;(Ⅲ)說明殘差平方和或相關(guān)指數(shù)R2與線性回歸模型擬合效果之間關(guān)系.(只需寫出結(jié)論,不需要計算)參考公式:b?=i=1參考數(shù)據(jù):(1)145×45+155×53.6+165×60+185×75=38608;(2)1452+1552+1652+1752+1852﹣5×1652=1000.(3)663×175=116025,664×175=116200,665×175=116375.(4)728×165=120120.【解析】解:(1)身高在[170,180)的總?cè)藬?shù)為:20+60+100+100+80+20+10+10=400,體重在[55﹣60)的頻率為:60400體重在[70﹣75)的頻率為:80400平均體重為:52.5×0.05+57.5×0.15+62.5×0.25+67.5×0.25+72.5×0.2+77.5×0.05+82.5×0.025+87.5×0.025≈66.4,(2)因為r=0.99→1,線性相關(guān)很強,故可以用線性回歸直線來刻畫中學(xué)生身高與體重的相關(guān),x=145+155+165+175+1855b?a?所以回歸直線方程為:y?(3)殘差平方和越小或相關(guān)指數(shù)R2越接近于1,線性回歸模型擬合效果越好.例11.2019年的“金九銀十”變成“銅九鐵十”,國各地房價“跳水”嚴重,但某地二手房交易卻“逆市”而行.如圖是該地某小區(qū)2018年11月至2019年1月間,當月在售二手房均價(單位:萬元/平方米)的散點圖.(圖中月份代碼1~13分別對應(yīng)2018年11月~2019年11月)根據(jù)散點圖選擇y=a+bx和y=c+dlnx兩個模型進行擬合,經(jīng)過數(shù)據(jù)處理得到兩個回歸方程分別為y^=0.9369+0.0285y^y^i=1130.0005910.000164i=1130.006050(1)請利用相關(guān)指數(shù)R2判斷哪個模型的擬合效果更好;(2)某位購房者擬于2020年4月購買這個小區(qū)m(70≤m≤160)平方米的二手房(欲購房為其家庭首套房).若購房時該小區(qū)所有住房的房產(chǎn)證均已滿2但未滿5年,請你利用(1)中擬合效果更好的模型解決以下問題:(i)估算該購房者應(yīng)支付的購房金額;(購房金額=房款+稅費,房屋均價精確到0.001萬元/平方米)(ii)若該購房者擬用不超過100萬元的資金購買該小區(qū)一套二手房,試估算其可購買的最大面積.(精確到1平方米)附注:根據(jù)有關(guān)規(guī)定,二手房交易需要繳納若干項稅費,稅費是按房屋的計稅價格(計稅價格=房款)進行征收的.房產(chǎn)證滿2年但未滿5年的征收方式如下:首套面積90平方米以內(nèi)(含90平方米)為1%;首套面積90平方米以上且140平方米以內(nèi)(含140平方米)1.5%;首套面積140平方米以上或非首套為3%.參考數(shù)據(jù):ln2≈0.69,ln3≈1.10,ln17≈2.83,ln19≈2.94,2≈1.41,3≈1.73,17≈4.12參考公式:相關(guān)指數(shù)R2【解析】解:(1)模型一中,y?相關(guān)指數(shù)為R2模型二中,y?相關(guān)指數(shù)為R2∴相關(guān)指數(shù)較大的模型二擬合效果好些.(2)通過散點圖確定2020年4月對應(yīng)的x=18,代入(1)中擬合效果更好的模型二,代入計算y?=0.9554+0.0306×(ln2+2ln3)=0.9554+0.0306×(0.69+2×1.10)≈1.044(萬元/平方米),則2020年4月份二手房均價的預(yù)測值為1.044(萬元/平方米).(i)設(shè)該購房者應(yīng)支付的購房金額h萬元,因為稅費中淵方只需繳納契稅,①當70?m?90時,契稅為計稅價格的1%,故h=m×1.044×(1%+1)=1.05444m;②當90<m?144時,契稅為計稅價格的1.5%,故h=m×1.044×(1.5%+1)=1.05966m;③當144<m?160時,契稅為計稅價格的3%,故h=m×1.044×(3%+1)=1.07532m;∴?=1.05444m,70?m?90∴當70?m?90時購房金額為1.05444m萬元,當90<m?144時購房金額為1.05966m萬元,當144<m?160時購房金額為1.07532m萬元.(ii)設(shè)該購房者可購買該小區(qū)二手房的最大面積為t平方米,由(i)知,當70?m?90時,應(yīng)支付的購房金額為1.05444t,又1.05444t?1.05444×90<100,又因為房屋均價約為1.044萬元/平方米,所以t<100,所以90?t<100,由1.05966t?100,解得t?1001.05966,且所以該購房者可購買該小區(qū)二手房的最大面積為94平方米.例12.某新興科技公司為了確定新研發(fā)的產(chǎn)品下一季度的營銷計劃,需了解月宣傳費x(單位:萬元)對月銷售量y(單位:千件)的影響,收集了2020年3月至2020年8月共6個月的月宣傳費x和月銷售量y的數(shù)據(jù)如表:月份345678宣傳費x5678910月銷售量y0.43.55.27.08.610.7現(xiàn)分別用模型①y?=b?(模型①和模型②的殘差分別為e?1和x5678910y0.43.55.37.08.610.7e?﹣0.60.540.280.12﹣0.24﹣0.1e?﹣0.631.712.101.63﹣0.7﹣5.42(1)根據(jù)上表的殘差數(shù)據(jù),應(yīng)選擇哪個模型來擬合月宣傳費x與月銷售量y的關(guān)系較為合適,簡要說明理由;(2)為了優(yōu)化模型,將(1)中選擇的模型殘差絕對值最大所對應(yīng)的一組數(shù)據(jù)(x,y)剔除,根據(jù)剩余的5組數(shù)據(jù),求該模型的回歸方程,并預(yù)測月宣傳費為12萬元時,該公司的月銷售量.(剔除數(shù)據(jù)前的參考數(shù)據(jù):x=7.5,y=5.9,i=16xiyi=299.8,i=16xi2參考公式:b?=i=1【解析】解:(1)應(yīng)選擇模型①,因為模型①每組數(shù)據(jù)對應(yīng)的殘差絕對值都比模型②的小,殘差波動小,殘差點比較均勻地落在水平的帶狀區(qū)域內(nèi),說明擬合精度高.(2)由(1)知,需剔除第一組數(shù)據(jù),則剔除后的x=7.5×6?555xy=280i=15x∴b?=i=1得①的回歸方程為y?則當x=12時,y?故月宣傳費為12萬元時,該公司的月銷售量為14.12千件.例13.新型冠狀病毒肺炎COVID﹣19疫情發(fā)生以來,在世界各地逐漸蔓延.在全國人民的共同努力和各級部門的嚴格管控下,我國的疫情已經(jīng)得到了很好的控制.然而,小王同學(xué)發(fā)現(xiàn),每個國家在疫情發(fā)生的初期,由于認識不足和措施不到位,感染人數(shù)都會出現(xiàn)快速的增長.如表是小王同學(xué)記錄的某國連續(xù)8天每日新型冠狀病毒感染確診的累計人數(shù).日期代
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 變更合同價款協(xié)議書
- 協(xié)議分戶析產(chǎn)協(xié)議書
- 商鋪置換住宅協(xié)議書
- 柳鐵一中試卷真題及答案
- 醫(yī)院租賃意向協(xié)議書
- 哥倆合作蓋房協(xié)議書
- 勞務(wù)合作免責協(xié)議書
- 商鋪租賃解除協(xié)議書
- 北京指標租憑協(xié)議書
- 土地開荒承包協(xié)議書
- 超星爾雅學(xué)習通《經(jīng)濟與社會如何用決策思維洞察生活》章節(jié)測試答案
- 柴油安全技術(shù)說明書(MSDS)
- 北師大版小學(xué)二年級數(shù)學(xué)上冊課程綱要
- 職工休假請假條模板
- 心臟康復(fù)指南完整版
- 國開電大土木工程本科《工程地質(zhì)》在線形考形考(作業(yè)1至4)試題及答案
- 售后維修服務(wù)單
- 國家中長期科技發(fā)展規(guī)劃綱要2021-2035
- ZDY3200S型煤礦用全液壓坑道鉆機行業(yè)資料礦業(yè)工程
- 北師大版八年級數(shù)學(xué)下冊 (一元一次不等式)一元一次不等式和一元一次不等式組課件(第2課時)
- 護理安全警示教育PPT
評論
0/150
提交評論