曲靖職業(yè)技術(shù)學(xué)院《探索性數(shù)據(jù)分析》2023-2024學(xué)年第一學(xué)期期末試卷_第1頁
曲靖職業(yè)技術(shù)學(xué)院《探索性數(shù)據(jù)分析》2023-2024學(xué)年第一學(xué)期期末試卷_第2頁
曲靖職業(yè)技術(shù)學(xué)院《探索性數(shù)據(jù)分析》2023-2024學(xué)年第一學(xué)期期末試卷_第3頁
曲靖職業(yè)技術(shù)學(xué)院《探索性數(shù)據(jù)分析》2023-2024學(xué)年第一學(xué)期期末試卷_第4頁
曲靖職業(yè)技術(shù)學(xué)院《探索性數(shù)據(jù)分析》2023-2024學(xué)年第一學(xué)期期末試卷_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

裝訂線裝訂線PAGE2第1頁,共3頁曲靖職業(yè)技術(shù)學(xué)院《探索性數(shù)據(jù)分析》

2023-2024學(xué)年第一學(xué)期期末試卷院(系)_______班級(jí)_______學(xué)號(hào)_______姓名_______題號(hào)一二三四總分得分一、單選題(本大題共20個(gè)小題,每小題1分,共20分.在每小題給出的四個(gè)選項(xiàng)中,只有一項(xiàng)是符合題目要求的.)1、已知某時(shí)間序列數(shù)據(jù)呈現(xiàn)出明顯的季節(jié)性波動(dòng)。為了消除季節(jié)因素的影響,以便更好地分析數(shù)據(jù)的長期趨勢(shì),應(yīng)該采用哪種方法?()A.移動(dòng)平均法B.指數(shù)平滑法C.季節(jié)指數(shù)法D.回歸分析法2、某工廠生產(chǎn)的零件尺寸服從正態(tài)分布,規(guī)定尺寸在[10±0.5]范圍內(nèi)為合格品。隨機(jī)抽取一個(gè)零件,其尺寸為9.8,計(jì)算該零件為合格品的概率是?()A.0.6826B.0.9544C.0.3413D.0.81853、在對(duì)兩個(gè)變量進(jìn)行回歸分析時(shí),得到回歸方程Y=3-0.5X。當(dāng)X增加1個(gè)單位時(shí),Y會(huì)()A.增加0.5個(gè)單位B.減少0.5個(gè)單位C.增加3個(gè)單位D.減少3個(gè)單位4、在一項(xiàng)調(diào)查中,要了解不同職業(yè)人群的平均收入水平。如果職業(yè)種類較多,應(yīng)該如何分組?()A.等距分組B.不等距分組C.單項(xiàng)式分組D.復(fù)合分組5、已知一組數(shù)據(jù)的均值為80,標(biāo)準(zhǔn)差為10。將每個(gè)數(shù)據(jù)都乘以2,那么新數(shù)據(jù)的均值和標(biāo)準(zhǔn)差分別為多少?()A.160,20B.160,10C.80,20D.80,106、在多元線性回歸分析中,如果自變量之間存在較強(qiáng)的多重共線性,會(huì)對(duì)回歸模型產(chǎn)生什么影響?()A.增大誤差方差B.降低擬合優(yōu)度C.使系數(shù)估計(jì)不準(zhǔn)確D.以上都是7、某地區(qū)的房?jī)r(jià)數(shù)據(jù)呈現(xiàn)右偏態(tài)分布,若要對(duì)其進(jìn)行描述性統(tǒng)計(jì),以下哪個(gè)指標(biāo)不太適合用來反映數(shù)據(jù)的集中趨勢(shì)?()A.均值B.中位數(shù)C.眾數(shù)D.以上都適合8、在一次市場(chǎng)調(diào)查中,要了解消費(fèi)者對(duì)某品牌產(chǎn)品的滿意度,設(shè)計(jì)了從非常滿意到非常不滿意的5個(gè)等級(jí)。收集到的數(shù)據(jù)應(yīng)屬于哪種數(shù)據(jù)類型?()A.定量數(shù)據(jù)B.定性數(shù)據(jù)C.連續(xù)型數(shù)據(jù)D.離散型數(shù)據(jù)9、某地區(qū)的氣溫在一年中呈現(xiàn)周期性變化,為了研究其規(guī)律,收集了過去5年每月的平均氣溫?cái)?shù)據(jù)。適合用于分析這種時(shí)間序列數(shù)據(jù)的方法是?()A.回歸分析B.方差分析C.指數(shù)平滑法D.聚類分析10、在研究身高與體重的關(guān)系時(shí),收集了50個(gè)人的數(shù)據(jù)。通過計(jì)算得到身高與體重的相關(guān)系數(shù)為0.7,決定系數(shù)為0.49。這意味著()A.身高可以解釋體重49%的變異B.體重可以解釋身高49%的變異C.身高與體重的關(guān)系不顯著D.身高與體重沒有關(guān)系11、某市場(chǎng)調(diào)查公司想了解消費(fèi)者對(duì)某品牌飲料口味的偏好,隨機(jī)抽取了500名消費(fèi)者進(jìn)行問卷調(diào)查。在分析數(shù)據(jù)時(shí),發(fā)現(xiàn)有部分消費(fèi)者未回答某些問題,對(duì)于這些缺失值,最合適的處理方法是?()A.直接刪除含缺失值的樣本B.用均值填充缺失值C.用中位數(shù)填充缺失值D.采用多重插補(bǔ)法12、在一個(gè)二項(xiàng)分布中,試驗(yàn)次數(shù)n=100,成功的概率p=0.3。計(jì)算成功次數(shù)的方差是?()A.21B.30C.70D.713、在對(duì)某地區(qū)的人口年齡結(jié)構(gòu)進(jìn)行分析時(shí),計(jì)算得到0-14歲人口占比為20%,15-64歲人口占比為70%,65歲及以上人口占比為10%。根據(jù)國際通用標(biāo)準(zhǔn),該地區(qū)的人口年齡結(jié)構(gòu)屬于哪種類型?()A.年輕型B.成年型C.老年型D.無法確定14、已知兩個(gè)變量X和Y之間存在線性關(guān)系,通過樣本數(shù)據(jù)計(jì)算得到回歸方程為Y=2X+3。若X的取值范圍為[1,5],當(dāng)X=3時(shí),Y的預(yù)測(cè)值的95%置信區(qū)間是多少?()A.[7,11]B.[8,10]C.[9,11]D.[6,10]15、在一個(gè)多元線性回歸模型中,如果存在多重共線性問題,會(huì)對(duì)模型產(chǎn)生什么影響?()A.系數(shù)估計(jì)不準(zhǔn)確B.模型預(yù)測(cè)能力下降C.方差增大D.以上都是16、為了解某城市居民的出行方式,隨機(jī)抽取了1000人進(jìn)行調(diào)查。已知選擇公交車出行的有400人,選擇地鐵出行的有300人,選擇私家車出行的有200人,選擇其他方式出行的有100人。若要繪制扇形圖展示各種出行方式的比例,選擇公交車出行所占的扇形角度約為()A.144°B.126°C.72°D.36°17、某工廠生產(chǎn)的零件尺寸服從正態(tài)分布,均值為10mm,標(biāo)準(zhǔn)差為0.1mm。質(zhì)量控制部門規(guī)定,零件尺寸在9.9mm至10.1mm之間為合格。一批產(chǎn)品中,合格產(chǎn)品的比例大約是多少?()A.68.27%B.95.45%C.99.73%D.幾乎為100%18、某工廠生產(chǎn)的產(chǎn)品重量服從正態(tài)分布,均值為100克,標(biāo)準(zhǔn)差為5克。質(zhì)量控制部門規(guī)定,產(chǎn)品重量低于90克或高于110克為不合格品。隨機(jī)抽取一個(gè)產(chǎn)品,其為不合格品的概率是多少?()A.0.0456B.0.0228C.0.0912D.0.182419、在進(jìn)行方差齊性檢驗(yàn)時(shí),如果檢驗(yàn)結(jié)果表明方差不齊,應(yīng)該如何處理?()A.使用校正的t檢驗(yàn)B.使用非參數(shù)檢驗(yàn)C.對(duì)數(shù)據(jù)進(jìn)行變換D.以上都可以20、某工廠生產(chǎn)的產(chǎn)品質(zhì)量特性服從正態(tài)分布,均值為100,標(biāo)準(zhǔn)差為5?,F(xiàn)從生產(chǎn)線上隨機(jī)抽取一個(gè)樣本,其質(zhì)量特性值為90。在顯著性水平為0.05下,該樣本是否為異常值?()A.是B.否C.無法確定D.以上都不對(duì)二、簡(jiǎn)答題(本大題共5個(gè)小題,共25分)1、(本題5分)闡述關(guān)聯(lián)規(guī)則挖掘的基本概念和方法,以一個(gè)實(shí)際的購物籃數(shù)據(jù)為例,說明如何發(fā)現(xiàn)有意義的關(guān)聯(lián)規(guī)則,并討論關(guān)聯(lián)規(guī)則的評(píng)價(jià)指標(biāo)。2、(本題5分)某電商平臺(tái)想要分析用戶的購買行為模式,收集了用戶的交易數(shù)據(jù)。請(qǐng)說明可以采用哪些統(tǒng)計(jì)方法來挖掘這些數(shù)據(jù)中的潛在模式,并闡述如何將分析結(jié)果應(yīng)用于營銷決策。3、(本題5分)闡述在進(jìn)行多水平模型分析時(shí),如何解釋固定效應(yīng)和隨機(jī)效應(yīng)的參數(shù)估計(jì),并舉例應(yīng)用。4、(本題5分)詳細(xì)論述假設(shè)檢驗(yàn)中的兩類錯(cuò)誤,即第一類錯(cuò)誤和第二類錯(cuò)誤,分析它們的產(chǎn)生原因和控制方法,舉例說明在實(shí)際檢驗(yàn)中如何權(quán)衡兩類錯(cuò)誤。5、(本題5分)解釋什么是秩和檢驗(yàn),并說明在什么情況下使用秩和檢驗(yàn)而不是參數(shù)檢驗(yàn)。三、案例分析題(本大題共5個(gè)小題,共25分)1、(本題5分)某農(nóng)產(chǎn)品批發(fā)市場(chǎng)統(tǒng)計(jì)了各類農(nóng)產(chǎn)品的價(jià)格波動(dòng)、銷售量和供應(yīng)來源,以穩(wěn)定市場(chǎng)價(jià)格和保障供應(yīng)。請(qǐng)展開數(shù)據(jù)分析。2、(本題5分)某電商平臺(tái)的廣告投放部門想分析不同廣告創(chuàng)意的點(diǎn)擊率和轉(zhuǎn)化率。收集到相關(guān)數(shù)據(jù)后,怎樣進(jìn)行優(yōu)化廣告創(chuàng)意和投放策略?3、(本題5分)某在線醫(yī)療平臺(tái)記錄了不同科室的問診量、患者滿意度和醫(yī)生工作效率等,分析應(yīng)如何利用統(tǒng)計(jì)方法優(yōu)化醫(yī)療資源配置和服務(wù)流程。4、(本題5分)某金融科技公司對(duì)不同信貸產(chǎn)品的申請(qǐng)數(shù)據(jù)和違約率進(jìn)行分析,包括申請(qǐng)人信用評(píng)分、貸款金額、還款期限等。請(qǐng)優(yōu)化信貸審批流程,降低風(fēng)險(xiǎn)。5、(本題5分)某金融機(jī)構(gòu)分析了不同貸款產(chǎn)品的申請(qǐng)量、審批通過率、貸款利率、客戶信用狀況等數(shù)據(jù)。請(qǐng)?jiān)u估貸款產(chǎn)品的市場(chǎng)表現(xiàn),并提出產(chǎn)品改進(jìn)建議。四、計(jì)算題(本大題共3個(gè)小題,共30分)1、(本題10分)某公司有兩個(gè)生產(chǎn)車間,A車間有80名工人,B車間有60名工人。在一次技能考核中,A車間工人的平均成績(jī)?yōu)?5分,標(biāo)準(zhǔn)差為8分;B車間工人的平均成績(jī)?yōu)?0分,標(biāo)準(zhǔn)差為6分。求兩個(gè)車間工人平均成績(jī)之差的90%置信區(qū)間。2、(本題10分)某班級(jí)學(xué)生的身高(單位:厘米)數(shù)據(jù)如下:160、165、170、175、180、185、1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論