寧波大學《統(tǒng)計機器學習及應用實踐》2023-2024學年第二學期期末試卷_第1頁
寧波大學《統(tǒng)計機器學習及應用實踐》2023-2024學年第二學期期末試卷_第2頁
寧波大學《統(tǒng)計機器學習及應用實踐》2023-2024學年第二學期期末試卷_第3頁
寧波大學《統(tǒng)計機器學習及應用實踐》2023-2024學年第二學期期末試卷_第4頁
寧波大學《統(tǒng)計機器學習及應用實踐》2023-2024學年第二學期期末試卷_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

自覺遵守考場紀律如考試作弊此答卷無效密自覺遵守考場紀律如考試作弊此答卷無效密封線第1頁,共3頁寧波大學

《統(tǒng)計機器學習及應用實踐》2023-2024學年第二學期期末試卷院(系)_______班級_______學號_______姓名_______題號一二三四總分得分一、單選題(本大題共20個小題,每小題1分,共20分.在每小題給出的四個選項中,只有一項是符合題目要求的.)1、一家公司對其員工的工資進行統(tǒng)計,發(fā)現(xiàn)工資分布呈現(xiàn)右偏態(tài)。以下哪種描述最符合這種情況?()A.大多數(shù)員工工資較低,少數(shù)員工工資極高B.大多數(shù)員工工資較高,少數(shù)員工工資極低C.員工工資均勻分布D.無法確定2、在一次市場調(diào)查中,要了解消費者對某品牌產(chǎn)品的滿意度,設計了從非常滿意到非常不滿意的5個等級。收集到的數(shù)據(jù)應屬于哪種數(shù)據(jù)類型?()A.定量數(shù)據(jù)B.定性數(shù)據(jù)C.連續(xù)型數(shù)據(jù)D.離散型數(shù)據(jù)3、在一項關于城市居民消費水平的調(diào)查中,隨機抽取了500個家庭。已知家庭月平均消費支出的均值為8000元,標準差為1500元。若從該樣本中隨機抽取一個家庭,其月消費支出在6500元至9500元之間的概率約為()A.0.68B.0.82C.0.95D.0.994、為了比較兩種不同教學方法對學生成績的影響,隨機選取了兩個班級分別采用不同的教學方法,經(jīng)過一學期的教學后進行測試。在分析數(shù)據(jù)時,以下哪種假設檢驗方法更適用?()A.獨立樣本t檢驗B.配對樣本t檢驗C.方差分析D.卡方檢驗5、某學校對學生的身高和體重進行了測量,想要了解身高和體重之間的關系是否為線性關系,可以通過繪制以下哪種圖形來判斷?()A.散點圖B.折線圖C.直方圖D.箱線圖6、在進行聚類分析時,常用的距離度量方法有歐氏距離和曼哈頓距離等。它們的主要區(qū)別在于?()A.計算方式不同B.對數(shù)據(jù)的敏感度不同C.適用場景不同D.以上都是7、已知兩個變量X和Y之間存在線性關系,通過樣本數(shù)據(jù)計算得到相關系數(shù)為0.8。若將X和Y的單位都擴大為原來的2倍,新的相關系數(shù)將變?yōu)槎嗌??()A.0.8B.1.6C.0.4D.不變8、某工廠生產(chǎn)的零件長度服從正態(tài)分布,均值為5cm,標準差為0.1cm?,F(xiàn)從生產(chǎn)的零件中隨機抽取100個進行測量,其平均長度為4.98cm。假設顯著性水平為0.05,能否認為該批零件的長度不符合標準?()A.能B.不能C.無法確定D.以上都不對9、在一項市場調(diào)研中,比較了三個品牌的產(chǎn)品滿意度得分,得分數(shù)據(jù)為有序分類數(shù)據(jù)。要檢驗三個品牌的滿意度是否有顯著差異,應采用哪種非參數(shù)檢驗方法?()A.Kruskal-Wallis檢驗B.Mann-WhitneyU檢驗C.Wilcoxon符號秩檢驗D.Friedman檢驗10、在對某城市居民收入水平的調(diào)查中,收集了不同職業(yè)、不同年齡和不同教育程度居民的收入數(shù)據(jù)。若要分析居民收入與這些因素之間的關系,最合適的統(tǒng)計方法是?()A.多元線性回歸B.邏輯回歸C.聚類分析D.因子分析11、某超市記錄了每天的銷售額,要預測未來一周的銷售額,使用了移動平均法。如果選擇移動期數(shù)為5,那么預測值會受到哪些數(shù)據(jù)的影響?()A.最近5天的銷售額B.最近5周的銷售額C.最近5個月的銷售額D.以上都不對12、為檢驗一組數(shù)據(jù)是否來自正態(tài)總體,除了繪制直方圖和Q-Q圖外,還可以進行以下哪種檢驗?()A.F檢驗B.t檢驗C.卡方檢驗D.秩和檢驗13、在一個正態(tài)分布中,已知均值為50,標準差為10。隨機抽取一個樣本,其值在40到60之間的概率大約是多少?()A.0.6826B.0.9544C.0.9974D.無法計算14、某地區(qū)的氣溫數(shù)據(jù)呈現(xiàn)出上升趨勢,為了預測未來的氣溫變化,采用了指數(shù)平滑法。如果平滑系數(shù)選擇較大的值,預測結(jié)果會()A.更平滑B.更接近實際值C.對近期數(shù)據(jù)更敏感D.對長期數(shù)據(jù)更敏感15、在一項關于消費者對某品牌滿意度的調(diào)查中,共發(fā)放問卷1000份,回收有效問卷800份。其中表示非常滿意的有200人,滿意的有400人,不滿意的有150人,非常不滿意的有50人。計算消費者滿意度的眾數(shù)為()A.滿意B.非常滿意C.不滿意D.非常不滿意16、在研究某疾病的危險因素時,收集了患者的生活習慣、遺傳因素、環(huán)境因素等數(shù)據(jù)。若要篩選出主要的危險因素,應采用哪種統(tǒng)計方法?()A.逐步回歸B.嶺回歸C.邏輯回歸D.以上都不對17、某工廠生產(chǎn)的零件長度服從正態(tài)分布,均值為5cm,標準差為0.2cm?,F(xiàn)從生產(chǎn)線上隨機抽取100個零件,測得其平均長度為4.95cm。請問在顯著性水平為0.05下,能否認為生產(chǎn)線出現(xiàn)異常?()A.能B.不能C.無法確定D.以上都不對18、為研究不同地區(qū)的經(jīng)濟發(fā)展水平,收集了各地區(qū)的GDP、人均收入等數(shù)據(jù)。若要對這些地區(qū)進行分類,可采用哪種統(tǒng)計方法?()A.判別分析B.聚類分析C.主成分分析D.因子分析19、為比較兩種生產(chǎn)工藝的效率,分別在兩種工藝下進行多次生產(chǎn),并記錄生產(chǎn)時間。已知兩種工藝的生產(chǎn)時間數(shù)據(jù)均服從正態(tài)分布,且方差相等。如果要檢驗兩種工藝的平均生產(chǎn)時間是否有差異,應采用哪種檢驗方法?()A.t檢驗B.Z檢驗C.F檢驗D.卡方檢驗20、在一項關于股票收益率的研究中,收集了過去5年的數(shù)據(jù)。要檢驗收益率是否具有自相關性,應采用哪種方法?()A.游程檢驗B.單位根檢驗C.Durbin-Watson檢驗D.偏自相關函數(shù)檢驗二、簡答題(本大題共5個小題,共25分)1、(本題5分)對于分類數(shù)據(jù),除了使用頻率和百分比進行描述外,還可以使用哪些統(tǒng)計量和圖表進行分析?請詳細闡述并舉例說明。2、(本題5分)解釋什么是穩(wěn)健統(tǒng)計方法,并說明其在面對異常值和離群點時的優(yōu)勢。以一個實際的數(shù)據(jù)為例,說明如何應用穩(wěn)健統(tǒng)計方法進行數(shù)據(jù)分析。3、(本題5分)在進行回歸分析時,可能會出現(xiàn)多重共線性問題。請闡述多重共線性的含義、產(chǎn)生的原因、檢測方法以及解決措施。4、(本題5分)詳細說明如何使用主成分分析來降低數(shù)據(jù)維度,解釋主成分的提取原則和如何解釋主成分的含義,并舉例應用。5、(本題5分)在一項關于居民消費支出的調(diào)查中,發(fā)現(xiàn)數(shù)據(jù)呈現(xiàn)右偏分布。請解釋數(shù)據(jù)右偏分布的特征,并說明在這種情況下,應使用哪種集中趨勢的度量指標更合適,為什么?三、案例分析題(本大題共5個小題,共25分)1、(本題5分)某連鎖咖啡店統(tǒng)計了不同門店的銷售額、飲品銷量和顧客消費習慣。如何運用統(tǒng)計分析優(yōu)化門店布局和產(chǎn)品供應?2、(本題5分)某服裝品牌想了解不同季節(jié)、不同款式服裝的銷售趨勢和市場份額,收集了銷售數(shù)據(jù)和市場調(diào)研信息,怎樣通過統(tǒng)計分析制定營銷策略?3、(本題5分)某金融科技公司統(tǒng)計了不同理財產(chǎn)品的銷售數(shù)據(jù)、用戶風險偏好和收益情況,分析如何通過統(tǒng)計分析設計更符合市場需求的理財產(chǎn)品。4、(本題5分)一所大學收集了學生的考試成績,包括不同課程、不同年級和不同專業(yè)。分析如何通過統(tǒng)計分析評估教學質(zhì)量和學生的學習情況。5、(本題5分)某旅游景區(qū)為了提升游客體驗,對景區(qū)設施、服務質(zhì)量和游客意見進行了調(diào)查分析。改進景區(qū)管理和服務。四、計算題(本大題共3個小題,共30分)1、(本題10分)某公司有兩個生產(chǎn)部門,A部門有200名員工,月平均工資為6000元,標準差為800元;B部門有300名員工,月平均工資為5500元,標準差為700元。請計算該公司全體員工的平均工資和工資的標準差,并分析兩個部門工資水平的差異。2、(本題10分)某城市對居民的交通出行方式進行調(diào)查,隨機抽取1000名居民,其中選擇公交車出行的有300人,選擇地鐵出行的有250人,選擇

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論