




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
3.2獨立性檢驗的基本思想
及其初步應(yīng)用(第1課時)廣東省高州市第三中學(xué)陳許聰1
我們經(jīng)常聽到這樣的結(jié)論:吸煙會容易得肺癌;身高會受到遺傳因素的影響;是否喜歡理科和性別有關(guān)系。等等。
為了回答這兩個問題,就需要同學(xué)們認(rèn)真學(xué)習(xí)本節(jié)課的內(nèi)容:統(tǒng)計學(xué)中的獨立性檢驗的基本思想及其初步應(yīng)用問題1:這些結(jié)論是怎樣得出的呢?問題2:你能有“多大把握”認(rèn)為這些結(jié)論是正確的呢?引入新課:那么21、分類變量——變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量
這個表格是為了調(diào)查吸煙是否對患肺癌有影響的一個調(diào)查表,那么在這里“是否吸煙”和“是否患肺癌”都是分類變量,而且這個表格中還給出了分類變量的頻數(shù),比如說…一、有關(guān)概念例如,性別,這個變量有什么取值呢?又比如,宗教信仰,國籍等。不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計9874919965
這個表格在統(tǒng)計學(xué)中又稱之為什么呢?再看一個例子:32、列聯(lián)表——像表中這樣列出的兩個分類變量的頻數(shù)表,
問題3:在這個表格中的數(shù)據(jù)能告訴我們什么樣的結(jié)論?
在高中階段我們只研究像下表中那樣的2×2列聯(lián)表:不患肺癌患肺癌總計不吸煙7775427817吸煙2099492148總計98749199652×2列聯(lián)表
方法一:
(1)在不吸煙者中患肺癌的比重是
(2)在吸煙者中患肺癌的比重是0.54%2.28%你的結(jié)論是:
這組數(shù)據(jù)如果放到圖表中,更能直觀的感受到它們的差異!
稱為列聯(lián)表4方法二:通過等高條形圖直觀判斷:等高條形圖患肺癌比例不患肺癌比例
從這個等高條形圖中,我們更直觀地看出吸煙者中患肺癌的比重與不吸煙者中患肺癌的比重有明顯差異,從而說明吸煙與患肺癌很有可能是有關(guān)系的。思考:這種判斷可靠嗎?以上方法只回答了我們課前提出的問題1,對于問題2中“把握度”問題還沒有解決,也就是說,你能有多大把握認(rèn)為“吸煙與患肺癌有關(guān)”呢?什么是“把握度”?5
1、思想
二、獨立性檢驗的思想
吸煙與患肺癌列聯(lián)表不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+d則:因此|ad-bc|越小,說明吸煙與患肺癌之間關(guān)系越弱;|ad-bc|越大,說明吸煙與患肺癌之間關(guān)系越強.
我們知道上面例子表中的數(shù)據(jù)是從某次調(diào)查中隨機抽樣得來的,帶有隨機性,為了使統(tǒng)計數(shù)據(jù)更具一般性,我們把表中數(shù)字用字母代替,得到如下用字母表示的列聯(lián)表:
假設(shè)H0:吸煙與患肺癌沒有關(guān)系即|ad-bc|≈06
為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標(biāo)準(zhǔn),基于上面的分析,我們引入一個隨機變量
顯然,K2的大小變化與|ad-bc|是同步的思考:這個K2的觀測值56.632是大還是???評價標(biāo)準(zhǔn)是什么?這個值到底能告訴我們什么呢?(討論)
那么上面例子,在假設(shè)H0成立,即“吸煙與患肺癌沒有關(guān)系”成立的前提下,K2應(yīng)該很小.分析:K2越小,|ad-bc|也越小,說明吸煙與患肺癌之間關(guān)系越弱;K2越大,
|ad-bc|也越大,說明吸煙與患肺癌之間關(guān)系越強.
(其中n=a+b+c+d為樣本容量)
把表中數(shù)據(jù)代入K2公式,計算得到K2的觀測值為7事先給定評價標(biāo)準(zhǔn)k0(臨界值)例如取k0=6.635
這個99%就是我們課前提到的一個“把握度”,這個“把握度”會因事先給定的臨界值(評價標(biāo)準(zhǔn))不同而不同。即在假設(shè)H0成立的情況下,K2的觀測值超過6.635的概率非常小,近似為0.01,是一個小概率事件,也就是說H0這個假設(shè)幾乎不可能發(fā)生的。而統(tǒng)計學(xué)家經(jīng)過研究后發(fā)現(xiàn),在假設(shè)H0成立的情況下
P(K2≥6.635)≈0.01(如何理解?)那么K2的觀測值遠(yuǎn)遠(yuǎn)大于6.635“H0發(fā)生”(即吸煙與患肺癌沒有關(guān)系)的概率是0.01,而“H0不發(fā)生”(即吸煙與患肺癌有關(guān)系)的概率是0.99因此,我們可以有99%的把握認(rèn)為吸煙與患肺癌有關(guān)系。81/26/20249經(jīng)過統(tǒng)計學(xué)家多年的研究,總結(jié)得出如下臨界值表:(如何查表?)10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445
k0.0010.0050.0100.0250.050.100.150.50.400.50思考:上面例子中還可以選用哪個臨界值(評價標(biāo)準(zhǔn))?這時的“把握度”又是多少?如何下結(jié)論?102、步驟:(3)查臨界值表,比較k與k0的大小得出結(jié)論。(2)利用公式計算K2的觀測值k;(1)寫出2×2列聯(lián)表,確定臨界值k0;
(事先給定或默認(rèn)值2.706)
上面這種利用隨機變量K2來判斷“兩個分類變量有關(guān)系”的方法稱為獨立性檢驗。這個檢驗過程就是獨立性檢驗的思想。11例1
在某醫(yī)院,因為患心臟病而住院的665名男性病人中,有214人禿頂,而另外772名不是因為患心臟病而住院的男性病人中有175人禿頂。能否在犯錯誤的概率不超過0.010的前提下認(rèn)為禿頂與患心臟病有關(guān)系?解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:患心臟病不患心臟病總計禿頂214175389不禿頂4515971048總計6657721437根據(jù)聯(lián)表中的數(shù)據(jù),得到因此,在犯錯的概率不超過0.01的前提下認(rèn)為“禿頂與患心臟病”有關(guān)系,即有99%的把握認(rèn)為“禿頂與患心臟病有關(guān)”。三、獨立性檢驗思想的初步應(yīng)用依題意查表可得臨界值k0=6.63512討論:這種獨立性檢驗的思想和以前我們學(xué)習(xí)的哪種證明方法比較類似?試比較一下這兩種原理。反證法原理在假設(shè)H0下,如果推出一個矛盾,就證明了H0不成立獨立性檢驗原理在假設(shè)H0下,如果出現(xiàn)一個與H0相矛盾的小概率事件,就推斷H0不成立,且該推斷犯錯誤的概率不超過這個小概率。反證法原理與獨立性檢驗原理的比較的比較131、在吸煙與患肺病這兩個分類變量的計算中,下列說法正確的是()A、若K的觀測值為k=6.635,我們有99%的把握認(rèn)為吸煙與患肺病有關(guān)系,那么在100個吸煙的人中必有99個患肺病B、從獨立性檢驗可知有99%的把握認(rèn)為吸煙與患肺病有關(guān)系時,我們說某人吸煙,那么他有99%的可能患肺病C、若從統(tǒng)計量中求出有9
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- DB32/T 4126-2021工作場所空氣中乙草胺職業(yè)接觸限值及檢測技術(shù)規(guī)程
- DB32/T 3632-2019大蒜地膜覆蓋栽培及地膜回收技術(shù)規(guī)程
- DB32/T 3545.3-2021血液凈化治療技術(shù)管理第3部分:血液凈化醫(yī)療機構(gòu)醫(yī)護人員培訓(xùn)規(guī)范
- DB32/T 3528-2019豆丹人工養(yǎng)殖技術(shù)規(guī)程
- DB32/T 3375-2018公共場所母乳哺育設(shè)施建設(shè)指南
- DB31/T 919-2015城市濕地水生植物應(yīng)用技術(shù)要求
- DB31/T 830-2014糧食儲備倉庫技術(shù)管理規(guī)范
- DB31/T 811-2014小企業(yè)安全生產(chǎn)標(biāo)準(zhǔn)化基本要求
- DB31/T 791-2014藥品生產(chǎn)質(zhì)量管理系統(tǒng)信息技術(shù)規(guī)范
- DB31/T 728-2013食品冷庫經(jīng)濟運行管理標(biāo)準(zhǔn)
- 人保農(nóng)險理賠試題
- Machine-Cmk-設(shè)備能力指數(shù)Cmk分析表
- ISO27001:2022信息安全管理體系全套文件+表單
- 大學(xué)體育與體質(zhì)健康(山東聯(lián)盟)智慧樹知到期末考試答案章節(jié)答案2024年中國石油大學(xué)(華東)
- 網(wǎng)絡(luò)食品交易第三方平臺備案表
- 核磁共振波譜法之氫譜解析
- 唐詩三百首word版
- 二次函數(shù)集體備課活動記錄(2)
- 硬筆書法考級專用紙(4—5級)
- 旅游景區(qū)財務(wù)制度及流程
- Dell 2950 SAS5RAID完全配置手冊
評論
0/150
提交評論