《獨立性檢驗的基本思想及其初步應(yīng)用》名師課件2_第1頁
《獨立性檢驗的基本思想及其初步應(yīng)用》名師課件2_第2頁
《獨立性檢驗的基本思想及其初步應(yīng)用》名師課件2_第3頁
《獨立性檢驗的基本思想及其初步應(yīng)用》名師課件2_第4頁
《獨立性檢驗的基本思想及其初步應(yīng)用》名師課件2_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

獨立性檢驗的基本思想及其初步應(yīng)用問題:

數(shù)學家龐加萊每天都從一家面包店買一塊1000g的面包,并記錄下買回的面包的實際質(zhì)量。一年后,這位數(shù)學家發(fā)現(xiàn),所記錄數(shù)據(jù)的均值為950g。于是龐加萊推斷這家面包店的面包分量不足。假設(shè)“面包分量足”,則一年購買面包的質(zhì)量數(shù)據(jù)的平均值應(yīng)該不少于1000g;“這個平均值不大于950g”是一個與假設(shè)“面包分量足”矛盾的小概率事件;這個小概率事件的發(fā)生使龐加萊得出推斷結(jié)果。1復習引入這種變量的不同“值”表示個體所屬的不同類別,這類變量稱為分類變量分類變量

性別變量,取值為:男、女請舉出幾個分類變量的例子試一試在日常生活中,我們常常關(guān)心分類變量的之間是否有關(guān)系:例如,吸煙是否與患肺癌有關(guān)系?性別是否對于喜歡數(shù)學課程有影響?2新課講解案例:某醫(yī)療機構(gòu)為了了解呼吸道疾病與吸煙是否有關(guān),進行了一次抽樣調(diào)查,共調(diào)查了515個成年人,其中吸煙者220人,不吸煙者295人。調(diào)查結(jié)果:吸煙的220人中有37人患呼吸道疾病,183人未患呼吸道疾病;不吸煙的295人中有21人患病,274人未患病。根據(jù)這些數(shù)據(jù),能否斷定:患呼吸道疾病與吸煙有關(guān)?2新課講解數(shù)據(jù)整理患病未患病合計吸煙不吸煙合計372158183274457220295515問題:判斷的標準是什么?2新課講解吸煙與不吸煙,患病的可能性的大小是否有差異?頻率估計概率患病未患病合計(n)吸煙16.82%83.18%100%(220)不吸煙7.12%92.88%100%(295)2新課講解通過圖形直觀判斷不患病比例患病比例2新課講解解決問題:直觀方法吸煙的患病率不吸煙的患病率37/220

16.82%21/295

7.12%根據(jù)統(tǒng)計分析的思想,用頻率估計概率可知,吸煙者與不吸煙者患病的可能性存在差異。你能有多大把握認為“患病與吸煙有關(guān)”呢?2新課講解

有一個顛撲不破的真理,那就是當我們不能確定什么是真的時,我們就應(yīng)該去探求什么是最可能的。笛卡爾能否用數(shù)量來刻畫“有關(guān)”程度將問題一般化獨立性檢驗不患肺癌患肺癌總計不吸煙aba+b吸煙cdc+d總計a+cb+da+b+c+dH0:吸煙與患肺癌沒有關(guān)系我們假設(shè)看看能推出什么樣的結(jié)論。2新課講解假設(shè)H0:吸煙和患肺癌之間沒有關(guān)系那么吸煙樣本中不患肺癌的比例應(yīng)該與不吸煙樣本中相應(yīng)的比例差不多,即:2新課講解作為檢驗在多大程度上可以認為“兩個變量有關(guān)系”的標準。上面這種利用隨機變量K2來判斷“兩個分類變量有關(guān)系”的方法稱為獨立性檢驗.

為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標準,基于上述分析,我們構(gòu)造一個隨機變量2新課講解

不患肺癌患肺癌總計不吸煙27421295吸煙18337220總計457585152新課講解獨立性檢驗故有99%的把握認為H0不成立,即有99%的把握認為“患肺癌與吸煙有關(guān)系”。即在成立的情況下,大于6.635概率非常小,近似為0.010現(xiàn)在的=56.632的觀測值遠大于6.635,出現(xiàn)這樣的觀測值的概率不超過0.010。已知在假設(shè)H0(吸煙和患肺癌之間沒有關(guān)系)成立的條件下:2新課講解10.8287.8796.6355.0243.8412.7062.0721.3230.7080.4550.0010.0050.0100.0250.050.100.150.250.400.50卡方臨界值表2新課講解一般地,對于兩個研究對象Ⅰ和Ⅱ,Ⅰ有兩類取值,即類A和B(如吸煙與不吸煙);Ⅱ也有兩類取值,即類1和2(如患病與不患?。?。于是得到下列聯(lián)表所示的抽樣數(shù)據(jù):

類1類2總計類Aaba+b類Bcdc+d總計a+cb+da+b+c+d2新課講解要推斷“Ⅰ和Ⅱ有關(guān)系”,可按下面的步驟進行:(1)提出假設(shè)H0

:Ⅰ和Ⅱ沒有關(guān)系;(3)查對臨界值,作出判斷。

2新課講解反證法原理與假設(shè)檢驗原理反證法原理:在一個已知假設(shè)下,如果推出一個矛盾,就證明了這個假設(shè)不成立。假設(shè)檢驗原理:在一個已知假設(shè)下,如果一個與該假設(shè)矛盾的小概率事件發(fā)生,就推斷這個假設(shè)不成立。2新課講解

有責任無責任總計有酒精650150800無酒精7005001200總1、從發(fā)生交通事故的司機中抽取2000名司機作隨機樣本,根據(jù)他們血液中是否含有酒精以及他們是否對事故負有責任將數(shù)據(jù)整理如下:3例題講解相應(yīng)的等高條形圖如圖.試結(jié)合等高條形圖分析血液中含有酒精與對事故負有責任是否有關(guān).[解]從題圖中可以看出,陰影部分所占比例差距較大,由此我們可以在某種程度上認為“血液中含有酒精”與“對事故負有責任”有關(guān)系.解題策略利用等高條形圖判斷兩個分類變量是否相關(guān)的步驟鞏固訓練1、某學校對高三學生做了一項調(diào)查發(fā)現(xiàn):在平時的模擬考試中,性格內(nèi)向的學生426人中332人在考前心情緊張,性格外向的學生594人中有213人在考前心情緊張,作出等高條形圖,利用圖形判斷考前心情緊張與性格類別是否有關(guān)系.

性格內(nèi)向性格外向總計考前心情緊張332213545考前心情不緊張94381475總計4265941020解:作列聯(lián)表如下:相應(yīng)的等高條形圖如圖所示:圖中陰影部分表示考前心情緊張與考前心情不緊張中性格內(nèi)向的比例,從圖中可以看出考前心情緊張的樣本中性格內(nèi)向占的比例比考前心情不緊張樣本中性格內(nèi)向占的比例大,可以認為考前心情緊張與性格類別有關(guān).例2、在某醫(yī)院,因為患心臟病而住院的665名男性病人中,有214人禿頂,而另外772名不是因為患心臟病而住院的男性病人中有175人禿頂.(1)利用圖形判斷禿頂與患心臟病是否有關(guān)系(2)能否在犯錯誤概率不超過0.01的前提下認為禿頂與患心臟病有關(guān)系?3例題講解解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表:患心臟病不患心臟病總計禿頂214175389不禿頂4515971048總計6657721437

根據(jù)列聯(lián)表中的數(shù)據(jù),得到所以在犯錯誤的概率不超過0.01的前提下認為“禿頂患心臟病有關(guān)”。3例題講解(1)根據(jù)已知的數(shù)據(jù)作出列聯(lián)表.(2)求K2的觀測值.(3)判斷可能性:與臨界值比較,得出事件有關(guān)的可能性大小.方法歸納解決獨立性檢驗問題的基本步驟鞏固訓練鍛煉時間男生女生總計少于1小時

15

不少于1小時20

總計

2、某大學開展陽光體育活動,為了研究鍛煉時間與性別是否有關(guān),對全校大學生的鍛煉時間進行隨機抽樣調(diào)查,從中隨機抽取男、女生各25名進行了問卷調(diào)查,得到如下列聯(lián)表:(1)請把列聯(lián)表中的數(shù)據(jù)補充完整;(2)根據(jù)表中數(shù)據(jù)分析,在犯錯誤的概率不超過多少的前提下可以認為“鍛煉時間與性別有關(guān)”?鍛煉時間男生女生總計少于1小時51520不少于1小時201030總計252550解:(1)列聯(lián)表如圖示:鞏固訓練鍛煉時間男生女生總計少于1小時

15

不少于1小時20

總計

2、某大學開展陽光體育活動,為了研究鍛煉時間與性別是否有關(guān),對全校大學生的鍛煉時間進行隨機抽樣調(diào)查,從中隨機抽取男、女生各25名進行了問卷調(diào)查,得到如下列聯(lián)表:(1)請把列聯(lián)表中的數(shù)據(jù)補充完整;(2)根據(jù)表中數(shù)據(jù)分析,在犯錯誤的概率不超過多少的前提下可以認為“鍛煉時間與性別有關(guān)”?解:3、為了調(diào)查胃病是否與生活規(guī)律有關(guān),在某地對540名40歲以上的人進行了調(diào)查,結(jié)果是:患胃病者生活不規(guī)律的共60人,患胃病者生活規(guī)律的共20人,未患胃病者生活不規(guī)律的共260人,未患胃病者生活規(guī)律的共200人.(1)根據(jù)以上數(shù)據(jù)列出2×2列聯(lián)表;(2)能夠以99%的把握認為40歲以上的人患胃病與否和生活規(guī)律有關(guān)系嗎?為什么?解:(1)由已知可列2×2列聯(lián)表得:鞏固訓練(2)根據(jù)列聯(lián)表中的數(shù)據(jù),由計算公式得K2的觀測值為:∵9.638>6.635因此,在犯錯誤的概率不超過0.01的前提下認為40歲以上的人患胃病與否和生活規(guī)律有關(guān).3、為了調(diào)查胃病是否與生活規(guī)律有關(guān),在某地對540名40歲以上的人進行了調(diào)查,結(jié)果是:患胃病者生活不規(guī)律的共60人,患胃病者生活規(guī)律的共20人,未患胃病者生活不規(guī)律的共260人,未患胃病者生活規(guī)律的共200人.(1)根據(jù)以上數(shù)據(jù)列出2×2列聯(lián)表;(2)能夠以99%的把握認為40歲以上的人患胃病與否和生活規(guī)律有關(guān)系嗎?為什么?解:鞏固訓練

素養(yǎng)提煉(2)圖形分析利用等高條形圖來分析兩分類變量之間是否具有相關(guān)關(guān)系,形象、直觀地反映兩個分類變量之間的總體狀態(tài)和差異大小,進而推斷它們之間是否具有相關(guān)關(guān)系.兩分類變量之間關(guān)聯(lián)關(guān)系的定性分析(1)頻率分析通過對樣本的每個分類變量的不同類別和事件發(fā)生的頻率的大小比較來分析分類變量之間是否有關(guān)聯(lián)關(guān)系,通常通過列聯(lián)表列出兩個分類變量進行分析.

素養(yǎng)提煉獨立性檢驗的基本思想類似于數(shù)學上的反證法.要判斷“兩個分類變量有關(guān)系”這一結(jié)論成立的可信程度,首先假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論“兩個分類變量沒有關(guān)系”成立,在該假設(shè)下構(gòu)造的隨機變量K2應(yīng)該很?。粲捎^測數(shù)據(jù)求得的K2的觀測值k很大,則斷言假設(shè)不成立.給定一個正數(shù)k0,稱為一個判斷規(guī)則的臨界值.如果k≥k0,就認為“兩個分類變量之間有關(guān)系”;否則就認為“兩個分類變量之間沒有關(guān)系”.獨立性檢驗的基本思想1、通過頻率比較法,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論