趙娜《應(yīng)用統(tǒng)計(jì)分析》課件-(09)第9章 分類數(shù)據(jù)分析_第1頁(yè)
趙娜《應(yīng)用統(tǒng)計(jì)分析》課件-(09)第9章 分類數(shù)據(jù)分析_第2頁(yè)
趙娜《應(yīng)用統(tǒng)計(jì)分析》課件-(09)第9章 分類數(shù)據(jù)分析_第3頁(yè)
趙娜《應(yīng)用統(tǒng)計(jì)分析》課件-(09)第9章 分類數(shù)據(jù)分析_第4頁(yè)
趙娜《應(yīng)用統(tǒng)計(jì)分析》課件-(09)第9章 分類數(shù)據(jù)分析_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)

STATISTICS第9章分類數(shù)據(jù)分析

(第六版)

統(tǒng)計(jì)學(xué)

作者:中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

賈俊平

9-1作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS第9章分類數(shù)據(jù)分析

(第六版)

9.1分類數(shù)據(jù)與c2統(tǒng)計(jì)量

9.2擬合優(yōu)度檢驗(yàn)

9.3列聯(lián)分析:獨(dú)立性檢驗(yàn)

9.4列聯(lián)分析中應(yīng)注意的問(wèn)題

9-2作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS學(xué)習(xí)目標(biāo)

(第六版)

1.理解分類數(shù)據(jù)與c2統(tǒng)計(jì)量

2.掌握擬合優(yōu)度檢驗(yàn)及其應(yīng)用

3.掌握獨(dú)立性檢驗(yàn)及其應(yīng)用

4.掌握測(cè)度列聯(lián)表中的相關(guān)性

9-3作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS9.1分類數(shù)據(jù)與列聯(lián)表

(第六版)

9.1.1分類數(shù)據(jù)

9.1.2c2統(tǒng)計(jì)量

9-4作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS

(第六版)

分類數(shù)據(jù)

9-5作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS分類數(shù)據(jù)

(第六版)

1.分類變量的結(jié)果表現(xiàn)為類別

n例如:性別例如:性別((男男,,女女))

2.各類別用符號(hào)或數(shù)字代碼來(lái)測(cè)度

3.使用分類或順序尺度

n你吸煙嗎你吸煙嗎??

l1.是;2.否

n你贊成還是反對(duì)這一改革方案你贊成還是反對(duì)這一改革方案??

l1.贊成;2.反對(duì)

4.對(duì)分類數(shù)據(jù)的描述和分析通常使用列聯(lián)表

5.可使用檢驗(yàn)

9-6作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS

(第六版)

統(tǒng)計(jì)量

9-7作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS統(tǒng)計(jì)量

(第六版)

1.1.用于檢驗(yàn)分類變量擬合優(yōu)度用于檢驗(yàn)分類變量擬合優(yōu)度

2.2.計(jì)算公式為計(jì)算公式為

9-8作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS統(tǒng)計(jì)量

(第六版)

分布與自由度的關(guān)系分布與自由度的關(guān)系

9-9作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS9.2擬合優(yōu)度檢驗(yàn)

(第六版)

9-10作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)擬合優(yōu)度檢驗(yàn)

STATISTICS

(第六版)(例題分析)

【例】1912年4月15日,豪華巨輪泰坦尼

克號(hào)與冰山相撞沉沒(méi)。當(dāng)時(shí)船上共有共

2208人,其中男性1738人,女性470人。

海難發(fā)生后,幸存者為718人,其中男性

374人,女性344人,以的顯著性水平檢驗(yàn)

存活狀況與性別是否有關(guān)。(0.05)

9-11作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)擬合優(yōu)度檢驗(yàn)

STATISTICS

(第六版)(例題分析)

解:要回答觀察頻數(shù)與期望頻數(shù)是否一致,檢驗(yàn)

如下假設(shè):

H0:觀察頻數(shù)與期望頻數(shù)一致

H1:觀察頻數(shù)與期望頻數(shù)不一致

9-12作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)擬合優(yōu)度檢驗(yàn)

STATISTICS

(第六版)(例題分析)

自由度的計(jì)算為df=R-1,R為分類變量類型的

個(gè)數(shù)。在本例中,分類變量是性別,有男

女兩個(gè)類別,故R=2,于是自由度df=2-

1=1,經(jīng)查分布表,(0.1)(1)=2.706,故

拒絕H0,說(shuō)明存活狀況與性別顯著相關(guān)

9-13作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS9.3列聯(lián)分析:獨(dú)立性檢驗(yàn)

(第六版)

9.3.1列聯(lián)表

9.3.2獨(dú)立性檢驗(yàn)

9-14作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)列聯(lián)表

STATISTICS

(第六版)(contingencytable)

1.由兩個(gè)以上的變量交叉分類的頻數(shù)分布表

2.行變量的類別用r表示,ri表示第i個(gè)類別

3.列變量的類別用c表示,cj表示第j個(gè)類別

4.每種組合的觀察頻數(shù)用fij表示

5.表中列出了行變量和列變量的所有可能的組

合,所以稱為列聯(lián)表

6.一個(gè)r行c列的列聯(lián)表稱為rc列聯(lián)表

9-15作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)列聯(lián)表的結(jié)構(gòu)

STATISTICS

(第六版)(rc列聯(lián)表的一般表示)

列列列((cc))

jj合計(jì)合計(jì)

行((ccjj))jj=1=1jj==22……

((rrii))

ii=1=1f11f12……r1

ii==22f21f22……r2

::::::::::

合計(jì)計(jì)c1c2……n

fijij表示第i行第j列的觀察頻數(shù)

9-16作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)獨(dú)立性檢驗(yàn)

STATISTICS

(第六版)(例題分析)

【【例例】】一種原料來(lái)自三個(gè)不同的地區(qū),原料質(zhì)量被分成三個(gè)不

同等級(jí)。從這批原料中隨機(jī)抽取500件進(jìn)行檢驗(yàn),結(jié)果如表9-3

所示,要求檢驗(yàn)各個(gè)地區(qū)和原料質(zhì)量之間是否存在依賴關(guān)系?

(0.05)

解:H0:地區(qū)和原料等級(jí)之間是獨(dú)立的(不存在依賴關(guān)系)

H1:地區(qū)和原料等級(jí)之間不獨(dú)立(存在依賴關(guān)系)

0.05(4)=9.488故拒絕H0,接受H1,即地區(qū)和原

料等級(jí)之間存在依賴關(guān)系,原料的質(zhì)量受地區(qū)的影響

9-17作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)獨(dú)立性檢驗(yàn)

STATISTICS

(第六版)(例題分析)

9-18作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS9.4列聯(lián)表中的相關(guān)測(cè)量

(第六版)

9.4.1相關(guān)系數(shù)

9.4.2列聯(lián)相關(guān)系數(shù)

9.4.3V相關(guān)系數(shù)

9-19作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS列聯(lián)表中的相關(guān)測(cè)量

(第六版)

1.品質(zhì)相關(guān)

n對(duì)品質(zhì)數(shù)據(jù)對(duì)品質(zhì)數(shù)據(jù)((分分類和順序數(shù)據(jù)類和順序數(shù)據(jù)))之間相關(guān)程之間相關(guān)程

度的測(cè)度度的測(cè)度

2.列聯(lián)表變量的相關(guān)屬于品質(zhì)相關(guān)

3.列聯(lián)表相關(guān)測(cè)量的統(tǒng)計(jì)量主要有

n相關(guān)系數(shù)相關(guān)系數(shù)

n列聯(lián)相關(guān)系數(shù)列聯(lián)相關(guān)系數(shù)

nVV相關(guān)系數(shù)相關(guān)系數(shù)

9-20作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)相關(guān)系數(shù)

STATISTICS

(第六版)(correlationcoefficient)

1.測(cè)度22列聯(lián)表中數(shù)據(jù)相關(guān)程度

2.對(duì)于22列聯(lián)表,系數(shù)的值在0~1之間

3.相關(guān)系數(shù)計(jì)算公式為

9-21作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)相關(guān)系數(shù)

STATISTICS

(第六版)(原理分析)

一個(gè)簡(jiǎn)化的22列聯(lián)表

因素因素因素因素XX

合計(jì)合計(jì)

Y

Yxx11xx22

yy11aba+b

yy22cdc+d

合合計(jì)計(jì)a+cb+dn

9-22作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)相關(guān)系數(shù)

STATISTICS

(第六版)(原理分析)

?列聯(lián)表中每個(gè)單元格的期望頻數(shù)分別為列聯(lián)表中每個(gè)單元格的期望頻數(shù)分別為

?將各期望頻數(shù)代入將各期望頻數(shù)代入的計(jì)算公式得的計(jì)算公式得

9-23作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)相關(guān)系數(shù)

STATISTICS

(第六版)(原理分析)

?將將入入相關(guān)系數(shù)的計(jì)算公式得相關(guān)系數(shù)的計(jì)算公式得

§§adad等于等于bcbc,,==00,,表明變量表明變量XX與與YY之間獨(dú)立之間獨(dú)立

§§若若bb=0=0,,cc=0=0,,或或aa=0=0,,dd=0=0,,意意味味著著各各觀觀察察頻頻

數(shù)數(shù)全全部部落落在在對(duì)對(duì)角角線線上上,,此此時(shí)時(shí)||||=1=1,,表表明明變變量量XX

與與YY之間完全相關(guān)之間完全相關(guān)

?列列聯(lián)聯(lián)表表中中變變量量的的位位置置可可以以互互換換,,的的符符號(hào)號(hào)沒(méi)沒(méi)有有

實(shí)際意義,故取絕對(duì)值即可實(shí)際意義,故取絕對(duì)值即可

9-24作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)列聯(lián)相關(guān)系數(shù)

STATISTICS

(第六版)(coefficientofcontingency)

1.用于測(cè)度大于22列聯(lián)表中數(shù)據(jù)的相關(guān)程度

2.計(jì)算公式為

§§CC的取值范圍是的取值范圍是00CC<1<1

§§CC==00表明列聯(lián)表中的兩個(gè)變量獨(dú)立表明列聯(lián)表中的兩個(gè)變量獨(dú)立

§§CC的的數(shù)數(shù)值值大大小小取取決決于于列列聯(lián)聯(lián)表表的的行行數(shù)數(shù)和和列列數(shù)數(shù),,

并隨行數(shù)和列數(shù)的增大而增大并隨行數(shù)和列數(shù)的增大而增大

§§根根據(jù)據(jù)不不同同行行和和列列的的列列聯(lián)聯(lián)表表計(jì)計(jì)算算的的列列聯(lián)聯(lián)系系數(shù)數(shù)不不

便于比較便于比較

9-25作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)V相關(guān)系數(shù)

STATISTICS

(第六版)(Vcorrelationcoefficient)

1.計(jì)算公式為計(jì)算公式為

2.VV的取值范圍是的取值范圍是00VV11

3.VV==00表明列聯(lián)表中的兩個(gè)變量獨(dú)立表明列聯(lián)表中的兩個(gè)變量獨(dú)立

4.VV=1=1表明列聯(lián)表中的兩個(gè)變量完全相關(guān)表明列聯(lián)表中的兩個(gè)變量完全相關(guān)

5.不同行和列的列聯(lián)表計(jì)算的列聯(lián)系數(shù)不便于比較不同行和列的列聯(lián)表計(jì)算的列聯(lián)系數(shù)不便于比較

6.當(dāng)當(dāng)列列聯(lián)聯(lián)表表中中有有一一維維為為22,,min[(min[(rr-1),(-1),(cc-1)]=1,-1)]=1,此此時(shí)時(shí)

VV==

9-26作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)

STATISTICS、C、V的比較

(第六版)

1.同一個(gè)列聯(lián)表,、C、V的結(jié)果會(huì)不同

2.不同的列聯(lián)表,、C、V的結(jié)果也不同

3.在對(duì)不同列聯(lián)表變量之間的相關(guān)程度進(jìn)行

比較時(shí),不同列聯(lián)表中的行與行、列與列

的個(gè)數(shù)要相同,并且采用同一種系數(shù)

9-27作者:賈俊平,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院

統(tǒng)計(jì)學(xué)列聯(lián)表中的相關(guān)測(cè)量

STATISTICS

(第六版)(例題分析)

【例】一種原料來(lái)自三個(gè)不同地區(qū),原料質(zhì)量被分成三個(gè)

不同等級(jí)。從這批原料中隨機(jī)抽取500件進(jìn)行檢驗(yàn),結(jié)果如

下表。分別計(jì)算系數(shù)、C系數(shù)和V系數(shù),并分析相關(guān)程度

地區(qū)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論