第10講數(shù)據(jù)統(tǒng)計分析與描述_第1頁
第10講數(shù)據(jù)統(tǒng)計分析與描述_第2頁
第10講數(shù)據(jù)統(tǒng)計分析與描述_第3頁
第10講數(shù)據(jù)統(tǒng)計分析與描述_第4頁
第10講數(shù)據(jù)統(tǒng)計分析與描述_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2021/7/31數(shù)學(xué)建模與數(shù)學(xué)實驗后勤工程學(xué)院數(shù)學(xué)教研室數(shù)據(jù)的統(tǒng)計描述和分析實驗?zāi)康膶嶒瀮?nèi)容1、直觀了解統(tǒng)計基本內(nèi)容。2、掌握用數(shù)學(xué)軟件包求解統(tǒng)計問題。1、統(tǒng)計的基本理論。2、用數(shù)學(xué)軟件包求解統(tǒng)計問題。3、實驗作業(yè)。統(tǒng)計的基本概念參數(shù)估計假設(shè)檢驗數(shù)據(jù)的統(tǒng)計描述和分析2021/7/331、表示位置的統(tǒng)計量—平均值和中位數(shù)n

iX平均值(或均值,數(shù)學(xué)期望):

X

=i=11n中位數(shù):將數(shù)據(jù)由小到大排序后位于中間位置的那個數(shù)值.2、表示變異程度的統(tǒng)計量—標準差、方差和極差11ni=1i(

X

-

X

)2

]2n

-1標準差:s

=[它是各個數(shù)據(jù)與均值偏離程度的度量.方差:標準差的平方.極差:樣本中最大值與最小值之差.一、統(tǒng)計量2021/7/343.

表示分布形狀的統(tǒng)計量—偏度和峰度nis偏度:

g

=331(

X

-

X

)1n

isi=1

i=144峰度:

g

2

=(

X

-

X

)1偏度反映分布的對稱性,g1

>0

稱為右偏態(tài),此時數(shù)據(jù)位于均值右邊的比位于左邊的多;g1

<0

稱為左偏態(tài),情況相反;而g1

接近0則可認為分布是對稱的.峰度是分布形狀的另一種度量,正態(tài)分布的峰度為3,若g2

比3大很多,表示分布有沉重的尾巴,說明樣本中含有較多遠離均值的數(shù)據(jù),因而峰度可用作衡量偏離正態(tài)分布的尺度之一.nX4. k

階原點矩:Vk

=

kii=11nn2021/7/35kk

階中心矩:U

k

=

ii=1(

X

-

X

)1n二、分布函數(shù)的近似求法1、整理資料:把樣本值

x1,x2,…,xn

進行分組,先將它們依大小次序排列得

x*

x*

x*

.在包含[x*

,

x*

]

的區(qū)間[a,b]內(nèi)插入一些等分點:1

2

n

1

na

<

x

'

<

x

'

<

<

x

'

<

b,

注意要使每一個區(qū)間(x

'

,

x

'

]

(i=1,2,…,n-1)1

2

n

i i

+1內(nèi)都有樣本觀測值xi(i=1,2,…,n-1)落入其中.2、求出各組的頻數(shù)和頻率:統(tǒng)計出樣本觀測值在每個區(qū)間(x

'

,

x

'

]

中出i

i+1n現(xiàn)的次數(shù)ni

,它就是這區(qū)間或這組的頻數(shù).計算頻率fin=

i.1

2

n3、作頻率直方圖:在直角坐標系的橫軸上,標出x

',x

',,x

'各點,分別以i2021/7/36fiDx

'的矩形,

Dx

'

=

x

'

-

x

'

,

i

=

1,2,,

n

-1

,即得i

i

+1

i(x

',x

'

]為底邊,作高為i

i

+1頻率直方圖.三、幾個在統(tǒng)計中常用的概率分布2460.10.050-4 -2

00.40.350.30.250.20.152s

22ps-(

x-m

)21.正態(tài)分布N

(m,s

2

)密度函數(shù):

p(x)=

1

edyex分布函數(shù):F

(x)2s

2

1

2ps(

y-m

)2--¥=其中m

為均值,s

2

為方差,-¥<x

<+¥

.標準正態(tài)分布:N(0,1)密度函數(shù)x2j

(x)=

1

e

-

22px2021/7/37e

2

dyy

21--¥F

(x)

=2p,分布函數(shù)051015200.160.140.120.10.080.060.040.0202、c

2

分布c

2

n)若隨機變量X

1,X

2

,…Xn

相互獨立,都服從標準正態(tài)分布N(

0,1),則隨機變量1

2

nY=

X

2

+

X

2

+

+

X

2服從自由度為n

的c

2

分布,記為Y~

c

2

n)

.Y

的均值為n,方差為2n.2021/7/383、t

分布t(n)若X~N(0,1),Y~

c

2

(n),且相互獨立,則隨機變量YnXT

=服從自由度為n

的t

分布,記為T~t(n).t

分布t(20)的密度函數(shù)曲線和N(0,1)的曲線形狀相似.理論上nfi

時,T~t(n)fi

N(0,1).-4-202460.40.350.30.250.20.150.10.050-62021/7/392021/7/3104.F

分布F(n1,n2)若X~

c

2

(n1),Y~

c

2

(n2),且相互獨立,則隨機變量YXF

=

n1n2服從自由度為(n1,n2)的F

分布,記作F~

F(n1,n2).由F

分布的定義可以得到

F

分布的一個重要性質(zhì):1

22

1若

F~F(n

,n

),則

1

~

F

(n

,

n

)F00.511.522.53010.90.80.70.60.50.40.30.20.1返回F分布F(10,50)的密度函數(shù)曲線無論總體X

的分布函數(shù)F(x;q1

,q2,,qk

)的類型已知或未知,我們總是需要去估計某些未知參數(shù)或數(shù)字特征,這就是參數(shù)估計問題.即參數(shù)估計就是從樣本(1

2

n?i1X

,X

,…,X

)出發(fā),構(gòu)造一些統(tǒng)計量q

(X

,X2,…,Xn)(i=1,2,…,k)去估計總體X

中的某些參數(shù)(或數(shù)字特征)qi

(i=1,2,…,k).這樣的統(tǒng)計量稱為估計量.1.點估計:構(gòu)造(X

,1

2

n?iX

,…,X

)的函數(shù)q

(X

,1

2

nX

,…,X

)作為參數(shù)q

的點估計量,稱統(tǒng)計量q?i

i

i為總體X

參數(shù)q

的點估計量.2.區(qū)間估計:構(gòu)造兩個函數(shù)qi1

(X1,X2,…,Xn)和qi

2

(X1,X2,…,Xn)做成區(qū)間,把這(qi1

,qi

2

)作為參數(shù)qi

的區(qū)間估計.2021/7/311一、點估計的求法(一)矩估計法假設(shè)總體分布中共含有k

個參數(shù),它們往往是一些原

點矩或一些原點矩的函數(shù),例如,數(shù)學(xué)期望是一階原點矩,方差是二階原點矩與一階原點矩平方之差等.因此,要想估計總體的某些參數(shù)qi

(i=1,2,…k),由于k

個參數(shù)一定可以表為不超過k

階原點矩的函數(shù),很自然就會想到用樣本的r階原點矩去估計總體相應(yīng)的r階原點矩,用樣本的一些原點矩的函數(shù)去估計總體的相應(yīng)的一些原點矩的函數(shù),再將k

個參數(shù)反解出來,從而求出各個參數(shù)的估計值.這就是矩估計法,它是最簡單的一種參數(shù)估計法.2021/7/312(二)極大似然估計法i

=1極大似然法的想法是:若抽樣的結(jié)果得到樣本觀測值x1,x2,…,xn,則我們應(yīng)當這樣選取參數(shù)qi

的值,使這組樣本觀測值出現(xiàn)的可能性最大.即構(gòu)造似然函數(shù):L(q1

,q2

,,qk

)

=

P(

X1

=

x1

,

X

2

=

x2

,,

X

n

=

xn

)

=

P(

X1

=

x1

)P(

X

2

=

x2

)P(

X

n

=

xn

)n=

p

(

x1

,q

1

,

q

k

)

p

(

x

2

,q

1

,

,q

k

)

p

(

x

n

,q

1

,

q

k

)

=

p

(

x

i

,q

1

,

q

k

)1

k

i

i?使L(q

,,q

)達到最大,從而得到參數(shù)q

的估計值q

.此估計值叫極大似然估計值.函數(shù)L(q1

,,qk

)稱為似然函數(shù).求極大似然估計值的問題,就是求似然函數(shù)L(q1

,,qk

)的最大值的問題,則?L

=

0?qii

=

1,2,,

k即?LnL

=

0?qii

=

1,2,,

k2021/7/313設(shè)總體

X

的分布中含有未知參數(shù)q

,若對于給定的概率1-a?11

2X

,X

,…,n?2X

)和q(12X

,X

,…,(0

<a

<1),存在兩個統(tǒng)計量q

(Xn),使得P(q?

<q

<q?

)

=1-a1

2則稱隨機區(qū)間(q?

,q?

)為參數(shù)q

的置信水平為1-a

的置信區(qū)間,q?

稱為1

2

12置信下限,q?

稱為置信上限.二、區(qū)間估計的求法2021/7/31422na1

a1--EX

在置信水平

1-a

下的置信區(qū)間為[

X

-

u

s

,

X

+

us

]

.n2.未知方差DX,求EX的置信區(qū)間nsnsaa1-21-2,

X

+

tEX

在置信水平1-a

下的置信區(qū)間為[X

-t]

.(一)數(shù)學(xué)期望的置信區(qū)間1、已知DX,求EX的置信區(qū)間設(shè)樣本(X1,X2,…,Xn)來自正態(tài)母體

X,已知方差DX

=

s

2

,,2021/7/315(二)方差的區(qū)間估計DX

在置信水平1-a

下的置信區(qū)間為[2a21

ac

2c

2(n

-1)s

2(n

-1)s

2-]

.返回對總體X的分布律或分布參數(shù)作某種假設(shè),根據(jù)抽取的樣本觀察值,運用數(shù)理統(tǒng)計的分析方法,檢驗這種假設(shè)是否正確,從而決定接受假設(shè)或拒絕假設(shè).參數(shù)檢驗:如果觀測的分布函數(shù)類型已知,這時構(gòu)造出的統(tǒng)計量依賴于總體的分布函數(shù),這種檢驗稱為參數(shù)檢驗.參數(shù)檢驗的目的往往是對總體的參數(shù)及其有關(guān)性質(zhì)作出明確的判斷.非參數(shù)檢驗:如果所檢驗的假設(shè)并非是對某個參數(shù)作出明確的判斷,因而必須要求構(gòu)造出的檢驗統(tǒng)計量的分布函數(shù)不依賴于觀測值的分布函數(shù)類型,這種檢驗叫非參數(shù)檢驗.如要求判斷總體分布類型的檢驗就是非參數(shù)檢驗.2021/7/316假設(shè)檢驗的一般步驟是:根據(jù)實際問題提出原假設(shè)H0與備擇假設(shè)H1,即說明需要檢驗的假設(shè)的具體內(nèi)容;選擇適當?shù)慕y(tǒng)計量,并在原假設(shè)H0成立的條件下確定該統(tǒng)計量的分布;按問題的具體要求,選取適當?shù)娘@著性水平a

,并根據(jù)統(tǒng)計量的分布查表,確定對應(yīng)于a

的臨界值.一般a

取0.05,0.01

或0.10根據(jù)樣本觀測值計算統(tǒng)計量的觀測值,并與臨界值進行比較,從而在檢驗水平a

條件下對拒絕或接受原假設(shè)H0

作出判斷.2021/7/317一、參數(shù)檢驗(一)單個正態(tài)總體均值檢驗設(shè)取出一容量為n

的樣本,得到均值X和標準差s,現(xiàn)要

對總體均值m

是否等于某給定值m

0

進行檢驗.記H0

:

m

=

m

0

;

H

1

:

m

?

m

0稱H0

為原假設(shè),H1

為備擇假設(shè),兩者擇其一:接受H0

;拒絕H0

,即接受H1

.2021/7/318用u

檢驗,檢驗的拒絕域為21-1-1-W

={

z

>

u

a

}

W

=

{z

<

-ua

或z

>

u

a

}2

2H0H1總體方差s

2

已知X

-

m0統(tǒng)計量z=sn總體方差s

2

未知統(tǒng)計量t

=X

-m0sn在顯著水平a

下拒絕H0,若Ⅰm

=

m0m

?

m0z

>

u

a1-2t

>

t

a

(n

-1)1-2Ⅱm

=

m0m

>

m0z

>

u1-at

>

t1-a

(n

-1)Ⅲm

=

m0m

<

m0z

<

-u1-at

<

-t1-a

(n

-1)1、總體方差s

2

已知2021/7/3192.總體方差s

2

未知用樣本方差s

2

代替總體方差s

2

,這種檢驗叫t

檢驗.(二)單個正態(tài)總體方差檢驗設(shè)X

,X

,…,X

是來自正態(tài)總體N

(m,s

2

)的樣本,欲檢驗假設(shè):1

2

nH

:

s

2

=

s

2

H

:

s

2

?

s

2

(或

s

2

>

s

2

s

2

<

s

2)0

0

1

0

0

0這叫c

2

檢驗.H0H1均值m

已知統(tǒng)計量2

1

n

2

2c

=

2

(

X

i

-

m)s

0

i=1均值m

未知統(tǒng)計量2

1

n

2

2c

=

2

(

X

i

-

X

)s

0

i=1在顯著水平a

下拒絕H0,若Ⅰs

2

=

s

20s

2

?

s

20c

2

<c

2

(n)或a2c

2

>

c

2

(n)1

a-2c

2

<c

2

(n

-1)或a2c

2

>

c

2

(n

-1)1

a-2Ⅱs

2

=

s

20s

2

>

s

20c

2

>

c

2

(n)1-ac

2

>

c

2

(n

-1)1-aⅢs

2

=

s

20s

2

<

s

20c

2

<

c

2

(n)ac

2

<

c

2

(n

-1)a2021/7/320(三)兩個正態(tài)總體均值檢驗構(gòu)造統(tǒng)計量s

2

s

2 1

+

2

n1

n2z

=

X

-Y

.1、s

2

與s

2

已知時1

22、s

2

與s

2

未知但相等時1

21

1

2

2n1

+

n2(n

-1)s

2

+

(n

-1)s

2構(gòu)造統(tǒng)計量

t

=

X

-Y

n1n2

(n1

+

n2

-

2)

,H0H1方差s

2

,s

2

已知1

2統(tǒng)計量z方差s

2

,s

2

未知但相等1

2統(tǒng)計量t在顯著水平a

下拒絕H0,若Ⅰm1

=

m2m1

?

m2z

>

u

a1-2t

>

t

a

(n1

+

n2

-

2)1-2Ⅱm1

=

m2m1

>

m2z

>

u1-at

>

t1-a

(n1

+

n2

-

2)Ⅲm1

=

m2m1

<

m2z

<

-u1-at

<

-t1-a

(n1

+

n2

-

2)(四)兩個正態(tài)總體方差檢驗設(shè)樣本X1,X2,…,Xn1

與Y1,Y2

,…,Yn2

分別來自正態(tài)總體N

(m

,s

2

)與1

1N

(m

,s

2

),檢驗假設(shè):2

2H

:s

2

=s

2

H

:s

2

?s

2

(或s

2

>s

2

或s

2

<s

2

)0

1

2

1

1

2

1

2

1

2H0H1均值m1

,m2

已知統(tǒng)計量F0均值m1

,m2

未知統(tǒng)計量F在顯著水平a

下拒絕H0,若Ⅰs

2

=

s

21

2s

2

?

s

21

2F0

>F

a

(n1

,n2

)或1-2F

<

10

F

(n

,

n

)1

a

2

1-2F

>F

a

(n1

-1,n2

-1)或1-2F

<

1F

a

(n2

-1,

n1

-1)1-2Ⅱs

2

=

s

21

2s

2

>

s

21

2F0

>

F1-a

(n1

,

n2

)F

>

F1-a

(n1

-1,

n2

-1)Ⅲs

2

=

s

21

2s

2

<

s

21

2F

<

10

F

(n

,

n

)1-a

2

1F

<

1F1-a

(n2

-1,

n1

-1)222011n2i=1

i

2n1

i

1nnF(Y

-

m

)(

X

-

m

)=

1

i=1

,2s

2s

21

2F

=

1

(設(shè)s

2

?s

2

)二、非參數(shù)檢驗2021/7/323(一)皮爾遜c

2

擬合檢驗法(二)概率紙檢驗法概率紙是一種判斷總體分布的簡便工具.使用它們,可以很快地判斷總體分布的類型.概率紙的種類很多.如果一個總體的分布F(X)是正態(tài)的,則(x,F(xiàn)(x))點在正態(tài)概率紙上應(yīng)呈一條直線.設(shè)X1,X2,…,Xn

是從正態(tài)總體中抽得的樣本觀測值,將它們按大小排列后,記作X(1)£

X(2)£…£X(n).則當n較大時,樣本的經(jīng)驗分布函數(shù)Fn(x)和理論分布F(x)很接近.因此,如果用(x,F(xiàn)(x))畫圖,則必應(yīng)近似為一條直線.返回統(tǒng)計工具箱中的基本統(tǒng)計命令數(shù)據(jù)的錄入、保存和調(diào)用基本統(tǒng)計量常見概率分布的函數(shù)頻數(shù)直方圖的描繪參數(shù)估計假設(shè)檢驗綜合實例返回2021/7/324一、數(shù)據(jù)的錄入、保存和調(diào)用例1上海市區(qū)社會商品零售總額和全民所有制職工工資總額的數(shù)據(jù)如下年份78798081828284858687職工工資總額

(億元)23.827.631.632.433.734.943.252.863.873.4商品零售總額

(億元)41.451.861.767.968.777.595.9137.4155.0175.0統(tǒng)計工具箱中的基本統(tǒng)計命令2021/7/3251、年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入。命令格式:x=a:h:bt=78:872、分別以x和y代表變量職工工資總額和商品零售總額。x=[23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4]y=[41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]3、將變量t、x、y的數(shù)據(jù)保存在文件data中。save

data

t

x

y4、進行統(tǒng)計分析時,調(diào)用數(shù)據(jù)文件data中的數(shù)據(jù)。load

dataTo

MATLAB(txy)2021/7/3261、輸入矩陣:

data=[78,79,80,81,82,83,84,85,86,87,88;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]2、將矩陣data的數(shù)據(jù)保存在文件data1中:save

data1

data3、進行統(tǒng)計分析時,先用命令:

load

data1調(diào)用數(shù)據(jù)文件data1中的數(shù)據(jù),再用以下命令分別將矩陣

data的第一、二、三行的數(shù)據(jù)賦給變量t、x、y:t=data(1,:)x=data(2,:)y=data(3,:)若要調(diào)用矩陣data的第j列的數(shù)據(jù),可用命令:data(:,j)To

MATLAB(data)返回2021/7/327二、基本統(tǒng)計量對隨機變量x,計算其基本統(tǒng)計量的命令如下:均值:mean(x)中位數(shù):median(x)標準差:std(x)方差:var(x)偏度:skewness(x)峰度:kurtosis(x)例對例1中的職工工資總額x,可計算上述基本統(tǒng)計量。2021/7/328To

MATLAB(tjl)返回三、常見概率分布的函數(shù)2021/7/329常見的幾種分布的命令字符為:正態(tài)分布:norm帕松分布:poiss威布爾分布:weibt分布:t指數(shù)分布:expb

分布:betac

2

分布:chi2F分布:FMatlab工具箱對每一種分布都提供五類函數(shù),其命令字符為:概率密度:pdf

概率分布:cdf逆概率分布:inv

均值與方差:stat隨機數(shù)生成:rnd(當需要一種分布的某一類函數(shù)時,將以上所列的分布命令字符與函數(shù)命令字符接起來,并輸入自變量(可以是標量、數(shù)組或矩陣)和參數(shù)即可.)To

MATLAB(liti2)如對均值為mu、標準差為sigma的正態(tài)分布,舉例如下:1、密度函數(shù):p=normpdf(x,mu,sigma)(當mu=0,sigma=1時可缺省)例

2

畫出正態(tài)分布

N

(0,1)

N

(0,22

)

的概率密度函數(shù)圖形.在Matlab中輸入以下命令:

x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)2021/7/330To

MATLAB(liti3)2021/7/3313、逆概率分布:x=norminv(P,mu,sigma).

即求出x

,使得P{X<x}=P.此命令可用來求分位數(shù).2、概率分布:P=normcdf(x,mu,sigma)例

3.

計算標準正態(tài)分布的概率

P{-1<X<1}.命令為:P=normcdf(1)-normcdf(-1)結(jié)果為:P=0.6827a21-例

4

取a

=

0.05

,求u1-au2

21-a的含義是:

X

~

N

(0,1)

,P{X<

u2}=1

-

aa

=

0.05

時,P=0.975,

u0.975

=

norminv(0.975)=1.96To

MATLAB(liti4)To

MATLAB(liti5)2021/7/3324、均值與方差:[m,v]=normstat(mu,sigma)例5

求正態(tài)分布N(3,52)的均值與方差.命令為:[m,v]=normstat(3,5)結(jié)果為:m=3,v=25結(jié)果為:M=0.95672.01252.88543.83345.02886.1191To

MATLAB(liti6)5、隨機數(shù)生成:normrnd(mu,sigma,m,n).產(chǎn)生m

n階的正態(tài)分布隨機數(shù)矩陣.例6

命令:M=normrnd([1

2

3;4

5

6],0.1,2,3)此命令產(chǎn)生了2

3的正態(tài)分布隨機數(shù)矩陣,各數(shù)分別服從N(1,0.12),

N(2,22),

N(3,

32),

N(4,0.12),

N(5,

22),N(6,

32)返回1、給出數(shù)組data的頻數(shù)表的命令為:

[N,X]=hist(data,k)此命令將區(qū)間[min(data),max(data)]分為k個小區(qū)間(缺省為10),返回數(shù)組data落在每一個小區(qū)間的頻數(shù)N和每一個小區(qū)間的中點X.2、描繪數(shù)組data的頻數(shù)直方圖的命令為:hist(data,k)四、頻數(shù)直方圖的描繪返回2021/7/333五、參數(shù)估計2021/7/3341、正態(tài)總體的參數(shù)估計設(shè)總體服從正態(tài)分布,則其點估計和區(qū)間估計可同時由以下命令獲得:[muhat,sigmahat,muci,sigmaci]

=

normfit(X,alpha)此命令在顯著性水平alpha下估計數(shù)據(jù)X的參數(shù)(alpha缺省時設(shè)定為0.05),返回值muhat是X的均值的點估計值,

sigmahat是標準差的點估計值,muci是均值的區(qū)間估計,sigmaci是標準差的區(qū)間估計.2、其它分布的參數(shù)估計有兩種處理辦法:一.取容量充分大的樣本(n>50),按中心極限定理,它近似地服從正態(tài)分布;二.使用Matlab工具箱中具有特定分布總體的估計命令.(1)[muhat,muci]=expfit(X,alpha)-----在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點估計及其區(qū)間估計.(2)[lambdahat,

lambdaci]

=

poissfit(X,alpha)-----

在顯著性水平alpha下,求泊松分布的數(shù)據(jù)X

的參數(shù)的點估計及其區(qū)間估計.(3)[phat,

pci]

=

weibfit(X,alpha)-----

在顯著性水平alpha下,求Weibull分布的數(shù)據(jù)X

的參數(shù)的點估計及其區(qū)2021/7/335間估計.返回六、假設(shè)檢驗2021/7/336在總體服從正態(tài)分布的情況下,可用以下命令進行假設(shè)檢驗.1、總體方差sigma2已知時,總體均值的檢驗使用z-檢驗[h,sig,ci]

=

ztest(x,m,sigma,alpha,tail)檢驗數(shù)據(jù)x

的關(guān)于均值的某一假設(shè)是否成立,其中sigma

為已知方差,alpha

為顯著性水平,究竟檢驗什么假設(shè)取決于

tail

的取值:tail=0,檢驗假設(shè)“x

的均值等于m”

tail=1,檢驗假設(shè)“x

的均值大于m”

tail=-1,檢驗假設(shè)“x

的均值小于m”

tail的缺省值為0,alpha的缺省值為0.05.返回值h

為一個布爾值,h=1

表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig

為假設(shè)成立的概率,ci

為均值的

1-alpha

置信區(qū)間.例7

Matlab統(tǒng)計工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國1993年一月份和二月份的汽油平均價格(price1,price2分別是一,二月份的油價,單位為美分),它是容量為20的雙樣本.假設(shè)一月份油價的標準偏差是一加侖四分幣(s=4),試檢驗一月份油價的均值是否等于115.2021/7/337解作假設(shè):m=115.首先取出數(shù)據(jù),用以下命令:load

gas然后用以下命令檢驗[h,sig,ci]

=

ztest(price1,115,4)返回:h=0,sig=0.8668,ci=[113.3970116.9030].檢驗結(jié)果: 1.

布爾變量h=0,

表示不拒絕零假設(shè).

說明提出的假設(shè)均值115是合理的.sig-值為0.8668,遠超過0.5,不能拒絕零假設(shè)95%的置信區(qū)間為[113.4,116.9],它完全包括115,且精度很高..To

MATLAB(liti7)2、總體方差sigma2未知時,總體均值的檢驗使用t-檢驗[h,sig,ci]=ttest(x,m,alpha,tail)檢驗數(shù)據(jù)x

的關(guān)于均值的某一假設(shè)是否成立,其中

alpha

為顯著性水平,究竟檢驗什么假設(shè)取決于tail的取值:tail=0,檢驗假設(shè)“x

的均值等于m”tail=1,檢驗假設(shè)“x

的均值大于m”

tail=-1,檢驗假設(shè)“x

的均值小于m”

tail的缺省值為0,alpha的缺省值為0.05.返回值h

為一個布爾值,h=1

表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig

為假設(shè)成立的概率,ci

為均值的

1-alpha

置信區(qū)間.2021/7/338返回:h

=

1,sig

=4.9517e-004,ci

=[116.8

120.2].2021/7/339檢驗結(jié)果:1.布爾變量h=1,表示拒絕零假設(shè).說明提出的假設(shè)油價均值115是不合理的.95%的置信區(qū)間為[116.8 120.2],

它不包括115,故不能接受假設(shè).sig-值為4.9517e-004,遠小于0.5,不能接受零假設(shè).To

MATLAB(liti8)例8

試檢驗例8中二月份油價

Price2的均值是否等于115.解

作假設(shè):m=115,

price2為二月份的油價,不知其方差,故用以下命令檢驗[h,sig,ci]

=

ttest(

price2

,115)3、兩總體均值的假設(shè)檢驗使用t-檢驗[h,sig,ci]=ttest2(x,y,alpha,tail)檢驗數(shù)據(jù)x

,y

的關(guān)于均值的某一假設(shè)是否成立,其中

alpha為顯著性水平,究竟檢驗什么假設(shè)取決于tail的取值:2021/7/340tail=0,檢驗假設(shè)“x的均值等于y的均值”tail=1,檢驗假設(shè)“x的均值大于y的均值”tail=-1,檢驗假設(shè)“x

的均值小于y的均值”tail的缺省值為0,alpha的缺省值為0.05.返回值h

為一個布爾值,h=1

表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig

為假設(shè)成立的概率,ci

為與x與y均值差的的1-alpha

置信區(qū)間.返回:h=1,sig=0.0083,ci=[-5.8,-0.9].2021/7/341檢驗結(jié)果:1.布爾變量h=1,表示拒絕零假設(shè).說明提出的假設(shè)“油價均值相同”是不合理的.95%的置信區(qū)間為[-5.8,-0.9],說明一月份油價比二月份油價約低1至6分.sig-值為0.0083,遠小于0.5,不能接受“油價均相同”假設(shè).To

MATLAB(liti9)例9

試檢驗例8中一月份油價Price1與二月份的油價Price2均值是否相同.解

用以下命令檢驗[h,sig,ci]

=

ttest2(price1,price2)4、非參數(shù)檢驗:總體分布的檢驗2021/7/342Matlab工具箱提供了兩個對總體分布進行檢驗的命令:(1)h

=

normplot(x)(2)h

=

weibplot(x)此命令顯示數(shù)據(jù)矩陣x的正態(tài)概率圖.如果數(shù)據(jù)來自于正態(tài)分布,則圖形顯示出直線性形態(tài).而其它概率分布函數(shù)顯示出曲線形態(tài).此命令顯示數(shù)據(jù)矩陣x的Weibull概率圖.如果數(shù)據(jù)來自于Weibull分布,則圖形將顯示出直線性形態(tài).而其它概率分布函數(shù)將顯示出曲線形態(tài).返回例10一道工序用自動化車床連續(xù)加工某種零件,由于刀具損壞等會出現(xiàn)故障.故障是完全隨機的,并假定生產(chǎn)任一零件時出現(xiàn)故障機會均相同.工作人員是通過檢查零件來確定工序是否出現(xiàn)故障的.現(xiàn)積累有100次故障紀錄,故障出現(xiàn)時該刀具完成的零件數(shù)如下:459362624542509584433748815505612452434982640742565706

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論