第二章定量數(shù)據(jù)的統(tǒng)計(jì)描述_第1頁
第二章定量數(shù)據(jù)的統(tǒng)計(jì)描述_第2頁
第二章定量數(shù)據(jù)的統(tǒng)計(jì)描述_第3頁
第二章定量數(shù)據(jù)的統(tǒng)計(jì)描述_第4頁
第二章定量數(shù)據(jù)的統(tǒng)計(jì)描述_第5頁
已閱讀5頁,還剩49頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2022-4-12醫(yī)學(xué)統(tǒng)計(jì)學(xué)-(馬斌榮主編)供本科生用第二章第二章定量資料的統(tǒng)計(jì)描述定量資料的統(tǒng)計(jì)描述第一節(jié)第一節(jié) 頻數(shù)分布頻數(shù)分布 一、頻數(shù)分布表一、頻數(shù)分布表簡稱頻數(shù)表(簡稱頻數(shù)表(frequency table)frequency table)8例例2-1 2-1 從某單位從某單位19991999年的職工體檢資料中年的職工體檢資料中獲得獲得101101名正常成年女子的血清總膽固醇(名正常成年女子的血清總膽固醇(mmol/Lmmol/L)的測量結(jié)果如下,試編制頻數(shù)分布)的測量結(jié)果如下,試編制頻數(shù)分布表。表。2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.

2、58 4.34 4.84 4.414.78 3.95 3.923.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.913.91 4.59 4.192.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.914.15 4.55 4.803.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.843.60 3.51 4.063.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.964.50 3.27 4.523.19 4.59 3.75 3.98 4.13 4.26 3.63 3.

3、87 5.713.30 4.73 4.175.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.284.06 5.26 5.253.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.254.15 4.36 4.953.00 3.26試編制頻數(shù)分布表。試編制頻數(shù)分布表。1、頻數(shù)表的編制、頻數(shù)表的編制4找全距找全距(range)4定組距定組距(class interval):一般分為一般分為1015組,如組距約為全距組,如組距約為全距/104寫組段:寫組段:8每個(gè)組段的起點(diǎn)稱為下限,每個(gè)組段的起點(diǎn)稱為下限,lower limit;8每個(gè)組

4、段的終點(diǎn)稱為上限,每個(gè)組段的終點(diǎn)稱為上限,upper limit;8下限下限X50, 或或 10)4資料的分布不清。資料的分布不清。4注意:在完全對稱的單峰曲線分布中,同注意:在完全對稱的單峰曲線分布中,同一組資料的均數(shù)與中位數(shù)相同,一組資料的均數(shù)與中位數(shù)相同, Mean = Median中位數(shù)的優(yōu)缺點(diǎn)中位數(shù)的優(yōu)缺點(diǎn)優(yōu)點(diǎn):優(yōu)點(diǎn):8不受個(gè)別特大或特小的觀察值影響;不受個(gè)別特大或特小的觀察值影響;8其它平均數(shù)不宜使用時(shí),中位數(shù)就顯示其它平均數(shù)不宜使用時(shí),中位數(shù)就顯示出它的優(yōu)越性。出它的優(yōu)越性。缺點(diǎn):缺點(diǎn):8掉失了大量信息,其敏感性不夠。掉失了大量信息,其敏感性不夠。百分位數(shù)百分位數(shù)(Percent

5、ile,Px)百分位數(shù)百分位數(shù)4位置指標(biāo);界值;位置指標(biāo);界值;4分布數(shù)列的百等份分割值。分布數(shù)列的百等份分割值。4有有x%的比的比Px小小, 有有(100-x)%的比的比Px大。大。4中位數(shù)是一個(gè)特定的百分位數(shù)中位數(shù)是一個(gè)特定的百分位數(shù)P50。百分位數(shù)的計(jì)算百分位數(shù)的計(jì)算fX 為為PX所在組段的頻數(shù),所在組段的頻數(shù), i 為該組段的組距,為該組段的組距, L 為該組段的下限,為該組段的下限, fL 為小于為小于L各組段的累計(jì)頻數(shù)。各組段的累計(jì)頻數(shù)。 Lxxfx%nfiLP某傳染性疾病的潛伏期(天)如下表,求其某傳染性疾病的潛伏期(天)如下表,求其 中位數(shù)和百分位數(shù)中位數(shù)和百分位數(shù)P P959

6、5潛伏期 (天)人數(shù)f累計(jì)頻數(shù)f累計(jì)頻率%4 262624.048 487468.5212259991.6716 610597.2220 3108100.00)( 3 .10265 . 01084848%天LfxnfiLM)(4 .189995. 01086416%95天LfxnfiLP百分位數(shù)的應(yīng)用百分位數(shù)的應(yīng)用4描述一組觀察值在某百分位置上的水描述一組觀察值在某百分位置上的水平。平。4用于確定醫(yī)學(xué)正常值范圍。用于確定醫(yī)學(xué)正常值范圍。4用一組百分位數(shù)描述一組觀察值的變用一組百分位數(shù)描述一組觀察值的變異度,如四分位數(shù)。異度,如四分位數(shù)。應(yīng)用平均數(shù)時(shí)的注意事項(xiàng)應(yīng)用平均數(shù)時(shí)的注意事項(xiàng)4同質(zhì)的變量值

7、才能求平均數(shù);同質(zhì)的變量值才能求平均數(shù);4根據(jù)資料的分布特點(diǎn),選用適應(yīng)根據(jù)資料的分布特點(diǎn),選用適應(yīng)的平均數(shù)指標(biāo)。的平均數(shù)指標(biāo)。平均水平平均水平SPSS統(tǒng)計(jì)描述命令統(tǒng)計(jì)描述命令4Analyze Descriptive Statistics Frequencies Descriptives使用頻數(shù)表資料時(shí)使用頻數(shù)表資料時(shí)SPSSSPSS操作中應(yīng)操作中應(yīng)注意的事項(xiàng)注意的事項(xiàng)Frequencies命令中要選擇命令中要選擇Values are group midpoints:根據(jù)根據(jù)分組資料計(jì)算百分位數(shù)。分組資料計(jì)算百分位數(shù)。SPSS操作操作求幾何均數(shù)時(shí)有三種方法求幾何均數(shù)時(shí)有三種方法: 1.是先計(jì)算對

8、數(shù)的均數(shù),然后求其反對數(shù),是先計(jì)算對數(shù)的均數(shù),然后求其反對數(shù),得出幾何均數(shù);得出幾何均數(shù);2.直接用直接用Report Case Summaries 命令;命令;3.用用Compare Means 命令,但要個(gè)增加分組命令,但要個(gè)增加分組變量。變量。第三節(jié)第三節(jié) 變異程度的統(tǒng)計(jì)指標(biāo)變異程度的統(tǒng)計(jì)指標(biāo)例例 有有3組同齡男孩體重(組同齡男孩體重(kg)如下,其)如下,其體重均數(shù)體重均數(shù) 都是都是30 (kg),試分析),試分析離散程度。離散程度。甲組甲組 26 28 30 32 34乙組乙組 24 27 30 33 36丙組丙組 26 29 30 31 34X離散程度(或變異程度)離散程度(或變異

9、程度)4指數(shù)據(jù)參差不齊的程度,反映資料的指數(shù)據(jù)參差不齊的程度,反映資料的離散趨勢。離散趨勢。4將反映平均水平與離散程度的指標(biāo)結(jié)將反映平均水平與離散程度的指標(biāo)結(jié)合起來使用,可全面地描述數(shù)據(jù)的分合起來使用,可全面地描述數(shù)據(jù)的分布規(guī)律。布規(guī)律。一、一、全距全距(或極差(或極差 , Range )4 全距全距 = 最大值最大值 最小值最小值4優(yōu)點(diǎn):簡單明了優(yōu)點(diǎn):簡單明了4缺點(diǎn):不能反映組內(nèi)其他數(shù)據(jù)的變?nèi)秉c(diǎn):不能反映組內(nèi)其他數(shù)據(jù)的變異,樣本含量相差較大時(shí),不宜用異,樣本含量相差較大時(shí),不宜用極差比較分布的離散程度。極差比較分布的離散程度。二、二、四分位數(shù)間距四分位數(shù)間距 (inter-quartile

10、range)4百分位數(shù):指把數(shù)據(jù)從小到大排列后處于百分位數(shù):指把數(shù)據(jù)從小到大排列后處于第第X百分位置的數(shù)值。它將全部數(shù)據(jù)分為百分位置的數(shù)值。它將全部數(shù)據(jù)分為兩部分,兩部分,在不包括在不包括PX的全部數(shù)據(jù)中有的全部數(shù)據(jù)中有X%數(shù)數(shù)據(jù)小于據(jù)小于PX,有,有1-X%的數(shù)據(jù)大于的數(shù)據(jù)大于PX%。中位。中位數(shù)是一個(gè)特定的百分位數(shù)數(shù)是一個(gè)特定的百分位數(shù)P50。4四分位數(shù):四分位數(shù):下四分位數(shù)下四分位數(shù)P25;上四分位數(shù);上四分位數(shù)P75 P0 P25 P50 P75 P100 4四分位數(shù)間距:四分位數(shù)間距: P75 - P25 或或 QU - QL 比極差穩(wěn)定,但仍未考慮每個(gè)數(shù)據(jù)的大小比極差穩(wěn)定,但仍未考

11、慮每個(gè)數(shù)據(jù)的大小。常和中位數(shù)結(jié)合使用描述數(shù)據(jù)的分布規(guī)。常和中位數(shù)結(jié)合使用描述數(shù)據(jù)的分布規(guī)律。律。三、三、離均差平方和離均差平方和 (sun of square)、方差方差(variance)和)和標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(standard deviation)2X-XSS4平均偏差(平均偏差(mean difference): 4離均差平方和離均差平方和(sun of square, SS)nXX平均偏差方差方差和和標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 NX22 NX2 4離均差平方和離均差平方和: 8考慮每個(gè)觀察值,但受考慮每個(gè)觀察值,但受N的影響。的影響。4對離均差平方和求均數(shù),得對離均差平方和求均數(shù),得總體總體方差方差 2

12、 ,開根號開根號得得標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 。 2X一般一般 未知,常常用未知,常常用 來估計(jì)之,來估計(jì)之,4數(shù)理統(tǒng)計(jì)證明,如用樣本的變量個(gè)數(shù)理統(tǒng)計(jì)證明,如用樣本的變量個(gè)數(shù)數(shù)n來代替來代替N,計(jì)算出的樣本方差比實(shí)計(jì)算出的樣本方差比實(shí)際際 2低,需要用低,需要用n-1校正,得校正,得樣本方樣本方差差S2。開根號得樣本開根號得樣本標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差s。 1nXXs22 X 1nXXs2 自由度,自由度,degree of freedom4方差計(jì)算公式中的方差計(jì)算公式中的n-1被稱為自由度,它描被稱為自由度,它描述了當(dāng)述了當(dāng) 選定時(shí),選定時(shí),n個(gè)個(gè)X中能自由變動(dòng)的中能自由變動(dòng)的X(變量值)的個(gè)數(shù)。(變量值)的個(gè)數(shù)。

13、4例:某樣本含有例:某樣本含有3個(gè)數(shù)據(jù),要求個(gè)數(shù)據(jù),要求X=10。則在自。則在自由確定了由確定了2個(gè)數(shù)據(jù)后,第個(gè)數(shù)據(jù)后,第3個(gè)數(shù)據(jù)只能是個(gè)數(shù)據(jù)只能是10-(x1+x2)。 即有即有2個(gè)數(shù)據(jù)可以自由變動(dòng)個(gè)數(shù)據(jù)可以自由變動(dòng),其自由度其自由度=2 。4推而廣之,任何統(tǒng)計(jì)量的自由度推而廣之,任何統(tǒng)計(jì)量的自由度 n-k,k為限制條件的個(gè)數(shù)。為限制條件的個(gè)數(shù)。 4自由度:是隨機(jī)變量可以自由度:是隨機(jī)變量可以“自由自由”取值的取值的個(gè)數(shù)。個(gè)數(shù)。X X4總體標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差4樣本標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差 NX2 1nX-Xs2標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 standard deviation 1/22 nnXXs 1/22 fffX

14、fXs8應(yīng)用于頻數(shù)表資料:應(yīng)用于頻數(shù)表資料:標(biāo)準(zhǔn)差的計(jì)算標(biāo)準(zhǔn)差的計(jì)算甲組甲組 26 28 30 32 34 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 3.16乙組乙組 24 27 30 33 36 4.74丙組丙組 26 29 30 31 34 2.92甲組:甲組:X=26+28+30+32+34=150X=26+28+30+32+34=150XX2 2=26=262 2+28+282 2+30+302 2+32+322 2+34+342 2=4540=454016. 3155/15045401/222nnXXs用頻數(shù)表法計(jì)算標(biāo)準(zhǔn)差用頻數(shù)表法計(jì)算標(biāo)準(zhǔn)差1/22fffXfXs8見下表計(jì)算見下表計(jì)算組段頻數(shù)f 組中值Xf X

15、f X22.3012.452.456.002.6032.758.2522.692.9063.0518.3055.823.2083.3526.8089.783.50 173.6562.05226.483.80 203.9579.00312.054.10 174.2572.25307.064.40 124.5554.60248.434.70 94.8543.65211.705.00 55.1525.75132.615.3025.4510.9059.415.605.901 5.755.7533.06合計(jì)101409.751705.09 )/(654.01101101/75.40909.17052Lm

16、mols 標(biāo)準(zhǔn)差的用途:標(biāo)準(zhǔn)差的用途:4反映一組觀察值的離散程度;反映一組觀察值的離散程度;4計(jì)算變異系數(shù);計(jì)算變異系數(shù);4計(jì)算標(biāo)準(zhǔn)誤;計(jì)算標(biāo)準(zhǔn)誤;4估計(jì)參考值范圍。估計(jì)參考值范圍。4標(biāo)準(zhǔn)差與算術(shù)均數(shù)之比,標(biāo)準(zhǔn)差與算術(shù)均數(shù)之比,4反映了相對離散程度反映了相對離散程度4常用于比較常用于比較8度量衡單位不同的多組資料的變異度度量衡單位不同的多組資料的變異度8均數(shù)相差懸殊的多組資料的變異度均數(shù)相差懸殊的多組資料的變異度1 10 00 0% %s sC CV Vx四、四、變異系數(shù)變異系數(shù) CV(coefficient of variation)例:度量衡單位不同的變異度例:度量衡單位不同的變異度4某地某地20歲男子歲男子110名名8身高身高 =172.73cm, s4.09cm;8體重體重 55.04kg, s4.10kg,4試比較兩組資料的變異試比較兩組資料的變異程度,即身高、體重的程度,即身高、體重的變異程度哪個(gè)大?變異程度哪個(gè)大?%37. 2%10073.17209. 4%100 XsCV%45

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論