醫(yī)學(xué)統(tǒng)計學(xué) 02-1 個體變異學(xué)習(xí)資料_第1頁
醫(yī)學(xué)統(tǒng)計學(xué) 02-1 個體變異學(xué)習(xí)資料_第2頁
醫(yī)學(xué)統(tǒng)計學(xué) 02-1 個體變異學(xué)習(xí)資料_第3頁
醫(yī)學(xué)統(tǒng)計學(xué) 02-1 個體變異學(xué)習(xí)資料_第4頁
醫(yī)學(xué)統(tǒng)計學(xué) 02-1 個體變異學(xué)習(xí)資料_第5頁
已閱讀5頁,還剩42頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

柏建嶺南京醫(yī)科大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計學(xué)系Medicalstatistics醫(yī)學(xué)統(tǒng)計學(xué)個體變異與變量分布4/30/20251柏建嶺講稿個體變異(individualvariation)是同質(zhì)觀察對象間表現(xiàn)出的差異。變異是生物體在一種或多種、已知或未知的不可控因素作用下所產(chǎn)生的綜合反映。就個體而言:變異是隨機的(random)。就總體而言:個體變異是有規(guī)律的。4/30/20252柏建嶺講稿一個原始資料142.3156.6142.7145.7138.2141.6142.5130.5134.5148.8134.4148.8137.9151.3140.8149.8145.2141.8146.8135.1150.3133.1142.7143.9151.1144.0145.4146.2143.3156.3141.9140.7141.2141.5148.8140.1150.6139.5146.4143.8143.5139.2144.7139.3141.9147.8140.5138.9134.7147.3138.1140.2137.4145.1145.8147.9150.8144.5137.1147.1142.9134.9143.6142.3125.9132.7152.9147.9141.8141.4140.9141.4160.9154.2137.9139.9149.7147.5136.9148.1134.7138.5138.9137.7138.5139.6143.5142.9129.4142.5141.2148.9154.0147.7152.3146.6132.1145.9146.7144.0135.5144.4143.4137.4143.6150.0143.3146.5149.0142.1140.2145.4142.4148.9146.7139.2139.6142.4138.7139.94/30/20253柏建嶺講稿頻數(shù)表編制步驟

求極差選定適當?shù)慕M段數(shù)后估計組距列出組段劃記歸組獲得頻數(shù)求頻率,完成頻數(shù)表

4/30/20254柏建嶺講稿頻數(shù)分布表的編制求極差或全距(Range):R=Xmax-XminR=160.9-125.9=35(cm)選定適當?shù)慕M段數(shù)后估計組距(i)組段數(shù)的選取以能反映資料的分布特征為宜一般取8~12組

i=35/10=3.5≈4(cm)4/30/20255柏建嶺講稿頻數(shù)分布表的編制列出組段組段的含義:包括組段的下限而不含組段的上限。如:124~等價于[124,128)第一個組段應(yīng)包含最小值

最后一個組段應(yīng)包含最大值4/30/20256柏建嶺講稿頻數(shù)分布表的編制劃記歸組獲得頻數(shù)常用的劃記方法:“正”;“||||”求頻率,完成頻數(shù)表相應(yīng)的頻數(shù)除以總數(shù)即為頻率各組段的頻率總和為1或者100%4/30/20257柏建嶺講稿計量資料的頻數(shù)、頻率分布組段頻數(shù)頻率

124~10.0083

128~20.0167

132~100.0833

136~220.1834

140~370.3083

144~260.2167

148~150.1250

152~40.0333

156~20.0167

160~10.0083合計1201.00004/30/20258柏建嶺講稿計量資料的頻數(shù)分布圖---直方圖124132140148156164010203040人數(shù)圖某市120名12歲男童身高的頻數(shù)分布4/30/20259柏建嶺講稿頻數(shù)分布表和頻數(shù)分布圖的用途

描述分布類型描述分布的特征便于發(fā)現(xiàn)特大、特小的可疑值便于計算有關(guān)指標、統(tǒng)計分析與處理4/30/202510柏建嶺講稿頻數(shù)分布特征

數(shù)據(jù)分布的范圍:125.9~160.9cm集中趨勢:中等大小人數(shù)居多,向中間集中數(shù)據(jù)最集中的區(qū)間:140.0~144.0cm離散趨勢:以中等大小的區(qū)間為中心,向兩側(cè)逐漸分散分布形態(tài):基本對稱4/30/202511柏建嶺講稿同一組資料,不同的人編制的頻數(shù)表,結(jié)果不盡相同,允許幾個合理的結(jié)果并存。

4/30/202512柏建嶺講稿定性及等級資料的頻數(shù)分布離散型頻數(shù)表離散型頻數(shù)圖——直條圖

4/30/202513柏建嶺講稿頻數(shù)分布表血型頻數(shù)頻率(%)O20540.43A11222.09B15029.59AB407.89合計507100.004/30/202514柏建嶺講稿頻數(shù)分布圖OABAB4/30/202515柏建嶺講稿頻數(shù)分布類型對稱分布:以正態(tài)分布較為常見非對稱分布:偏態(tài)分布正偏態(tài):右側(cè)>左側(cè)向右側(cè)拖尾 負偏態(tài):左側(cè)>右側(cè)向左側(cè)拖尾

4/30/202516柏建嶺講稿圖239人發(fā)汞含量的頻數(shù)分布13579111315171921發(fā)汞含量(umol/kg)706050403020100人數(shù)4/30/202517柏建嶺講稿圖某城市892名老年人生存質(zhì)量自評分的頻數(shù)分布0102030405060708090100自評分4003002001000人數(shù)4/30/202518柏建嶺講稿圖102名黑色素瘤患者的生存時間頻數(shù)分布151015202530354045生存時間(月)403020100人數(shù)4/30/202519柏建嶺講稿圖某地1990~1992年男性死亡年齡分布

0510152025

303540

455055606570758085死亡年齡(歲)250020001500100050004/30/202520柏建嶺講稿定量資料的統(tǒng)計指標集中位置的描述離散趨勢的描述4/30/202521柏建嶺講稿集中位置的描述----平均數(shù)(average)均數(shù)(arithmeticmean,mean)4/30/202522柏建嶺講稿均數(shù)的幾何意義均數(shù)代表每組觀察值的平衡點,也就是重心。如:(1,4,7,8)則均數(shù)為5。則圖示如下:均數(shù)的重要特性:離均差(各觀察值與均數(shù)之差)總和等于零123456784/30/202523柏建嶺講稿平均數(shù)(average)加權(quán)均數(shù)(weightedmean)

均數(shù)是加權(quán)均數(shù)的一個特例4/30/202524柏建嶺講稿平均數(shù)(average)幾何均數(shù)(geometricmean)

4/30/202525柏建嶺講稿幾何均數(shù)例1:10,1:20,1:40,1:80,1:1604/30/202526柏建嶺講稿平均數(shù)(average)中位數(shù)(median)

將一組數(shù)據(jù)按從小到大的順序排列,位置居中的數(shù)即是中位數(shù)。4/30/202527柏建嶺講稿中位數(shù)例9例正常人的發(fā)汞值(

mol/kg):

1.1,1.83.54.24.85.65.97.110.5

M=4.810例正常人的發(fā)汞值:

1.1,1.83.54.24.85.65.97.110.516.3

M=(4.8+5.6)/2=5.2

4/30/202528柏建嶺講稿平均數(shù)(average)LP1P2P3P4HP97P98P991%1%1%1%1%1%1%同樣有十分位數(shù)、四分位數(shù)……百分位數(shù)(percentile)4/30/202529柏建嶺講稿

M=P50排序數(shù)據(jù):按從小到大順序排列X%(100-X)%PXHL4/30/202530柏建嶺講稿平均數(shù)應(yīng)用的注意事項同質(zhì)的資料計算平均數(shù)才有意義根據(jù)資料分布的特征選用適當?shù)钠骄鶖?shù)均數(shù):單峰對稱分布的資料幾何均數(shù):分布呈偏態(tài),經(jīng)對數(shù)變換后趨于單峰對稱分布的資料等比資料、滴度資料、對數(shù)正態(tài)分布資料中位數(shù):理論上可用于任何分布資料,但當資料適合計算均數(shù)或幾何均數(shù)時,不宜用中位數(shù)。偏態(tài)分布、分布不明資料、有不確定值的資料4/30/202531柏建嶺講稿平均數(shù)應(yīng)用的注意事項計算幾何均數(shù)時:

變量值中不能有0

同一組變量值不能同時存在正、負值若變量值全為負值,可先將負號除去,算出結(jié)果后再冠以負號樣本含量較少時不宜計算靠近兩端的百分位數(shù)

平均數(shù)要與變異指標結(jié)合使用4/30/202532柏建嶺講稿看一個例子:有甲、乙、丙三組同性別同年齡兒童體重(kg):甲組26,28,30,32,34=30kgn甲=5

乙組24,27,30,33,36=30kgn乙=5

丙組26,29,30,31,34

=30kgn丙=5上述兩組數(shù)據(jù)的特點:集中位置相同:均為30kg

離散程度不同:各觀察值離均數(shù)的遠近不同4/30/202533柏建嶺講稿離散趨勢的描述全距(Range)

亦稱極差,記為R,是一組變量值中最大值與最小值之差。優(yōu)點:簡單明了缺點:不靈敏、不穩(wěn)定

4/30/202534柏建嶺講稿離散趨勢的描述四分位數(shù)間距(interquartilerange)

定義為:

QU~QL,即中間一半觀察值的極差。 四分位數(shù)(quartile)是兩個特定的百分位數(shù):第25%分位數(shù)P25,和第75%分位數(shù)P75,分別記為QL和QU。

四分位數(shù)間距較全距穩(wěn)定,常與中位數(shù)一起,描述不對稱分布資料的特征。4/30/202535柏建嶺講稿25%25%25%25%排序數(shù)據(jù):按從小到大順序排列MQLQUinter-quartilerangeQ2Q1Q34/30/202536柏建嶺講稿離散趨勢的描述方差(Variance)和標準差(StandardDeviation)總體均數(shù)

未知,用樣本均數(shù)估計

4/30/202537柏建嶺講稿標準差“離均差平方之和平均后的方根”“均方根”n-1稱為(標準差的)自由度,即“可以自由變異的程度”分子有n項離均差,但只有n-1項獨立,根據(jù)任一離均差均可以用另外n-1個離均差表示,所以“只有n-1個獨立的離均差”。4/30/202538柏建嶺講稿標準差大:分布分散、不整齊、波動大;標準差小:分布集中、整齊、波動較小。4/30/202539柏建嶺講稿離散趨勢的描述變異系數(shù)(coefficientofvariation)亦稱離散系數(shù)(coefficientofdispersion),是標準差s與均數(shù)之比,即:

4/30/202540柏建嶺講稿變異系數(shù)的兩個特點及相應(yīng)的用途

沒有單位反映標準差占均數(shù)的百分比或標準差是均數(shù)的幾倍可用來比較度量衡單位不同的資料的變異度

不受平均水平的影響反映的是以均數(shù)為基數(shù)的相對變異的大小比較均數(shù)相差懸殊的資料的變異度

4/30/202541柏建嶺講稿某地20歲男子100人,身高均數(shù)為166.06cm,標準差為4.95cm;體重均數(shù)為53.72kg,標準差為4.96kg

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論