定量資料的統(tǒng)計描述PPT課件_第1頁
定量資料的統(tǒng)計描述PPT課件_第2頁
定量資料的統(tǒng)計描述PPT課件_第3頁
定量資料的統(tǒng)計描述PPT課件_第4頁
定量資料的統(tǒng)計描述PPT課件_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

定量資料的統(tǒng)計描述,主要內容,1、頻數(shù)分布表的編制和用途 頻數(shù)分布的特征和類型2、集中趨勢指標均數(shù)、幾何均數(shù)、中位數(shù)3、離散趨勢指標極差、四分位數(shù)間距、方差、標準差、變異系數(shù) 百分位數(shù),(一)、頻數(shù)分布表的編制,某地兒研所測得該地150名12歲健康男童體重(kg)原始數(shù)據(jù)如下,試編制頻數(shù)表。,25.2 34.9 34.3 38.1 41.3 27.8 33.8 37.7 28.4 33.5 47.3 34.8 30.5 36.2 51.0 38.0 43.8 40.9 37.5 36.6 33.4 47.4 36.4 41.4 36.5 42.5 33.7 29.3 39.6 37.5 39.6 33.2 32.1 29.9 43.7 33.8 35.1 37.8 32.4 38.5 28.2 36.5 23.4 35.8 34.1 27.6 42.6 23.1 37.1 44.0 35.6 44.5 46.5 35.0 31.8 36.4 36.2 47.9 38.7 20.5 37.1 29.2 38.2 41.1 36.2 43.5 32.8 36.3 31.8 30.6 38.5 39.6 28.7 33.7 35.1 42.9 20.1 35.4 26.5 42.0 39.6 38.7 35.4 51.231.4 34.1 25.3 29.6 38.2 43.7 33.8 24.5 29.2 45.9 32.5 23.536.8 27.2 34.0 34.7 44.4 41.2 35.3 42.6 34.1 30.0 31.4 40.827.3 48.6 35.8 29.7 45.6 41.8 33.0 28.3 33.3 35.1 40.6 38.237.6 25.5 37.3 37.5 41.5 38.4 44.2 43.2 31.5 40.2 34.5 37.437.8 33.4 32.2 33.4 32.4 32.8 36.8 45.7 41.2 40.9 36.5 47.935.7 39.3 42.2 35.3 30.1 27.2,1. 找出最大值和最小值,計算極差。,最大值為51.2kg,最小值為20.1kg,極差R=51.2-20.1=31.1kg。極差(R)也叫全距,它是一組變量值中最大值與最小值之差。,2.按極差大小決定組段數(shù)、組段和組距。,確定組段數(shù):組段數(shù)的多少一般根據(jù)觀察單位的多少來確定,過多或過少均不能更好地反映資料的分布特征,以能夠反映頻數(shù)分布的特點為宜,一般分為815組,觀察單位少時可相對少些,觀察單位較多時組段數(shù)可酌情多些。本例初步確定為10個組。 確定組距:相鄰組段下限值之差稱為組距,一般分組時取組距相等。組距=極差/組數(shù),常取整數(shù)作組距,取整只是為了方便資料的整理匯總。本例組距=30.1/10= 3.113。,劃分組段:各組段應有明確的界限,便于匯總,每個組段的起點稱“下限”,終點稱“上限”。第一組段必須包括最小值,一般取略小于最小值的整數(shù)作為第一組的下限,但是第一組的下限值不能等于最小值。各組段即不重疊,也不能留空隙,所以每一組段均為半開閉區(qū)間,后一組的下限就是前一組的上限。 組段中的橫線不能省略,它表示連續(xù)型資料。 最后一個組段應該包括最大值,并且封口,但最后一個組段的上限不能等于最大值。,本例最小值為20.1,故取20為第一組的下限。第二組下限即20+3=23,余類推。 最后一個組段為5053,包括最大值51.2。3.列表劃記,統(tǒng)計各組段頻數(shù)。4.計算頻率與累計頻率,頻數(shù)分布的兩個特征,體重雖有輕有重,但都向35組段集中,數(shù)據(jù)大多數(shù)集中在3238組段,共83人,占總人數(shù)的55%,這種趨勢稱為集中趨勢。另一方面,隨體重逐漸變大或變小,仍有小部分變量值存在,稱這種特征為離散趨勢,其變異程度是可以測定得。集中趨勢和離散趨勢是頻數(shù)分布的兩個重要特征,測定其集中趨勢和離散趨勢就可較全面地分析所研究的事物。,頻數(shù)分布的類型,頻數(shù)分布分為對稱分布和偏態(tài)分布兩種類型。對稱分布是指集中位置在正中,左右兩側頻數(shù)分布大體對稱,如上表所示。若將其繪制成頻數(shù)分布直方圖,則更清楚。直方圖是以x(本例為體重)為橫坐標,頻數(shù)或百分數(shù)為縱坐標,用矩形面積大小表示頻數(shù)多少。,某地150名12歲男童體重頻數(shù)分布圖,頻數(shù)分布的類型,偏態(tài)分布指集中位置偏向一側,頻數(shù)分布不對稱。一些以兒童為主的傳染病,患者的年齡分布,集中位置偏于年齡小的一側,頻數(shù)尾部向右側延伸,稱為正偏態(tài)(峰)分布,如圖,120例鏈球菌感染咽炎患者潛伏期分布圖(正偏峰分布),一些慢性病患者的年齡分布,其集中位置偏向年齡大的一側,頻數(shù)尾部向左側延伸,稱為負偏態(tài)(峰)分布,如圖,207例某惡性腫瘤患者年齡分布(負偏峰分布),頻數(shù)表的用途,作為統(tǒng)計資料描述的一種表達方式,可以揭示資料分布類型與特征。便于計算統(tǒng)計指標和進一步分析處理。便于發(fā)現(xiàn)資料中遠離群體的某些特大或特小的可疑值,必要時經檢驗后舍去。正態(tài)性判斷的圖示法,為用正態(tài)近似法確定參考值范圍打基礎。,(二)、集中趨勢指標,平均數(shù)是統(tǒng)計學中最重要、應用最廣泛的一個指標體系。用來描述一組變量的集中趨勢、中心位置或平均水平,常作為一組資料的代表值,使資料產生簡明概括的印象,又便于組間的比較。平均數(shù)的計算和應用必須具備同質基礎。常用的平均數(shù)有均數(shù)、幾何均數(shù)和中位數(shù)。,1、均數(shù)(mean),均數(shù)是算術均數(shù)的簡稱,它反映了一組觀察值在數(shù)量上的平均水平??傮w均數(shù)用希臘字母表示,樣本均數(shù)用 表示。均數(shù)的計算 均數(shù)的計算方法有直接法和加權法,計算機運算中多采用直接法。,均數(shù)的計算,直接法是將所有性質相同的觀察值x1,x2,x3xn,直接相加再除以觀察值的個數(shù)n。例:10名12歲健康男童體重(kg)分別為39.6,33.2,32.1,29.9,43.7,33.8,35.1,37.8,32.4,38.5,求平均體重。,均數(shù)的計算,加權法 當資料中相同觀察值較多時,可將相同觀察值的個數(shù),即頻數(shù)f乘以該觀察值x,以代替相同觀察值逐個相加。對于頻數(shù)表資料,可用各組段的頻數(shù)為f,以相應的組中值為x,代入公式計算均數(shù)。從該公式中可以看出,某一變量值x的頻數(shù)越大,則該變量值對均數(shù)的影響越大,因此頻數(shù)也叫權數(shù),這樣計算出來的均數(shù)又叫加權均數(shù)。權越大,該變量值對均數(shù)的影響也越大,故稱加權法。,均數(shù)的計算,均數(shù)的兩個重要特征,離均差的總和等于零,即各變量值與均數(shù)之差的代數(shù)和等于零。 證明: 各離均差的平方和小于各觀察值X與任何數(shù)a之差的平方( )。,均數(shù)的應用,用途:用來描述一組變量值的平均水平,具有代表性,因此變量值必須是同質的。應用條件:適用于呈對稱分布的資料,特別是正態(tài)分布或者近似正態(tài)分布的資料,因為這時均數(shù)位于分布的中心,最能反映分布的集中趨勢。,2、幾何均數(shù)(geometric mean,G),有些醫(yī)學資料,如抗體的滴度、細菌計數(shù)、傳染病的潛伏期等,其頻數(shù)分布明顯偏態(tài),各觀察值之間呈倍數(shù)變化,這時應該用幾何均數(shù)反映其平均增(減)倍數(shù)。幾何均數(shù)的計算直接法:是將n個觀察值x1,x2,x3xn的乘積開n次方所得的根。加權法:,幾何均數(shù)的應用,用于等比級數(shù)資料和對數(shù)正態(tài)分布資料, 如:某些傳染病的潛伏期、抗體滴度、細菌計數(shù)等。同一組資料的幾何均數(shù)小于算術均數(shù)。觀察值不能為0。因為0不能取對數(shù),也不能與任何其它數(shù)呈對數(shù)關系。可以把所有的變量值均加上一個較小的常數(shù),如加1。觀察值不能同時有正值和負值。若全是負值,計算是可把負號去掉,得出結果后再加上負號。,3、中位數(shù)(M)和百分位數(shù)(P),中位數(shù)(median, M)是將一組觀察值從小到大按順序排列,位次居中的數(shù)值對應的觀察值就是中位數(shù)。因而全部觀察值中,大于和小于中位數(shù)的觀察值的個數(shù)相等。百分位數(shù)(percentile,P)是指把一組資料的全部觀測值分為兩部分,理論上講,有x%的觀測值比Px小,有(100-x)%的觀測值比Px大。中位數(shù)是特定的百分位數(shù),即P50,它是表示一組資料集中位置的指標。,直接法計算中位數(shù),將原始觀察值按大小順序排列:n為奇數(shù)時, n為偶數(shù)時, 例:臨床觀察7名某病患者,其潛伏期(天)分別為:2,3,3,5,6,9,16,求其平均潛伏天數(shù)。 M5臨床觀察8名某病患者,其潛伏期(天)分別為:2,3,3,5,6,9,16,20 求其平均潛伏天數(shù)。 M(5+6)/25.5,頻數(shù)表法,M=P50Lx: 第x百分位數(shù)所在組段的下限;fx:第x百分位數(shù)所在組段的頻數(shù);ix:第x百分位數(shù)所在組段的組距;fL:小于L各組段的累計頻數(shù)。,中位數(shù)和百分位數(shù)的應用,中位數(shù)不是由全部觀察值的數(shù)量值綜合計算出來的,只受居中變量值波動的影響,不受兩端特小值和特大值的影響,僅僅反映了位次居中的觀察值的水平,因此中位數(shù)常用于描述偏態(tài)分布或末端無確定數(shù)據(jù)時資料的集中位置。百分位數(shù)用于描述樣本或總體觀察值序列在某百分位置水平,多個百分位數(shù)結合應用時,可更全面地描述總體或樣本的分布特征,可用來確定醫(yī)學參考值范圍。由于位于中部的百分位數(shù)比較穩(wěn)定,所以最常用的百分位數(shù)是中位數(shù),它有較好的代表性。,(三)、離散程度指標,三組同性別、同年齡兒童的體重(kg)如下,分析其集中趨勢與離散趨勢。甲組 26 28 30 32 34 X甲=30kg乙組 24 27 30 33 36 X乙=30kg丙組 26 29 30 31 34 X丙=30kg 哪一組數(shù)值的代表性好?,離散趨勢即個體值之間的變異程度,數(shù)據(jù)越分散,變異程度越高。極差四分位數(shù)間距方差標準差變異系數(shù),1、極差(range,R),極差也叫全距,表示一組觀察值中最大值與最小值之差,反映個體差異的范圍。極差大,說明變異度大,各變量值離均數(shù)越遠,數(shù)據(jù)越分散;反之亦然。缺點:由于計算極差時只采用了最大值和最小值,未考慮組內其它數(shù)據(jù)的變異程度,因此用極差反映變異度不夠全面,穩(wěn)定性也差;另外,當樣本例數(shù)增大時,得到較大或較小觀察值的機會可能會變大,所以極差也可能更大。,2、四分位數(shù)間距(quartile range ,QR),QR=QU-QL=P75P25四分位數(shù)間距包含一半的觀測值,其值越大,變異程度越大;其值越小,變異程度越小。優(yōu)點:采用四分位數(shù)間距來反映一組資料的變異程度,比極差穩(wěn)定。一般來說,樣本例數(shù)越多,四分位間距越穩(wěn)定。實際工作中,常與中位數(shù)結合使用,描述偏態(tài)分布資料的分布特征。 缺點:不能全面地反映所有觀察值的變異程度。,極差R 四分位數(shù)間距QR 離均差(x-) 離均差總和(x)=0 離均差絕對值和|x| 離均差平方和(x)2 均方(方差)2=(x)2/N 標準差,3、方差與標準差,但是在實際工作中,總體方差往往是未知的,常用樣本方差s2來估計。在公式中,用 代替,用n代替N,這時計算的結果往往比總體方差2要小,所以分母用n-1來代替N,即公式變?yōu)椋?這時樣本方差s2是總體方差2的無偏估計。N-1:自由度,常用或df表示,是指隨機樣本研究中,可獨立地隨機選擇變動的觀測值的個數(shù)。,三組同性別、同年齡兒童的體重(kg)如下,分析其集中趨勢與離散趨勢。甲組 26 28 30 32 34 X甲=30kg R=8 S=3.16乙組 24 27 30 33 36 X乙=30kg R=12 S=4.74丙組 26 29 30 31 34 X丙=30kg R=8 S=2.91丙組數(shù)值的代表性好。,標準差的應用,標準差是反映數(shù)據(jù)變異程度的指標,其大小受每一個觀察值的影響,變異程度大,標準差也大。各觀察值同加(或減)一個不為零的常數(shù),標準差仍保持不變;但每一個觀察值同乘(或除)一個不為零的常數(shù),其標準差等于原標準差乘(或除)以該常數(shù)的絕對值。常用于描述對稱分布,尤其是正態(tài)分布資料的離散程度??梢苑从硺颖揪鶖?shù)的代表性。可用于標準誤、變異系數(shù)等統(tǒng)計指標的計算。,4、變異系數(shù)(CV),CV =s/ 100%它是反映相對變異度的指標。變異系數(shù)常用于:測量單位不同的幾組資料變異度的比較;均數(shù)相差懸殊的幾組資料變異度的比較。,小 結,頻數(shù)的分布特征:集中趨勢和離散趨勢。頻數(shù)的分布類型:對稱分布和偏態(tài)分布。 平均數(shù)是描述頻數(shù)分布集中位置的指標,它代表一組觀察值的平均水平。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論