衛(wèi)生統(tǒng)計學(xué)教學(xué)提要_第1頁
衛(wèi)生統(tǒng)計學(xué)教學(xué)提要_第2頁
衛(wèi)生統(tǒng)計學(xué)教學(xué)提要_第3頁
衛(wèi)生統(tǒng)計學(xué)教學(xué)提要_第4頁
衛(wèi)生統(tǒng)計學(xué)教學(xué)提要_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、衛(wèi)生統(tǒng)計學(xué)教學(xué)提要緒論一.衛(wèi)生統(tǒng)計學(xué)( health statistic)的定義和內(nèi)容1.定義: 統(tǒng)計學(xué):研究數(shù)據(jù)的收集、整理、分析,對不確定的數(shù)據(jù)作出科學(xué)推理的一門科學(xué)(即概率論).衛(wèi)生統(tǒng)計學(xué):2.內(nèi)容:衛(wèi)生統(tǒng)計學(xué)的基本原理和方法 健康統(tǒng)計 衛(wèi)生服務(wù)統(tǒng)計二.統(tǒng)計工作的基本步驟 全過程包括:計劃與設(shè)計、收集資料、整理資料、分析資料 1、設(shè)計(design): 根據(jù)研究目的對統(tǒng)計全過程的一個全面的設(shè)想。這是最關(guān)鍵的一步。 要求:科學(xué)、周密、簡捷。 設(shè)計包括:實(shí)驗(yàn)設(shè)計、調(diào)查設(shè)計、臨床實(shí)驗(yàn)設(shè)計 設(shè)計原則:齊同原則、對照原則、重復(fù)原則、隨機(jī)化原則 2、搜集資料(collection of data):

2、 要求:完整、準(zhǔn)確、及時。 醫(yī)學(xué)統(tǒng)計資料的來源主要有三個方面: (1) 統(tǒng)計報表:eg法定傳染病報表、職業(yè)病報表、醫(yī)院工作報表; 報表項(xiàng)目較少,不具備可比性 (2) 日常醫(yī)療工作的原始記錄和報告卡片; eg:衛(wèi)生監(jiān)測記錄、健康檢查記錄 (3)專題調(diào)查與實(shí)驗(yàn): A常見專題調(diào)查的種類: 居民健康狀況調(diào)查 流行病調(diào)查(病因?qū)W調(diào)查) 臨床遠(yuǎn)期療效觀察 衛(wèi)生學(xué)調(diào)查:職業(yè)衛(wèi)生學(xué)調(diào)查、環(huán)境衛(wèi)生學(xué)調(diào)查、營養(yǎng)與食品衛(wèi)生學(xué)調(diào)查、放射衛(wèi)生學(xué)調(diào)查、心理衛(wèi)生學(xué)調(diào)查等。 B調(diào)查的內(nèi)容:a. 明確調(diào)查目的、內(nèi)容和指標(biāo)b. 確定調(diào)查對象(總體)、觀察單位(個體)c. 選擇調(diào)查方法:全面調(diào)查(普查:census) 非全面調(diào)查:

3、典型調(diào)查:有意識選擇范圍 抽樣調(diào)查d. 確定調(diào)查范圍:時間、空間、數(shù)量范圍e. 選擇調(diào)查方式:觀察法、采訪法、填表法、通訊法。f. 確定調(diào)查項(xiàng)目和設(shè)計調(diào)查表: 調(diào)查項(xiàng)目:核查項(xiàng)目(檢索項(xiàng)目、備考項(xiàng)):被調(diào)查者的姓名、住址等。 分析項(xiàng)目(業(yè)務(wù)項(xiàng)目):資料不能缺少的分析項(xiàng)目。 調(diào)查者項(xiàng)目(審核項(xiàng)目):調(diào)查者的姓名和調(diào)查日期 調(diào)查表:調(diào)查項(xiàng)目按一定順序列成的表格。 制表要求:簡便、清楚 多用:選擇、填空、符號、數(shù)字; 少用:文字?jǐn)⑹?調(diào)查表形式: 一覽表(list):多個觀察單位記錄在一張表中 適用于調(diào)查項(xiàng)目少、樣本少的專題調(diào)查 單一表(card、調(diào)查卡片、個案卡片): 一個觀察單位記錄在一張表 中

4、,適用于調(diào)查項(xiàng)目多、樣本多的專題調(diào)查 編碼調(diào)查表(code sheet): 適用于樣本多、分析項(xiàng)目多、分析內(nèi)容復(fù)雜的專題調(diào)查,計算機(jī)保存。g. 確定樣本大小h. 制定調(diào)查的組織工作:建立組織、確定起止時間、進(jìn)度、分工、培訓(xùn)調(diào)查員可先小范圍調(diào)查(預(yù)調(diào)查) 3、整理資料(sorting data):系統(tǒng)化、條理化 1)核查資料; 2)分組匯總,擬整理表:按性質(zhì)(分類變量)或數(shù)量(數(shù)值變量)分組, 擬定整理表(過渡性的表格,按調(diào)查指標(biāo)合理設(shè)計,用于原始資料的歸組,表中有合計、總計等項(xiàng)目)。4.分析資料:計算有關(guān)指標(biāo),反映數(shù)據(jù)綜合特征統(tǒng)計描述(descriptive statistic) 包括指標(biāo)的計

5、算、統(tǒng)計圖表的 繪制,描述數(shù)據(jù)的特征和分布規(guī)律。 統(tǒng)計推斷(inferentical statistic) 用樣本統(tǒng)計量通過參數(shù)估計、假設(shè)檢驗(yàn)等統(tǒng)計方法推斷總體. 推斷總體 1)推斷總體分布;是正態(tài)還是偏態(tài)(常有理論或經(jīng)驗(yàn)得到) 2)推斷總體分布的參數(shù)或特征量: 和s 三.統(tǒng)計中的幾個基本概念1、變量與變異:變量:個體的研究特征; 變異:各觀察指標(biāo)(即個體)之間的差異:包括個體變異和隨機(jī)測量變異同質(zhì)觀察單位之間的個體變異,是生物的重要特征,是偶然性的表現(xiàn)。 變量值:變量的觀察結(jié)果: 定量變量: 數(shù)值變量資料 定性變量: 分類變量資料數(shù)值變量(numerical variabal): 用定量方法

6、對每個觀察單位測定某項(xiàng)指標(biāo)的所得的資料.一般有度量衡單位(也稱計量資料measurement data)。分類變量(categorical variable) 表現(xiàn)為互不相容的類別或?qū)傩?分兩種: a.無序分類變量:(unordered categories,計數(shù)資料enumeration data):將觀察單位按某種屬性或類別分組,再清點(diǎn)各組的觀察單位數(shù)??煞譃槎?xiàng)式或多項(xiàng)式分類變量。 b.有序分類(ordinal categories,等級資料ranked data半定量資料):將觀察單位按某種屬性(或性質(zhì)、標(biāo)志)的不同程度分組,然后清點(diǎn)各組的數(shù)據(jù)所得的資料。(各組之間有程度的差異). (

7、這類資料與計數(shù)資料不同的是:屬性的分組有程度的差別,各組按大小順序排列;與計量資料不同的是:每個觀察單位未確切定量,因而又稱為半定量資料。) 三種資料間可以相互轉(zhuǎn)化。2、總體與樣本: 總體(population):根據(jù)研究目的確定的同質(zhì)的研究對象的全體(性質(zhì)相同的所有觀察單位的某種變量值的集合)。 樣本(sample):從總體中隨機(jī)抽取一部分觀察單位進(jìn)行觀察,這部分觀察單位對總體有代表性,稱為樣本。(總體中每一觀察單位均有相同的機(jī)會被抽取到樣本中去。)3.概率(probability)與頻率描述某事物發(fā)生的可能性大小的數(shù)值,用分?jǐn)?shù)、小數(shù)、百分?jǐn)?shù)表示。符號p。P=1 p=0 0<p<

8、1 隨機(jī)事件p0.05或p0.01 小概率事件3.誤差(statistic error):測得值與真實(shí)值之差。 系統(tǒng)誤差(systematic error)因儀器不準(zhǔn)等造成的呈傾向性偏大或偏小的誤差(可以消除)。 隨機(jī)測量誤差(random measurement error)儀器校正后由于偶然因素造成同一物體多次測量結(jié)果不完全一致(不可避免,無傾向性)。抽樣誤差(sampling error): 消除系統(tǒng)誤差和控制隨機(jī)測量誤差后,由于觀察單位間存在個體差異, 隨機(jī)抽樣造成的樣本指標(biāo)與總體參數(shù)有差異, 這種樣本統(tǒng)計量與總體參數(shù)間的差別稱為抽樣誤差。4.參數(shù)與統(tǒng)計量: 總體指標(biāo)均稱參數(shù),用希臘字

9、母表示:, ,樣本指標(biāo)均稱統(tǒng)計量,用拉丁字母表示X,s。頻數(shù)分布的集中趨勢和離散趨勢一. 數(shù)值變量資料的頻數(shù)表1. 頻數(shù)表的編制 a.求全距(range)R R=最大值-最小值 b.確定組距(class interval)i i=全距/組數(shù) 組數(shù)取決于資料性質(zhì)、樣本量、分析目的 要求:組數(shù)一般815組,組距相等 c.劃分組段:每組都有開始值、終止值 第一組包括最小值,最后一組包括最大值 每組段只寫組下限,省略組上限 各組界限要分明(既不包含也不留空隙) d.歸納記數(shù),擬整理表 方法:劃記法(tabulation method):正 適用于樣本少、內(nèi)容簡單的資料 分卡法(card sorting

10、 method):卡片分組 適用于樣本多的資料2. 頻數(shù)分布的兩個特征: 集中趨勢和離散趨勢3. 頻數(shù)分布的類型:對稱分布和偏態(tài)分布(正偏和負(fù)偏)4. 頻數(shù)表的用途二. 集中趨勢的描述:平均數(shù)(average)1.概念:平均數(shù)是集中趨勢(central tendency)指標(biāo)(亦稱位置指標(biāo)), 用以描述同質(zhì)計量資料頻數(shù)分布的集中趨勢, 反映一組變量值的平均水平, 是一組變量值的代表值。2.種類:1) 算術(shù)均數(shù): arithmatic mean, 樣本均數(shù), 符號: X (eksba),拉丁字母,簡稱均數(shù), 總體均數(shù), 符號(miu), 希臘字母 (1)適用范圍:對稱分布(特別是呈正態(tài)分布或近似

11、正態(tài)分布)。 (2)計算方法: A.直接法(direct method): 當(dāng)觀察值個數(shù)較少時X =Sx/n S:希臘字母,sigma,求和符號 B.加權(quán)法(weighting method): X =S¦x/S¦=S¦x/n 條件: 當(dāng)觀察值個數(shù)較多時 步驟:A) 制備頻數(shù)表 B)求各組組中值(class-mid value) X=(本組段組下限+下組段組下限)/2 C)統(tǒng)計各組段頻數(shù)f D) Sfx E)x=Sfx/Sf 各組段f權(quán)衡了各組中值因f不同對均數(shù)的影響,起權(quán)衡作用,權(quán)數(shù)大,作用大. (3)均數(shù)的兩個重要特征: A. (XX )=0 B.(XX )2

12、<(Xa)22)幾何均數(shù)(geomatric mean ,符號G表示)用于描述變量值呈等比數(shù)列, 或呈對數(shù)正態(tài)分布(log-normal distrbution)或近似對數(shù)正態(tài)分布資料。 資料作對數(shù)變換(log arithmic transformation)直接法:當(dāng)n較小時 G=(x1x2× x3× ×××××× xn )1/n, G=lg-1( SlgX/n )加權(quán)法: 當(dāng)n較大時 G=lg-1( S¦lgX/S¦ )應(yīng)用條件:任何一個不能為0,不能同時有正有負(fù)步驟:求倒數(shù)X log

13、X flogX S¦lgX S¦lgX/S¦ lg-1( S¦lgX/S¦ )=G3)中位數(shù)(median, 位置平均數(shù),符號M): 是一組變量值從小到大順序排列后位次居正中間的那個數(shù)值。 應(yīng)用條件:多用于描述偏態(tài)分布資料,或一端或兩端無確定數(shù)值的開資料的集中趨勢,或頻數(shù)分布不明資料,。 計算方法: 直接法:當(dāng)n較小時 n為奇數(shù)時 M=X(n+1/2) n為偶數(shù)時 M= X(n/2)+X(n/2+1) 頻數(shù)表計算方法: 當(dāng)n較大時用 A 編頻數(shù)表(frequency table)B PX =L+i/fm( n×x% - S¦

14、L )L:中位數(shù)所在組段下限;i: 中位數(shù)所在組段組距fm : 中位數(shù)所在組段頻數(shù)S¦L:中位數(shù)所在組段之前的累積頻數(shù)x%:百分位 50%4)百分位數(shù)(percentile,PX ):描述一組有序排列的偏態(tài)分布數(shù)據(jù)某百等分界值大?。ê喎Q界值,是一種位置指標(biāo))應(yīng)用條件:偏態(tài)分布(skew distribution)資料應(yīng)用: 估計正常值范圍:95%: P2.5 P97.5三. 離散程度的描述 描述變異程度的常用指標(biāo):例:三組同性別同年齡兒童體重(KG),其集中趨勢與離散程度分別是: 甲組:26 28 30 32 34 X =30KG 乙組:24 27 30 33 36 X =30KG

15、丙組:26 29 30 31 34 X =30KG 三組數(shù)據(jù)集中位置用X描述 ,X =30KG, 三組數(shù)據(jù)離散度不同,分布特征不盡相同。 1)全距(range, R, 極差)即一組變量值中最大值與最小值之差。 R=X最大X最小 優(yōu)點(diǎn):簡單明了,常用于傳染病、食物中毒的最長、最短潛伏期 缺點(diǎn): A .不能反映組內(nèi)數(shù)據(jù)的變異度 B. N R C. 抽樣誤差較大2)四分位間距(quartile Q) P75 QU P25 QL Q = QUQL(包括全部觀察值的一半)應(yīng)用:偏態(tài)分布資料優(yōu)點(diǎn):較穩(wěn)定,特別是N較大時,越接近分布的中間越穩(wěn)定。缺點(diǎn):未考慮每個觀察的變異度。 3)方差(variance,s

16、2 ,s2)離均差平方和的平均值 離均差: X, (X)=0 離均差平方和(Sum of squares), (X)2 1 .與變異度有關(guān):變異度 ,(X)2 2與N多少有關(guān):N , (X)2 為消除N的影響,取其均值 (X)2 (XX )2 s2 = S2= (樣本方差公式) N n-1 缺點(diǎn):單位平方 優(yōu)點(diǎn):考慮了每個變量值的變異,方差大小不受樣本量多少的影響4)標(biāo)準(zhǔn)差(standard deviation,s s): 是最常用的衡量變量值間離散程度的變異指標(biāo)。 (X)2 s= N定義:離均差的平方和的平均值的平方根意義: 1. s越大,說明個體差異越大,則平均數(shù)代表性就越差 2. 未知,

17、用s估計s,用(XX )2 代替(X)2 用樣本例數(shù)n代替N, 由于抽樣誤差存在,X=可能性小,當(dāng) X=按上式算得結(jié)果常比實(shí)際s低, 英國W.S.Gosset提出用n-1代替n校正, (XX )2 S= (樣本標(biāo)準(zhǔn)差公式) n-1 自由度 :隨機(jī)變量能自由取值的個數(shù)。(niu) =n-1 (XX)2 X2(X)2/ n fX2(fX)2/n n-1 = n-1 = n-1 Lxx=SS=X2(X)2/ n Lxx=SS=fX2(fX)2/n 應(yīng)用:(1)用來描述資料的變異程度:應(yīng)用條件:正態(tài)分布X +s (2)比較不同資料變異程度大?。簯?yīng)用條件: 單位相同 均數(shù)相近優(yōu)點(diǎn):考慮了每個觀察值的變異

18、情況,和集中趨勢單位一致; 當(dāng)資料呈正態(tài)或近似正態(tài)資料時可寫成: X ± S, 表示均數(shù)的代表性。 缺點(diǎn):計算復(fù)雜5)變異系數(shù): (離散系數(shù) coefficient of dispersion ,CV) CV= (S/ X ) *100% 應(yīng)用:A、比較均數(shù)相差懸殊的幾組資料的變異程度; B、比較單位不同的多組資料的變異度: 應(yīng)用條件:正態(tài)分布; 單位不同或均數(shù)不等 優(yōu)點(diǎn):無單位,便于比較 正態(tài)分布及其應(yīng)用一. 正態(tài)分布(又稱Gauss分布)概念:: 是醫(yī)學(xué)和生物學(xué)中最常見的連續(xù)性總體頻數(shù)分布, 以均數(shù)為中心, 兩側(cè)逐漸下降并對稱, 兩端永遠(yuǎn)不與橫軸相交。1. 正態(tài)分布(normal

19、 distribution)圖形:直方圖,當(dāng)n增大各直條逐漸變窄,其頂點(diǎn) 中點(diǎn)將變成一條光滑曲線(頻數(shù)曲線),形狀呈鐘形,兩頭低,中間高,左右對稱。正態(tài)分布用N(m, s2)表示, 為了應(yīng)用方便, 常對變量X 作 u=( X - m )/ s變換, u=( X - m )/ s 1)原點(diǎn)移到 m 的位置 2)橫軸尺度以 s 為單位 使m=0, s=1,則正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布(standard normaldistrution,U分布), 用N(0, 1)表示。 U:稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)差 特征: A、均數(shù)處最高; B、以均數(shù)為中心, 左右對稱; C、有兩個參數(shù): m和s, u 位置

20、參數(shù),圖形向右移動 s變異度參數(shù),數(shù)據(jù)越分散 D、正態(tài)曲線下的面積分布有一定規(guī)律: a.曲線與橫軸X所夾面積總和為1 b.橫軸上某一區(qū)間和曲線所夾面積與總面積之比,相當(dāng)于變量值落在該區(qū)間的概率(概率分布),反映該區(qū)間例數(shù)與總例數(shù)之比(頻率分布,百分?jǐn)?shù)) c.橫軸上某一區(qū)間所夾面積可用函數(shù)積分求得 正態(tài)曲線下的面積分布規(guī)律 變量值范圍 正態(tài)曲線下面積(變量值出現(xiàn)的概率) m ± 1.0s 68.27% m ± 1.96s 95.00% m ± 2.58 s 99.00% 3) 正態(tài)分布的應(yīng)用: 常用于估計頻數(shù)分布情況; 制定正常值范圍。正常值:指正常人的各種生理常數(shù)

21、。當(dāng)資料呈正態(tài)分布時,最常用X ± 1.96S估計95%正常值范圍, 其含義是指絕大多數(shù)正常的變量值都在這個范圍內(nèi), 絕大多數(shù)是包括正常的80%、90%、95%和99%, 最常用95%。 應(yīng)用:1 估計醫(yī)學(xué)參考值范圍 X ± uS 2. 質(zhì)量控制 X +2S 上下警戒線 X +3S 上下控制線 常用的U值表 參考值范圍% 單側(cè) 雙側(cè) 90 1.282 1.645 95 1.645 1.96 99 2.326 2.58 95%參考值范圍 雙側(cè) X +1.96S 單側(cè) 上限 (upper limit) X +1.645S 下限(low limit) X -1.645S 99%參

22、考值范圍 雙側(cè) X +2.58S 應(yīng)用條件:1. 正態(tài)分布或近似正態(tài)分布資料 2.可轉(zhuǎn)化為正態(tài)分布資料: 對數(shù)變換(抗體滴度、血清效價、住院天數(shù)、潛伏期、檢驗(yàn)結(jié)果、殘留量、有害物質(zhì)的濃度等) 3.t分布、二項(xiàng)分布、POISSON分布等極限為正態(tài)分布 正態(tài)分布是X2分布、t分布、F分布的基礎(chǔ)總體均數(shù)的估計和假設(shè)檢驗(yàn)一.均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤(standard error) 1) 均數(shù)的抽樣誤差 隨機(jī)抽10個變量值組成樣本 第一次:x11 x12 x13 x14 x15 x16 x17 x18 x19 x110 X 1 第二次:x21 x22 x23 x24 x25 x26 x27 x28 x29

23、 x220 X 2 類推: 第n次:xn1 xn2 xn3 xn4 xn5 xn6 xn7 xn8 xn9 xn10 X n N(m, s2 ) (1)特征:a.樣本均數(shù)x1 x2 x3. xn不一定相等. b.s為定值,s越大, 抽樣誤差越大. c.樣本均數(shù)的頻數(shù)分布呈近似正態(tài)分布: X =X/nu (2)中心極限定律(central limit theorem)a.正態(tài)總體中隨機(jī)抽取許多含量相等的樣本,這些樣本均數(shù)的頻數(shù)分布呈正態(tài)分布N(m,s2x )b.偏態(tài)總體中隨機(jī)抽取許多含量相等的樣本,當(dāng)n>30時,樣本均數(shù)的頻數(shù)分布近似正態(tài)分布N(u,s2x )若變量x的總體(正態(tài)或偏態(tài))均

24、數(shù)為m,標(biāo)準(zhǔn)差為s,則含量為n的樣本均數(shù)X的總體均數(shù)也為m, 樣本均數(shù)的標(biāo)準(zhǔn)差為sx(放回抽樣). 均數(shù)的抽樣誤差:因隨機(jī)抽樣造成的樣本統(tǒng)計量之間以及樣本統(tǒng)計量與總體參數(shù)之間的差異.記作sx sx. (3)抽樣誤差影響因素:a. n大小b. sc. 抽樣方法不同, sx不同. 抽樣誤差不可避免.2)標(biāo)準(zhǔn)誤的概念 (1)定義:樣本均數(shù)的標(biāo)準(zhǔn)差,是說明均數(shù)抽樣誤差大小的指標(biāo)。標(biāo)準(zhǔn)誤愈小,表示抽樣誤差愈小,樣本統(tǒng)計量對總體參數(shù)的估計愈可靠。 (2)標(biāo)準(zhǔn)誤的計算sx=s/Ön(總體標(biāo)準(zhǔn)誤) sx=s/Ön(樣本標(biāo)準(zhǔn)誤)(當(dāng)s未知,用s代替s) (3)標(biāo)準(zhǔn)誤的應(yīng)用表示樣本均數(shù)的離散度

25、; 估計總體均數(shù)的可信區(qū)間; 進(jìn)行假設(shè)檢驗(yàn) (4)標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別和聯(lián)系 標(biāo)準(zhǔn)差 標(biāo)準(zhǔn)誤 區(qū)別: 表示個體之間的變異度 表示樣本均數(shù)之間的變異度 表示觀察值與樣本均值之間的離散度 表示樣本均數(shù)與總體均數(shù)之間的離散度 可以衡量樣本均數(shù)抽樣誤差的大小 聯(lián)系: sx=s/Ön二.t分布(t distribution)(1) t分布的概念: 從正態(tài)總體中隨機(jī)抽取許多含量為n的樣本,由樣本算出樣本均值X和sx,按t公式算出t值,將n個t值作直方圖,構(gòu)成t變量的頻數(shù)分布圖(連續(xù)性分布) X1 s1 t1值 X2 s2 t2值 X3 s3 t3值 Xn sn tnu=( X - m )/sx

26、U變換, X 由N (m, sx2)變換為標(biāo)準(zhǔn)正態(tài)分布(U分布)sx往往用sx來估計t = ( X - m )/sx t變換(t分布)。U值稱樣本檢驗(yàn)統(tǒng)計量, t值也稱樣本檢驗(yàn)統(tǒng)計量 當(dāng)n 就成了t曲線(2) t分布的特征: 與標(biāo)準(zhǔn)正態(tài)分布相比有以下特征: a.二者都是單峰分布, 以0為中心, 左右對稱; b. t分布有一個參數(shù),u不同,t曲線不同, u越大,峰度越大。u逐漸增大時, t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布; 當(dāng)u=¥時,t=u, t分布就完全成為標(biāo)準(zhǔn)正態(tài)分布了。 c.t分布曲線下的面積有一定規(guī)律: t曲線與橫軸所夾面積總和為1 橫軸上某一區(qū)間和曲線所夾面積與總面積之比,相當(dāng)于t

27、值落在該區(qū)間的概率(概率分布) 從總體中隨機(jī)抽樣獲得t值落在整個橫軸概率為1, 獲得t值³ ta,u的概率p<a單側(cè): P( t £ - ta,u)= a, 或P(t ³ ta,u)= a雙側(cè): P( t £ - ta,u)+P(t ³ ta,u)= a; P( - ta,u < t < ta,u)= 1 - a隨機(jī)抽樣算t值,95%滿足: - ta,u < t < ta,u - ta,u < (X - m) /sx < ta,u X - ta,u sx < m <X + ta,u sx ;

28、(3)t界值 t界值表, 橫標(biāo)目為自由度u, 縱標(biāo)目為概率P, 表中數(shù)字表示自由度為u, P為a(檢驗(yàn)水準(zhǔn))時, t的界值, 常記為ta,u。 注意: u不同, ta,u不同 u相同, p , ta,u 且單側(cè)P與雙側(cè)2P的t值相等, p相同, u , ta,u三.總體均數(shù)的估計 包括點(diǎn)值估計和區(qū)間估計: a.區(qū)間估計的涵義: 意思是從總體中作隨機(jī)抽樣, 每個樣本可以算得一個可信區(qū)間, 如95%可信區(qū)間, 意味著做100個可信區(qū)間, 平均有95個可信區(qū)間包括總體均數(shù)(估計正確), 只有5個可信區(qū)間不包括總體均數(shù)(估計錯誤)。 b.區(qū)間估計的方法: X - ta,u sx < m <

29、X + ta,u sx ; s已知 X - Ua,sx < m <X + Ua,sx ; s未知但n足夠大 X - Ua,sx < m <X + Ua, sx ; c.可信區(qū)間兩要素: 準(zhǔn)確度:反映區(qū)間包含總體均數(shù)的概率大小,即1-a大小,越趨近1越好 精度: 反映區(qū)間的長度, 長度越小越好 1-a 一定條件下,n , 精度 四.假設(shè)檢驗(yàn)(hypothesis test)一般步驟: X與m不等的原因 1.由于抽樣誤差引起,若無抽樣誤差,它們之間相等 2.總體存在質(zhì)的差異,并非抽樣誤差引起,若無抽樣誤差,它們之間仍不相等(1) 概念:所謂假設(shè)檢驗(yàn), 就是根據(jù)研究目的, 對

30、樣本所屬總體特征提出一個假設(shè), 然后用適當(dāng)方法根據(jù)樣本提供的信息, 推斷此假設(shè)應(yīng)當(dāng)拒絕或不拒絕, 以使研究者了解在假設(shè)的條件下, 差異由抽樣誤差引起的可能性大小, 便于比較分析。即:推斷樣本統(tǒng)計量與總體參數(shù)之間或樣本統(tǒng)計量之間的差異是由抽樣誤差引起還是總體存在質(zhì)的差異。假設(shè)檢驗(yàn)(對總體而言);顯著性檢驗(yàn)(對樣本而言)(2) 一般步驟a.建立假設(shè): 無效假設(shè)(null hypothesis)H0: m= m0 即假設(shè)樣本指標(biāo)與總體參數(shù)(樣本與樣本指標(biāo))是相等的,若不等,它們的差別是由抽樣誤差引起。 備擇假設(shè)H1: mm0,是與H0相對立的假設(shè);差別不是由抽樣誤差引起,而是有本質(zhì)差異b.確定檢驗(yàn)水

31、準(zhǔn)a(亦稱顯著性水準(zhǔn),第一類錯誤),假陽性概率,即本來差異無顯著性而判斷其有顯著性的概率,是一個接受或拒絕H0的概率標(biāo)準(zhǔn)。常取a =0.05或a=0.01 1-a:可信度 c.選定檢驗(yàn)方法和計算統(tǒng)計量: t檢驗(yàn)、U檢驗(yàn)、c2檢驗(yàn)、F檢驗(yàn)等。d. 確定P值:e. P值:是指在由H0所規(guī)定的總體中作隨機(jī)抽樣,由于抽樣誤差引起的獲得現(xiàn)有樣本統(tǒng)計量的概率。 X - m t= SX根據(jù)t值判斷:若H0成立,理論上從總體中抽得樣本均數(shù)與總體均數(shù)差別 X -m 不會很大,則t值不會很大,t 值很大的可能性(概率)是很小的,用尾部面積表示,即 t ta,u 的概率Pa,即由抽樣誤差引起兩均數(shù)有差別的概率很小,

32、根據(jù)“小概率事件在依次一次試驗(yàn)中基本上不發(fā)生”,故拒絕H0 ,本身有質(zhì)的差異的概率很大。 t ta,u Pa,拒絕H0,接受H1 t ta,u Pa,不拒絕H0 f.作出統(tǒng)計推斷: 當(dāng)P£ a時, 統(tǒng)計推斷結(jié)論為按所取檢驗(yàn) 水準(zhǔn)拒絕H0, 接受H1, 差別有顯著性意義。P0.05,差異無顯著性(nonsignificance)P0.05,差異有顯著性P0.01,差異有高度顯著性五.t檢驗(yàn)與u檢驗(yàn)1.樣本均數(shù)與總體均數(shù)的比較: 應(yīng)用條件:正態(tài)分布 H0: m = m0 H1: mm0 t = ( X - m )/ SX , u = n 1 t ta,u ,Pa,拒絕H0,接受H1 t

33、ta,u Pa,不拒絕H02.配對設(shè)計資料的t檢驗(yàn): 即差值均數(shù)與總體均數(shù)0比較的t檢驗(yàn) 配對方法: 對同對的兩個受試對象分別給予兩種處理; 對同一受試對象分別給予兩種處理; 同一受試對象給予某種處理,比較處理前后有無差別。 H0: md = 0,差值的總體均數(shù) t = d / Sd3.成組設(shè)計兩樣本均數(shù)的t檢驗(yàn):應(yīng)用條件: 正態(tài)分布 總體方差齊:12=22 H0: m1 = m2 t = ( X1 - X2)/ sx1-x2 u = n1 + n2 24.兩大樣本均數(shù)的U檢驗(yàn):(Z檢驗(yàn)) 應(yīng)用條件:樣本例數(shù)較大,如兩樣本均樣本n50,樣本均數(shù)的分布呈近似正態(tài)分布 或總體標(biāo)準(zhǔn)差已知 H0: m

34、1 = m2 U = ( X1 - X2)/ ÖSX1 2+ SX2 2 六.方差不齊時兩小樣本均數(shù)的比較1.兩樣本方差的齊性檢驗(yàn)2.t檢驗(yàn)七.正態(tài)性檢驗(yàn):意義和方法八.第一類錯誤與第二類錯誤第一類錯誤(type error): 拒絕實(shí)際上是成立的H0, 概率為a。第二類錯誤(type error): 不拒絕實(shí)際上是不成立H0,概率為b1-:叫可信度:兩總體無差別按水準(zhǔn)判斷其無差別的能力1-b:把握度,即兩總體確有差別,按水準(zhǔn)能發(fā)現(xiàn)它們有差別的能力客觀實(shí)際 拒絕H0 不拒絕H0H0成立 第一類錯誤() 判斷正確(1-)H0 不成立 判斷正確(1-) 第一類錯誤():根據(jù)研究者要求確定

35、:只有與H1結(jié)合才有意義,值很難確切估計 n一定, 反之亦然、根據(jù)研究要求適當(dāng)控制: 當(dāng)n,一定 ,也相應(yīng)減少 n一定, 選定來控制 若重點(diǎn)減少,可取=0.01 若重點(diǎn)減少,可取=0.05,也可取其他水準(zhǔn)九.假設(shè)檢驗(yàn)時應(yīng)注意的問題a.要有嚴(yán)密的抽樣研究設(shè)計;b.選用的假設(shè)檢驗(yàn)方法應(yīng)符合其應(yīng)用條件;c.正確理解差別有無顯著性的條件意義;d. 結(jié)論不能絕對化;e.報告結(jié)論時注意應(yīng)列出檢驗(yàn)統(tǒng)計量值, 注明采用的是單側(cè)或雙側(cè)檢驗(yàn),寫出報告,P值的確切范圍。十.可信區(qū)間和假設(shè)檢驗(yàn)的關(guān)系方差分析一 方差分析的基本思想1. 總變異=組內(nèi)變異+組間變異2. 方差分析的應(yīng)用條件: 各隨機(jī)樣本相互獨(dú)立 均來自正態(tài)

36、總體 各總體方差均相等二 成組設(shè)計的多個樣本均數(shù)比較三 配伍組設(shè)計的多個樣本均數(shù)比較四 多個樣本均數(shù)間兩兩比較五 多個方差的齊性檢驗(yàn)六 變量變換:對數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換 分類資料的統(tǒng)計描述一. 分類資料的頻數(shù)表相對數(shù)(relative number):指兩個有聯(lián)系的事物計數(shù)數(shù)據(jù)之比,表示事物相對大小。二.常用相對數(shù): 分析計數(shù)資料的指標(biāo)。常用的相對數(shù)有: ( 1 ) 率(rate): 表示某種現(xiàn)象發(fā)生的頻度或強(qiáng)度。率= 某現(xiàn)象實(shí)際發(fā)生例數(shù)/可能發(fā)生該現(xiàn)象的總例數(shù) ´ 比例基數(shù)( 習(xí)慣上以計算的率保留1 - 2位整數(shù)) ( 2 ) 構(gòu)成比(constituen

37、t ratio): 說明一事物內(nèi)部各組成部分所占的比重或分布。構(gòu)成比= 某一組成部分的觀察單位數(shù)/同一事物各組成部分的觀察單位總數(shù) ´100% ( 3) 相對比(relative ratio): 兩個有關(guān)指標(biāo)之比, 用以表示兩個指標(biāo)之間的對比關(guān)系。分子、分母可以同時是相對數(shù),也可以同時是絕對數(shù)。三.應(yīng)用相對數(shù)時應(yīng)注意的問題(1) 計算相對數(shù)的分母不宜太小;(2) 分析時不能以比代率;(3) 對觀察單位數(shù)不等的幾個率,不能直接相加,PC=(nP)/n=x/n(4) 資料的對比應(yīng)注意可比性: a.觀察對象同質(zhì); b.內(nèi)部構(gòu)成相同,否則,應(yīng)對率進(jìn)行標(biāo)準(zhǔn)化(5) 對樣本率( 或構(gòu)成比 )的比

38、較應(yīng)遵循隨機(jī)抽樣, 要作假設(shè)檢驗(yàn)。四.標(biāo)準(zhǔn)化法標(biāo)準(zhǔn)化法:基本思想和計算 (1)基本思想: 即采用一個共同的內(nèi)部構(gòu)成標(biāo)準(zhǔn), 使兩個樣本或多個樣本的不同內(nèi)部構(gòu)成調(diào)整為共同的內(nèi)部構(gòu)成標(biāo)準(zhǔn), 以消除因內(nèi)部構(gòu)成不同對樣本率的影響。標(biāo)準(zhǔn)化后的率叫標(biāo)準(zhǔn)化率。 (2) 計算方法: 直接法、間接法。 (3) 注意事項(xiàng): a. 選定標(biāo)準(zhǔn)不同, 算得的標(biāo)準(zhǔn)化率也不同, 因此不能代表實(shí)際水平; b. 各組間若出現(xiàn)明顯交叉, 不宜用標(biāo)準(zhǔn)化法; c. 兩樣本標(biāo)化率的比較應(yīng)作假設(shè)檢驗(yàn)。五.常用幾個相對數(shù)指標(biāo): 發(fā)病率、患病率、死亡率、病死率、感染率、治愈率、生存率、平均期望壽命、生存率(1) 出生率=某年活產(chǎn)數(shù)/同年平均人

39、口數(shù) ´ 1000%(2) 死亡率=某年死亡總數(shù)/同年平均人口數(shù) ´ 1000%(3) 發(fā)病率=某人群某時期內(nèi)新病例數(shù)/某人群同期平均人口數(shù) ´ K(4) 某病患病率=觀察時點(diǎn)某病例數(shù)/同時點(diǎn)檢查人數(shù) ´ K(5) 某病感染率=受檢者感染某病原體人數(shù)/受檢人數(shù) ´ K(6) 治愈率= 治愈病人數(shù)/接受治療人數(shù) ´ 100%(7) 某病病死率=某期間因某病死亡人數(shù)/同期該病患者 ´ 100%(8) 生存率=n年末存活的病例數(shù)/隨訪滿n年的病例數(shù) ´ 100%六.動態(tài)數(shù)列及其分析指標(biāo)七.率的抽樣誤差和率的標(biāo)準(zhǔn)誤 (1)

40、 概念: 由抽樣造成的樣本率與總體率的差別叫率的抽樣誤差。衡量率的抽樣誤差大小, 衡量樣本率的穩(wěn)定性的指標(biāo), 即率的標(biāo)準(zhǔn)誤。 (2) 率的標(biāo)準(zhǔn)誤的計算 sP =Öp( 1 - p )/n SP =ÖP( 1 - P )/n (3) 總體率的區(qū)間估計 a. 查表法: n較小, 特別是p接近0或1時 b.正態(tài)近似法:n足夠大,樣本率p和(1 - p)均不太小, 如np與n(1- p )均大于5時( p - ua SP , p + ua SP )2.樣本率與總體率比較:U檢驗(yàn) 條件: n足夠大, 樣本率p和(1 - p)均不太小, 如np與n( 1 - p )均大于5時, 樣本率

41、的分布呈正態(tài)分布。H0: p = p0 u =½ p - p½/ sP 3.兩樣本率比較的u檢驗(yàn)H0: p1 = p0 u =½ p1 - p2½/ SP1 - P2 X2檢驗(yàn)一.四格表資料的X2檢驗(yàn):基本思想 方法及注意事項(xiàng) (1) 用途檢驗(yàn)兩個樣本率(或構(gòu)成比)之間的差異顯著性,檢驗(yàn)多個樣本率之間的差異顯著性, 檢驗(yàn)配對計數(shù)資料的差異顯著性。(2) 基本思想 c2 = S( A - T)2/T T = nRnC/n c2反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度。 c2的大小取決于A - T的差值, 還取決于自由度u。 u = ( 行數(shù)- 1 )( 列數(shù)-

42、1 )(3) 四格表資料的c2檢驗(yàn)( 兩樣本率比較 ) 統(tǒng)計量的計算可用專用公式或基本公式 a. 基本條件: n > 40, T > 1 b. 校正條件: n > 40,5 > T > 1二.行 ´ 列表的c2檢驗(yàn)( 多個樣本率或構(gòu)成比的比較) a. c2值的計算: c2 = n( A2/nRnC - 1 ) b. 注意事項(xiàng): c2檢驗(yàn)要求理論頻數(shù)不宜太小, 一般認(rèn)為不宜有1/5以上格子理論數(shù)小于5, 或有一個理論數(shù)小于1, 處理辦法有: 增大一般含量, 最好; 刪去理論頻數(shù)太小的行或列; 合并性質(zhì)相近的行或列。 等級資料宜用秩和檢驗(yàn)。當(dāng)結(jié)論為拒絕檢驗(yàn)假

43、設(shè), 只能認(rèn)為各總體率( 或總體構(gòu)成比 )之間總的來說有差別, 但不能說明它們彼此之間都有差別。三.列聯(lián)表資料X2檢驗(yàn) a. H0 : b = c b. c2 =( b - c )2/ b + c c. b + c < 40, 需校正, c2 =( ½b - c½ - 1)2/b + cf. u = 1四.四格表的確切概率法統(tǒng)計表與統(tǒng)計圖一.統(tǒng)計表(statistic table)兩個組成:被說明的事物 統(tǒng)計指標(biāo)(1) 基本結(jié)構(gòu)與要求: 由標(biāo)題、標(biāo)目、線條、數(shù)字等組成 a. 標(biāo)題: 要求中心內(nèi)容突出, 必要時注明資料的時間、地點(diǎn)。 b. 標(biāo)目: 橫標(biāo)目: 位于表的左側(cè)

44、, 是表的主語位置。 縱標(biāo)目: 位于表的上方, 是表的謂語位置。 c. 線條: 分頂線、底線、縱標(biāo)目下面與合計上面的橫線,斜線、豎線省略。 d. 數(shù)字: 一律用阿拉伯?dāng)?shù)字。 表示數(shù)值不詳或暫缺 - 無數(shù)值a. 備注: 列于表的下面, 對表中標(biāo)有( * )的數(shù)字加以描述。 標(biāo)題 橫標(biāo)目總稱 縱標(biāo)目 橫 標(biāo) 目 合計(1) 種類:內(nèi)容上:廣義: 狹義:形式上: a. 簡單表: 被研究的事物只按一個特征或指標(biāo)分組。 b. 復(fù)合表: 被研究的事物按兩個或兩個以上相關(guān)聯(lián)的特征或指標(biāo)分組。(2) 制表原則:簡單明了,重點(diǎn)突出主謂分明,層次清楚數(shù)據(jù)準(zhǔn)確,便于對比分析二.統(tǒng)計圖(statistic graph

45、)(1) 基本要求: a. 依據(jù)資料的性質(zhì)選擇適當(dāng)?shù)膱D形; b. 標(biāo)題簡明扼要,必要時注明時間、地點(diǎn); c.縱軸和橫軸應(yīng)有標(biāo)目,并注明單位 d.尺度:橫軸尺度自左而右, 縱軸尺度自下而上, 數(shù)量一律由小到大, 并需等距標(biāo)明??v橫坐標(biāo)長度的比例一般為5: 7。 e.復(fù)式圖:比較不同事物時, 用不同的線條或顏色表示, 要附圖例說明。3、常用統(tǒng)計圖(1) 直條圖(bar graph): 用相同寬度條形的長短.來表示資料數(shù)值大小比例關(guān)系, 適用于按性質(zhì)分組,各個獨(dú)立的、無連續(xù)關(guān)系的統(tǒng)計圖。(2) 百分條圖: 適用于表達(dá)構(gòu)成比的資料。(3) 線圖: 用線條的上升和下降來表示某事物( 或某現(xiàn)象 )因時間或條件而變化的趨勢。適用于連續(xù)性的變量資料。(4) 直方圖: 用于表示連續(xù)變量的頻數(shù)分布。常以橫軸表示被觀察現(xiàn)象, 縱軸表示頻數(shù)或頻率, 以各矩形( 寬度為組距 )的面積代表各組段的頻數(shù)。調(diào)查設(shè)計一. 特點(diǎn):二.調(diào)查計劃:1. 明確調(diào)查目的和指標(biāo)2. 確定觀察對象和單位3. 調(diào)查方法(1) 普查( 全面調(diào)查

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論