預防醫(yī)學緒論課件_第1頁
預防醫(yī)學緒論課件_第2頁
預防醫(yī)學緒論課件_第3頁
預防醫(yī)學緒論課件_第4頁
預防醫(yī)學緒論課件_第5頁
已閱讀5頁,還剩723頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

醫(yī)學本科生用

醫(yī)學統(tǒng)計學主講程琮泰山醫(yī)學院預防醫(yī)學教研室1預防醫(yī)學緒論Theteachingplan

formedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege2預防醫(yī)學緒論預防醫(yī)學教授,碩士生導師。男,1959年6月出生。漢族,無黨派。1982年12月,山東醫(yī)學院公共衛(wèi)生專業(yè)五年本科畢業(yè),獲醫(yī)學學士學位。1994年7月,上海醫(yī)科大學公共衛(wèi)生學院研究生畢業(yè),獲醫(yī)學碩士學位。2003年12月晉升教授?,F(xiàn)任預防醫(yī)學教研室副主任。主要從事《醫(yī)學統(tǒng)計學》、《預防醫(yī)學》,《醫(yī)學人口統(tǒng)計學》等課程的教學及科研工作,每年聽課學生500-800人。自2000年起連續(xù)六年,為碩士研究生開設《醫(yī)學統(tǒng)計學》、《SPSS統(tǒng)計分析簡明教程》、《衛(wèi)生經(jīng)濟學》等課程,同時指導研究生的科研設計、開題報告及科研資料的統(tǒng)計處理與分析。發(fā)表醫(yī)學統(tǒng)計學及預防醫(yī)學的科研論文30多篇。代表作有“鋅對乳癌細胞生長、增殖與基因表達的影響”,,“行列相關的測度”等。主編、副主編各類教材及專著8部,代表作有《醫(yī)學統(tǒng)計學》、《SPSS統(tǒng)計分析簡明教程》獲得院級科研論文及科技進步獎8項,院第四屆教學能手比賽二等獎一項,院教學評建先進工作者一項。獲2004年泰山醫(yī)學院首屆十大教學名師獎。程琮教授簡介3預防醫(yī)學緒論醫(yī)學統(tǒng)計學總目錄

第1章緒論

第2章定量資料統(tǒng)計描述

第3章總體均數(shù)的區(qū)間估計和假設檢驗

第4章方差分析

第5章定性資料的統(tǒng)計描述

第6章總體率的區(qū)間估計和假設檢驗

第7章二項分布與泊松分布

第8章秩和檢驗

第9章直線相關與回歸

第10章實驗設計

第11章調查設計

第12章統(tǒng)計表與統(tǒng)計圖4預防醫(yī)學緒論第1章緒論目錄

第五節(jié)學習統(tǒng)計學應注意的幾個問題

第二節(jié)統(tǒng)計工作的基本步驟

第三節(jié)統(tǒng)計資料的類型

第四節(jié)統(tǒng)計學中的幾個基本概念

第一節(jié)醫(yī)學統(tǒng)計學的定義和內容5預防醫(yī)學緒論第一章緒論

第一節(jié)醫(yī)學統(tǒng)計學的定義和內容醫(yī)學統(tǒng)計學(medicalstatistics)---是以醫(yī)學理論為指導,運用數(shù)理統(tǒng)計學的原理和方法研究醫(yī)學資料的搜集、整理與分析,從而掌握事物內在客觀規(guī)律的一門學科。6預防醫(yī)學緒論醫(yī)學研究的對象----主要是人以及與其健康有關的各種影響因素。醫(yī)學統(tǒng)計學的主要內容:1.統(tǒng)計設計包括實驗設計和調查設計,它可以合理地、科學地安排實驗和調查工作,使之能較少地花費人力、物力和時間,取得較滿意和可靠的結果。2.資料的統(tǒng)計描述和總體指標的估計通過計算各種統(tǒng)計指標和統(tǒng)計圖表來描述資料的集中趨勢、離散趨勢和分布特征況(如正態(tài)分布或偏態(tài)分布);利用樣本指標來估計總體指標的大小。

7預防醫(yī)學緒論3.假設檢驗是通過統(tǒng)計檢驗方法(如t檢驗、u檢驗、F檢驗、卡方檢驗、秩和檢驗等)來推斷兩組或多組統(tǒng)計指標的差異是抽樣誤差造成的還是有本質的差別。4.相關與回歸醫(yī)學中存在許多相互聯(lián)系、相互制約的現(xiàn)象。如兒童的身高與體重、胸圍與肺活量、血糖與尿糖等,都需要利用相關與回歸來分析。8預防醫(yī)學緒論5.多因素分析如多元回歸、判別分析、聚類分析、正交設計分析、主成分分析、因子分析、logistic回歸、Cox比例風險回歸等,都是分析醫(yī)學中多因素有效的方法(本書不涉及,請參考有關統(tǒng)計書籍)。這些方法計算復雜,大部分需借助計算機來完成。6.健康統(tǒng)計研究人群健康的指標與統(tǒng)計方法,除了用上述的某些方法外,他還有其特有的方法,如壽命表、生存分析、死因分析、人口預測等方法9預防醫(yī)學緒論醫(yī)學統(tǒng)計工作可分為四個步驟:統(tǒng)計設計、搜集資料、整理資料和分析資料。這四個步驟密切聯(lián)系,缺一不可,任何一個步驟的缺陷和失誤,都會影響統(tǒng)計結果的正確性。第二節(jié)統(tǒng)計工作的基本步驟10預防醫(yī)學緒論設計(design)是統(tǒng)計工作的第一步,也是關鍵的一步,是對統(tǒng)計工作全過程的設想和計劃安排。統(tǒng)計設計---就是根據(jù)研究目的確定試驗因素、受試對象和觀察指標,并在現(xiàn)有的客觀條件下決定用什么方式和方法來獲取原始資料,并對原始資料如何進行整理,以及整理后的資料應該計算什么統(tǒng)計指標和統(tǒng)計分析的預期結果如何等。一、統(tǒng)計設計11預防醫(yī)學緒論搜集資料(collectionofdate)——是根據(jù)設計的要求,獲取準確可靠的原始資料,是統(tǒng)計分析結果可靠的重要保證。醫(yī)學統(tǒng)計資料的來源主要有以下三個方面:1.統(tǒng)計報表統(tǒng)計報表是醫(yī)療衛(wèi)生機構根據(jù)國家規(guī)定的報告制度,定期逐級上報的有關報表。如法定傳染病報表、出生死亡報表、醫(yī)院工作報表等,報表要完整、準確、及時。

二、搜集資料12預防醫(yī)學緒論2.醫(yī)療衛(wèi)生工作記錄如病歷、醫(yī)學檢查記錄、衛(wèi)生監(jiān)測記錄等。3.專題調查或實驗研究它是根據(jù)研究目的選定的專題調查或實驗研究,搜集資料有明確的目的與針對性。它是醫(yī)學科研資料的主要來源。13預防醫(yī)學緒論整理資料(sortingdata)的目的就是將搜集到的原始資料進行反復核對和認真檢查,糾正錯誤,分類匯總,使其系統(tǒng)化、條理化,便于進一步的計算和分析。整理資料的過程如下:1.審核:認真檢查核對,保證資料的準確性和完整性。2.分組:歸納分組,分組方法有兩種:①質量分組,即將觀察單位按其類別或屬性分組,如按性別、職業(yè)、陽性和陰性等分組。②數(shù)量分組,即將觀察單位按其數(shù)值的大小分組,如按年齡的大小、藥物劑量的大小等分組。三、整理資料

14預防醫(yī)學緒論3.匯總:分組后的資料要按照設計的要求進行匯總,整理成統(tǒng)計表。原始資料較少時用手工匯總,當原始資料較多時,可使用計算機匯總。四、分析資料

分析資料(analysisofdata)——是根據(jù)設計的要求,對整理后的數(shù)據(jù)進行統(tǒng)計學分析,結合專業(yè)知識,作出科學合理的解釋。15預防醫(yī)學緒論1.統(tǒng)計描述(descriptivestatistics)將計算出的統(tǒng)計指標與統(tǒng)計表、統(tǒng)計圖相結合,全面描述資料的數(shù)量特征及分布規(guī)律。2.統(tǒng)計推斷(inferentialstatistics)

使用樣本信息推斷總體特征。通過樣本統(tǒng)計量進行總體參數(shù)的估計和假設檢驗,以達到了解總體的數(shù)量特征及其分布規(guī)律,才是最終的研究目的。統(tǒng)計分析包括以下兩大內容:16預防醫(yī)學緒論醫(yī)學統(tǒng)計資料按研究指標的性質一般分為定量資料、定性資料和等級資料三大類。一、定量資料定量資料(quantitativedata)

亦稱計量資料(measurementdata),是用定量的方法測定觀察單位(個體)某項指標數(shù)值的大小,所得的資料稱定量資料。如身高(㎝)、體重(㎏)、脈搏(次/分)、血壓(kPa)等為數(shù)值變量,其組成的資料為定量資料。第三節(jié)統(tǒng)計資料的類型17預防醫(yī)學緒論定性資料(qualitativedata)

亦稱計數(shù)資料(enumerationdata)或分類資料(categoricaldata),是將觀察單位按某種屬性或類別分組,清點各組的觀察單位數(shù),所得的資料稱定性資料。定性資料的觀察指標為分類變量(categoricalvariable)。如人的性別按男、女分組;化驗結果按陽性、陰性分組;動物實驗按生存、死亡分組;調查某人群的血型按A、B、O、AB分組等,觀察單位出現(xiàn)的結果為分類變量,分類變量沒有量的差別,只有質的不同,其組成的資料為定性資料。二、定性資料18預防醫(yī)學緒論三、等級資料等級資料(rankeddata)亦稱有序分類資料(ordinalcategoricaldata),是將觀察單位按屬性的等級分組,清點各組的觀察單位數(shù),所得的資料為等級資料。如治療結果分為治愈、顯效、好轉、無效四個等級。

19預防醫(yī)學緒論根據(jù)需要,各類變量可以互相轉化。若按貧血的診斷標準將血紅蛋白分為四個等級:重度貧血、中度貧血、輕度貧血、正常,可按等級資料處理。有時亦可將定性資料或等級資料數(shù)量化,如將等級資料的治療結果賦以分值,分別用0、1、2…等表示,則可按定量資料處理。如調查某人群的尿糖的情況,以人為觀察單位,結果可分—、±、+、++、+++五個等級。20預防醫(yī)學緒論同質(homogeneity)是指觀察單位或研究個體間被研究指標的主要影響因素相同或基本相同。如研究兒童的生長發(fā)育,同性別、同年齡、同地區(qū)、同民族、健康的兒童即為同質兒童。變異(variation)

由于生物個體的各種指標所受影響因素極為復雜,同質的個體間各種指標存在差異,這種差異稱為變異。如同質的兒童身高、體重、血壓、脈搏等指標會有一定的差別。第四節(jié)統(tǒng)計學中的幾個基本概念

一、同質與變異21預防醫(yī)學緒論二、總體與樣本樣本(sample):是從總體中隨機抽取的部分觀察單位變量值的集合。樣本的例數(shù)稱為樣本含量(samplesize)。注意:1。總體是相對的,總體的大小是根據(jù)研究目的而確定的。2。樣本應有代表性,即應該隨機抽樣并有足夠的樣本含量。

22預防醫(yī)學緒論圖示:總體與樣本populationsample2sample1sample3sample4sample523預防醫(yī)學緒論三、參數(shù)與統(tǒng)計量參數(shù)(parameter):由總體計算或得到的統(tǒng)計指標稱為參數(shù)。總體參數(shù)具有很重要的參考價值。如總體均數(shù)μ,總體標準差σ等。統(tǒng)計量(statistic):由樣本計算的指標稱為統(tǒng)計量。如樣本均數(shù),樣本標準差s等。注意:一般不容易得到參數(shù),而容易獲得樣本統(tǒng)計量。24預防醫(yī)學緒論四、抽樣誤差抽樣誤差(sampleerror):

由于隨機抽樣所引起的樣本統(tǒng)計量與總體參數(shù)之間的差異以及樣本統(tǒng)計量之間的差別稱為抽樣誤差。如樣本均數(shù)與總體均數(shù)之間的差別,樣本率與總體率的差別等。注意:抽樣誤差是不可避免的。無論抽樣抽得多么好,也會存在抽樣誤差。25預防醫(yī)學緒論五、概率概率(probability):是描述隨機事件發(fā)生可能性大小的量值。用英文大寫字母P來表示。概率的取值范圍在0~1之間。當P=0時,稱為不可能事件;當P=1時,稱為必然事件。小概率事件:統(tǒng)計學上一般把P≤0.05或P≤0.01的事件稱為小概率事件。小概率原理:小概率事件在一次試驗中幾乎不可能發(fā)生。利用該原理可對科研資料進行假設檢驗。26預防醫(yī)學緒論第五節(jié)學習醫(yī)學統(tǒng)計學應注意的問題1.重點掌握醫(yī)學統(tǒng)計學的基本知識、基本技能、基本概念和基本方法,掌握使用范圍和注意事項。2.要培養(yǎng)科學的統(tǒng)計思維方法,提高分析問題、解決問題的能力。3.掌握調查設計和實驗設計的原則,培養(yǎng)搜集、整理、分析統(tǒng)計資料的系統(tǒng)工作能力。27預防醫(yī)學緒論課后作業(yè)列舉出計量資料、分類資料、等級資料各10個實例。列舉出可能事件、必然事件、不可能事件及小概率事件各10個。認真復習本章已學過的基本概念2-3遍。28預防醫(yī)學緒論BestWishestoAllofYou!ThankYouforListening!THEEND29預防醫(yī)學緒論醫(yī)學本科生用主講程琮泰山醫(yī)學院預防醫(yī)學教研室醫(yī)學統(tǒng)計學30預防醫(yī)學緒論Theteachingplan

formedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege31預防醫(yī)學緒論第2章定量資料的統(tǒng)計描述目錄

第二節(jié)集中趨勢的描述

第三節(jié)離散趨勢的描述

第四節(jié)正態(tài)分布

第一節(jié)頻數(shù)分布表32預防醫(yī)學緒論統(tǒng)計描述:是用統(tǒng)計圖表、統(tǒng)計指標來描述資料的分布規(guī)律及其數(shù)量特征。頻數(shù)分布表(frequencydistributiontable):主要由組段和頻數(shù)兩部分組成表格。第一節(jié)頻數(shù)分布表第二章定量資料的統(tǒng)計描述33預防醫(yī)學緒論二、頻數(shù)分布表的編制

編制步驟:1.計算全距(range):一組變量值最大值和最小值之差稱為全距(range),亦稱極差,常用R表示。2.確定組距(classinterval):組距用i表示;3.劃分組段:每個組段的起點稱組下限,終點稱組上限。一般分為8~15組。;4.統(tǒng)計頻數(shù):將所有變量值通過劃記逐個歸入相應組段;5.頻率與累計頻率:將各組的頻數(shù)除以n所得的比值被稱為頻率。累計頻率等于累計頻數(shù)除以總例數(shù)。

34預防醫(yī)學緒論表2-2某年某市120名12歲健康男孩身高(cm)的頻數(shù)分布

身高組段(1)頻數(shù)(2)頻率(%)(3)累計頻數(shù)(4)累計頻率(%)(5)125~10.8310.83129~43.3354.17133~108.341512.50…………………………合計120100.0035預防醫(yī)學緒論36預防醫(yī)學緒論二、頻數(shù)分布表的用途1.揭示資料的分布類型2.觀察資料的集中趨勢和離散趨勢3.便于發(fā)現(xiàn)某些特大或特小的可疑值4.便于進一步計算統(tǒng)計指標和作統(tǒng)計處理37預防醫(yī)學緒論38預防醫(yī)學緒論第二節(jié)集中趨勢的描述集中趨勢:代表一組同質變量值的集中趨勢或平均水平。

常用的平均數(shù)有算術均數(shù)、幾何均數(shù)和中位數(shù)。另外不常用的有:眾數(shù),調和平均數(shù)和調整均數(shù)等。39預防醫(yī)學緒論一、算術均數(shù)

算術均數(shù)(arithmeticmean):

簡稱均數(shù)。適用條件:對稱分布或近似對稱分布的資料。習慣上以希臘字母μ表示總體均數(shù)(populationmean),以英文字母表示樣本均數(shù)(samplemean)40預防醫(yī)學緒論1.直接法:用于觀察值個數(shù)不多時

計算方法41預防醫(yī)學緒論2.加權法(weightingmethod):用于變量值個數(shù)

較多時。注意:權數(shù)即頻數(shù)f,為權重權衡之意。42預防醫(yī)學緒論

身高(1)組中值X(2)頻數(shù)f(3)fX(4)=(2)(3)fX2(5)=(2)(4)125~127112716129129~131452468644133~135101350182250…………………………合計120171682460040表2-4120名12歲健康男孩身高(cm)均數(shù)和標準差加權法計算表

43預防醫(yī)學緒論44預防醫(yī)學緒論120名12歲健康男孩身高均數(shù)為143.07cm。

計算結果45預防醫(yī)學緒論幾何均數(shù)(geometricmean,簡記為G):表示其平均水平。適用條件:對于變量值呈倍數(shù)關系或呈對數(shù)正態(tài)分布(正偏態(tài)分布),如抗體效價及抗體滴度,某些傳染病的潛伏期,細菌計數(shù)等。計算公式:有直接法和加權法。

二、幾何均數(shù)46預防醫(yī)學緒論1.直接法:用于變量值的個數(shù)n較少時47預防醫(yī)學緒論直接法計算實例48預防醫(yī)學緒論2.加權法:用于資料中相同變量值的個數(shù)f(即頻數(shù))較多時。49預防醫(yī)學緒論

抗體滴度(1)頻數(shù)f

(2)滴度倒數(shù)X

(3)lgX

(4)flgX(5)=(2)(4)1:4240.60201.20401:8680.90315.41861:167161.20418.4287…………………………合計50--89.1045表2-550名兒童麻疹疫苗接種后血凝抑制抗體滴度幾何均數(shù)計算表50預防醫(yī)學緒論51預防醫(yī)學緒論50名兒童麻疹疫苗接種后平均血凝抑制抗體滴度為1:60.55。計算結果:將有關已知數(shù)據(jù)代入公式有52預防醫(yī)學緒論①變量值中不能有0;

②不能同時有正值和負值;

③若全是負值,計算時可先把負號去掉,得出結果后再加上負號。計算幾何均數(shù)注意事項:53預防醫(yī)學緒論㈠中位數(shù)

定義:將一組變量值從小到大按順序排列,位次居中的變量值稱為中位數(shù)(median,簡記為M)。適用條件:①變量值中出現(xiàn)個別特小或特大的數(shù)值;②資料的分布呈明顯偏態(tài),即大部分的變量值偏向一側;③變量值分布一端或兩端無確定數(shù)值,只有小于或大于某個數(shù)值;④資料的分布不清。

三、中位數(shù)及百分位數(shù)54預防醫(yī)學緒論定義:百分位數(shù)(percentile)是一種位置指標,以Px表示。百分位數(shù)是將頻數(shù)等分為一百的分位數(shù)。一組觀察值從小到大按順序排列,理論上有x%的變量值比Px小,有(100-x)%的變量值比Px大。故P50分位數(shù)也就是中位數(shù),即P50=M

。㈡百分位數(shù)55預防醫(yī)學緒論①描述一組資料在某百分位置上的水平;②用于確定正常值范圍;③計算四分位數(shù)間距。百分位數(shù)的應用條件:56預防醫(yī)學緒論計算方法:有直接法和加權法1.直接法:用于例數(shù)較少時n為奇數(shù)時n為偶數(shù)時

57預防醫(yī)學緒論2.頻數(shù)表法:用于例數(shù)較多時中位數(shù)百分位數(shù)58預防醫(yī)學緒論

潛伏期(小時)(1)頻數(shù)f

(2)累計頻數(shù)(3)累計頻率(%)(4)0~171711.76~466343.412~3810169.9……………………合計145--表2-6145例食物中毒病人潛伏期分布表59預防醫(yī)學緒論60預防醫(yī)學緒論先找到包含Px的最小累計頻率;該累計頻率同行左邊的組段值為L;L同行右邊的頻數(shù)為fx(或fm);L前一行的累計頻數(shù)為∑fL;將上述已知條件代入公式計算Px或P50。計算中位數(shù)及百分位數(shù)的步驟:61預防醫(yī)學緒論計算結果:62預防醫(yī)學緒論定義:用來說明變量值的離散程度或變異程度。注意:僅用集中趨勢尚不能完全反映一組數(shù)據(jù)的特征。故應將集中趨勢和離散趨勢結合起來才能更好地反映一組數(shù)據(jù)的特征。常用離散指標有:極差、四分位數(shù)間距、標準差、方差、變異系數(shù)。第三節(jié)離散趨勢的描述63預防醫(yī)學緒論甲組:184186188190192乙組:180184188192196兩組球員的平均身高都是188cm,但甲組球員身高比較集中,乙組球員身高比較分散。為了說明離散趨勢,就要用離散指標。實例分析64預防醫(yī)學緒論㈠極差

極差(range,簡記為R)亦稱全距,即一組變量值中最大值與最小值之差。特點:計算簡單,不穩(wěn)定,不全面,易變化;可用于各種分布的資料。一、極差和四分位數(shù)間距65預防醫(yī)學緒論㈡四分位數(shù)間距公式:

Q=P75-P25

特點:比極差穩(wěn)定,只反映中間兩端值的差異。計算不太方便??捎糜诟鞣N分布的資料。66預防醫(yī)學緒論二、方差和標準差㈠方差(variance)總體方差樣本方差67預防醫(yī)學緒論自由度(degreeoffreedom)的概念n-1是自由度,用希臘小寫字母ν表示,讀作[nju:]。定義:在N維或N度空間中能夠自由選擇的維數(shù)或度數(shù)。例:A+B=C,共有n=3個元素,其中只能任選2個元素的值,故自由度ν=n-1=3-1=2。68預防醫(yī)學緒論方差的特點充分反映每個數(shù)據(jù)間的離散狀況,意義深刻;指標穩(wěn)定,應用廣泛,但計算較為復雜,不易理解;方差的單位與原數(shù)據(jù)不同,有時使用時不太方便;在方差分析中應用甚廣而極為重要。69預防醫(yī)學緒論(二)標準差(standarddeviation)總體標準差樣本標準差70預防醫(yī)學緒論牢記:離均差平方和展開式:71預防醫(yī)學緒論標準差的特點:意義同方差,是方差的開平方;標準差的單位與原數(shù)據(jù)相同,使用方便,意義深刻,應用廣泛;故一般已作為醫(yī)學生物學領域中反映變異的標準,故稱標準差。72預防醫(yī)學緒論標準差的計算方法:可分為直接法和加權法。

1.直接法

2.加權法73預防醫(yī)學緒論直接法:標準差計算實例:例2.12例2.2中7名正常男子紅細胞數(shù)(1012/L)如下:4.67,4.74,4.77,4.88,4.76,4.72,4.92,計算其標準差。

∑x=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46

∑x2=4.672+4.742+4.772+4.882+4.762+4.722+4.922=159.99

74預防醫(yī)學緒論計算結果:75預防醫(yī)學緒論例2.13對表2-4資料用加權法計算120名12歲健康男孩身高值的標準差。加權法:標準差計算實例:在表2-4中已算得∑fx=17168,∑fx2=2460040,代入公式76預防醫(yī)學緒論變異系數(shù)(coefficientofvariation):簡記為CV;特征:①變異系數(shù)為無量綱單位,可以比較不同單位指標間的變異度;②變異系數(shù)消除了均數(shù)的大小對標準差的影響,所以可以比較兩均數(shù)相差較大時指標間的變異度。三、變異系數(shù)77預防醫(yī)學緒論例2.14某地20歲男子160人,身高均數(shù)為166.06cm,標準差為4.95cm;體重均數(shù)為53.72kg,標準差為4.96kg。試比較身高與體重的變異程度。變異系數(shù)計算實例78預防醫(yī)學緒論身高體重變異系數(shù)計算結果79預防醫(yī)學緒論第四節(jié)正態(tài)分布一、正態(tài)分布的概念和特征正態(tài)分布(normaldistribution):也稱高斯分布,是醫(yī)學和生物學最常見的連續(xù)性分布。如身高、體重、紅細胞數(shù)、血紅蛋白等。80預防醫(yī)學緒論圖2-1120名12歲健康男孩身高的頻數(shù)分布81預防醫(yī)學緒論㈠正態(tài)分布的函數(shù)和圖形正態(tài)分布的密度函數(shù),即正態(tài)曲線的方程為:82預防醫(yī)學緒論圖2-2頻數(shù)分布逐漸接近正態(tài)分布示意83預防醫(yī)學緒論為了應用方便,常按公式(2.19)作變量變換u值稱為標準正態(tài)變量或標準正態(tài)離差,有的參考書也將u值稱為z值。84預防醫(yī)學緒論這樣將正態(tài)分布變換為標準正態(tài)分布

(standardnormaldistribution)85預防醫(yī)學緒論圖2-3正態(tài)分布的面積與縱高

86預防醫(yī)學緒論㈡正態(tài)分布的特征1.集中性正態(tài)曲線的高峰位于正中央,即均數(shù)所在的位置。對稱性正態(tài)曲線以均數(shù)為中心,左右對稱,3.正態(tài)分布有兩個參數(shù),即均數(shù)和標準差。4.正態(tài)曲線下面積有一定的分布規(guī)律

87預防醫(yī)學緒論圖2-4不同標準差的正態(tài)分布示意88預防醫(yī)學緒論二、正態(tài)曲線下面積的分布規(guī)律89預防醫(yī)學緒論標準正態(tài)分布表(u值表)標準正態(tài)分布曲線下的面積,由此表可查出曲線下某區(qū)間的面積。查表時應注意:①表中曲線下面積為-∞到u

的下側累計面積;②當已知μ、σ、和X時,先按公式(2.19)求得u值,再查表;當和未知時,并且樣本例數(shù)在100例以上,常用樣本均數(shù)和標準差S分別代替μ和σ,按公式(2.19)求得u值;③曲線下橫軸上的總面積為100%或190預防醫(yī)學緒論

例2.16前例2.1中,某年某市120名12歲健康男孩身高,已知均數(shù)=143.07cm,標準差S=5.70cm,①估計該地12歲健康男孩身高在135cm以下者占該地12歲男孩總數(shù)的百分數(shù);②估計身高界于135cm~150cm范圍內12歲男孩的比例;③分別求出均數(shù)±1S、均數(shù)±1.96S、均數(shù)±2.58S范圍內12歲男孩人數(shù)占該120名男孩總數(shù)的實際百分數(shù),說明與理論百分數(shù)是否接近。

91預防醫(yī)學緒論根據(jù)題意,按公式(2.19)作u變換92預防醫(yī)學緒論身高范圍所占面積故估計該地12男孩身高在135cm以下者約占7.78%;身高界于135cm~150cm范圍內者約占81.10%。

93預防醫(yī)學緒論三、正態(tài)分布的應用㈠制定醫(yī)學參考值范圍參考值范圍也稱為正常值范圍。醫(yī)學上常把絕大數(shù)正常人的某指標范圍稱為該指標的正常值范圍。這里的“絕大多數(shù)”可以是90%、95%、99%,最常用的是95%。㈡質量控制

常以均數(shù)±2S作為上、下警戒值,以均數(shù)±3S作為上、下控制值。

㈢正態(tài)分布是很多統(tǒng)計方法的理論基礎94預防醫(yī)學緒論THEENDTHANKYOUFORLISTENING95預防醫(yī)學緒論本科生用

醫(yī)學統(tǒng)計學教案主講程琮泰山醫(yī)學院預防醫(yī)學教研室96預防醫(yī)學緒論Theteachingplan

formedicalstudentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege97預防醫(yī)學緒論第3章總體均數(shù)的區(qū)間估計和假設檢驗目錄

第五節(jié)均數(shù)的u檢驗

第二節(jié)t分布

第三節(jié)總體均數(shù)的區(qū)間估計

第四節(jié)假設檢驗的意義和基本步驟

第一節(jié)均數(shù)的抽樣誤差與標準誤

第六節(jié)均數(shù)的t檢驗

第七節(jié)兩個方差的齊性檢驗和t’檢驗

第八節(jié)Ⅰ型錯誤和Ⅱ型錯誤

第九節(jié)應用假設檢驗應注意的問題98預防醫(yī)學緒論圖示:總體與樣本Populationμsample2sample1sample3sample4sample599預防醫(yī)學緒論一、標準誤的意義及其計算統(tǒng)計推斷(statisticalinference):根據(jù)樣本信息來推論總體特征。均數(shù)的抽樣誤差:由抽樣引起的樣本均數(shù)與總體均數(shù)的差異稱為均數(shù)的抽樣誤差。標準誤(standarderror):反映均數(shù)抽樣誤差大小的指標。

第一節(jié)均數(shù)的抽樣誤差與標準誤100預防醫(yī)學緒論σ已知:標準誤計算公式σ未知:101預防醫(yī)學緒論

實例:如某年某市120名12歲健康男孩,已求得均數(shù)為143.07cm,標準差為5.70cm,按公式計算,則標準誤為:102預防醫(yī)學緒論1.表示抽樣誤差的大小;2.進行總體均數(shù)的區(qū)間估計;

3.進行均數(shù)的假設檢驗等。二、標準誤的應用103預防醫(yī)學緒論正態(tài)變量X采用u=(X-μ)/σ變換,則一般的正態(tài)分布N(μ,σ)即變換為標準正態(tài)分布N(0,1)。又因從正態(tài)總體抽取的樣本均數(shù)服從正態(tài)分布N(μ,),同樣可作正態(tài)變量的u變換,即第二節(jié)t分布

一、t分布的概念104預防醫(yī)學緒論實際工作中由于理論的標準誤往往未知,而用樣本的標準誤作為的估計值,此時就不是u變換而是t變換了,即下式:105預防醫(yī)學緒論t分布于1908年由英國統(tǒng)計學家W.S.Gosset以“Student”筆名發(fā)表,故又稱Studentt分布(Students’t-distribution)。106預防醫(yī)學緒論二、t分布曲線的特征t分布曲線是單峰分布,以0為中心,左右兩側對稱,曲線的中間比標準正態(tài)曲線(u分布曲線)低,兩側翹得比標準正態(tài)曲線略高。t分布曲線隨自由度υ而變化,當樣本含量越?。▏栏竦卣f是自由度υ=n-1越小),t分布與u分布差別越大;當逐漸增大時,t分布逐漸逼近于u分布,當υ=∞時,t分布就完全成正態(tài)分布。t分布曲線是一簇曲線,而不是一條曲線。t分布下面積分布規(guī)律:查t分布表。107預防醫(yī)學緒論t分布示意圖108預防醫(yī)學緒論t分布曲線下雙側或單側尾部合計面積我們常把自由度為υ的t分布曲線下雙側尾部合計面積或單側尾部面積為指定值α時,則橫軸上相應的t界值記為tα,υ。如當υ=20,α=0.05時,記為t0.05,20;當υ=22,α=0.01時,記為t0.01,22。對于tα,υ值,可根據(jù)α和υ值,查附表2,t界值表。109預防醫(yī)學緒論t分布是t檢驗的理論基礎。由公式(3.4)可知,│t│值與樣本均數(shù)和總體均數(shù)之差成正比,與標準誤成反比。在t分布中│t│值越大,其兩側或單側以外的面積所占曲線下總面積的比重就越小,說明在抽樣中獲得此│t│值以及更大│t│值的機會就越小,這種機會的大小是用概率P來表示的。│t│值越大,則P值越??;反之,│t│值越小,P值越大。根據(jù)上述的意義,在同一自由度下,│t│≥tα,則P≤α;反之,│t│<tα,則P>α。110預防醫(yī)學緒論第三節(jié)總體均數(shù)的區(qū)間估計參數(shù)估計:用樣本指標(統(tǒng)計量)估計總體指標(參數(shù))稱為參數(shù)估計。估計總體均數(shù)的方法有兩種,即:點值估計(pointestimation)區(qū)間估計(intervalestimation)。111預防醫(yī)學緒論一、點值估計點值估計:是直接用樣本均數(shù)作為總體均數(shù)的估計值。此法計算簡便,但由于存在抽樣誤差,通過樣本均數(shù)不可能準確地估計出總體均數(shù)大小,也無法確知總體均數(shù)的可靠程度。112預防醫(yī)學緒論二、區(qū)間估計區(qū)間估計是按一定的概率(1-α)估計包含總體均數(shù)可能的范圍,該范圍亦稱總體均數(shù)的可信區(qū)間(confidenceinterval,縮寫為CI)。1-α稱為可信度,常取1-α為0.95和0.99,即總體均數(shù)的95%可信區(qū)間和99%可信區(qū)間。1-α(如95%)可信區(qū)間的含義是:總體均數(shù)被包含在該區(qū)間內的可能性是1-α,即(95%),沒有被包含的可能性為α,即(5%)。113預防醫(yī)學緒論總體均數(shù)的可信區(qū)間的計算1.未知σ且n較小(n<100)按t分布的原理2.已知σ或n較大(n≥100)按u分布的原理114預防醫(yī)學緒論95%的可信區(qū)間為123.7±2.064×2.38,即(118.79,128.61)。故該地1歲嬰兒血紅蛋白平均值95%的可信區(qū)間為118.7~128.61(g/L)。例3.1為了了解某地1歲嬰兒的血紅蛋白濃度,從該地隨機抽取了1歲嬰兒25人,測得其血紅蛋白的平均數(shù)為123.7g/L,標準差為11.9g/L。試求該地1歲嬰兒的血紅蛋白平均值95%的可信區(qū)間。115預防醫(yī)學緒論例3.2上述某市120名12歲健康男孩身高均數(shù)為143.07cm,標準誤為0.52cm,試估計該市12歲康男孩身高均數(shù)95%和99%的可信區(qū)間。95%的可信區(qū)間為143.07±1.96×0.52,即(142.05,144.09)。99%的可信區(qū)間為143.07±2.58×0.52,即(141.73,144.41)。116預防醫(yī)學緒論注意點標準誤愈小,估計總體均數(shù)可信區(qū)間的范圍也愈窄,說明樣本均數(shù)與總體均數(shù)愈接近,對總體均數(shù)的估計也愈精確;反之,標準誤愈大,估計總體均數(shù)可信區(qū)間的范圍也愈寬,說明樣本均數(shù)距總體均數(shù)愈遠,對總體均數(shù)的估計也愈差。117預防醫(yī)學緒論表3-1標準差和標準誤的區(qū)別

118預防醫(yī)學緒論第四節(jié)假設檢驗的意義和基本步驟假設檢驗(hypothesistest):亦稱顯著性檢驗(significancetest),是統(tǒng)計推斷的重要內容。它是指先對總體的參數(shù)或分布作出某種假設,再用適當?shù)慕y(tǒng)計方法根據(jù)樣本對總體提供的信息,推斷此假設應當拒絕或不拒絕。119預防醫(yī)學緒論例3.3根據(jù)大量調查,已知健康成年男子脈搏的均數(shù)為72次/分鐘,某醫(yī)生在一山區(qū)隨機測量了25名健康成年男子脈搏數(shù),求得其均數(shù)為74.2次/分鐘,標準差為6.5次/分鐘,能否認為該山區(qū)成年男子的脈搏數(shù)與一般健康成年男子的脈搏數(shù)不同?

本例兩個均數(shù)不等有兩種可能性:①山區(qū)成年男子的脈搏總體均數(shù)與一般健康成年男子的脈搏總體均數(shù)是相同的,差別僅僅由于抽樣誤差所致;②受山區(qū)某些因素的影響,兩個總體的均數(shù)是不相同的。如何作出判斷呢?按照邏輯推理,如果第一種可能性較大時,可以接受它,統(tǒng)計上稱差異無統(tǒng)計學意義(nostatisticalsignificance);如果第一種可能性較小時,可以拒絕它而接受后者,統(tǒng)計上稱差異有統(tǒng)計學意義(statisticalsignificance)。

120預防醫(yī)學緒論假設檢驗的一般步驟如下:1.建立檢驗假設一種是無效假設(nullhypothesis),符號為H0;一種是備擇假設(alternativehypothesis)符號為H1。H0:

H1:121預防醫(yī)學緒論表3-2樣本均數(shù)所代表的未知總體均數(shù)

與已知總體均數(shù)的比較122預防醫(yī)學緒論表3-3兩樣本均數(shù)所代表的未知總體均數(shù)的比較123預防醫(yī)學緒論2.確定檢驗水準

檢驗水準(sizeofatest)亦稱顯著性水準(significancelevel),符號為α。它是判別差異有無統(tǒng)計意義的概率水準,其大小應根據(jù)分析的要求確定。通常取α

α=0.05。3.選定檢驗方法和計算統(tǒng)計量根據(jù)研究設計的類型和統(tǒng)計推斷的目的要求選用不同的檢驗方法。如完全隨機設計中,兩樣本均數(shù)的比較可用t檢驗,樣本含量較大時(n>100),可用u檢驗。不同的統(tǒng)計檢驗方法,可得到不同的統(tǒng)計量,如t值和u值。124預防醫(yī)學緒論4.確定概率P值

P值是指在H0所規(guī)定的總體中作隨機抽樣,獲得等于及大于(或小于)現(xiàn)有統(tǒng)計量的概率。│t│≥tα,υ,則P≤α;│t│<tα,υ,則P>α。

125預防醫(yī)學緒論5.作出推斷結論

①當P≤α時,表示在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有統(tǒng)計量的概率是小概率,根據(jù)小概率事件原理,現(xiàn)有樣本信息不支持H0,因而拒絕H0,結論為按所取檢驗水準拒絕H0,接受H1,即差異有統(tǒng)計學意義,如例3.3可認為兩總體脈搏均數(shù)有差別;②當P>α時,表示在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有統(tǒng)計量的概率不是小概率,現(xiàn)有樣本信息還不能拒絕H0,結論為按所取檢驗水準不拒絕H0,即差異無統(tǒng)計意義,如例3.3尚不能認為兩總體脈搏均數(shù)有差別。126預防醫(yī)學緒論下結論時的注意點:P≤α,拒絕H0,不能認為H0肯定不成立,因為雖然在H0成立的條件下出現(xiàn)等于及大于現(xiàn)有統(tǒng)計量的概率雖小,但仍有可能出現(xiàn);同理,P>α,不拒絕H0,更不能認為H0肯定成立。由此可見,假設檢驗的結論是具有概率性的,無論拒絕H0或不拒絕H0,都有可能發(fā)生錯誤,即第一類錯誤或第二類錯誤127預防醫(yī)學緒論第五節(jié)均數(shù)的u檢驗國外統(tǒng)計書籍及統(tǒng)計軟件亦稱為單樣本u檢驗(onesampleu-test)。樣本均數(shù)與總體均數(shù)比較的u檢驗適用于:①總體標準差σ已知的情況;②樣本含量較大時,比如n>100時。對于后者,是因為n較大,υ也較大,則t分布很接近u分布的緣故。

一、樣本均數(shù)與總體均數(shù)比較的u檢驗128預防醫(yī)學緒論u

值的計算公式為:總體標準差σ已知時,不管n的大小??傮w標準差σ未知時,但n>100時。129預防醫(yī)學緒論例3.4某托兒所三年來測得21~24月齡的47名男嬰平均體重11kg。查得近期全國九城市城區(qū)大量調查的同齡男嬰平均體重11.18kg,標準差為1.23kg。問該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平有無不同?(全國九城市的調查結果可作為總體指標)實例130預防醫(yī)學緒論(1)建立檢驗假設H0:μ=μ0,即該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平相同,α=0.05(雙側)H1:μ≠μ0,即該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平不同。(2)計算u值本例因總體標準差σ已知,故可用u檢驗。本例n=47,樣本均數(shù)=11,總體均數(shù)=11.18,總體標準差=1.23,代入公式(3.7)131預防醫(yī)學緒論(3)確定P值,作出推斷結論查u界值表(附表2,t界值表中為∞一行),得u0.05=1.96,u=1.003<u0.05=1.96,故P>0.05。按α=0.05水準,不拒絕H0,差異無統(tǒng)計學意義。結論:可認為該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平相同。132預防醫(yī)學緒論二、兩樣本均數(shù)比較的u檢驗該檢驗也稱為獨立樣本u檢驗(independentsampleu-test),適用于兩樣本含量較大(如n1>50且n2>50)時,u值可按下式計算:133預防醫(yī)學緒論

例3.5測得某地20~24歲健康女子100人收縮壓均數(shù)為15.27kPa,標準差為1.16kPa;又測得該地20~24歲健康男子100人收縮壓均數(shù)為16.11kPa,標準差為1.41kPa。問該地20~24歲健康女子和男子之間收縮壓均數(shù)有無差別?實例134預防醫(yī)學緒論(1)建立檢驗假設

H0:μ1=μ2,即該地20~24歲健康女子和男子之間收縮壓均數(shù)相同;

H1:μ1≠μ2,即該地20~24歲健康女子和男子之間收縮壓均數(shù)不同。α=0.05(雙側)(2)計算u值

本例n1=100,均數(shù)1=15.27,S1=1.16

n2=100,均數(shù)2=16.11,S2=1.41135預防醫(yī)學緒論(3)確定P值,作出推斷結論查u界值表(附表2,t界值表中為∞一行),得u0.05=1.96,現(xiàn)u>u0.05=1.96,故P<0.05。按水準α=0.05,拒絕H0,接受H1,差異有統(tǒng)計學意義。結論:可認為該地20~24歲健康人的收縮壓均數(shù)男性高于女性。136預防醫(yī)學緒論第六節(jié)均數(shù)的t檢驗當樣本含量較?。ㄈ鏽<50)時,t分布和u分布有較大的出入,所以小樣本的樣本均數(shù)與總體均數(shù)的比較以及兩個樣本均數(shù)的比較要用t檢驗。t檢驗的適用條件:①樣本來自正態(tài)總體或近似正態(tài)總體;②兩樣本總體方差相等。137預防醫(yī)學緒論一、樣本均數(shù)與總體均數(shù)比較的t檢驗亦稱為單樣本t檢驗(onesamplet-test)。即樣本均數(shù)代表的未知總體均數(shù)與已知的總體均數(shù)(一般為理論值、標準值或經(jīng)過大量觀察所得的穩(wěn)定值等)進行比較。這時檢驗統(tǒng)計量t值的計算在H0成立的前提條件下由公式(3.4)變?yōu)椋?38預防醫(yī)學緒論例3.6對例3.3資料進行t檢驗。(1)建立檢驗假設

H0:μ=μ0,即該山區(qū)健康成年男子脈搏均數(shù)與一般健康成年男子脈搏均數(shù)相同;H1:μ≠μ0,即該山區(qū)健康成年男子脈搏均數(shù)與一般健康成年男子脈搏均數(shù)不同。α=0.05(雙側)

(2)計算t值本例n=25,s=6.5,樣本均數(shù)=74.2,總體均數(shù)=72,代入公式(3.10)139預防醫(yī)學緒論(3)確定P值,作出推斷結論

本例υ=25-1=24,查附表2,t界值表,得t0.05,24=2.064,現(xiàn)t=1.692<t0.05,24=2.064,故P>0.05。按α=0.05的水準,不拒絕H0,差異無統(tǒng)計學意義。結論:即根據(jù)本資料還不能認為此山區(qū)健康成年男子脈搏數(shù)與一般健康成年男子不同。140預防醫(yī)學緒論二、配對資料的t檢驗醫(yī)學科研中配對資料的三種主要類型:同一批受試對象治療前后某些生理、生化指標的比較;同一種樣品,采用兩種不同的方法進行測定,來比較兩種方法有無不同;配對動物試驗,各對動物試驗結果的比較等。配對實驗設計得到的資料稱為配對資料。141預防醫(yī)學緒論

先求出各對子的差值d的均值,若兩種處理的效應無差別,理論上差值d的總體均數(shù)應為0。

所以這類資料的比較可看作是樣本均數(shù)與總體均數(shù)為0的比較。

要求差值的總體分布為正態(tài)分布。

t檢驗的公式為:配對資料的t檢驗(pairedsamplest-test)142預防醫(yī)學緒論例3.7設有12名志愿受試者服用某減肥藥,服藥前和服藥后一個療程各測量一次體重(kg),數(shù)據(jù)如表3-4所示。問此減肥藥是否有效?(1)建立檢驗假設H0:μd=0,即該減肥藥無效;H1:μd≠0,即該減肥藥有效。單側α=0.05143預防醫(yī)學緒論表3-4某減肥藥研究的體重(kg)觀察值144預防醫(yī)學緒論(2)計算t值本例n=12,Σd=-16,Σd2

=710,差值的均數(shù)=Σd/n=-16/12=-1.33(kg)145預防醫(yī)學緒論(3)確定P值,作出推斷結論自由度=n-1=12-1=11,查附表2,t界值表,得單側t0.05,11=2.201,現(xiàn)t=0.58<t0.05,11=2.201,故P>0.05。按α=0.05水準,不拒絕H0,差異無統(tǒng)計學意義。結論:故尚不能認為該減肥藥有減肥效果。146預防醫(yī)學緒論例3.8某單位研究飲食中缺乏維生素E與肝中維生素A含量的關系,將同種屬的大白鼠按性別相同,年齡、體重相近配成8對,并將每對中的兩頭動物隨機分到正常飼料組和維生素E缺乏組,然后定期將大白鼠殺死,測得其肝中維生素A的含量如表3-5。

問不同飼料組的大白鼠肝中維生素A含量有無差別?

(自學內容)147預防醫(yī)學緒論三、兩樣本均數(shù)比較的t檢驗兩本均數(shù)比較的t檢驗亦稱為成組t檢驗,又稱為獨立樣本t檢驗(independentsamplest-test)。適用于比較按完全隨機設計而得到的兩組資料,比較的目的是推斷它們各自所代表的總體均數(shù)和是否相等。148預防醫(yī)學緒論樣本估計值為:總體方差已知:標準誤的計算公式149預防醫(yī)學緒論若n1=n2時:已知S1和S2時:150預防醫(yī)學緒論例3.9測得14名慢性支氣管炎病人與11名健康人的尿中17酮類固醇(mol/24h)排出量如下,試比較兩組人的尿中17酮類固醇的排出量有無不同。原始調查數(shù)據(jù)如下:病人X1:n=14;10.0518.7518.9915.9413.9617.6720.5117.2214.6915.109.428.217.2424.60健康人X2:n=11;17.9530.4610.8822.3812.8923.0113.8919.4015.8326.7217.29151預防醫(yī)學緒論(1)建立檢驗假設

H0:μ1=μ2,即病人與健康人的尿中17酮類固醇的排出量相同H1:μ1≠μ2,即病人與健康人的尿中17酮類固醇的排出量不同α=0.05

152預防醫(yī)學緒論(2)計算t值本例n1=14,ΣX1=212.35,ΣX12=3549.0919

n2=11,ΣX2=210.70,ΣX22=4397.64153預防醫(yī)學緒論(3)確定P值作出推斷結論υ=14+11-2=23,查t界值表,得t0.05,23=2.069,現(xiàn)t=1.8035<t0.05,23=2.069,故P>0.05。按α=0.05水準,不拒絕H0,差異無統(tǒng)計學意義。結論:尚不能認為慢性支氣管炎病人與健康人的尿中17酮類固醇的排出量不同。154預防醫(yī)學緒論四、兩樣本幾何均數(shù)t檢驗比較兩樣本幾何均數(shù)的目的是推斷它們各自代表的總體幾何均數(shù)有無差異。適用于:①觀察值呈等比關系,如血清滴度;②觀察值呈對數(shù)正態(tài)分布,如人體血鉛含量等。。兩樣本幾何均數(shù)比較的t檢驗公式與兩樣本均數(shù)比較的t檢驗公式相同。只需將觀察X用lgX來代替就行了

155預防醫(yī)學緒論例3.10將20名鉤端螺旋體病人的血清隨機分為兩組,分別用標準株和水生株作凝溶試驗,抗體滴度的倒數(shù)(即稀釋度)結果如下。問兩組抗體的平均效價有無差別?標準株(11人):1002004004004004008001600160016003200水生株(9人):1001001002002002002004001600將兩組數(shù)據(jù)分別取對數(shù),記為x1,x2。

x1:2.0002.3012.6022.6022.6022.6022.9033.2043.2043.2043.505x2:2.0002.0002.0002.3012.3012.3012.3012.6023.204156預防醫(yī)學緒論一、兩樣本方差的齊性檢驗用較大的樣本方差S2比較小的樣本方差S2

第七節(jié)兩總體方差的齊性檢驗和t'檢驗υ1為分子自由度,υ2為分母自由度157預防醫(yī)學緒論注意:①方差齊性檢驗本為雙側檢驗,但由于公式(3.18)規(guī)定以較大的方差作分子,F(xiàn)值必然大于1,故附表3單側0.025的界值,實對應雙側檢驗P=0.05;②當樣本含量較大時(如n1和n2均大于50),可不必作方差齊性檢驗。158預防醫(yī)學緒論深層水:n1=8,樣本均數(shù)=1.781(mg/L),S1=1.899(mg/L)表層水:n2=10,樣本均數(shù)=0.247(mg/L),S2=0.210(mg/L)例3.11某研究所為了了解水體中汞含量的垂直變化,對某氯堿廠附近一河流的表層水和深層水作了汞含量的測定,結果如下。試檢驗兩個方差是否齊性。159預防醫(yī)學緒論確定P值作出推斷結論本例υ1=8-1=7,υ2=10-1=9,查附表3,F(xiàn)界值表(方差齊性檢驗用),得F0.05,7,9=4.20,本例F=80.97>F0.05,7,9=4.20;故P<0.05,按α=0.05水準,拒絕H0,接受H1,結論:故可認為兩總體方差不齊。160預防醫(yī)學緒論方差不齊時,兩小樣本均數(shù)的比較,可選用以下方法:①采用適當?shù)淖兞孔儞Q,使達到方差齊的要求;②采用秩和檢驗;③采用近似法t'檢驗。二、t'檢驗161預防醫(yī)學緒論計算統(tǒng)計量t'

162預防醫(yī)學緒論例3.12由例3.11已知表層水和深層水含汞量方差不齊,試比較其均數(shù)有無差別?自學內容163預防醫(yī)學緒論假設檢驗中作出的推斷結論可能發(fā)生兩種錯誤:①拒絕了實際上是成立的H0,這叫Ⅰ型錯誤(typeⅠerror)或第一類錯誤,也稱為α錯誤。②不拒絕實際上是不成立的H0,這叫Ⅱ型錯誤(typeⅡerror)或第二類錯誤,也稱為β錯誤。第八節(jié)Ⅰ型錯誤和Ⅱ型錯誤164預防醫(yī)學緒論表3-6可能發(fā)生的兩類錯誤165預防醫(yī)學緒論166預防醫(yī)學緒論聯(lián)系:一般α增大,則β減??;α減小,則β增大;區(qū)別:(1)一般α為已知,可取單側或雙側,如0.05,或0.01。(2)一般β為未知,只取單側,如取0.1或0.2。1-β(把握度)≮0.75。兩類錯誤的聯(lián)系與區(qū)別167預防醫(yī)學緒論1-β稱為檢驗效能(poweroftest)或把握度,其意義是兩總體確有差別,按α水準能發(fā)現(xiàn)它們有差別的能力。α與β的大小應根據(jù)實際情況適當取值。168預防醫(yī)學緒論1.資料要來自嚴密的抽樣研究設計2.選用假設檢驗的方法應符合其應用條件3.正確理解差別有無顯著性的統(tǒng)計涵義正確理解差別有統(tǒng)計學意義及臨床上的差別的統(tǒng)計學意義。4.假設檢驗的推斷結論不能絕對化5.要根據(jù)資料的性質事先確定采用雙側檢驗或單側檢驗第九節(jié)應用假設檢驗的注意問題169預防醫(yī)學緒論THANKYOUFORLISTENINGTHEEND170預防醫(yī)學緒論醫(yī)學本科生用泰山醫(yī)學院預防醫(yī)學教研室Email:主講程琮醫(yī)學統(tǒng)計學171預防醫(yī)學緒論TeachingPlan

forMedicalStudentsMedicalStatisticsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege172預防醫(yī)學緒論第4章方差分析目錄

第五節(jié)多個方差的齊性檢驗

第二節(jié)單因素方差分析

第三節(jié)雙因素方差分析

第四節(jié)多個樣本均數(shù)間的兩兩比較

第一節(jié)方差分析的基本思想

第六節(jié)變量變換173預防醫(yī)學緒論第四章方差分析學習要求:1。掌握方差分析的基本思想;2。掌握單因素、雙因素方差分析的應用條件、意義及計算方法;3。熟悉多個均數(shù)間兩兩比較的意義及方法;4。了解方差齊性檢驗和t’檢驗的意義及方法;5。熟悉變量變換的意義和方法。174預防醫(yī)學緒論第一節(jié)方差分析的基本思想一、方差分析的用途及應用條件方差分析(analysisofvariance,縮寫為ANOVA)是常用的統(tǒng)計分析方法之一。其應用廣泛,分析效率高,節(jié)省樣本含量。主要用途有:①進行兩個或兩個以上樣本均數(shù)的比較;②可以同時分析一個、兩個或多個因素對試驗結果的作用和影響;③分析多個因素的獨立作用及多個因素之間的交互作用;④進行兩個或多個樣本的方差齊性檢驗等。方差分析對分析數(shù)據(jù)的要求及條件比較嚴格,即要求各樣本為隨機樣本,各樣本來自正態(tài)總體,各樣本所代表的總體方差齊性或相等。175預防醫(yī)學緒論

二、方差分析的基本思想處理因素可分為若干個等級或不同類型,通常稱為水平。在不同的水平下進行若干次試驗并取得多個數(shù)據(jù),可以將在每個水平下取得的這些數(shù)據(jù)看作一個樣本。若某個因素有四個水平,每個水平的數(shù)據(jù)代表一個樣本,則獲得四個樣本的數(shù)據(jù)。

設有k個相互獨立的樣本,分別來自k個正態(tài)總體X1,X2,…Xk,且方差相等,即要求檢驗假設為此假設的意義為,在某處理因素的不同水平下,各樣本的總體均數(shù)相等。

176預防醫(yī)學緒論1。設某因素有多個水平,即試驗數(shù)據(jù)產(chǎn)生多個樣本。由多個樣本的全部數(shù)據(jù)可以計算出總變異,稱為總的離均差平方和。即SS總。2。數(shù)理統(tǒng)計證明,SS總可以由幾個部分構成。單因素方差分析中,SS總由組間變異和組內變異構成。

SS總=SS組間+SS組內。3。組間變異主要受到處理因素和個體誤差兩方面影響,組內變異主要受個體誤差的影響。當H0為真時,由于處理因素不起作用,組間變異只受個體誤差的影響。此時,組間變異與組內變異相差不能太大。177預防醫(yī)學緒論表4-2PCNA在三種不同胃組織中的表達結果標本Xj不同胃組織XiABC156302124637143392027…………∑Xj553221100874(∑X)ni109827(N)均數(shù)55.3024.5612.532.37(總均值)∑Xj2312916273167239236(∑X2)178預防醫(yī)學緒論4。各種變異除以相應的自由度,稱為均方,用MS表示,也就是方差。當H0為真時,組間均方與組內均方相差不大,兩者比值F值約接近于1。即F=組間均方/組內均方≈1。5。當H0不成立時,處理因素產(chǎn)生了作用,使得組間均方增大,此時,F(xiàn)>>1,當大于等于F臨界值時,則P≤0.05??烧J為H0不成立,各樣本均數(shù)不全相等。179預防醫(yī)學緒論三、方差分析的類型1。單因素方差分析(one-wayANOVA)也稱為完全隨機設計(completelyrandomdesign)的方差分析。該設計只能分析一個因素下多個水平對試驗結果的影響。2。雙因素方差分析(two-wayANOVA)稱為隨機區(qū)組設計(randomizedblockdesign)的方差分析。該設計可以分析兩個因素。一個為處理因素,也稱為列因素;一個為區(qū)組因素,也稱為行因素。180預防醫(yī)學緒論3。三因素方差分析也稱為拉丁方設計(Latinsquaredesign)的方差分析。該設計特點是,可以同時分析三個因素對試驗結果的作用,且三個因素之間相互獨立,不能有交互作用。4。析因設計(factorialdesign)的方差分析當兩個因素或多個因素之間存在相互影響或交互作用時,可用該設計來進行分析。該設計不僅可以分析多個因素的獨立作用,也可以分析多個因素間的交互作用,是一種高效率的方差分析方法。181預防醫(yī)學緒論5。正交試驗設計的方差分析如果要分析的因素有三個或三個以上,可進行正交試驗設計(orthogonalexperimentaldesign)的方差分析。當分析因素較多時,試驗次數(shù)會急劇增加,用此設計進行分析則更能體現(xiàn)出其優(yōu)越性。該設計利用正交表來安排各次試驗,以最少的試驗次數(shù),得到更多的分析結果。182預防醫(yī)學緒論四、方差分析的基本步驟1。計算總變異:指所有試驗數(shù)據(jù)的離均差平方和。2。計算各部分變異:單因素方差分析中,可以分出組間變異(SS組間)和組內變異(SS組內);雙因素方差分析中,可以分出處理組變異(SS處理),區(qū)組變異(SS區(qū)組)或稱為配伍組變異(SS配伍)及誤差變異(SS誤差)。

183預防醫(yī)學緒論3。計算各部分變異的均方在方差分析中,方差也稱為均方,是各部分的離均差平方和除以其相應的自由度,用MS表示?;竟綖椋篗S=SS/ν。4。計算統(tǒng)計量F值

F值是指兩個均方之比。一般是用較大的均方除以較小的均方。故F值一般不會小于1。5。確定P值,推斷結論根據(jù)分子ν1,分母ν2,查F界值表(方差分析用),得到F值的臨界值(criticalvalue),即:如果F≥F界值,則P≤0.05,在α=0.05水準上拒絕H0,接受H1??梢哉J為各樣本所代表的總體均數(shù)不全相等。如果想要了解哪兩個樣本均數(shù)之間有差異,可以繼續(xù)進行各樣本均數(shù)的兩兩比較。184預防醫(yī)學緒論第二節(jié)單因素方差分析1。特點單因素方差分析是按照完全隨機設計的原則將處理因素分為若干個不同的水平,每個水平代表一個樣本,只能分析一個因素對試驗結果的影響及作用。其設計簡單,計算方便,應用廣泛,是一種常用的分析方法,但其效率相對較低。該設計中的總變異可以分出兩個部分,即SS總=SS組間+SS組內。2。常用符號及其意義(1)Xij

意義為第i組的第j個數(shù)據(jù)。其中下標i表示列,j表示行。(2)意義為將第i組的全部j個數(shù)據(jù)合計。185預防醫(yī)學緒論(3)將第i組的j個數(shù)據(jù)合計后平方,再將所有各i組的平方值合計。(4)變異來源①SS總:表示變異由處理因素及隨機誤差共同所致;②

SS組間:表示變異來自處理因素的作用或影響;③SS組內:表示變異由個體差異和測量誤差等隨機因素所致。186預防醫(yī)學緒論計算公式187預防醫(yī)學緒論三。計算實例例4.1科研人員研究細胞增殖核抗原(PCNA)在胃癌組織(A組),胃癌旁組織(B組)及正常胃粘膜組織(C組)中的表達狀況。檢測結果用表達指數(shù)來表示。數(shù)據(jù)見表4-2。試分析PCNA在三種胃組織中的表達有無差異。188預防醫(yī)學緒論表4-2PCNA在三種不同胃組織中的表達結果標本Xj不同胃組織XiABC156302124637143392027…………∑Xj553221100874(∑X)ni109827(N)均數(shù)55.3024.5612.532.37(總均值)∑Xj2312916273167239236(∑X2)189預防醫(yī)學緒論檢驗步驟及方法⑴建立檢驗假設H0:PCNA在三種組織中的表達指數(shù)相同,μ1=μ2=μ3;H1:PCNA在三種組織中的表達指數(shù)不全相同。α=0.05,⑵計算檢驗統(tǒng)計量F值由表4-2的數(shù)據(jù)計算有:校正系數(shù)C=(∑X)2/N=(874)2/27=28291.70

SS總=∑X2-C=39236-28291.70=10944.3υ總=N-1=27-1=26190預防醫(yī)學緒論υ組間=k-1=3-1=2SS組內=SS總-SS組間=10944.3-8965.98=1978.32191預防醫(yī)學緒論(3)列方差分析表見表4-3。(4)確定P值根據(jù)α=0.05,υ1=υ組間=2,υ2=υ組內=24,查附表4,F(xiàn)界值表,得F界值:F0.01(2,24)=5.61。本例F=54.39,大于界值F0.01(2,24)=5.61,則P<0.01。(5)推斷結論由于P<0.01,在α=0.05水準上拒絕H0,接受H1,差異有統(tǒng)計學意義??梢哉J為PCNA在三種不同胃組織中的表達指數(shù)不全相同。該結論的意義為,至少有兩種組織的PCNA表達指數(shù)不同。如果想確切了解哪兩個組織的PCNA表達指數(shù)有差異,可進一步作多個樣本均數(shù)的兩兩比較。192預防醫(yī)學緒論表4-3方差分析表變異來源SS自由度均方F值F0.05F0.01P值(1)(2)(3)(4)(5)(6)(7)(8)SS總10944.3026SS組間8965.9824482.9954.393.405.61<0.01SS組內1978.322482.43193預防醫(yī)學緒論第三節(jié)雙因素方差分析一、特點及意義1.特點按照隨機區(qū)組設計的原則來分析兩個因素對試驗結果的影響及作用。其中一個因素稱為處理因素,一般作為列因素;另一個因素稱為區(qū)組因素或配伍組因素,一般作為行因素。兩個因素相互獨立,且無交互影響。雙因素方差分析使用的樣本例數(shù)較少,分析效率高,是一種經(jīng)常使用的分析方法。但雙因素方差分析的設計對選擇受試對象及試驗條件等方面要求較為嚴格,應用該設計方法時要十分注意。該設計方法中,總變異可以分出三個部分:SS總=SS處理+SS區(qū)組+SS誤差194預防醫(yī)學緒論2.常用符號及其意義⑴:將第i個處理組的j個數(shù)據(jù)合計后平方,再將所有i個處理組的平方值合計。⑵:將第j個區(qū)組的i個數(shù)據(jù)合計后平方,再將所有j

個區(qū)組的平方值合計。⑶各種變異來源

SS總:總變異,由處理因素、區(qū)組因素及隨機誤差的綜合作用而形成。

SS處理:各處理組之間的變異,可由處理因素的作用所致。

SS區(qū)組或SS配伍:各區(qū)組之間的變異,可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論