協(xié)和研究生統(tǒng)計總復(fù)習(xí)課件_第1頁
協(xié)和研究生統(tǒng)計總復(fù)習(xí)課件_第2頁
協(xié)和研究生統(tǒng)計總復(fù)習(xí)課件_第3頁
協(xié)和研究生統(tǒng)計總復(fù)習(xí)課件_第4頁
協(xié)和研究生統(tǒng)計總復(fù)習(xí)課件_第5頁
已閱讀5頁,還剩79頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、總 復(fù) 習(xí)薛 芳流行病與統(tǒng)計學(xué)系北京協(xié)和醫(yī)學(xué)院 .基礎(chǔ)學(xué)院basicstat_ , password: 65296408 醫(yī) 學(xué) 統(tǒng) 計 學(xué) 顏 虹 主 編1考試要求閉卷、筆試 獨立完成 150分鐘只允許帶有基本統(tǒng)計功能的計算器。 (請不要攜帶其他書本資料、筆記、電腦等物品)。2考試題型 (20122013第一學(xué)期)一、選擇題(10題,20分)二、填空(10+1 題,28=22+6分)三、案例分析(4題,28分)四、計算題(2題,24分)3統(tǒng)計學(xué)中的幾個基本概念個體、總體與樣本個體:可以是一個人、一個動物、一個家庭、一個地區(qū)、一份樣品等,是基本觀察單位??傮w:是根據(jù)研究目的所確定的、性質(zhì)相同的

2、所有觀察單位的某種變量值的集合。樣本:是從總體中隨機抽取的部分觀察單位的某個變量的測量值所組成的集合。抽樣的目的:是用樣本信息來推斷總體特征,因此要保證樣本的可靠性和代表性,使樣本能夠充分地反映總體的真實情況。4 隨機變量和研究資料的類型定量變量、數(shù)值變量計量資料定量變量是用儀器、工具或其它定量方法進行測定或衡量所取得的數(shù)據(jù)。由一組同質(zhì)的定量變量所組成的資料稱為計量資料;計量資料的各個觀察值之間有量的區(qū)別,沒有性質(zhì)的不同。 順序變量、有序分類變量等級資料順序變量可以體現(xiàn)程度上的不同,但是不能精確地測量相鄰的兩個變量值之間的差別。由同質(zhì)的順序變量組成的資料稱為等級資料。5誤差誤差:是指觀察值(實

3、際值)與真實值(理論值)之差。誤差按其產(chǎn)生的原因和性質(zhì)可分為系統(tǒng)誤差和隨機誤差,不同的誤差應(yīng)采取不同的方法進行處理。系統(tǒng)誤差一般是恒向、恒量的,且有其特定的變化規(guī)律,故可以通過嚴(yán)格、科學(xué)的實驗設(shè)計將其減小或控制在最小范圍之內(nèi)。隨機誤差是排除過失誤差、系統(tǒng)誤差之后尚存在的誤差,它由多種無法控制的因素引起的,大小和方向是隨機變化的。7隨機誤差盡管隨機誤差是不可避免的,但其以零為中心呈正態(tài)分布,所以可以利用概率統(tǒng)計學(xué)的方法對隨機誤差進行估計。隨機誤差包括抽樣誤差和隨機測量誤差兩類。抽樣誤差是在隨機抽樣研究中,由于抽樣而引起的樣本統(tǒng)計量和總體參數(shù)之間的差異。抽樣誤差的大小主要取決于個體之間變異程度的大

4、小和樣本含量的多少,變異程度越大,樣本含量越小,抽樣誤差就越大;反之亦然。8統(tǒng)計工作的基本步驟 研究設(shè)計搜集資料整理資料分析資料10研究設(shè)計研究設(shè)計是對整個研究過程的總體設(shè)想和安排,是統(tǒng)計工作和醫(yī)學(xué)科研工作的基礎(chǔ)。統(tǒng)計設(shè)計可按照在研究過程中是否對研究對象進行干預(yù)分為調(diào)查研究設(shè)計和實驗研究設(shè)計。調(diào)查設(shè)計是指研究者通過客觀地觀察、描述調(diào)查對象來搜集資料,未加任何的干預(yù)措施;實驗設(shè)計是指研究者根據(jù)研究假設(shè)主動地對研究對象加以干預(yù)措施,并觀察總結(jié)其結(jié)果,回答研究假設(shè)所提出的問題。11實驗設(shè)計的分類動物實驗研究:以動物或標(biāo)本(如細(xì)胞、組織等)為研究對象,因此在研究中,研究者可以主動施加干預(yù)措施。臨床試驗

5、:以人為研究對象。多中心、隨機、盲法、平行對照臨床試驗(RCT)社區(qū)干預(yù)試驗:以社區(qū)人群為研究對象,接受某種處理或干預(yù)措施的基本單位是整個社區(qū)或某一人群的亞群。其主要目的是通過干擾某些危險因素或施加某些保護性措施,觀察其對人群產(chǎn)生的預(yù)防效果。12分析資料分析資料統(tǒng)計描述:統(tǒng)計指標(biāo)、統(tǒng)計表、統(tǒng)計圖等方法,對資料的數(shù)量特征及分布規(guī)律進行測定和描述。統(tǒng)計推斷:根據(jù)概率分布和抽樣的原理,在隨機變量的樣本信息基礎(chǔ)上推斷總體特征。統(tǒng)計推斷包括參數(shù)估計和假設(shè)檢驗。14調(diào)查方法簡介普查: 典型調(diào)查:亦稱案例調(diào)查。抽樣調(diào)查:是醫(yī)學(xué)研究中最常用的方法,是通過隨機抽樣方法從總體中隨機抽取一定數(shù)量具代表性的觀察單位組

6、成的樣本進行調(diào)查,然后根據(jù)樣本信息來推斷總體特征。單純隨機抽樣;系統(tǒng)抽樣;整群抽樣;分層抽樣。15常用的抽樣方法系統(tǒng)抽樣(systematic sampling)又稱機械抽樣、等距抽樣,即先將總體的觀察單位按某一順序號分成n個部分,再從第一部分隨機抽取第k號觀察單位,依次用相等間距,從每一部分各抽取一個觀察單位組成樣本。優(yōu)點:易于理解、簡便易行。缺點:總體有周期或增減趨勢時,易產(chǎn)生偏性。17常用的抽樣方法整群抽樣(cluster sampling)總體分群,再隨機抽取幾個群組成樣本,群內(nèi)全部調(diào)查。 優(yōu)點:便于組織、節(jié)省經(jīng)費。 缺點:抽樣誤差大于單純隨機抽樣。18常用的抽樣方法分層抽樣(stra

7、tified sampling)先按對觀察指標(biāo)影響較大的某種特征,將總體分為若干個類別,再從每一層內(nèi)隨機抽取一定數(shù)量的觀察單位,合起來組成樣本。有按比例分配和最優(yōu)分配兩種方案。優(yōu)點:樣本代表性好,抽樣誤差減少。以上四種基本抽樣方法都屬單階段抽樣,實際應(yīng)用中常根據(jù)實際情況將整個抽樣過程分為若干階段來進行,稱為多階段抽樣(multi-stage sampling)。19頻數(shù)分布的特征和類型集中趨勢和離散趨勢是頻數(shù)分布的兩個重要特征,測定其集中趨勢和離散趨勢就可較全面地分析所研究的事物。頻數(shù)分布分對稱分布和偏態(tài)分布。對稱分布是指集中位置在正中,左右兩側(cè)頻數(shù)分布大體對稱,如正態(tài)分布;偏態(tài)分布指集中位置

8、偏向一側(cè),頻數(shù)分布不對稱。20集中趨勢指標(biāo)平均數(shù)是描述頻數(shù)分布集中位置的指標(biāo),它代表一組觀察值的平均水平。均數(shù):描述對稱分布,特別是正態(tài)或近似正態(tài)分布的平均數(shù)量水平。幾何均數(shù):反映等比級數(shù)資料或?qū)?shù)正態(tài)分布資料的平均增(減)倍數(shù)。中位數(shù):常用于反映偏態(tài)分布、分布不明或分布末端無確定值的資料的位次居中的觀察值水平 。21百分位數(shù)百分位數(shù)用于描述樣本或總體觀察值序列在某百分位置水平,多個百分位數(shù)結(jié)合應(yīng)用時,可更全面地描述總體或樣本的分布特征,可用來確定醫(yī)學(xué)參考值范圍。22第四章 正態(tài)分布正態(tài)分布的概念和特征;正態(tài)分布的檢驗標(biāo)準(zhǔn)正態(tài)分布的概念和標(biāo)準(zhǔn)化變換;正態(tài)分布的應(yīng)用:估計頻數(shù)分布;醫(yī)學(xué)參考值范圍

9、。24正態(tài)分布的特征, XN(m,s) 正態(tài)曲線在橫軸上方均數(shù)處最高。標(biāo)準(zhǔn)正態(tài)分布在u=0時,(u)達到最大值。 正態(tài)分布以為中心,左右對稱。 正態(tài)分布有兩個參數(shù),即和。總體均數(shù)是位置參數(shù),用以描述正態(tài)分布的集中位置,當(dāng)恒定后,改變 ,則正態(tài)分布曲線沿x軸平移,其曲線形狀不變, 越大,則曲線沿橫軸越向右移動; 越小,則曲線沿橫軸越向左移動。是變異度參數(shù),用以描述曲線的離散程度,當(dāng) 恒定時,改變 ,則正態(tài)分布曲線的形狀會發(fā)生變化,而曲線的中心位置不變,越大,表示數(shù)據(jù)越分散,曲線越扁平,變異越大;越小,表示數(shù)據(jù)越集中,曲線越陡峭,變異越小。25例3.2 某年某地150名12歲健康男孩體重的均數(shù)36

10、.3,標(biāo)準(zhǔn)差6.19,試估計體重在3040kg 者占該地12歲健康男孩總數(shù)的比例;解:根據(jù)正態(tài)分布的性質(zhì) P(x1Xx2) = P(u1Uu2)= (u2)- (u1) = (0.5977)- (-1.018) = 1- (-0.5977) - (-1.018)=1-0.2743-0.1539=0.5718 即理論上體重在3040kg 者占該地12歲健康男孩總數(shù)的比例是57.18%。27醫(yī)學(xué)參考值范圍參考值范圍是指同質(zhì)總體中大多數(shù)個體變量值的分布范圍。95%參考值范圍指同質(zhì)總體中95%的個體值分布在此范圍內(nèi)。它與標(biāo)準(zhǔn)差有關(guān),各個體值變異越大,該范圍越寬,分布也越分散。正態(tài)近似法是根據(jù)正態(tài)分布曲

11、線下面積分布規(guī)律進行參考值范圍估計的方法,該法得到結(jié)果穩(wěn)定。百分位數(shù)法 當(dāng)資料不能滿足正態(tài)性要求時,可用百分位數(shù)法按照下式估計參考值范圍。28第五、六章 參數(shù)估計、假設(shè)檢驗抽樣誤差、標(biāo)準(zhǔn)誤、可信區(qū)間、假設(shè)檢驗、檢驗效能、單雙側(cè)檢驗、第類錯誤和第類錯誤;標(biāo)準(zhǔn)差與均數(shù)標(biāo)準(zhǔn)誤的區(qū)別、t分布的特征、假設(shè)檢驗與區(qū)間估計的關(guān)系;均數(shù)標(biāo)準(zhǔn)誤的計算、總體均數(shù)的可信區(qū)間及其適用條件;假設(shè)檢驗的基本原理和步驟、t檢驗及應(yīng)用條件;應(yīng)用假設(shè)檢驗需要注意的問題。29均數(shù)的標(biāo)準(zhǔn)誤由于抽樣而造成的樣本均數(shù)和總體均數(shù)之差稱為均數(shù)的抽樣誤差,這是抽樣研究固有的特點。 是樣本均數(shù)的標(biāo)準(zhǔn)差也稱為標(biāo)準(zhǔn)誤,它反映了樣本均數(shù)與總體均數(shù)之

12、間的離散程度,常用以說明均數(shù)抽樣誤差的大小。標(biāo)準(zhǔn)誤的計算公式如下:在實際工作中,總體標(biāo)準(zhǔn)差常是未知的,而是用樣本標(biāo)準(zhǔn)差s來代替, 的估計值記作 。30t分布 t分布也是一種對稱分布,它只有一個參數(shù),即自由度。t 分布與標(biāo)準(zhǔn)正態(tài)分布相比有以下特征: 二者都是單峰分布,以0為中心,左右兩側(cè)對稱。 t分布的峰部較矮而尾部翹得較高,說明遠(yuǎn)側(cè)t 值的個數(shù)相對較多,即尾部面積(概率P)較大。自由度越小這種情況越明顯。 t分布不是一條曲線,而是由一簇隨自由度改變而變化的曲線所組成。當(dāng)逐漸增大時,t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布;當(dāng) = 時,t分布就完全成為標(biāo)準(zhǔn)正態(tài)分布了。31總體均數(shù)的估計 參數(shù)估計是通過樣本指標(biāo)

13、(統(tǒng)計量)來估計總體指標(biāo)(參數(shù))。它包括兩種方法:點(值)估計(point estimation):即把樣本統(tǒng)計量直接作為總體參數(shù)的估計值,如用樣本均數(shù)來估計總體均數(shù)。這種方法雖然很簡單,但是未涉及隨機誤差,而隨機誤差在抽樣研究中是不可忽視的。區(qū)間估計(interval estimation)即按一定的概率估計總體均數(shù)在哪個范圍,它把抽樣誤差引入估計量,確定具有特定概率意義的區(qū)間。32均數(shù)的區(qū)間估計(95%的可信區(qū)間)未知時。一般用t分布的原理作區(qū)間估計。 已知未知,但n足夠大33總體均數(shù)差的可信區(qū)間則兩總體均數(shù)之差的1-可信區(qū)間為:34假設(shè)檢驗的步驟 建立檢驗假設(shè)和確定檢驗水準(zhǔn) 選定檢驗方法

14、和計算檢驗統(tǒng)計量 確定P值和做出推斷結(jié)論 35建立檢驗假設(shè)和確定檢驗水準(zhǔn) 在均數(shù)的比較中,檢驗假設(shè)是針對總體特征而言,包括相互對立的兩個方面,即兩種假設(shè): 一種是無效假設(shè)或稱原假設(shè)、零假設(shè),符號為H0,它是要否定的假設(shè);另一種是備擇假設(shè),記為H1,它是H0的對立面。二者是從反證法的思想提出的,H1和H0是相互聯(lián)系、又相互對立的假設(shè)。檢驗水準(zhǔn)也稱顯著性水準(zhǔn),它指無效假設(shè)H0為真,但被錯誤地拒絕的一個小概率值。 一般取 =0.05。36t 檢驗樣本均數(shù)與總體均數(shù)的比較;配對設(shè)計資料的t檢驗;成組設(shè)計資料的t檢驗。37樣本均數(shù)與總體均數(shù)的比較 樣本均數(shù)與總體均數(shù)的比較的t檢驗,即單樣本t檢驗。比較的

15、目的是推斷樣本所代表的未知總體均數(shù)與已知的總體均數(shù)0有無差別。 首先對所估計的總體提出一個假設(shè),如: 假設(shè)這個總體的平均數(shù)等于某個值0 ,然后通過樣本均數(shù)去推斷這個假設(shè)是否可以接受,如果可以接受,樣本很可能來自這個總體;否則很可能不是來自這個總體。38配對設(shè)計定量資料的t 檢驗配對設(shè)計資料分三種情況:配成對子的同對受試對象分別給予兩種不同的處理,其目的是推斷兩種處理的效果有無差別;同一受試對象分別接受兩種不同處理,其目的是推斷兩種處理的效果有無差別;同一受試對象處理前后的比較,其目的是推斷某種處理有無作用。 配對設(shè)計的t檢驗研究的是差值均數(shù)(樣本均數(shù))與理論上的差值總體均數(shù)的比較。39兩組完全

16、隨機化設(shè)計資料樣本均數(shù)的比較正態(tài)化、總體方差相等兩獨立樣本t檢驗(兩組完全隨機化設(shè)計資料樣本均數(shù)的t檢驗)非正態(tài)化、總體方差不等近似t檢驗或Wilcoxon秩和檢驗40總體方差相等的兩獨立樣本t檢驗當(dāng)兩總體方差相等時,可將兩樣本方差合并為 。41假設(shè)檢驗的兩類錯誤結(jié)論真實情況H0 正確H0 錯誤不拒絕 H0正確II型錯誤拒絕 H0型錯誤正確42檢驗效能1-即指在備擇假設(shè)正確的前提下,拒絕了實際上不成立的H0而做出正確推斷的概率,又稱為檢驗效能。其意義為當(dāng)兩總體確有差別,按規(guī)定的假設(shè)檢驗水準(zhǔn)所能發(fā)現(xiàn)該差別的能力。43第八、十八、二十章 方差分析方差分析的基本思想、不同設(shè)計類型方差分析變異和自由度

17、的分解。完全隨機設(shè)計、隨機區(qū)組設(shè)計方差分析 結(jié)果的解釋, 多重比較結(jié)果的解釋;析因設(shè)計方差分析中交互作用的意義與解釋;重復(fù)測量數(shù)據(jù)的特點與分析;SPSS結(jié)果的解讀。44方差分析(ANOVA ) 方差分析的基本思想:將所有觀察值之間的變異(稱總變異)按設(shè)計和需要分解成幾部分,每一部分變異都反映了研究工作中某種特定的內(nèi)容,通過對平均變異的比較,做出相應(yīng)的統(tǒng)計判斷。 方差分析應(yīng)用條件為:各樣本必須是相互獨立的隨機樣本(獨立性),各樣本均來自正態(tài)總體(正態(tài)性),相互比較的各樣本的總體方差相等(方差齊性)。45方差分析 完全隨機設(shè)計是將隨機抽取的受試對象,隨機地分配到兩個或多個水平(處理)組中,觀察和比

18、較不同處理所產(chǎn)生的效應(yīng)。 總變異=組間變異 + 組內(nèi)變異方差分析也能代替t檢驗進行兩樣本均數(shù)的比較,F(xiàn)=t2。 46方差分析完全隨機設(shè)計的方差分析總變異=組內(nèi)變異 + 組間變異隨機區(qū)組設(shè)計的方差分析總變異=誤差項 + 處理組間+區(qū)組間兩因素析因設(shè)計的方差分析總變異=誤差項 + 交互項 + A因素主效應(yīng) + B因素主效應(yīng)47表5-2 完全隨機設(shè)計方差分析計算公式變異來源離均差平方和 SS自由度v 均方 MSF組 間 (處理組間)k-1SS組間/v組間MS組間/MS組內(nèi)組 內(nèi) (誤差)SS總-SS組間n-kSS組內(nèi)/v組內(nèi)總變異n-148表5-9 隨機區(qū)組設(shè)計方差分析計算公式變異來源離均差平方和

19、SS自由度v 均方 MSF處理組間b-1SS處理/ v處理MS處理/ MS誤差區(qū)組間a-1SS區(qū)組/ v區(qū)組MS區(qū)組/ MS誤差誤差SS總-SS處理-SS區(qū)組 v總-v處理-v區(qū)組SS誤差/ v誤差總變異n-1SSASSBSSESST49變異來源處理組間vMSF 處理組間SS處理 ab1主效應(yīng)ASSA a1 MSAMSA / MS誤差主效應(yīng)BSSB b1 MSBMSB / MS誤差交互效應(yīng) ABSSAB = SS處理- SSA - SSB (a1)(b1) MSABMSAB / MS誤差 試驗誤差SS誤差 = SS總- SS處理 ab(n1) MS誤差 總 變 異SS總 abn1表5-11 析

20、因設(shè)計的方差分析公式 50多個樣本均數(shù)間的多重比較LSD-t檢驗:最小顯著差法容易獲得P1,說明某因素存在與不存在相比之下有優(yōu)勢,即該因素容易導(dǎo)致結(jié)果陽性,或該因素與結(jié)果為陽性有關(guān)聯(lián);OR值1,說明某因素存在與不存在相比之下缺乏優(yōu)勢;優(yōu)勢與優(yōu)勢比一般用于病例-對照研究。55第四章 二項分布、 Poisson分布二項分布、 Poisson分布的基本概念與適用條件;二項分布、 Poisson分布資料分析的參數(shù)區(qū)間估計和假設(shè)檢驗。56二項分布的概率 設(shè)總體中的每一觀察單位具有相互對立的一種結(jié)果,如有效或無效、陰性或陽性、男嬰或女嬰等。已知發(fā)生某一結(jié)果(如陽性)的概率為,此概率對于每一個個體是相同的;

21、其對立結(jié)果(陰性)發(fā)生的概率為1-,各單位的觀察結(jié)果相互獨立。則從該總體中隨機抽取n例,其中恰有X例是某一結(jié)果(陽性)的概率為:X=0,1,2,n。57二項分布的應(yīng)用條件每次試驗只會發(fā)生相互對立的兩種結(jié)果之一,如陽性或陰性,生存或死亡;每次試驗產(chǎn)生某種結(jié)果的概率固定不變,已知發(fā)生某一結(jié)果(如陽性)的概率為,其對立結(jié)果的概率則為1-;重復(fù)試驗是相互獨立的,即每次試驗的觀察結(jié)果不會影響到其它試驗的結(jié)果,也不會受其它試驗的結(jié)果的影響。58二項分布的均數(shù)與標(biāo)準(zhǔn)差若XB(n,),則 X的總體均數(shù) =n X的總體方差 2=n(1-) X的總體標(biāo)準(zhǔn)差 若以率表示樣本率p的總體均數(shù) p=樣本率p的總體方差 樣

22、本率p的總體標(biāo)準(zhǔn)差 當(dāng)總體率未知時,以樣本率p作為的估計值,則p的估計用59總體率的區(qū)間估計正態(tài)近似法:當(dāng)n較大,且np和n(1-p)均大于5時,可利用樣本率p的分布近似正態(tài)分布的原理估計總體率的1-可信區(qū)間。 (P - uSp , P + u Sp) 查表法: n 50P85,例為了解某醫(yī)院剖宮產(chǎn)情況,在該院隨機抽查了106人,其中有62人實施剖宮產(chǎn),試估計該醫(yī)院剖宮產(chǎn)率。60Poisson分布Poisson分布的概率函數(shù) 其中:=n為Poisson分布的總體均數(shù),為總體中每單位中的平均陽性數(shù);X為單位時間或單位空間內(nèi)某事件的發(fā)生數(shù)(陽性數(shù));Poisson分布主要用于研究單位時間 或單位空

23、間內(nèi)某事件的發(fā)生數(shù);Poisson分布是二項分布的極限形式, Poisson分布可看成二項分布的特例; 二項分布中,當(dāng)很小而n很大,n時,二項分布趨于Poisson分布。 k=1, 2, 3 61第九章 2 檢驗2 檢驗的基本思想;完全隨機設(shè)計和配對設(shè)計四格表資料的2 檢驗的步驟及應(yīng)用條件;行列表資料的2 檢驗,及其應(yīng)用中應(yīng)注意的問題;SPSS結(jié)果的解讀。622 檢驗的基本思想實際數(shù)和理論數(shù)差異的大小可以用值的大小來說明。同一總體中隨機抽出的樣本所算得的值分布近似于分布。值的計算公式如下:式中A代表實際頻數(shù),T代表理論頻數(shù)。 =(R-1)(C-1)63四格表資料的2 檢驗當(dāng)n40,且T5時,不

24、需要進行校正。當(dāng) n40, 但有1T5時,需對上述公式進行連續(xù)性校正。當(dāng)n40,或T1時,應(yīng)采用四格表精確概率法。64 配對設(shè)計資料的2檢驗配對設(shè)計的計數(shù)資料特點:對同一樣本的每一對象分別用兩種方法處理,觀察其陽性或陰性結(jié)果,調(diào)查或?qū)嶒炘O(shè)計數(shù)據(jù)等。常用于: 比較兩種處理方法的陽性率的差別等。 檢驗兩種方法的結(jié)果的相關(guān)性。配對計數(shù)資料和前面所講的配對計量資料有共同之處,都是把兩種處理分別施于條件相似的兩個受試對象,或先后施于同一受試對象,逐個記錄其試驗結(jié)果。 65配對設(shè)計資料的2檢驗兩種處理方法的陽性率比較當(dāng)b+c40時 =1當(dāng)b+c40時,其理論分布具有偏性,故須計算校正值。=166屬性變量的

25、關(guān)聯(lián)性分析兩種處理結(jié)果的關(guān)聯(lián)性分析當(dāng)n40,且T5時,不需要進行校正。當(dāng) n40, 但有1T5時,需對上述公式進行連續(xù)性校正。當(dāng)n40,或T50mg”等 );受限少;穩(wěn)健性好。缺點:方法比較粗糙,沒能充分利用數(shù)據(jù)信息,但比較穩(wěn)??;對于符合參數(shù)檢驗條件者,采用非參數(shù)檢驗其檢驗效能較低,不如參數(shù)檢驗方法靈敏;樣本含量較大時,兩者結(jié)論常相同。第十一、十二章 簡單線性回歸和相關(guān)線性回歸與相關(guān)分析的基本概念、統(tǒng)計學(xué)意義與計算;回歸方程、回歸系數(shù)、決定系數(shù)、相關(guān)系數(shù)的假設(shè)檢驗;Spearman秩相關(guān)分析意義與適用范圍;線性回歸與相關(guān)分析中應(yīng)注意的問題;SPSS軟件結(jié)果解釋。73直線回歸分析的一般步驟 1、

26、將 n 個觀察單位的變量對(x,y)在直角坐標(biāo)系中繪制散點圖,若呈直線趨勢,則可擬合直線回歸方程。2、求回歸方程的回歸系數(shù)和截矩3、寫出回歸方程 ,畫出回歸直線4、對回歸方程進行假設(shè)檢驗74 b 為回歸系數(shù)(coefficient of regression) 即直線的斜率。 b0,表示隨x增加,y亦增加; b0,表示隨x增加,y值減少; b=0,表示回歸直線與x軸平行,意為y與x無關(guān)?;貧w系數(shù) b 的統(tǒng)計意義是當(dāng) x 每增(減)一個單位,y平均改變 b 個單位。 稱為Xi取值時,一組yi的平均值,也稱為y的估計值。 b :回歸系數(shù)75回歸系數(shù)的假設(shè)檢驗 H0: 0,即自變量x對因變量y的作用不顯著 H1: 0,即自變量x對因變量y的作用顯著檢驗統(tǒng)計量 注意:對同一資料作一元線性回歸,F(xiàn)檢驗與t檢驗的結(jié)論是一致的,且有 即一元線性回歸中,回歸方程的顯著性檢驗與回歸系數(shù)的顯著性檢驗等價。76樣本決定系數(shù)決定系數(shù)r2 :回歸平方和與總的離差平方和之比,即決定系數(shù)r2是一個回歸直線與樣本觀測值擬合優(yōu)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論