第9章 雙變量回歸與相關(guān)-四 五節(jié)_第1頁
第9章 雙變量回歸與相關(guān)-四 五節(jié)_第2頁
第9章 雙變量回歸與相關(guān)-四 五節(jié)_第3頁
第9章 雙變量回歸與相關(guān)-四 五節(jié)_第4頁
第9章 雙變量回歸與相關(guān)-四 五節(jié)_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第九章 雙變量回歸與相關(guān) 第一節(jié) 直線回歸3 第2、第3、第4章介紹了計(jì)量資料單變量的統(tǒng) 計(jì)描述與統(tǒng)計(jì)推斷:P.11 例2-1:計(jì)算138名成年女子紅細(xì)胞數(shù) 的平均指標(biāo)與變異指標(biāo)。P.39 例3-7:比較阿卡波糖膠囊(試驗(yàn)組)與拜 糖蘋膠囊(對照組)降低糖尿病人的空腹血糖值 有無差別。P.57 例4-2:比較安慰劑組、降血脂新藥2.4g 組、降血脂新藥4.8g組、降血脂新藥7.2g組降 低患者的低密度脂蛋白含量有無差別。4在醫(yī)學(xué)研究中常要分析兩變量間或多變 量間的關(guān)系: 年齡與血壓藥物劑量與動物死亡率 肺活量與身高、體重、胸圍和肩寬等 5事物間的相關(guān)關(guān)系確定性關(guān)系 兩變量間的函數(shù)表達(dá)式 圓的周

2、長與半徑的關(guān)系: C2R 路程與速度、時間的關(guān)系:LST 數(shù)學(xué)中X與Y的直線函數(shù)關(guān)系:Ya+bX 非確定性關(guān)系 兩變量間存在關(guān)系,但未精 確到可以用函數(shù)表達(dá)式來描述。 年齡與血脂的關(guān)系; 身高與體重的關(guān)系; 體重與體表面積的關(guān)系。兩個關(guān)系:互依關(guān)系(伴隨): 應(yīng)變量Y與自變量 X 間的彼此關(guān)系。 相關(guān)分析依存關(guān)系(因果):應(yīng)變量(dependent variable) Y隨自變量(independent variable) X變化而變化。 回歸分析 直線回歸是分析成對觀測數(shù)據(jù)中兩變量間線性依存關(guān)系的方法。目的: 研究應(yīng)變量Y對自變量X的數(shù)量依存關(guān)系。一、直線回歸的概念 例9-1 某地方病研究所

3、調(diào)查了8名正常兒童的尿肌酐含量(mmol/24h),試估計(jì)尿肌酐含量(Y)對其年齡(X)的回歸方程。各散點(diǎn)呈直線趨勢但并非均在一條直線上根據(jù)原始數(shù)據(jù)擬合的直線方程與數(shù)理 上二元一次函數(shù)方程在內(nèi)涵上有區(qū)別, 稱為直線回歸方程。直線回歸方程的一般表達(dá)式為 為各X處Y的總體均數(shù)的估計(jì)1a 為回歸直線在 Y 軸上的截距。a 0,表示直線與縱軸的交點(diǎn)在原點(diǎn)的上方;a 0,則交點(diǎn)在原點(diǎn)的下方;a = 0,則回歸直線通過原點(diǎn)。a = 0a 0XYb0,直線從左下方走向右上方,Y 隨 X 增大而增大; b0b0b=0 求解a、b實(shí)際上就是“合理地”找到一條能最好地代表數(shù)據(jù)點(diǎn)分布趨勢的直線。原則:最小二乘法,即

4、可保證各實(shí)測點(diǎn)至直線的縱向距離(殘差)的平方和最小二、直線回歸方程的求法 例9-1 某地方病研究所調(diào)查了8名正常兒童的尿肌酐含量(mmol/24h),試估計(jì)尿肌酐含量(Y)對其年齡(X)的回歸方程。(一)回歸方程的假設(shè)檢驗(yàn)1.方差分析(1)建立檢驗(yàn)假設(shè)并確定檢驗(yàn)水準(zhǔn) H0:=0 H1: 0 =0.05的分解三、直線回歸中的統(tǒng)計(jì)推斷SS總=SS回+SS殘19因變量Y總變異 的分解X Y Y20 (3)計(jì)算檢驗(yàn)統(tǒng)計(jì)量F值總= 回+ 殘 總=n1, 回=1, 殘=n221SS總=lYY =1.0462 SS回=blXY=l2XY/lXX=5.8452/42=0.8134SS殘= SS總SS回=1.0

5、4620.8134=0.2328F0.01(1,6)=13.742.回歸系數(shù)t檢驗(yàn) 直線回歸中對回歸系數(shù)的t檢驗(yàn)與F檢驗(yàn)是等價。(二) 總體回歸系數(shù)的可信區(qū)間 例9-3 根據(jù)例9-1中所得b=0.1392,估計(jì)其總體回歸系數(shù)的95%可信區(qū)間。H0:=0 不在此區(qū)間之內(nèi),就是此區(qū)間不包括0。這與按照=0.05水準(zhǔn)拒絕H0的推斷結(jié)論是等價的。第二節(jié) 直線相關(guān)一、直線相關(guān)的概念 當(dāng)一個變量增大,另一個也隨之增大(或減少),這種現(xiàn)象稱共變,或相關(guān)。兩個變量有共變現(xiàn)象,稱為有相關(guān)關(guān)系。 相關(guān)關(guān)系不一定是因果關(guān)系。r = 0(h)r 0(f)r-1(d)r1(b)0r1(a)-1r2.160 P50時,計(jì)

6、算U值 一、Spearman秩相關(guān) 例9-8 某省調(diào)查了1995年到1999年當(dāng)?shù)鼐用?8類死因的構(gòu)成以及每種死因?qū)е碌臐撛诠ぷ鲹p失年數(shù)WYPLL的構(gòu)成,結(jié)果見表。以死因構(gòu)成為X,WYPLL構(gòu)成為Y,作等級相關(guān)分析。H0:s=0,即死因構(gòu)成和WYPLL之間無直線相關(guān)關(guān)系H1:s0, =0.05 r0.05,18=0.472, 0.9050.472,P0.05,故可認(rèn)為當(dāng)?shù)鼐用袼酪虻臉?gòu)成和各種死因?qū)е碌臐撛诠ぷ鲹p失年數(shù)WYPLL的構(gòu)成存在正相關(guān)關(guān)系。 對X與Y分別排秩時,若相同秩較多時校正二、相同秩次較多時rs的校正第六節(jié)曲線擬合491.依據(jù)分析目的確定X與Y,根據(jù)兩變量 散點(diǎn)圖、結(jié)合專業(yè)知識選

7、擇曲線類型2.選用適當(dāng)?shù)慕y(tǒng)計(jì)方法求回歸方程: 曲線直線化3.實(shí)際工作中有時結(jié)合散點(diǎn)圖試配幾種不 同形式的曲線方程并計(jì)算擬合優(yōu)度:R2一、曲線擬合的一般步驟CRF:促腎上腺皮質(zhì)激素釋放因子 ACTH:腎上腺皮質(zhì)激素 例9-13 以不同劑量的標(biāo)準(zhǔn)CRF刺激離體培養(yǎng)的大鼠垂體前葉細(xì)胞,監(jiān)測其垂體合成分泌腎上腺激素的量。 例9-13數(shù)據(jù)散點(diǎn)圖CRF(nmol/L) XYACTH(pmol/L) 例9-13數(shù)據(jù)對X作對數(shù)變換散點(diǎn)圖YACTH(pmol/L)lg (X)Y=110.060+36.115lgx曲線方程: Y=110.060+15.685 lnx 例9-14一位醫(yī)院管理人員想建立一個回歸模型,對重傷病人出院后的長期恢復(fù)情況進(jìn)行預(yù)測。 例9-14數(shù)據(jù)散點(diǎn)圖病人住院天數(shù)(天) XY預(yù)后指數(shù)圖9-15 例9

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論