




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第十四章直線回歸與直線相關單變量的統(tǒng)計分析方法------統(tǒng)計描述與同一變量的不同處理組間的比較。多變量的統(tǒng)計分析方法----多個變量之間的數(shù)量依存關系及關聯(lián)度的研究線性相關線性相關的概念及統(tǒng)計描述例隨機抽取15名健康成人,測定血液的凝血酶濃度及凝固時間,數(shù)據(jù)見表11-1。試判斷此數(shù)據(jù)是否相關?表11-115例健康成人凝血時間與凝血酶濃度測量值記錄受試者號123456789101112131415濃度1.11.21.00.91.21.10.90.61.00.91.10.91.110.7時間141315151314161714161516141517
圖1
數(shù)據(jù)散點圖從散點圖中可以看出:圖中散點雖不都在一條直線上,但它們有一種線性趨勢存在,即凝血酶濃度高的,凝血時間短;凝血酶濃度低的,凝血時間長,說明凝血酶濃度與凝血時間之間確實存在聯(lián)系且方向相反。兩變量的關系不象函數(shù)關系那樣能以一個變量的數(shù)值精確地確定出另一個變量的數(shù)值,即為非確定性關系若圖中各散點趨勢接近一直線,且變化方向相同,稱為正相關;若圖中各散點趨勢接近一直線,且變化方向相反,稱為負相關;若圖中散點的趨勢不呈直線,但有規(guī)律地呈一條曲線,稱為非線性相關;若圖中散點雜亂無序,稱為零相關。
直線相關的概念研究兩個連續(xù)型隨機變量之間是否存在線性關系,關系是否密切以及是正相關還是負相關.
直線相關系數(shù)又稱pearson積差相關系數(shù),以r表示樣本相關系數(shù),以ρ表示總體相關系數(shù).它反映兩個變量線性關系的方向和密切程度的指標,沒有單位,其值為-1≤r≤1.
計算公式上式中,若為總體協(xié)方差或總體方差時,相關系數(shù)為總體相關系數(shù),記為ρρ≠0,X和Y線性相關ρ=0,X和Y線性不相關上式中,若為樣本協(xié)方差或樣本方差時,相關系數(shù)為樣本相關系數(shù),記為r相關系數(shù)的特點1)是無量綱的數(shù)值,且-1<r<12)r>0為正相關,r<0為負相關3)|r|越接近于1,說明相關性越強,|r|越接近于0,說明相關性越弱相關系數(shù)的方向r>0,說明兩變量之間為正相關關系,r=1,完全正相關r<0,說明兩變量之間為負相關關系,r=-1,完全負相關r=0,說明兩變量之間無線性關系(零相關)應用條件
Pearson積矩相關系數(shù)要求兩變量均服從正態(tài)分布,若不服從,則求相關系數(shù)為spearman相關系數(shù)
相關系數(shù)的計算作散點圖計算相關系數(shù)相關系數(shù)的統(tǒng)計推斷----相關系數(shù)的假設檢驗
(1)T檢驗例就上述r值,檢驗凝血時間與凝血酶濃度是否有直線相關關系.(2)查表法求出r后,根據(jù)ν=n-2查相關系數(shù)界值表相關分析應用中的注意事項相關分析要有實際意義;相關關系不一定都是“因果”關系;相關系數(shù)r假設檢驗中p的大小不能說明相關的密切程度;出現(xiàn)異常值時慎用相關分層資料盲目合并易出現(xiàn)假象直線相關和等級相關有各自不同的適用條件。秩相關秩相關的概念及統(tǒng)計描述研究兩個不滿足正態(tài)分布條件的連續(xù)型隨機變量之間是否存在相關關系,關系是否密切以及是正相關還是負相關.秩相關系數(shù)又稱spearman相關系數(shù),以
表示樣本相關系數(shù),以
表示總體相關系數(shù).它反映兩個變量相關關系的方向和密切程度的指標,沒有單位,其值為-1≤r≤1.分別為x和y的秩次例某地研究2-7歲急性白血病患兒的血小板數(shù)與出血癥狀程度之間的相關性,結果見表.試用秩相關進行分析。病人編號血小板數(shù)秩次p秩次平方出血癥狀秩次q秩次平方pq12345678910111212113816531042654074010601260129014382004123456789101112149162536496481100121144++++++-++++----+++-1159.07.03.59.09.03.53.53.53.511..53.5132.25814912.25818112.2512.2512.2512.25132.2512.2511.5182114455424.52831.535126.542合計7865078630451表1急性白血病患兒的血小板和出血癥狀步驟:1)將變量X,Y成對的觀察值分別從小到大排序編秩,以pi表示Xi的秩次,以qi表示Yi的秩次,觀察值相同時取平均秩次,見表12)用pi,qi的值分別作為Xi,Yi的值代入pearson相關系數(shù)的計算公式中秩相關系數(shù)的統(tǒng)計推斷----秩相關系數(shù)的假設檢驗
(1)T檢驗(2)查表法直線回歸
直線回歸的概念很早以前,英國遺傳學家FrancisGalton與其弟子K.pearson和A.Lee注意到一個有趣現(xiàn)象,即父親高,兒子也高,父親矮,兒子也矮,但兒子離平均水平更近些,即子代身高向均數(shù)回歸.回歸分析的類型因變量為非時間的連續(xù)型變量(一元線性回歸分析,多項式回歸分析,非線性回歸分析,可直線化的曲線回歸分析)因變量為時間的連續(xù)型變量(COX回歸分析)因變量為隨時間變化的連續(xù)型變量(時間序列分析)因變量為二值離散型變量(logistic回歸分析或對數(shù)線性模型分析)因變量為多值有序離散型變量(logistic回歸分析)因變量為多值名義離散型變量(logistic回歸分析或logit模型回歸分析,對數(shù)線性模型分析)例1在腦血管疾病的診斷治療中,腦脊液白細胞介素-6水平是影響診斷與預后分析的一項重要指標,但腦脊液在臨床上又不容易采集到。某醫(yī)生欲了解急性腦血管疾病人血清與腦脊液IL-6水平,隨機抽取了某醫(yī)院確診的10例蛛網(wǎng)膜下腔出血(SAH)患者24小時內(nèi)血清IL-6和腦脊液IL-6數(shù)據(jù)如下。假說SAH血清IL-6和腦脊液IL-6間有直線相關關系,試如何用血清IL-6來估計和預測腦脊液IL-6?表12-1SAH患者第一天血清和腦脊液IL-6檢測結果患者號12345678910血清(x)腦脊液(y)22.4134.051.6167.058.1132.325.180.265.9100.079.7139.175.3187.232.497.296.4192.385.7199.4圖1SAH患者血清和腦脊液IL-6散點圖圖2函數(shù)關系圖例2隨機抽取15名健康成人,測定血液的凝血酶濃度及凝固時間,數(shù)據(jù)見表11-1。試判斷此數(shù)據(jù)是否呈直線相關關系?表12-215例健康成人凝血時間與凝血酶濃度測量值記錄受試者號123456789101112131415濃度1.11.21.00.91.21.10.90.61.00.91.10.91.110.7時間141315151314161714161516141517圖3凝血酶濃度與凝血時間的散點分布從散點圖中可以看出:圖中散點雖不都在一條直線上,但它們有一種線性趨勢存在,即隨著血清IL-6的增加,腦脊液IL-6也在增加;隨著凝血濃度的增加,凝血時間在減少。它與數(shù)學中兩變量間嚴格對應的函數(shù)關系不同,但它同樣可以描述兩變量之間數(shù)量依存關系,該直線稱為回歸直線。用回歸直線來描述兩變量之間的直線關系的方法稱為直線回歸。直線回歸方程的表達式X為自變量的取值,為X取某一值時應變量Y的平均估計值,稱為Y的預測值a-------截距。a>0說明直線與Y軸的交點在原點的上方,a<0說明直線與Y軸的交點在原點的下方,a=0,則直線過原點。b的統(tǒng)計學意義:X每增加(或減少)一個單位,應變量Y平均改變b個單位。
b-----回歸系數(shù)(即直線的斜率)。b>0表示Y隨X的增大而增大,b<0表示Y隨X的增大而減小,b=0表示直線與X軸平行,即X與Y沒有直線關系。直線回歸方程的求法最小二乘法則保證各實測點至回歸直線的縱向距離平方和為最小.例3對例1中的數(shù)據(jù)求出其直線回歸方程(1)繪制數(shù)據(jù)的散點圖。見圖1。從圖中可以看出數(shù)據(jù)之間存在著直線變化的趨勢。(2)計算回歸系數(shù)與截距(3)寫出回歸直線方程b=1.18>0,表明SAH患者腦脊液IL-6隨血清IL-6增加而增加,且血清IL-6每增加1pg/ml時,腦脊液平均增加1.181pg/ml。總體回歸系數(shù)的統(tǒng)計推斷總體回歸系數(shù)的區(qū)間估計總體回歸系數(shù)β的1-α的置信區(qū)間為例求上例中回歸系數(shù)β的95%置信區(qū)間回歸系數(shù)β的95%置信區(qū)間為(1.180-2.306×0.398,1.180+2.306×0.398)=(0.262,2.098總體回歸系數(shù)的假設檢驗目的判斷b是否從回歸系數(shù)為零(β=0)的總體中隨機抽樣得來的.方法(1)t檢驗
例對上例中的回歸系數(shù)進行假設檢驗(2)方差分析應變量y的離均差平方和回歸平方和,即在y的總變異中可用x與y的線性關系解釋的那部分變異殘差平方和,即扣除了x對y的線性影響后,其它所有因素對y變異的影響P(x,y)應變量平方和分解圖例用方差分析對上述回歸方程進行假設檢驗回歸模型的假設條件1)反應變量Y與自變量X之間呈直線變化的趨勢,作散點圖觀察2)因變量Y服從正態(tài)分布或殘差服從正態(tài)分布的隨機變量,X可為隨機或非隨機的變量3)任意兩個觀察值之間是相互獨立的4)在自變量X的取值范圍內(nèi),不論X取何值,Y均有相同的方差直線回歸方程的圖示
在自變量X的實測范圍內(nèi)任取兩個值,代入回歸方程算出對應的,根據(jù)兩點成一直線就可以畫出該直線的圖形。說明:所繪直線經(jīng)過點;該直線與縱軸交點的坐標必等于截距a.此兩點可以檢驗圖形的繪制是否正確。直線回歸方程的應用描述兩變量的數(shù)量依存關系利用回歸方程進行預測
所謂預測就是把預報因子(自變量X)代入回歸方程對預報量進行估計,其波動范圍按求個體Y值的容許區(qū)間方法來計算。利用回歸方程進行統(tǒng)計控制
統(tǒng)計控制時利用回歸方程進行逆估計,如要求應變量Y在一定范圍內(nèi)波動,可以通過自變量X的取值來實現(xiàn)。個體y值的容許區(qū)間當X取某一定值時,個體Y有一波動范圍,其標準差為個體y值的100(1-α)容許區(qū)間為殘差的標準誤,剩余標準誤如:為使一名糖尿病人的血糖維持在正常范圍(4.44,6.66),如何控制血中胰島素水平?已知有胰島素估計血糖平均水平的直線回歸方程為欲將血糖水平控制在正常范圍的上界即6.66以內(nèi)時,血中胰島素應維持在什么水平?即將一名血糖病人的血糖水平控制在6.66以內(nèi),胰島素可維持在32.64U/L上殘差分析殘差(residual)是指觀察值Yi與回歸模型擬合值之差,即為它反映模型與數(shù)據(jù)擬合優(yōu)劣的信息。非線性回歸通過自變量的變換化為線性回歸通過因變量的變換化為線性回歸例9.14以不同劑量的標準促進腎上腺皮質(zhì)激素釋放因子CRF刺激離體培養(yǎng)的大鼠垂體前葉細胞,監(jiān)測其垂體合成分泌腎上腺皮質(zhì)激素ACTH的量。根據(jù)表中數(shù)據(jù)的量建立CRF-ACTH工作曲線。例一位醫(yī)院管理人員想建立一個回歸模型,對重傷病人出院后的長期恢復情況進行預測。自變量為病人住院天數(shù)X,因變量為病人出院后長期恢復后的預后指數(shù)Y,指數(shù)取值愈大表示預后結果越好。數(shù)據(jù)見下表。編號123456789101112131415住院天數(shù)X預后指數(shù)Y2545507451037143519252620311634183813458521153860465615名重傷病人的住院天數(shù)與預后指數(shù)直線相關與直線回歸的聯(lián)系和區(qū)別
區(qū)別資料的要
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年計算機:IT.程序員職業(yè)技能資格知識考試題與答案
- 主題婚禮策劃與流程
- 全科醫(yī)學轉崗培訓課件
- 宣傳信息工作培訓
- 個人能力培訓教程課件
- 物業(yè)安全人員崗前培訓
- 園林景觀設計與施工培訓課件
- 車輛維修報賬合同協(xié)議
- 《金融投資機構介紹》課件
- 《臨床診斷膽石癥現(xiàn)象》課件
- 附件6工貿(mào)高風險企業(yè)高危領域較大以上安全風險管控清單
- 國際貿(mào)易公司后勤管理崗位職責
- 中國礦業(yè)大學專職輔導員招聘真題2024
- 骨科手術切口感染的預防與控制
- 2025年保安證考試答題技巧與試題答案
- 透析營養(yǎng)不良相關知識
- 中級宏觀經(jīng)濟學知到課后答案智慧樹章節(jié)測試答案2025年春浙江大學
- 2025 ACC-AHA急性冠脈綜合征患者管理指南解讀課件
- 智慧樹知到《形勢與政策(北京大學)》2025春期末答案
- 綠化工程施工專項施工方案
- 甘肅省歷年中考語文古詩欣賞試題匯編(2003-2023)
評論
0/150
提交評論