




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、應用應用Stata做做logistic回歸回歸何保昌何保昌 實際生活中經常會遇到因變量只有實際生活中經常會遇到因變量只有0和和1的二分類變量,的二分類變量,不能滿足正態(tài)性和方差齊性,故不能直接使用線性模型不能滿足正態(tài)性和方差齊性,故不能直接使用線性模型來擬合方程。來擬合方程。 Logistic回歸正是處理因變量是二分類或多分類變量的回歸正是處理因變量是二分類或多分類變量的一種方法?,F(xiàn)已廣泛應用于隊列研究,病例對照研究和一種方法?,F(xiàn)已廣泛應用于隊列研究,病例對照研究和試驗性研究,成為分類因變量的首選多變量分析模型。試驗性研究,成為分類因變量的首選多變量分析模型。分類分類 按因變量性質,可分為二分
2、類、無序按因變量性質,可分為二分類、無序多分類、有序多分類。多分類、有序多分類。 按是否匹配可分為非條件和條件按是否匹配可分為非條件和條件logistic回歸?;貧w。 Stata軟件專門有一組命令用于做不同軟件專門有一組命令用于做不同類型的類型的logistic回歸,例如:回歸,例如:logit、blogit、glogit、clogit、mlogit、ologit。1.Logistic 回歸命令:命令:logit 因變量因變量 自變量自變量 ,選擇項選擇項在進行在進行l(wèi)ogistic 回歸時要注意資料的形式。通常,回歸時要注意資料的形式。通常,用于用于logistic 回歸的資料有三種形式:回
3、歸的資料有三種形式:(1) 分水平頻數(shù)資料,一般自變量較少,且均為分分水平頻數(shù)資料,一般自變量較少,且均為分類變量,常以各變量類變量,常以各變量(包括因變量、自變量包括因變量、自變量)各水平各水平的組合的頻數(shù)表形式出現(xiàn)。如例的組合的頻數(shù)表形式出現(xiàn)。如例1。擬合時仍用上述。擬合時仍用上述命令,只是命令中增加命令,只是命令中增加fw=頻數(shù)變量頻數(shù)變量選擇項。選擇項。(2) 分組頻數(shù)資料,一般自變量較少,且均為分組頻數(shù)資料,一般自變量較少,且均為分類變量,常以各自變量分類變量,常以各自變量(不包括因變量不包括因變量)各各水平的組合的頻數(shù)表形式出現(xiàn),因變量常表水平的組合的頻數(shù)表形式出現(xiàn),因變量常表達為
4、分子與分母。如例達為分子與分母。如例2。用下列命令:。用下列命令:blogit 陽性數(shù)變量陽性數(shù)變量 總觀察數(shù)變量總觀察數(shù)變量 ,logit 命命令選擇項令選擇項或或 glogit 陽性數(shù)變量陽性數(shù)變量 總觀察數(shù)變量總觀察數(shù)變量 ,level(#) or(3) 個體水平資料,即一個觀察對象一條記錄。個體水平資料,即一個觀察對象一條記錄。如例如例3,直接使用,直接使用logit 命令估計即可。命令估計即可。擬合模型后可以用指令擬合模型后可以用指令predict 得到預測概率,得到預測概率,然后進行模型診斷、應用等。然后進行模型診斷、應用等。例例1 本例是探討婦女使用雌激素與患本例是探討婦女使用雌
5、激素與患子宮內膜癌之間關系的病例子宮內膜癌之間關系的病例-對照研對照研究資料,見表究資料,見表1,請計算,請計算OR 及其及其95可信區(qū)間。再可信區(qū)間。再用用logistic 回歸估計參數(shù),寫出回回歸估計參數(shù),寫出回歸方程,并說明回歸系數(shù)與歸方程,并說明回歸系數(shù)與OR 的關的關系。系。也可以用也可以用logit命令命令可以利用例可以利用例3做逐步回歸做逐步回歸Stata 用于逐步回歸分析的命令是在要執(zhí)行的用于逐步回歸分析的命令是在要執(zhí)行的命令前增加命令前增加sw 。o sw 回歸命令回歸命令 因變量因變量自變量自變量, 篩選變量篩選變量的的P 值值 選擇項選擇項o 其中,篩選變量的其中,篩選變
6、量的P 值有值有3 種組合種組合o pr(#) /* 后退法后退法o pe(#) /* 向前法向前法o pr(#) pe(#) /* 逐步后退法逐步后退法o pr(#) pe(#) forward /* 逐步向前法逐步向前法 pr(#)是剔除變量的P 值,pe(#)是選入變量的P 值,如果只選pr(#),則表示用后退法,如果同時選用pr(#)和pe(#)表示逐步法。應用時,為防止計算進入死循環(huán),pr(#)須略大于pe(#)。例如,pe(0.05),pr(0.051)。1. 用逐步后退法,剔選變量的概率為:用逐步后退法,剔選變量的概率為:pe(0.05),pr(0.06),結果如,結果如下:下:
7、 sw logit y x1 x2 x3, pe(0.05) pr(0.06)2. 用逐步前進法,剔選變量的概率不用逐步前進法,剔選變量的概率不變變,結果如下:結果如下: sw logit y x1 x2 x3, pr(0.06) pe(0.05) forward條件條件logistic 回歸回歸非條件非條件logistic 回歸適用于平行組設計的病例回歸適用于平行組設計的病例-對對照研究,隊列研究,而不適用于配比設計的病例照研究,隊列研究,而不適用于配比設計的病例-對照研究。對于配比的病例對照研究。對于配比的病例-對照研究資料需要對照研究資料需要用條件用條件logistic 回歸。其命令為:
8、回歸。其命令為:o clogit 因變量因變量 自變量自變量 , group(配比變量配比變量) level(#) or o 其中其中group()是必選項是必選項,它是用來區(qū)分各配比,它是用來區(qū)分各配比組的。組的。level(#)及及or 的意義同的意義同logit。例例4 在子宮內膜癌與使用雌激素關系的研究在子宮內膜癌與使用雌激素關系的研究中,運用了中,運用了1:4 的病例的病例-對照研究,配比因對照研究,配比因素為年齡,共調查了素為年齡,共調查了20 對,對,100 例例。各變量定義如下:各變量定義如下:1: match 配比組配比組2: y y=1:病例,:病例, y=0:對照:對照3
9、: ht ht=0:無高血壓,:無高血壓, ht=1:有高血壓:有高血壓4: est est=0 未使用過雌激素,未使用過雌激素, est=1:使用:使用過雌激素過雌激素5: dose 劑量:劑量:dose=0:未使用過,:未使用過, dose=1:0.1-0.299(mg/day)6: drug drug=0:未使用其他藥物,:未使用其他藥物, drug=1:使用了其他藥物:使用了其他藥物首先,使用首先,使用ht、est、drug 三個變量作條件三個變量作條件logistic 回歸?;貧w。. clogit y ht est drug, group(match)o 結果顯示,患高血壓結果顯示,
10、患高血壓(ht)及使用其他藥物及使用其他藥物(drug)與子宮內膜癌無關,而使用過雌激素與子宮內膜癌無關,而使用過雌激素者患子宮內膜癌的可能性比未使用過雌激素者者患子宮內膜癌的可能性比未使用過雌激素者大。因此,可以進一步考慮劑量大。因此,可以進一步考慮劑量-反應關系。變反應關系。變量劑量量劑量(dose)可以按兩種方法處理,先按線可以按兩種方法處理,先按線性形式進入模型,再以啞變量形式進入模型,性形式進入模型,再以啞變量形式進入模型,并比較兩者的結果。并比較兩者的結果。o clogit y ht dose drug, group(match)o結果顯示,隨著劑量的上升,服用結果顯示,隨著劑量的
11、上升,服用雌激素與患內膜癌間的聯(lián)系也明顯雌激素與患內膜癌間的聯(lián)系也明顯上升,呈現(xiàn)出明顯的劑量反應關上升,呈現(xiàn)出明顯的劑量反應關系。這種關系是否為線性的?系。這種關系是否為線性的?dose 用啞變量形式是否更好?用啞變量形式是否更好?oxi : clogit y ht i.dose drug, group(match)多類結果的多類結果的logistic回歸回歸在醫(yī)學研究中,常常會遇到結果變在醫(yī)學研究中,常常會遇到結果變量是多分類的情況,如同一種腫量是多分類的情況,如同一種腫瘤的不同亞型;病例瘤的不同亞型;病例-對照研究對照研究中的一個對照組,兩個或多個病中的一個對照組,兩個或多個病例組;或一個
12、病例組,兩個或多例組;或一個病例組,兩個或多個對照組,如醫(yī)院對照和健康人個對照組,如醫(yī)院對照和健康人群對照等。群對照等。用于多類結果的用于多類結果的logistic 回歸的命回歸的命令是令是mlogit。mlogit 因變量因變量 自變量自變量 , base (#) constraints(clist) level(#) rrr 例例5 產后大出血分為兩大類:即宮縮乏力性產后大出血分為兩大類:即宮縮乏力性(稱為子宮因素稱為子宮因素)及胎盤因素。在產后大出血及胎盤因素。在產后大出血與有無妊高癥與有無妊高癥x1及有無人流史及有無人流史x2的關系研的關系研究中,將產后出血量究中,將產后出血量400m
13、l的作為病例,并分的作為病例,并分為上述兩類,共調查了為上述兩類,共調查了933人,其中子宮因人,其中子宮因素出血的素出血的155人,胎盤因素出血的人,胎盤因素出血的33人,人,對照對照745人。結果見表人。結果見表5。本例,結果變量為:本例,結果變量為:y=0 為對照為對照(C類類)y=1 為宮縮乏力性產后大出血為宮縮乏力性產后大出血(A類類)y=2 為胎盤因素產后大出血為胎盤因素產后大出血(B類類)。mlogit y x1 x2 fw=count, rrr同一變量在不同的同一變量在不同的logit函數(shù)中的效應可函數(shù)中的效應可能相同,亦可能不同,這可以通過能相同,亦可能不同,這可以通過test命命令來檢驗。令來檢驗。test 1x1=2x1test 1x2=2x2有序結果的累積比數(shù)有序結果的累積比數(shù)logistic回歸回歸用于有序結果的用于有序結果的logistic 回歸的命令是回歸的命令是ologit。ologit 因變量因變量 自變量自變量 ,table level(#)o其中選擇項其中選擇項table用于指定打印出各類用于指定打印出各類的概率;的概率;level用于指定顯著性水平用于指定顯著性水平例例6 南通醫(yī)學院陳佩珍教授研究了兒童智商南通醫(yī)學院陳佩珍教授研究了兒童智商等級與其母親文化程度的關系
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 商業(yè)智慧教育美妝品牌的市場策略與方向
- 醫(yī)療科技的創(chuàng)新之路基于設計思維的實踐與探索
- 全球教育趨勢與國際化發(fā)展戰(zhàn)略規(guī)劃
- 從學生心理角度看教育改革與發(fā)展趨勢
- 商業(yè)培訓中的互動游戲化教學策略研究
- 抖音商戶直播樣品簽收確認制度
- 抖音商戶直播停留時長優(yōu)化方案執(zhí)行制度
- 公交優(yōu)先戰(zhàn)略下2025年城市交通擁堵治理的智能交通設施布局分析報告
- CDK9-IN-38-生命科學試劑-MCE
- 浙江省溫州市各學校2025屆化學九年級第一學期期末檢測試題含解析
- 2025年云南省時事政治考試試卷帶解析附完整答案(考點梳理)
- 車子刮擦協(xié)議書
- 詩歌鑒賞|蘇軾《鶴嘆》注釋+賞析+試題
- JT-T 329-2025 公路橋梁預應力鋼絞線用錨具、夾具和連接器
- 2024年質量工程師備考常見問答試題及答案
- 2025-2030全球及中國管道運輸服務行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 安慶市桐城經開區(qū)建設投資集團有限公司招聘筆試題庫2025
- JJF 2244-2025公共機構重點用能單位能源資源計量審查規(guī)范
- 警犬基地人員管理制度
- 2025年甘肅省建筑安全員B證(項目經理)考試題庫
- ICU感控管理分析報告
評論
0/150
提交評論