



下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、王笑(孝)權安徽省五河縣臨北鄉(xiāng)石家村衛(wèi)生室 主成分分析又稱主分量、主軸分析,實質就是對較多的變量在盡量保存原信息的情況下加以線性概括。在此過程前, 為消除變量量綱不同造成的影響, 首先要對各原始指標進行標準化處理。 迄今為止, 所見教材的主成分分析”實質都是用求得主成分再對原始變量的回歸分析。教材的通病都是未詳細說明最后的回歸過程,往往令初學者感覺到莫名其妙。目前,由網上的一些所謂的主成分分析”可知,或者其資料不適用主成分分析,還有根本就不是主成分分析。有鑒于此,現利用網上獲得的數據,進行主成分分析的探討。1 資料與方法1.1 資料來源資料來源于中華人民共和國衛(wèi)生部網站1,我國“2006 年工
2、業(yè)部門職業(yè)病發(fā)病及死亡情況”,剔除其中的第 1、2、14 號無意義指標,以及末尾的觀測其它”,剩余 11 個指標,觀測值有缺失則用 0 補齊。程序分別賦這些指標為 x1-x11,其名稱標簽見附件 1;余詳見數據 1。數據 12006 年工業(yè)部門職業(yè)病發(fā)病及死亡情況相關數據namex1x2x3x4x5x 6x7x8x9x10 x11煤炭45672124103401301570石油2410140010140電力110110281 011161核工業(yè)冶金049406504002015900000305324110有色金屬3331193133412013884451900110293375023811
3、電子701431200 0511330兵器70402200011360船舶180101100020化工10321053622089170244醫(yī)藥5080150119810鐵道646202101041交通6116014306680建材698176051 0103200建設地質礦產126253123381103405001230010水利農業(yè)森林工業(yè)223217002000100000022500011001010000輕工1891610132941012324213紡織航空航天20121200012011140052360410商業(yè)110200312020郵電石化工業(yè)回收加工業(yè)29001101
4、52002060000010000012000001.2 方法將數據1 倒入 SAS9.1 邏輯庫sasuser 后調用,程序默認對原始數據標準化后進行主成分分析。根據觀察的需要對初步運行后的輸出數據編程帶入,以了解更多內容(見附件 1)。2 結果輸出結果表明:各個主成分貢獻率沒有出奇的大,本資料適用于主成分分析;且前 4 個主成分累計貢獻率達到 0.8112,每個的特征值都1,符合一般主成分個數選取標準,可以選取 4 個主成分,見輸出 1。輸出 1 相關矩陣的前 5 個特征值、貢獻率EigenvaluesoftheCorrelationMatrixEigenvalueDifferencePr
5、oportionCumulative14.061904931.526008420.36930.369322.535896521.220978090.23050.599831.314918430.303976160.11950.719341.010942260.298151440.09190.81123 討論各主成分與標準化變量的相關系數說明了主成分被這些指標影響的強度,由 rz1x 可見:各標準化指標與 z1 均成正相關,由于主成分 1 受 x2-x5、x7、x10 支配可以理解 z1 是產生急性、嚴重職業(yè)病的綜合指標,可能是毒性強,、濃度高的有害物質迅速導致工作人員發(fā)病、呼吸道損害、中毒乃至
6、死亡;z2 其實與 z1 是對立性綜合指標,反映低濃度生產、生活環(huán)境下的慢性損害,x1 支配 rz2x 表明隨著環(huán)境有毒物質濃度降低,呼吸道損害下降,但是這種相對較好一點的有毒環(huán)境仍然避免不掉會損害人的皮膚、眼睛等防護薄弱地方;x6 與 x7 各自單獨支配主成分 z3(見 rz3x)、z4(見 rz4x),它們表達的是與 z1、z2 完全不同的信息,z3 不是環(huán)境毒害物質造成的,實際是長期暴露在某種場合,防護不當的后果;z4 是環(huán)境有害因素慢性長期作用人體,損害人體的免疫系統(tǒng)、導致免疫監(jiān)視混亂,喪失殺死、清除機體內的異變細胞功能。標準化變量與主成分的詳細關系見輸出 2。輸出 2 主成分與準化指
7、標的相關系數namerz1xrz2xrz3xrz4xx10.59571-0.71288-0.285740.03795x20.66688-0.65136-0.16550-0.13085x30.884860.38006-0.018180.09209x40.440390.405630.29572-0.25224x50.767080.215930.36782-0.19094x60.311940.008830.721940.43830 x70.64136-0.462500.212090.33249x80.505340.68292-0.254760.28210 x90.304900.60786-0.532
8、430.33055x100.75893-0.29938-0.26026 -0.04144x110.513840.329150.02268-0.62498在實際工作中,要用每個主成分對全部原始變量回歸建立起主成分回歸方程,使分析有意義。用回歸方程中的系數、截距對應各自的自變量(原始變量)編程帶入 SAS 運行,即能觀察各部門職業(yè)病的符合情況, 又可對新樣品的主成分歸屬進行判讀。 事實上該過程并不需要研究者額外費心, 因為這個過程就是 SAS程序自動輸出的主成分得分(輸出 3)而已。由于各主成分包含職業(yè)病的屬性不同,觀測受某主成分的支配量最大時,那么相應工業(yè)部門工作人員職業(yè)病病種,特征信息就包含在
9、該主成分中。各觀測主成分得分及分類見輸出 3。輸出 3 根據主成分得分對觀測的判別歸類Obsnamez1z2z3z4g1煤炭4.80628-5.73054 -2.002430.6828322石油-1.12318-0.36420-0.25621-0.1573113電力-0.83878-0.28533-0.11621-0.3654214核工業(yè)-1.50940-0.25718-0.14052-0.0985915冶金2.612730.721070.19429-3.8380246有色金屬3.17963-0.813741.37801-0.5665017機械1.641830.55132-0.501730.3
10、755918電子0.391291.720520.076080.0539329兵器-0.812330.90634-1.458370.81899310船舶-1.47388-0.243140.00184-0.00501111化工3.650424.82568-2.592391.40049212醫(yī)藥-0.985830.26187-0.305470.32627113鐵道-1.22241-0.21814-0.05596-0.28756114交通-1.00402-0.084990.077750.27589115建材-0.47419-0.64732-0.624670.10248316建設0.122651.185
11、781.23910-1.02345317地質礦產-1.42439-0.33828-0.17242-0.08197118水利-1.45709-0.37322-0.15203-0.13854119農業(yè)-0.36656-0.610113.003822.38548320森林工業(yè)-1.45231-0.26919-0.068500.03247121輕工4.771121.108262.749000.68439122紡織-0.17623-0.42846-0.44198-0.19643323航空航天-1.41781-0.15992-0.20594-0.03345124商業(yè)-1.28329-0.273410.29
12、0080.30555125郵電-1.44519-0.078120.03885-0.22250126石化工業(yè)-1.39624-0.17381-0.13145-0.07545127回收加工業(yè)-1.312820.068260.17745-0.354171主成分分析是其它分析前對數據的預處理過程,例如因子分析、對應分析、判別、聚類、秩和比、回歸等。一般的主成分分析實際是主成分回歸分析,并最終通過建立的回歸方程完成新樣品判別分析。由此可幫助人們認識不同工業(yè)部門的職業(yè)病風險情況,有針對的采取防護措施,減少或延緩職業(yè)病的發(fā)生、發(fā)展。1 中華人民共和國衛(wèi)生部網站.2006 年工業(yè)部門職業(yè)病發(fā)病及死亡情況,ht
13、tp:/ 1:有關分析程序procstandarddata=sasuser.wxq163out=wmean=0std=1;/*調用邏輯庫數據*/varx1-x11;procprincompdata=sasuser.wxq163prefix=zout=wx;/*主成份分析*/varx1-x11;procprintdata=wx;datarx;setsasuser.wxq16;r1=z1*sqrt(e1);r2=z2*sqrt(e2);r3=z3*sqrt(e3);r4=z4*sqrt(e4);procprintdata=rx;varr1-r4;/*各主成分于標準化變量相關系數*/datawxq1638;mergewx(keep=z1-z4)sasuser.wxq163;a1=abs(round(z1,0.1);a2=abs(round(z2,0.1);a3=abs(round(z3,0.1);a4=abs(round(z4,0.1);maxa=MAX(OFa1-a4);ifa1=maxatheng=1;ifa2=maxatheng=2;ifa3=maxatheng=3;ifa4=maxatheng=4;/*利用主成分得分對觀測判斷分組*/keepx1-x11z1-z4g;procprintdata=wxq1638;procregdata=wxq1638;la
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 風險管理流程中的關鍵點試題及答案
- 行政法學學習方法探討試題及答案
- 公路工程技術員年度總結(5篇)
- 2025年全球視野下的公司戰(zhàn)略試題及答案
- 2025年計算機二級VB考試的重點回顧及試題及答案
- 安全應急裝備行業(yè)發(fā)展動態(tài)與未來市場潛力分析
- VB語言應用場景試題及答案分析
- 2025年零售企業(yè)數字化供應鏈協(xié)同與物流配送優(yōu)化報告
- 法學概論考試的重要實踐環(huán)節(jié)與試題及答案
- 2025年軟件設計師考試心理準備策略試題及答案
- MOOC 音樂導聆-山東大學 中國大學慕課答案
- 保安定期開展心理健康培訓
- 農行超級柜臺業(yè)務知識考試題庫(含答案)
- 免疫治療免疫相關不良反應的處理PowerPoint-演示文稿
- 研究生英語翻譯答案
- GB 15607-2023涂裝作業(yè)安全規(guī)程粉末靜電噴涂工藝安全
- 手表買賣合同協(xié)議書
- 2023門面裝修合同范本
- DB34-T 4170-2022 軟闊立木材積表
- 汽車租賃有限公司車隊及車輛管理制度
- 2022公務員錄用體檢操作手冊(試行)
評論
0/150
提交評論