




已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
如何選擇數據分析方法?,吳喜之,2,數據和目的相結合的出發(fā)點,1.相關分析及回歸類模型(相關、簡單的回歸、Logistic回歸、對數線性模型、方差分析和一般線性模型)2.經典多元分析內容(主成分分析、因子分析、聚類分析、判別分析、對應分析),3,主要涉及的相關問題,什么是相關?列聯(lián)表中定性變量的相關(Fisher但列聯(lián)表也會帶有定量變量作為協(xié)變量。,14,二維列聯(lián)表的檢驗,研究列聯(lián)表的一個主要目的是看這些變量是否相關。比如前面例子中的收入和觀點是否相關。這需要形式上的檢驗,15,二維列聯(lián)表的檢驗,對于上面那樣的二維表。我們檢驗的零假設和備選假設為H0:觀點和收入這兩個變量不相關;H1:這兩個變量相關。這里的檢驗統(tǒng)計量在零假設下有(大樣本時)近似的c2分布。當該統(tǒng)計量很大時或p-值很小時,就可以拒絕零假設,認為兩個變量相關。實際上有不止一個c2檢驗統(tǒng)計量。包括Pearsonc2統(tǒng)計量和似然比(likelihoodratio)c2統(tǒng)計量;它們都有漸近的c2分布。根據計算可以得到(對于這兩個統(tǒng)計量均有)p-值小于0.001。因此可以說,收入高低的確影響觀點。,16,Pearsonc2統(tǒng)計量,似然比c2統(tǒng)計量,Oi代表第i個格子的計數,Ei代表按照零假設(行列無關)對第i格子的計數的期望值,17,二維列聯(lián)表的檢驗,剛才說,這些c2統(tǒng)計量是近似的,那么有沒有精確的統(tǒng)計量呢?當然有。這個檢驗稱為Fisher精確檢驗;它不是c2分布,而是超幾何分布。對本問題,計算Fisher統(tǒng)計量得到的p-值也小于0.001。既然有精確檢驗為什么還用近似的c2檢驗?這是因為當數目很大時,超幾何分布計算相當緩慢(比近似計算會差很多倍的時間);而且在計算機速度不快時,根本無法計算。因此人們多用大樣本近似的c2統(tǒng)計量。而列聯(lián)表的有關檢驗也和c2檢驗聯(lián)系起來了。,18,Fisher精確檢驗,19,SPSS:Weight-Describ-crosstab-exact,20,下面為SPSS對于table7.savs數據產生的下面二維列聯(lián)表相關分析的輸出,21,兩個定量變量的相關,如果兩個定量變量沒有關系,就談不上建立模型或進行回歸。但怎樣才能確定兩個變量有沒有關系呢?最簡單的辦法就是畫出它們的散點圖。,22,例1有50個從初中升到高中的學生.為了比較初三的成績是否和高中的成績相關,得到了他們在初三和高一的各科平均成績(數據:highschool.sav),從這張圖可以看出什么呢?,23,問題是,怎么判斷這兩個變量是否相關?如何相關?相關的度量是什么?進一步的問題是能否以初三成績?yōu)樽宰兞浚咭怀煽優(yōu)橐蜃兞縼斫⒁粋€回歸模型以描述這樣的關系,或用于預測。,四組數據(每個有兩個變量的樣本)的散點圖,25,幾種相關的度量,Pearson相關系數,又叫相關系數或線性相關系數。它一般用字母r表示.Kendallt相關系數(Kendallst)這里的度量原理是把所有的樣本點配對,看每一對中的x和y是否都增加來判斷總體模式.Spearman秩相關系數,它和Pearson相關系數定義有些類似,只不過在定義中把點的坐標換成各自樣本的秩.它們各自都有以不相關為零假設的檢驗,即p-值小則相關.但各自的相關含義不盡相同.現在再來看例1的數據(highschool.sav).關于初三和高一成績的相關系數的結果是Pearson相關系數,Kendallt和Spearman秩相關系數分別為0.795,0.595和0.758。,26,SPSS的相關分析,相關分析(hischool.sav)利用SPSS選項:AnalizeCorrelateBivariate再把兩個有關的變量(這里為j3和s1)選入,選擇Pearson,Spearman和Kendall就可以得出這三個相關系數和有關的檢驗結果了(零假設均為不相關)。,27,例子,x=-20:20y=x2,28,例子,x=-20:20y=x2,29,例子,x=1:41y=x5,30,例子,x=1:41y=x5,31,多個(定性或定量)變量間的關系,比如關于高等學校的數據的一些指標包括:定量變量(在校生人數、研究生比例,教師人數、教師占雇員的比例、教師學生比例、SCI和SSCI文章數目和引用數目、科研項目數和科研總經費)和定性變量(所屬于分類、所在地區(qū)分類)等,32,在許多變量之中,比如,可得任何一個變量和其余變量(無論定量還是定性)之間的定量關系(回歸或線性模型)或者多個(定量)變量之間的定量關系(因而可以建立模型,進行預測和各種推斷)(典型相關分析、對應分析)也可以利用其中一些(定量)變量把各個
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 智慧安防保障城市安全的智能系統(tǒng)
- 從心理成長到創(chuàng)新教育的理論框架構建與實踐
- 智慧城市公共安全的綜合治理與大數據應用
- 學生創(chuàng)新能力培養(yǎng)的教育心理學策略
- 以教育技術為媒介探索增強學生學習動力和效率的新路徑
- 當代辦公室內應用個化學資料的有效性及其對于技術變革的響應
- 中職數學基礎模塊課件
- 企業(yè)級數據治理平臺的構建與實踐
- 醫(yī)療科技與智慧教育的深度融合探討
- 機器人輔助的醫(yī)療教學與智能教育探索
- 農業(yè)供應鏈管理考試試題及答案
- 人行雨棚施工方案
- 2025-2030中國晶圓鍵合系統(tǒng)行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析研究報告
- 從校園到職場:新員工角色轉換與職業(yè)化塑造
- 奶茶服務協(xié)議合同
- 學生食堂維修改造工程施工組織設計
- 書籍保密協(xié)議書范文
- 2025年章魚小丸子項目可行性研究報告
- “中小學生每天至少2小時體育活動”的價值追求與實現路徑研究
- 2024年四川成都農業(yè)科技中心招聘筆試真題
- 成都市房產抵押合同模板2025年
評論
0/150
提交評論