




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
PAGEPAGE1SPSS中判別分析的使用內(nèi)容摘要:判別分析是多元統(tǒng)計(jì)分析中最常用的方法之一。該文結(jié)合一個(gè)語言學(xué)實(shí)驗(yàn)的例子對SPSS判別分析的操作步驟和輸出結(jié)果作了具體的介紹,并對判別分析的不同方法在SPSS中的使用進(jìn)行了區(qū)分。本文關(guān)鍵詞語:SPSS;判別分析;語言學(xué)瞿健菊1.引言判別分析是多元統(tǒng)計(jì)分析中判別樣本所屬類型的一種常用方法。它的研究對象是訓(xùn)練樣本,也就是說原始數(shù)據(jù)的詳細(xì)分類是事先已經(jīng)知道的,然后根據(jù)原始數(shù)據(jù)求出判別函數(shù)將待判樣本的數(shù)據(jù)代入判別函數(shù)中判定其類型。[1]常用的判別分析方法重要有:間隔判別法、Fisher判別法和Bayes判別法。然而,在SPSS操作中只能實(shí)現(xiàn)Bayes判別法與Fisher判別法兩種,而且這兩種方法的操作是合在一起進(jìn)行的,所以使用起來需要十分留意。[2]下文將結(jié)合一個(gè)語言學(xué)實(shí)驗(yàn)的例子對SPSS判別分析的步驟和輸出結(jié)果作具體解釋和說明。2.語言學(xué)實(shí)驗(yàn)2.1實(shí)驗(yàn)背景Fletcher和Peters〔1984〕研究發(fā)現(xiàn),能夠用語法和詞匯兩個(gè)維度來刻畫語言受損兒童在語言表達(dá)方面的特征。被試分為兩組,一組是20個(gè)正常兒童〔LN〕,另一組是用標(biāo)準(zhǔn)化測試標(biāo)準(zhǔn)在年齡和智力活動(dòng)方面跟LN組相比而診斷為語言受損的9個(gè)兒童〔LI〕。在標(biāo)準(zhǔn)條件下采集他們的自覺的語言數(shù)據(jù)〔LN組的年齡均值為60.86個(gè)月,LI組的年齡均值為62.33個(gè)月〕。圍繞65個(gè)語法與詞匯范疇――大部分引自Crystal、Fletcher和Garman〔1976〕,每組兒童提供的樣本都包含200個(gè)話語的得分。其中一個(gè)語法變量是根據(jù)無標(biāo)記動(dòng)詞形式――既無后綴又無助動(dòng)詞修飾的實(shí)義動(dòng)詞詞干――的個(gè)數(shù)來評分的。另外一個(gè)詞匯范疇是動(dòng)詞詞型,即一個(gè)兒童在樣本中使用不同的實(shí)義動(dòng)詞的個(gè)數(shù)。[3]2.2數(shù)據(jù)錄入本文使用的SPSS為20.0版本。首先建立一個(gè)數(shù)據(jù)文件linguistics.sav,將Fletcher和Peters所提供的每個(gè)被試的數(shù)據(jù)錄入進(jìn)去。數(shù)據(jù)文件的變量視圖和數(shù)據(jù)視圖分別如此圖1和圖2所示。在變量視圖中,定義變量Y〔分類〕的值標(biāo)簽,-1為語言受損,1為正常。在數(shù)據(jù)視圖中,共29行數(shù)據(jù),分別為29個(gè)被試兒童在x1和x2這兩個(gè)變量上的得分及所屬類別。圖1變量視圖2.3判別分析步驟①單擊“分析〞→“分類〞→“判別分析〞,從對話框左側(cè)的變量列表中選中進(jìn)行判別分析的變量“無標(biāo)記動(dòng)詞形式[x1]〞和“動(dòng)詞詞型[x2]〞進(jìn)入“自變量〞框,作為判別分析的基礎(chǔ)數(shù)據(jù)變量。從對話框左側(cè)的變量列表選中“分類[Y]〞進(jìn)入“分組變量〞框,并單擊“定義范圍〞按鈕,在“定義范圍〞對話框中,定義判別原始數(shù)據(jù)的類別數(shù),在最小值處輸入-1,在最大值處輸入1。分析方法按默認(rèn)的“一起輸入自變量〞。②翻開“統(tǒng)計(jì)量〞對話框,在“描繪敘述性〞中,選擇“單變量ANOVA〞和“Box’sM〞。在“函數(shù)系數(shù)〞中選擇“Fisher〞〔注:此為Bayes選項(xiàng)〕和“未標(biāo)準(zhǔn)化〞〔注:此為Fisher選項(xiàng)〕。除此之外,“均值〞能夠輸出各類中各自變量的均值和標(biāo)準(zhǔn)差?!熬仃嚚曔x項(xiàng)組可選擇自變量的系數(shù)矩陣。③翻開“分類〞對話框,在“先驗(yàn)概率〞〔注:此為Bayes選項(xiàng)〕中,按默認(rèn)選擇“所有組相等〞。在“使用協(xié)方差矩陣〞中,按默認(rèn)選擇“在組內(nèi)〞。在“輸出〞〔注:此為Bayes選項(xiàng)〕中,選擇“內(nèi)容摘要表〞和“不考慮該個(gè)案時(shí)的分類〞。在“圖〞〔注:此為Fisher選項(xiàng)〕中,選擇“合并組〞、“分組〞和“區(qū)域圖〞。除此之外,“個(gè)案結(jié)果〞能夠輸出每個(gè)觀測量包含判別分?jǐn)?shù)實(shí)際類預(yù)測類〔根據(jù)判別函數(shù)求得的分類結(jié)果〕和后驗(yàn)概率等。④翻開“保存〞對話框,選擇“預(yù)測構(gòu)成員〞、“判別得分〞和“構(gòu)成員概率〞。全部選擇完成后,單擊“判別分析〞對話框中的“確認(rèn)〞按鈕。2.4判別分析結(jié)果①適用條件檢驗(yàn)。在“統(tǒng)計(jì)量〞對話框中,選擇“單變量ANOVA〞和“Box’sM〞,可分別得到下面的表1和表2。表1中的Sig值表示這兩個(gè)變量均值在各組間都是有差別的,因而這兩個(gè)變量對類間的判別都是有作用的。表2中的Sig值表示組間協(xié)方差齊這一假設(shè)是被回絕的。不外,協(xié)方差齊的這一要求在實(shí)際應(yīng)用中往往是被忽視的。[4]②基本輸出結(jié)果。表3給出了判別函數(shù)的特征根以及判別指數(shù)。本實(shí)驗(yàn)中只要一個(gè)判別函數(shù),所以只要一個(gè)特征值。表4中的Sig值表示差別到達(dá)顯著水平,即這個(gè)投影函數(shù)能將兩組兒童區(qū)分開。從表5中,能夠看出判別函數(shù)重要與“動(dòng)詞詞型〞這個(gè)自變量相關(guān)。由于本實(shí)驗(yàn)只要一個(gè)判別函數(shù)和兩個(gè)自變量,那么能夠揣測在區(qū)分正常兒童和語言受損兒童上,“動(dòng)詞詞型〞這個(gè)變量在判別分析中起了重要作用。表6是各組的判別函數(shù)的重心。留意此處使用的是非標(biāo)準(zhǔn)化典型判別式函數(shù)。③三種判別式。判別分析默認(rèn)會給出表7的判別函數(shù),其中的判別函數(shù)使用的是標(biāo)化變量。假如在“統(tǒng)計(jì)量〞對話框中,選擇“未標(biāo)準(zhǔn)化〞,能夠得到表8的判別函數(shù);選擇“Fisher〞,能夠得到表9的判別函數(shù)。留意此處“Fisher〞復(fù)選框?qū)?yīng)的實(shí)際上是Bayes判別。標(biāo)準(zhǔn)化典型判別式為:F〔X〕=-0.684×Z無標(biāo)記動(dòng)詞形式+0.785×Z動(dòng)詞詞型〔變量前加Z表示標(biāo)化后的數(shù)值〕未標(biāo)準(zhǔn)化典型判別式為:F〔X〕=-2.046?C0.060×無標(biāo)記動(dòng)詞形式+0.190×動(dòng)詞詞型Bayes判別式為:語言受損=-13.760+0.285×無標(biāo)記動(dòng)詞形式+0.897×動(dòng)詞詞型正常=-17.050+0.167×無標(biāo)記動(dòng)詞形式+1.271×動(dòng)詞詞型④圖表。由于本實(shí)驗(yàn)只要一個(gè)判別函數(shù),所以沒有產(chǎn)生區(qū)域圖和合并圖,只要如此圖3和圖4所示的分組直方圖,從直方圖中能夠大致看出各組中樣本的分布情況。圖3分組直方圖〔語言受損〕圖4分組直方圖〔正?!尝莘诸惤Y(jié)果。在“分類〞對話框中,選擇了“內(nèi)容摘要表〞能夠得到表10中的上半部分,是采取回代法得到的判別信息,由表可見有96.6%的正確率,其中語言受損有1例錯(cuò)判。在“分類〞對話框中,選擇了“不考慮該個(gè)案時(shí)的分類〞能夠得到表10中的下半部分,是采取穿插驗(yàn)證法得到的判別信息,本實(shí)驗(yàn)中正確率為86.2%,其中語言受損有1例錯(cuò)判,正常有3例錯(cuò)判。⑥保存結(jié)果。運(yùn)行判別分析后回到數(shù)據(jù)文件的數(shù)據(jù)視圖,如此圖5所示,生成了新的變量。在“保存〞對話框,選擇“預(yù)測構(gòu)成員〞,產(chǎn)生“Dis_1〞變量,顯示的是各樣本按Bayes判別所屬的類別;選擇“判別得分〞得到“Dis1_1〞列,是樣本在Fisher投影函數(shù)下投影的坐標(biāo);選擇“構(gòu)成員概率〞得到“Dis1_2〞和“Disc2_2〞,為樣本分別屬于第1類與第2類的后驗(yàn)概率大小。根據(jù)表10所示,語言受損有1例錯(cuò)判。在圖5中能夠看出,語言受損兒童中錯(cuò)判的是第3例,由于其第2類的后驗(yàn)概率0.90727大于第1類的后驗(yàn)概率0.09273,因而判別為第2類。除此之外,“Dis1_1〞的值還能夠結(jié)合表6的類中心坐標(biāo)使用間隔判別法進(jìn)行類別判別。3.結(jié)束語綜上所述,SPSS只能完成Bayes判別與Fisher判別,無法直接完成間隔判別。SPSS判別分析是以Bayes判別為主,重要菜單與選項(xiàng)都是針對Bayes判別分析設(shè)置,而且最終保存的判別結(jié)果也是以Bayes判別為根據(jù);Fisher判別操作僅給出投影表達(dá)式、各類投影中心坐標(biāo)及投影分界圖,最終判別結(jié)果需要自己根據(jù)各類投影中心坐標(biāo)或投影分界圖去做判別。[5]除此之外,由于判別
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年消防員現(xiàn)場救援安全操作協(xié)議
- 2025年科研項(xiàng)目協(xié)議范例
- 2025年標(biāo)準(zhǔn)創(chuàng)業(yè)孵化場地租賃協(xié)議
- 2025年正規(guī)門面出租策劃協(xié)議范本
- 大型地下空間施工技術(shù)與管理方法
- 施工過程中的質(zhì)量管理與控制體系
- 重塑跨境電商出海新勢能的現(xiàn)狀及總體形勢
- 智能教育環(huán)境下的語文教學(xué)改革探索
- 清明節(jié)主題模板222
- 資源共享與教育服務(wù)質(zhì)量提升的雙重驅(qū)動(dòng)
- 2021年新高考全國1卷(含答案解析)
- 自動(dòng)泊車輔助系統(tǒng)課件
- 小學(xué)綜合實(shí)踐活動(dòng)-《認(rèn)識二十四節(jié)氣》教學(xué)課件設(shè)計(jì)
- 神經(jīng)外科疾病診療規(guī)范診療指南診療常規(guī)2022版
- 廉政風(fēng)險(xiǎn)防范管理辦法
- 上海市長寧區(qū)西延安中學(xué)2022-2023學(xué)年八年級數(shù)學(xué)第二學(xué)期期末檢測試題含解析
- 2023年衢州中考科學(xué)卷真題含答案
- 施工方案設(shè)計(jì)(宿舍樓裝修改造)
- 全國初中語文優(yōu)質(zhì)課一等獎(jiǎng)《壺口瀑布》展示課精品課件
- 園林工程園林給水排水工程
- 2022年上海西虹橋商務(wù)開發(fā)有限公司招聘筆試試題及答案解析
評論
0/150
提交評論