SPSS統(tǒng)計分析方差分析課件_第1頁
SPSS統(tǒng)計分析方差分析課件_第2頁
SPSS統(tǒng)計分析方差分析課件_第3頁
SPSS統(tǒng)計分析方差分析課件_第4頁
SPSS統(tǒng)計分析方差分析課件_第5頁
已閱讀5頁,還剩114頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第六章4/5/20241主要內(nèi)容第一節(jié)方差分析簡介第二節(jié)單因素方差分析第三節(jié)多因素方差分析第四節(jié)協(xié)方差分析4/5/20242第一節(jié)方差分析簡介

方差分析是英國統(tǒng)計學(xué)家R.A.Fisher(1890-1962)在進行試驗設(shè)計時為解釋試驗數(shù)據(jù)而首先引入的。方差分析是一種通過分析樣本資料各項差異的來源以檢驗三個以上總體平均數(shù)是否相等的統(tǒng)計方法。目前,方差分析方法在各個領(lǐng)域都得到了廣泛應(yīng)用。方差分析的核心就是方差可分解。即將總變異分解為由隨機誤差造成的變異(組內(nèi)SS)與由均數(shù)差異造成的變異(組間SS)兩個部分。如果后者大于前者,且具有統(tǒng)計學(xué)意義,我們將拒絕零假設(shè),即認為總體中均數(shù)間存在差異。4/5/20243一、方差分析的作用

在諸多領(lǐng)域的數(shù)量分析研究中,找到眾多影響因素中重要的影響因素是非常重要的。比如:在農(nóng)業(yè)生產(chǎn)中,我們總是希望在盡量少的投入成本下得到較高的農(nóng)作物產(chǎn)量。這就需要首先分析農(nóng)作物的產(chǎn)量究竟受到哪些因素的影響。有許多因素會影響農(nóng)作物的產(chǎn)量,如種子的品種、施肥量、氣候、地域等,他們都會給農(nóng)作物的產(chǎn)量帶來或多或少的影響。如果我們能夠掌握在眾多的影響因素中,哪些因素對農(nóng)作物的產(chǎn)量起到了主要的、關(guān)鍵性的作用,我們就可以根據(jù)實際情況對這些關(guān)鍵因素加以控制。進一步,在掌握關(guān)鍵影響因素,如品種、施肥量因素等之后,我們還要對不同的品種、不同的施肥量條件下的產(chǎn)量進行對比分析,研究究竟哪個品種的產(chǎn)量高,施肥量究竟多少最合適,哪種品種與哪種施肥量搭配最優(yōu),等等。在這些分析研究的基礎(chǔ)上,我們就可以計算出各個組合方案的成本和收益,并選擇最合理的種植方案,主動的在農(nóng)作物種植過程中對各種影響因素加以準確控制,進而獲得最理想的效果。4/5/20244三、方差分析的原理

方差分析認為,如果控制變量的不同水平對觀測變量產(chǎn)生了顯著影響,那么它和隨機變量共同作用必然使得觀測變量值顯著變動;反之,如果控制變量的不同水平?jīng)]有對觀測變量產(chǎn)生顯著影響,那么觀測變量值的變動就不明顯,其變動可以歸結(jié)為隨機變量影響造成的。建立在觀測變量各總體服從正態(tài)分布和同方差的假設(shè)之上,方差分析的問題就轉(zhuǎn)化為在控制變量不同水平上的觀測變量均值是否存在顯著差異的推斷問題了。綜上所述,方差分析從對觀測變量的方差分解入手,通過推斷控制變量各水平下各觀測變量的均值是否存在顯著差異,分析控制變量是否給觀測變量帶來了顯著影響,進而再對控制變量各個水平對觀測變量影響的程度進行剖析。根據(jù)控制變量的個數(shù)可將方差分析分為單因素方差分析、多因素方差分析;根據(jù)觀測變量的個數(shù)可將方差分析分為一元方差分析(單因變量方差分析)和多元方差分析(多因變量方差分析)。4/5/20246四、方差分析過程1、One-Way過程:單因素簡單方差分析過程。在CompareMeans菜單項中,可以進行單因素方差分析、均值多重比較和相對比較。2、GeneralLinearModel(簡稱GLM)過程:GLM過程由Analyze菜單直接調(diào)用。這些過程可以完成簡單的多因素方差分析和協(xié)方差分析,不但可以分析各因素的主效應(yīng),還可以分析各因素間的交互效應(yīng)。4/5/20247在GeneralLinearModel菜單項下有四項:Univariate:提供一個因變量與一個或多個因素變量的方差分析。Multivariate:可進行多因變量的多因素分析RepeatedMeasure:可進行重復(fù)測量方差分析VarianceComponent:可進行方差成分分析。通過計算方差估計值,可以幫助我們分析如何減小方差。4/5/20248選入因變量,可有多個變量選入分組變量,必須滿足只取有限個水平的條件。圖6-1One-WayAnova主對話框見圖6--2見圖6--3見圖6--44/5/202410(1)Contrasts選項

Contrasts選項用來實現(xiàn)先驗對比檢驗和趨勢檢驗。如果進行趨勢檢驗,則應(yīng)選擇Polynomial選項,然后在后面的下拉框中選擇趨勢檢驗的方法。其中Linear表示線性趨勢檢驗;Quadratic表示進行二次多項式檢驗;Cubic表示進行三次多項式檢驗,4th和5th表示進行四次和五次多項式檢驗。如果進行先驗對比檢驗,則應(yīng)在Coefficients后依次輸入系數(shù)ci,并確?!芻i=0。應(yīng)注意系數(shù)輸入的順序,它將分別與控制變量的水平值相對應(yīng)。4/5/202411(2)PostHoc選項PostHoc選項用來實現(xiàn)多重比較檢驗。提供了18種多重比較檢驗的方法。其中EqualVariancesAssumed框中的方法適用于各水平方差齊性的情況。在方差分析中,由于其前提所限,應(yīng)用中多采用EqualVariancesAssumed框中的方法。多重比較檢驗中,SPSS默認的顯著性水平為0.05,可以根據(jù)實際情況修改Significancelevel后面的數(shù)值以進行調(diào)整。4/5/202413(3)Option選項Option選項用來對方差分析的前提條件進行檢驗,并可輸出其他相關(guān)統(tǒng)計量和對缺失數(shù)據(jù)進行處理。

Homogeneityofvariancetest選項實現(xiàn)方差齊性檢驗;Descriptive選項輸出觀測變量的基本描述統(tǒng)計量;Brown-Forsythe、Welch選項可計算其統(tǒng)計量以檢驗各組均值的相等性,當(dāng)方差齊性不成立時應(yīng)選擇使用這兩個統(tǒng)計量而不是F統(tǒng)計量。MeansPlot選項輸出各水平下觀測變量均值的折線圖;MissingValues框中提供了兩種缺失數(shù)據(jù)的處理方式。4/5/202415圖6—4Options對話框選擇缺失值的處置方式:在檢驗變量中含有缺失值的觀測將不被計算在任何一個變量中含有缺失值的觀測都將不被計算規(guī)定輸出的統(tǒng)計量:輸出描述統(tǒng)計量,包括觀測量數(shù)目,均值,最小值,最大值,標準差,標準誤差,各組中每個因變量均值的95%的置信區(qū)間用Levene檢驗進行方差一致性檢驗輸出均數(shù)分布圖三、例題分析

例1[06-1]某燈泡廠用四種不同配料方案制成的燈絲,生產(chǎn)了四批燈泡。每批燈泡中隨機抽取若干個燈泡測其使用壽命(單位:小時),數(shù)據(jù)如表6-1,求四種燈絲的燈泡的使用壽命有無顯著差異。4/5/2024161、不使用選擇項操作步驟1)定義兩個變量:Filament變量,取值1、2、3、4分別代表甲、乙、丙、丁,標簽為“燈絲”Hours變量其值為燈泡的使用壽命,標簽為“燈泡使用壽命”2)按AnalyzeComparedMeansOne-WayAnova順序打開“單因素分析”主對話框。3)從源變量框中選取hours進入DependentList框中;選取filament變量進入Factor框中,單擊“OK”運行。4)輸出結(jié)果及分析4/5/202418表6-2燈泡使用壽命的單因素方差分析結(jié)果表6-2說明:第一列:方差來源;第二列:離差平方和;第三列:自由度;第四列:均方;第五列:F值;第六列:F統(tǒng)計量的P值。2、使用選擇項操作步驟1)定義變量和選取變量同1(第1-3步)的操作步驟4/5/2024192)在主對話框中單擊“Contrast”,在Contrast對話框中選擇多項式比較,選擇一次多項式比較各組均值,共指定兩組多項式系數(shù):系數(shù)依次為1、-1、-1、1,這是檢驗燈絲對燈泡使用壽命的影響及甲、丁效應(yīng)和與乙、丙效應(yīng)和是否有顯著差異系數(shù)依次為1、-1、1、-1,這是檢驗燈絲對燈泡使用壽命的影響及甲、丙效應(yīng)和與乙、丁效應(yīng)和是否有顯著差異3)打開PostHocMultipleComparisons對話框,選擇多重比較:在EqualVarianceAssumed欄中選擇LSD和Duncan在EqualVarianceNotAssumed欄中選擇Tamhane’sT24/5/2024204)打開Options對話框,輸出統(tǒng)計量選擇項。選中Descriptive復(fù)選框,輸出描述性統(tǒng)計量。選中Homogeneity-of-variance復(fù)選框,用Levene檢驗進行方差一致性檢驗選中Meansplot復(fù)選框,輸出均數(shù)分布圖。選中Excludecasesanalysisbyanalysis復(fù)選框,不計算在檢驗變量中含有缺失值的觀測。5)單擊OK,提交運行輸出結(jié)果及分析4/5/202421表6-3描述性統(tǒng)計量表表6-3為描述性統(tǒng)計量表6-4方差一致性檢驗表6-4為方差一致性檢驗結(jié)果,其顯著值P大于0.05,說明各組的方差在0.05的顯著水平上沒有顯著性差異,即方差具有一致性。4/5/202422表6-7LSD法和Tamhane’sT2法進行均值多重比較結(jié)果從表可看出,各均值間沒有顯著差異。4/5/202424表6-8Duncan法進行均值多重比較結(jié)果各列的內(nèi)容:第一列:按均值由小到大的順序列出燈絲種類。第二列:各組樣本容量。第三列:在顯著性水平0.05下的比較結(jié)果,同一列中均值無顯著差異。由于各組樣本容量不相等,計算均值用的是調(diào)和平均數(shù)的樣本量6.034。表中最后一行列出P值為0.085,大于0.05,說明各組均值具有一致性。4/5/202425圖6-5均值分布圖

圖6-5是均值分布圖,以燈絲為橫軸,以燈泡使用的平均時間為縱軸,從此圖上可看出各組均值的分布。4/5/202426一、多因素方差分析的基本思想

1、定義:多因素方差分析用來研究兩個及兩個以上控制變量的不同水平是否對觀測變量產(chǎn)生了顯著影響。多因素方差分析不僅能夠分析多個因素對觀測變量的獨立影響,還能夠分析多個控制變量的交互作用能否對觀測變量產(chǎn)生顯著影響。例如:分析不同品種、不同施肥量是否給農(nóng)作物的產(chǎn)量產(chǎn)生顯著影響,并進一步研究哪種品種和哪種施肥量是提高農(nóng)作物產(chǎn)量的最優(yōu)組合。2、觀測變量方差的分解將觀測變量總的離差平方和分解為:其中,SST為觀測變量的總離差平方和;SSA、SSB分別為控制變量A、B獨立作用引起的變差;SSAB為控制變量A、B兩兩交互作用引起的變差;SSE為隨機因素引起的變差。4/5/202428其中:4/5/2024293、比較觀測變量總離差平方和各部分的比例在觀測變量總離差平方和中,如果SSA所占比例較大,則說明控制變量A是引起觀測變量的變動主要因素之一,觀測變量的變動可以部分的由控制變量A來解釋,即控制變量A給觀測變量帶來了顯著影響。對SSB、SSAB同理。4/5/202431二、多因素方差分析的基本步驟1、提出原假設(shè):各控制變量不同水平下觀測變量各總體的均值無顯著差異,控制變量交互作用對觀測變量無顯著影響。2、計算檢驗統(tǒng)計量和概率P值。3、給定顯著性水平與p值做比較:如果p值小于顯著性水平,則應(yīng)該拒絕原假設(shè),反之就不能拒絕原假設(shè)。4/5/202432三、多因素方差分析的基本操作步驟在利用SPSS進行多因素方差分析時,應(yīng)首先將各個控制變量以及觀測變量分別定義成多個SPSS變量,并組織好數(shù)據(jù)再進行分析。1、選擇菜單Analyze-GeneralLinearModel-Univariate,出現(xiàn)主窗口。2、把觀測變量指定到DependentVariable框中。3、把固定效應(yīng)的控制變量指定到FixedFactor(s)框中,把隨機效應(yīng)的控制變量指定到RandomFactor(s)框中。至此,SPSS將自動建立多因素方差分析的飽和模型,并計算各檢驗統(tǒng)計量的觀測值和對應(yīng)的概率p值,并將結(jié)果顯示到輸出窗口中。4/5/2024334/5/202434四、多因素方差分析應(yīng)用舉例

[06-2]利用某企業(yè)不同廣告形式在不同地區(qū)的廣告效果(銷售額)進行評估的數(shù)據(jù),通過多因素方差分析方法對廣告形式、地區(qū)、廣告形式和地區(qū)的交互作用給銷售額的影響進行分析,進而為制訂廣告和地區(qū)的最優(yōu)宣傳組合方案提供依據(jù)。這里,以廣告形式和地區(qū)為控制變量,銷售額為觀測變量,建立固定效應(yīng)的飽和模型。零假設(shè)為:不同廣告形式?jīng)]有對銷售額產(chǎn)生顯著影響;不同地區(qū)的銷售額沒有顯著差異;廣告形式和地區(qū)對銷售額沒有產(chǎn)生顯著的交互影響。4/5/202435五、多因素方差分析的進一步分析1、多因素方差分析的非飽和模型在飽和模型中,觀測變量的總變差被分解為控制變量獨立作用、控制變量交互作用及隨機誤差三部分(SST=SSA+SSB+SSAB+SSE)。如果研究發(fā)現(xiàn),控制變量的某階交互作用沒有給觀測變量產(chǎn)生顯著影響,那么可以嘗試建立非飽和模型。區(qū)別在于將飽和模型中某些部分合并到SSE中,例如兩因素非飽和模型為:SST=SSA+SSB+SSE4/5/2024362、均值檢驗在SPSS中,利用多因素方差分析功能還能夠?qū)Ω鱾€控制變量不同水平下的均值是否存在顯著差異進行比較,實現(xiàn)方式有兩種:多重比較檢驗(PostHoc)和對比檢驗(Contrast)。多重比較檢驗的方法與單因素方差分析類似,不再重復(fù)。對比檢驗采用的是單樣本t檢驗的方法。4/5/202437檢驗值可以指定一下幾種:None:SPSS默認,不做對比分析;Deviation:表示以觀測變量的總體均值為標準,比較各水平上觀測變量的均值是否有顯著差異;Simple:表示以第一水平或最后一個水平上的觀測變量均值為標準,比較各水平上的觀測變量均值是否有顯著差異;Difference:表示將各水平上觀測變量均值與其前一個水平上的觀測變量均值做比較;Helmert:表示將各水平上觀測變量均值與其后一個水平上的觀測變量均值做比較。4/5/2024383、控制變量交互作用的圖形分析控制變量的交互作用可以通過圖形直觀分析。如果控制變量之間無交互作用,各水平對應(yīng)的直線是近于平行的;如果控制變量間存在交互作用,各水平對應(yīng)的直線會相互交叉。4、模型分析這里模型分析的主要任務(wù)有三個:第一,利用多因素方差分析模型計算觀測變量預(yù)測值;第二,計算各種殘差值,評價模型對數(shù)據(jù)的擬合程度;第三,對數(shù)據(jù)中的異常點進行診斷。4/5/202439六、多因素方差分析中進一步分析的操作步驟1、建立非飽和模型的操作SPSS多因素方差分析中默認建立的是飽和模型。如果希望建立非飽和模型,則應(yīng)在主窗口中單擊Model按鈕,出現(xiàn)窗口:4/5/202440默認的選項是Fullfactorial,表示飽和模型,此時Factors&Covariates框、Model框以及BuildTerm(s)下拉框均呈不可用狀態(tài)。如果選擇Custom項,則表示建立非飽和模型,且Factors&Covariates框、Model框以及BuildTerm(s)下拉框均變?yōu)榭捎脿顟B(tài)。此時便可自定義非飽和模型中的數(shù)據(jù)項。其中,Interaction為交互作用;Maineffects為主效應(yīng);All2-way、All3-way等表示二階、三階或更高階交互作用。4/5/2024412、均值比較的操作

如果通過多因素方差分析得知某控制變量的不同水平對觀測變量產(chǎn)生顯著影響,進一步可對各水平間的均值進行比較。如果采用多重比較檢驗方法,則單擊PostHoc按鈕,選擇合適的多重比較檢驗方法。4/5/202442如果采用對比檢驗方法,則單擊Contrasts按鈕,默認是不進行對比檢驗(顯示如x1(None));如果進行對比檢驗,可展開Contrast后的下拉框,指定對比檢驗的檢驗值,并單擊Change按鈕完成指定。4/5/2024433、控制變量交互作用圖形分析的操作如果希望通過圖形直觀判斷控制變量間是否存在交互作用,則應(yīng)在主窗口單擊Plots按鈕。首先選擇一個控制變量作為交互圖形中的橫軸,并將其選擇到HorizontalAxis框中;其次,指定在交互圖中各直線代表的是哪個控制變量的不同水平,并將其選擇到SeparatedLines框中;最后,如果控制變量有三個,由于交互作用圖只能反映兩控制變量的交互情況,此時第三個變量只能選入SeparatePlots框中,第三個變量有幾個水平便繪制出幾張交互圖。4/5/2024444/5/2024454、模型分析的操作

SPSS多因素方差模型建立完成后,可以在主窗口中單擊Save按鈕對模型進行分析,并將分析結(jié)果以變量的形式存入SPSS數(shù)據(jù)編輯窗口中。其中,PredictedValues框中的選項用來計算模型的預(yù)測值;Residuals框中的各選項用來計算各種殘差;Diagnostics框?qū)崿F(xiàn)異常值的診斷。各選項具體含義同回歸分析。4/5/202446七、多因素方差分析進一步分析應(yīng)用舉例在前面的應(yīng)用舉例中對廣告形式、地區(qū)對銷售額的影響進行了多因素方差分析,建立了飽和模型。分析可知,廣告形式和地區(qū)的交互作用不顯著,可以進一步嘗試建立非飽和模型,并進行均值比較分析、交互作用圖形分析。4/5/202447一、協(xié)方差分析的基本思想

無論是單因素方差分析還是多因素方差分析,控制變量是可以控制的,其各個水平可以通過人為努力得到控制和確定。但是在實際問題中,有些控制變量很難人為控制,但他們的不同水平確實對觀測變量產(chǎn)生較為顯著的影響。比如:研究教學(xué)方法與學(xué)習(xí)成績的關(guān)系時要求按入學(xué)成績分別進行分析,以消除入學(xué)成績因素的影響。在方差分析中,如果忽略這些因素的存在而單純?nèi)シ治銎渌蛩貙τ^測變量的影響,往往會夸大或縮小其他因素對觀測變量的影響,使分析結(jié)論不準確。因此,為了更加準確的研究控制變量不同水平對觀測變量的影響,應(yīng)盡量排除其他因素對分析結(jié)論的影響。1、定義:協(xié)方差分析就是將那些很難人為控制的因素作為協(xié)變量,并在排除協(xié)變量對觀測變量影響的條件下,分析控制變量對觀測變量的影響,從而更加準確的對控制變量進行分析。第四節(jié)協(xié)方差分析4/5/2024482、協(xié)方差分析的特點方差分析中的控制變量都是定性變量(包括分類和順序變量),線性回歸分析中的解釋變量(自變量)都是定量變量。而協(xié)方差分析中的控制變量是定性變量,而協(xié)變量一般是定量變量。所以說協(xié)方差分析是一種介于方差分析和線性回歸分析之間的分析方法。例如:在研究生豬的飼養(yǎng)問題的協(xié)方差分析中,飼料是控制變量,生豬的初始體重是協(xié)變量。協(xié)方差分析中要求多個協(xié)變量之間無交互作用,且觀測變量與協(xié)變量之間有顯著的線性關(guān)系。4/5/2024493、離差平方和的分解在協(xié)方差分析中,將觀測變量的總離差平方和分解為由控制變量獨立作用引起的、由控制變量交互作用引起的、由協(xié)變量引起的和由隨機因素引起的。以單因素協(xié)方差分析為例,觀測變量的總變差可以分解為:4、比較觀測變量總離差平方和各部分的比例在觀測變量總離差平方和中,如果SSA所占比例較大,則說明控制變量A是引起觀測變量的變動主要因素之一,觀測變量的變動可以部分的由控制變量A來解釋,即控制變量A給觀測變量帶來了顯著影響。對SSB、SSAB同理。4/5/202450二、協(xié)方差分析的基本步驟1、提出原假設(shè):協(xié)變量對觀測變量的線性影響是不顯著的;在扣除協(xié)變量影響的條件下,控制變量各水平下觀測變量的各總體均值無顯著差異。2、計算檢驗統(tǒng)計量和概率P值。3、給定顯著性水平與p值做比較:如果p值小于顯著性水平,則應(yīng)該拒絕原假設(shè),反之就不能拒絕原假設(shè)。4/5/202451三、協(xié)方差分析的基本操作步驟在利用SPSS進行協(xié)方差分析時,應(yīng)首先將作為協(xié)變量的變量定義成一個SPSS變量。1、選擇菜單Analyze-GeneralLinearModel-Univariate。2、把觀測變量指定到DependentVariable框中。3、把固定效應(yīng)的控制變量指定到FixedFactor(s)框中,把隨機效應(yīng)的變量指定到RandomFactor(s)框中。4、把作為協(xié)變量的變量指定到Covariate(s)框中。

可見,SPSS多因素方差分析和協(xié)方差分析的窗口是同一個,窗口中的其他功能按鈕都可應(yīng)用于協(xié)方差分析中。至此,SPSS將自動完成對各變差的分析,并計算各F檢驗統(tǒng)計量、對應(yīng)的概率p值及其他計算結(jié)果,并將結(jié)果顯示到輸出窗口中。4/5/202452四、協(xié)方差分析的應(yīng)用舉例

[06-3]為研究三種不同飼料對生豬體重增加(wyh)的影響,將生豬隨機分成三組各喂養(yǎng)不同的飼料(sl),得到體重增加的數(shù)據(jù)。由于生豬體重的增加理論上會受到其自身身體條件的影響,于是收集生豬喂養(yǎng)前的體重(wyq)數(shù)據(jù),作為自身身體條件的測量指標。為準確評價飼料的優(yōu)劣,采用單因素協(xié)方差分析的方法進行分析。這里,豬體重的增加量為觀測變量,飼料為控制變量,豬喂養(yǎng)前體重為協(xié)變量。

4/5/202453第七章相關(guān)與回歸分析4/5/202454主要內(nèi)容第一節(jié)相關(guān)分析一、概述二、相關(guān)分析的SPSS過程三、Bivariate相關(guān)分析四、偏相關(guān)分析第二節(jié)回歸分析一、線性回歸二、曲線估計4/5/202455第一節(jié)相關(guān)分析

一、相關(guān)分析概述1、線性相關(guān)分析:研究兩個變量間線性相關(guān)的程度。用相關(guān)系數(shù)r來描述。如果變量Y與X間是函數(shù)關(guān)系,則r=1或r=-1;如果變量Y與X間是統(tǒng)計關(guān)系,則-1<r<1,如果x,y變化的方向一致,如身高與體重的關(guān)系,則稱為正相關(guān),r>0;如果x,y變化的方向相反,如吸煙與肺功能的關(guān)系,則稱為負相關(guān),r<0;而r=0表示無線性相關(guān)。一般地,|r|0.8高度相關(guān);0.5|r|<0.8中度相關(guān);0.3|r|<0.5

低度相關(guān);|r|<0.3關(guān)系極弱,認為無線性相關(guān)。4/5/202456SPSS中相關(guān)系數(shù)的計算有三種:Pearson、Spearman和Kendall。Pearson相關(guān)系數(shù):對數(shù)值型變量的數(shù)據(jù)進行計算。Pearson簡單相關(guān)系數(shù)的檢驗統(tǒng)計量為:4/5/202457Spearman等級相關(guān)系數(shù)用來度量順序變量間的線性相關(guān)關(guān)系,設(shè)計思想與Pearson簡單相關(guān)系數(shù)相同,只是數(shù)據(jù)為非數(shù)值的,故計算時并不直接采用原始數(shù)據(jù),而是利用數(shù)據(jù)的秩,用兩變量的秩代替代入Pearson簡單相關(guān)系數(shù)計算公式中,于是其中的xi和yi的取值范圍被限制在1和n之間,且可被簡化為:4/5/202458如果兩變量的正相關(guān)性較強,它們秩的變化具有同步性,于是的值較小,r趨向于1;如果兩變量的正相關(guān)性較弱,它們秩的變化不具有同步性,于是的值較大,r趨向于0;在小樣本下,在零假設(shè)成立時,Spearman等級相關(guān)系數(shù)服從Spearman分布;在大樣本下,Spearman等級相關(guān)系數(shù)的檢驗統(tǒng)計量為Z統(tǒng)計量,定義為:Z統(tǒng)計量近似服從標準正態(tài)分布。4/5/202459Kendall相關(guān)系數(shù):采用非參數(shù)檢驗方法度量順序變量間的線性相關(guān)關(guān)系。它利用變量秩數(shù)據(jù)計算一致對數(shù)目(U)和非一致對數(shù)目(V)。如果兩變量具有較強的正相關(guān)關(guān)系,則一致對數(shù)目U應(yīng)較大,非一致對數(shù)目V應(yīng)較??;如果兩變量具有較強的負相關(guān)關(guān)系,則一致對數(shù)目U應(yīng)較小,非一致對數(shù)目V應(yīng)較大;如果兩變量的相關(guān)性較弱,則一致對數(shù)目U和非一致對數(shù)目V應(yīng)大致相等,大約各占樣本數(shù)的1/2。Kendall相關(guān)系數(shù)正是要對此進行檢驗。4/5/2024602、偏相關(guān)分析:它描述的是當(dāng)控制了一個或幾個另外的變量的影響條件下兩個變量間的相關(guān)性,如控制年齡和工作經(jīng)驗的影響,估計工資收入與受教育水平之間的相關(guān)關(guān)系。3、相似性測度:兩個或若干個變量、兩個或兩組觀測量之間的關(guān)系有時也可以用相似性或不相似性來描述,一般不單獨使用,而作為聚類分析和因子分析等的預(yù)分析。4/5/202461二、相關(guān)分析的SPSS過程在Analyze→Correlate下的三個子菜單:1、Bivariate--相關(guān)分析,計算指定的兩個變量間的相關(guān)關(guān)系,可選擇Pearson相關(guān)、Spearman和Kendall相關(guān);同時對相關(guān)系數(shù)進行檢驗,檢驗的零假設(shè)為:相關(guān)系數(shù)為0(無線性相關(guān)),給出相關(guān)系數(shù)為0的概率。2、Partial--偏相關(guān)分析,計算兩個變量間在控制了其他變量的影響下的相關(guān)關(guān)系,對相關(guān)系數(shù)也進行檢驗,檢驗的零假設(shè)為:相關(guān)系數(shù)為0。3、Distance--相似性測度,對變量或觀測量進行相似性或不相似性測度。4/5/202462三、Bivariate相關(guān)分析在進行相關(guān)分析時,散點圖是重要的工具,分析前應(yīng)先做散點圖,以初步確定兩個變量間是否存在相關(guān)趨勢,該趨勢是否為直線趨勢,以及數(shù)據(jù)中是否存在異常點,否則可能得出錯誤結(jié)論。Bivariate相關(guān)分析的步驟:輸入數(shù)據(jù)后,依次單擊Analyze—Correlate—Bivariate,打開BivariateCorrelations對話框如圖7-1。4/5/202463圖7-1BivariateCorrelations對話框不清楚變量之間是正相關(guān)還是負相關(guān)時選擇此項。清楚變量之間是正相關(guān)還是負相關(guān)時可選擇此項。計算積矩相關(guān)系數(shù),數(shù)值型變量才可采用。計算Kendall秩相關(guān)系數(shù),適合于順序變量或不滿足正態(tài)分布假設(shè)的等間隔數(shù)據(jù)。計算Spearman秩相關(guān)系數(shù),適合于順序變量或不滿足正態(tài)分布假設(shè)的等間隔數(shù)據(jù)。在輸出結(jié)果中,相關(guān)系數(shù)的右上角上有“*”則表示顯著性水平為0.05;右上角上有“**”則表示顯著性水平為0.01。見圖7-24/5/202464圖7-2Optins對話框?qū)γ恳粋€變量輸出均值、標準差和無缺省值的觀測數(shù)。對每一個變量輸出平方和、叉積和、方差及協(xié)方差。計算某個統(tǒng)計量時,在這一對變量中排除有缺省值的觀測值。對于任何分析,有缺省值的觀測值都會被排除。4/5/202465觀測號12345678910體重(克)83726990909590917570雞冠重(毫克)564218845610790683148數(shù)值變量相關(guān)分析實例數(shù)據(jù)表相關(guān)分析實例1、數(shù)值變量的相關(guān)分析實例

[07-1]十只小雞的體重與雞冠重的數(shù)據(jù)如表所示(數(shù)據(jù)文件:小雞(相關(guān)).sav):4/5/202466分析步驟1)輸入數(shù)據(jù),依次單擊Analyze—Correlate—Bivariate,打開BivariateCorrelations對話框2)選擇weight和comb變量進入Variables框中。3)在CorrelationCoefficients欄內(nèi)選擇Pearson。4)在TestofSignificance欄選擇Two-tailed。5)選擇Flagsignificantcorrelation。6)單擊Options按鈕,選擇Meanandstandarddeviations、Cross-productdeviationsandcovariances、Excludecasespairwise選項。7)單擊OK完成。4/5/202467描述性統(tǒng)計量表,如下:

從表中可看出,變量weight的均值為82.50,標準差為10.01,觀測數(shù)為10;變量comb的均值為60.00,標準差為27.60,觀測數(shù)為10;結(jié)果分析4/5/202468

從表中可看出,Pearson相關(guān)系數(shù)為0.865,即小雞的體重與雞冠的相關(guān)系數(shù)為0.865,這兩者之間不相關(guān)的雙尾檢驗p值為0.001。體重觀測值的方差為100.278,而雞冠重觀測值的方差為761.556,體重和雞冠重的協(xié)方差為239.111。從統(tǒng)計結(jié)果可得到,小雞的體重與雞冠重之間存在正相關(guān)關(guān)系,當(dāng)小雞的體重越大時,則小雞的雞冠越重。Pearson相關(guān)系數(shù)矩陣4/5/2024692、順序變量的Spearman分析實例

[07-2]為研究集團迫使個人順從的效應(yīng),一些研究者用為測量地位欲而設(shè)計的一種量表對12名大學(xué)生進行調(diào)查?,F(xiàn)分析權(quán)威主義和地位欲評分之間的關(guān)系。學(xué)生ABCDEFGHIJKL權(quán)威主義265110983412711地位欲342181110671259權(quán)威主義和地位欲排秩4/5/2024701)輸入數(shù)據(jù),依次單擊Analyze—Correlate—Bivariate,打開BivariateCorrelations對話框2)選擇power和position變量進入Variables框中。3)在CorrelationCoefficients欄內(nèi)選擇Spearman選項。4)在TestofSignificance欄選擇Two-tailed。5)選擇Flagsignificantcorrelation。6)單擊Options按鈕,選擇Excludecasespairwise選項。7)單擊OK。分析步驟4/5/202471

從表中知,權(quán)威主義與地位欲不相關(guān)的假設(shè)檢驗P值為0.001,否定原假設(shè),即權(quán)威主義與地位欲是相關(guān)的;權(quán)威主義和地位欲的相關(guān)系數(shù)為0.818,這表明權(quán)威主義越高的人地位欲也越高。結(jié)果分析

4/5/2024723、順序變量的Kendall分析實例

仍用前例中的數(shù)據(jù)(數(shù)據(jù)文件:權(quán)威(Spearman相關(guān)).sav)。操作過程相同,只是在第3步的CorrelationCoefficients欄內(nèi)選擇Kendall’s選項。結(jié)果如下:

從表中可看出,權(quán)威主義和地位欲的相關(guān)系數(shù)為0.667,這表明權(quán)威主義越高的人地位欲也越高,P值為0.003,否定原假設(shè),即權(quán)威主義與地位欲是相關(guān)的。Kendall相關(guān)分析所得到的結(jié)果類似于Spearman分析。4/5/202473四、偏相關(guān)分析線性相關(guān)分析計算兩個變量間的相關(guān)關(guān)系,分析兩個變量間線性關(guān)系的程度。往往因為第三個變量的作用,使相關(guān)系數(shù)不能真正反映兩個變量間的線性程度。如身高、體重與肺活量之間的關(guān)系。如果使用Pearson相關(guān)計算其相關(guān)系數(shù),可以得出肺活量與身高和體重均存在較強的線性關(guān)系。但實際上,如果對體重相同的人,分析身高和肺活量,是否身高越高,肺活量就越大呢?不是的。原因是身高與體重有線性關(guān)系,體重與肺活量存在線性關(guān)系,因此得出身高和肺活量之間存在著較強的線性關(guān)系的錯誤結(jié)論。偏相關(guān)分析的任務(wù)就是在控制其他變量的線性影響的條件下,研究兩個變量之間的線性相關(guān)關(guān)系。分析身高與肺活量之間的相關(guān)性,就要控制體重在相關(guān)分析中的影響。實際生活中有許多這樣的關(guān)系,如可以控制年齡和工作經(jīng)驗兩個變量的影響,估計工資收入與受教育程度之間的相關(guān)關(guān)系??梢栽诳刂其N售能力與各種其他經(jīng)濟指標的情況下,研究銷售量與廣告費用之間的關(guān)系等。4/5/202474第一,計算樣本的偏相關(guān)系數(shù)假設(shè)有三個變量y、x1和x2,在分析x1和y之間的凈相關(guān)時,當(dāng)控制了x2的線性作用后,x1和y之間的一階偏相關(guān)定義為:

偏相關(guān)系數(shù)的取值范圍及大小含義與相關(guān)系數(shù)相同。利用偏相關(guān)系數(shù)進行分析的步驟4/5/202475第二,對樣本來自的兩總體是否存在顯著的凈相關(guān)進行推斷檢驗統(tǒng)計量為:其中,r為偏相關(guān)系數(shù),n為樣本數(shù),q為階數(shù)。T統(tǒng)計量服從n-q-2個自由度的t分布。4/5/2024761.選擇菜單Analyze-Correlate-Partial偏相關(guān)分析的基本操作4/5/2024772.把參與分析的變量選擇到Variables框中。3.選擇一個或多個控制變量到Controllingfor框中。4.在TestofSignificance框中選擇輸出偏相關(guān)檢驗的雙尾概率p值或單尾概率p值。5.在Option按鈕中的Statistics選項中,選中Zero-orderCorrelations表示輸出零階偏相關(guān)系數(shù)。至此,SPSS將自動進行偏相關(guān)分析和統(tǒng)計檢驗,并將結(jié)果顯示到輸出窗口。4/5/202478偏相關(guān)分析實例例

[07-3]某農(nóng)場通過試驗取得早稻產(chǎn)量與降雨量和溫度的數(shù)據(jù)如下,現(xiàn)求降雨量對產(chǎn)量的偏相關(guān)系數(shù)。早稻產(chǎn)量與春季降雨量和平均溫度的關(guān)系產(chǎn)量降雨量溫度1502562303383004510450105134801111450011516550120175801201860012518600130204/5/202479第二節(jié)回歸分析在SPSS回歸過程中包括:Liner:線性回歸CurveEstimation:曲線估計BinaryLogistic:二項邏輯回歸MultinomialLogistic:多項邏輯回歸Ordinal:有序回歸Probit:概率回歸Nonlinear:非線性回歸WeightEstimation:加權(quán)估計2-StageLeastsquares:二段最小平方法OptimalScaling最優(yōu)編碼回歸我們主要介紹前面2個4/5/202480一、線性回歸(Liner)一元線性回歸方程:y=a+bxa稱為截距b為回歸直線的斜率用R2判定系數(shù)判定一個線性回歸直線的擬合程度:用來說明用自變量解釋因變量變異的程度(所占比例)多元線性回歸方程:y=b0+b1x1+b2x2+…+bnxnb0為常數(shù)項b1、b2、…、bn稱為y對應(yīng)于x1、x2、…、xn的偏回歸系數(shù)用AdjustedR2調(diào)整判定系數(shù)判定一個多元線性回歸方程的擬合程度:用來說明用自變量解釋因變量變異的程度(所占比例)回歸模型的確定:一般先做散點圖(Graphs→Scatter→

Simple),以便進行簡單地觀測(如:可支配收入與消費的關(guān)系)若散點圖的趨勢大概呈線性關(guān)系,可以建立線性方程,若不呈線性分布,可建立曲線方程模型,并比較R2(→1)來確定一種最佳方程式(曲線估計)4/5/2024811、回歸方程的擬合優(yōu)度回歸直線與各觀測點的接近程度稱為回歸方程的擬合優(yōu)度,也就是樣本觀測值聚集在回歸線周圍的緊密程度。(1)離差平方和的分解:建立直線回歸方程可知:y的觀測值的總變動可由來反映,稱為總變差。引起總變差的原因有兩個:由于x的取值不同,使得與x有線性關(guān)系的y值不同;隨機因素的影響。線性回歸方程的有關(guān)檢驗4/5/202482即:總離差平方和(SST)=剩余離差平方和(SSE)+回歸離差平方和(SSR)其中;SSR是由x和y的直線回歸關(guān)系引起的,可以由回歸直線做出解釋;SSE是除了x對y的線性影響之外的隨機因素所引起的Y的變動,是回歸直線所不能解釋的??傠x差平方和可分解為4/5/202483

回歸平方和在總離差平方和中所占的比例可以作為一個統(tǒng)計指標,用來衡量X與Y的關(guān)系密切程度以及回歸直線的代表性好壞,稱為可決系數(shù)。對于一元線性回歸方程:(2)可決系數(shù)(判定系數(shù)、決定系數(shù))4/5/202484對于多元線性回歸方程:

在多元線性回歸分析中,引起判定系數(shù)增加的原因有兩個:一個是方程中的解釋變量個數(shù)增多,另一個是方程中引入了對被解釋變量有重要影響的解釋變量。如果某個自變量引入方程后對因變量的線性解釋有重要貢獻,那么必然會使誤差平方和顯著減小,并使平均的誤差平方和也顯著減小,從而使調(diào)整的判定系數(shù)提高。所以在多元線性回歸分析中,調(diào)整的判定系數(shù)比判定系數(shù)更能準確的反映回歸方程的擬合優(yōu)度。4/5/2024852、回歸方程的顯著性檢驗(方差分析F檢驗)回歸方程的顯著性檢驗是要檢驗被解釋變量與所有的解釋變量之間的線性關(guān)系是否顯著。對于一元線性回歸方程,檢驗統(tǒng)計量為:對于多元線性回歸方程,檢驗統(tǒng)計量為:4/5/2024863、回歸系數(shù)的顯著性檢驗(t檢驗)回歸系數(shù)的顯著性檢驗是要檢驗回歸方程中被解釋變量與每一個解釋變量之間的線性關(guān)系是否顯著。對于一元線性回歸方程,檢驗統(tǒng)計量為:

4/5/202487對于多元線性回歸方程,檢驗統(tǒng)計量為:4/5/2024884、殘差分析

殘差是指由回歸方程計算得到的預(yù)測值與實際樣本值之間的差距,定義為:

對于線性回歸分析來講,如果方程能夠較好的反映被解釋變量的特征和規(guī)律性,那么殘差序列中應(yīng)不包含明顯的規(guī)律性。殘差分析包括以下內(nèi)容:殘差服從正態(tài)分布,其平均值等于0;殘差取值與X的取值無關(guān);殘差不存在自相關(guān);殘差方差相等。

4/5/202489(1)對于殘差均值和方差齊性檢驗可以利用殘差圖進行分析。如果殘差均值為零,殘差圖的點應(yīng)該在縱坐標為0的中心的帶狀區(qū)域中隨機散落。如果殘差的方差隨著解釋變量值(或被解釋變量值)的增加呈有規(guī)律的變化趨勢,則出現(xiàn)了異方差現(xiàn)象。(2)DW檢驗。DW檢驗用來檢驗殘差的自相關(guān)。檢驗統(tǒng)計量為:

DW=2表示無自相關(guān),在0-2之間說明存在正自相關(guān),在2-4之間說明存在負的自相關(guān)。一般情況下,DW值在1.5-2.5之間即可說明無自相關(guān)現(xiàn)象。4/5/2024905、多重共線性分析

多重共線性是指解釋變量之間存在線性相關(guān)關(guān)系的現(xiàn)象。測度多重共線性一般有以下方式:(1)容忍度:其中,是第i個解釋變量與方程中其他解釋變量間的復(fù)相關(guān)系數(shù)的平方,表示解釋變量之間的線性相關(guān)程度。容忍度的取值范圍在0-1之間,越接近0表示多重共線性越強,越接近1表示多重共線性越弱。(2)方差膨脹因子VIF。方差膨脹因子是容忍度的倒數(shù)。VIF越大多重共線性越強,當(dāng)VIF大于等于10時,說明存在嚴重的多重共線性。

4/5/202491(3)特征根和方差比。根據(jù)解釋變量的相關(guān)系數(shù)矩陣求得的特征根中,如果最大的特征根遠遠大于其他特征根,則說明這些解釋變量間具有相當(dāng)多的重復(fù)信息。如果某個特征根既能夠刻畫某解釋變量方差的較大部分比例(0.7以上),又能刻畫另一解釋變量方差的較大部分比例,則表明這兩個解釋變量間存在較強的線性相關(guān)關(guān)系。(4)條件指數(shù)。指最大特征根與第i個特征根比的平方根。通常,當(dāng)條件指數(shù)在0-10之間時說明多重共線性較弱;當(dāng)條件指數(shù)在10-100之間說明多重共線性較強;當(dāng)條件指數(shù)大于100時說明存在嚴重的多重共線性。

4/5/202492(1)選擇菜單Analyze-Regression-Linear,出現(xiàn)窗口:線性回歸分析的基本操作4/5/202493(2)選擇被解釋變量進入Dependent框。(3)選擇一個或多個解釋變量進入Independent(s)框。(4)在Method框中選擇回歸分析中解釋變量的篩選策略。其中Enter表示所選變量強行進入回歸方程,是SPSS默認的策略,通常用在一元線性回歸分析中;Remove表示從回歸方程中剔除所選變量;Stepwise表示逐步篩選策略;Backward表示向后篩選策略;Forward表示向前篩選策略。4/5/202494注:多元回歸分析中,變量的篩選一般有向前篩選、向后篩選、逐步篩選三種基本策略。向前篩選(Forward)策略:解釋變量不斷進入回歸方程的過程。首先,選擇與被解釋變量具有最高線性相關(guān)系數(shù)的變量進入方程,并進行回歸方程的各種檢驗;然后,在剩余的變量中尋找與被解釋變量偏相關(guān)系數(shù)最高且通過檢驗的變量進入回歸方程,并對新建立的回歸方程進行各種檢驗;這個過程一直重復(fù),直到再也沒有可進入方程的變量為止。4/5/202495向后篩選(Backward)策略:變量不斷剔除出回歸方程的過程。首先,所有變量全部引入回歸方程,并對回歸方程進行各種檢驗;然后,在未通過回歸系數(shù)顯著性檢驗的一個或多個變量中,剔除t檢驗值最小的變量,重新建立回歸方程,并進行各種檢驗;如果新建回歸方程中所有變量的回歸系數(shù)檢驗都顯著,則回歸方程建立結(jié)束。否則按上述方法再一次剔除最不顯著的變量,直到再也沒有可剔除的變量為止。逐步篩選(Stepwise)策略:在向前篩選策略的基礎(chǔ)上結(jié)合向后篩選策略,在每個變量進入方程后再次判斷是否存在應(yīng)該剔除出方程的變量。因此,逐步篩選策略在引入變量的每一個階段都提供了再剔除不顯著變量的機會。4/5/202496(5)第三和第四步中確定的解釋變量及變量篩選策略可放置在不同的塊(Block)中。通常在回歸分析中不止一組待進入方程的解釋變量和相應(yīng)的篩選策略,可以單擊Next和Previous按鈕設(shè)置多組解釋變量和變量篩選策略并放置在不同的塊中。(6)選擇一個變量作為條件變量放到Selection

Variable框中,并單擊Rule按鈕給定一個判斷條件。只有變量值滿足判定條件的樣本才參與線性回歸分析。(7)在CaseLabels框中指定哪個變量作為樣本數(shù)據(jù)點的標志變量,該變量的值將標在回歸分析的輸出圖形中。4/5/2024971、Statistics按鈕,出現(xiàn)的窗口可供用戶選擇更多的輸出統(tǒng)計量。線性回歸分析的其他操作4/5/202498(1)Estimates:SPSS默認輸出項,輸出與回歸系數(shù)相關(guān)的統(tǒng)計量。包括回歸系數(shù)(偏回歸系數(shù))、回歸系數(shù)標準誤差、標準化回歸系數(shù)、回歸系數(shù)顯著性檢驗的t統(tǒng)計量和概率p值,各解釋變量的容忍度。(2)ConfidenceIntervals:輸出每個非標準化回歸系數(shù)95%的置信區(qū)間。(3)Descriptive:輸出各解釋變量和被解釋變量的均值、標準差、相關(guān)系數(shù)矩陣及單側(cè)檢驗概率p值。4/5/202499(4)Modelfit:SPSS默認輸出項,輸出判定系數(shù)、調(diào)整的判定系數(shù)、回歸方程的標準誤差、回歸方程顯著F檢驗的方差分析表。(5)Rsquaredchange:輸出每個解釋變量進入方程后引起的判定系數(shù)的變化量和F值的變化量。(6)Partandpartialcorrelation:輸出方程中各解釋變量與被解釋變量之間的簡單相關(guān)、偏相關(guān)系數(shù)。4/5/2024100(7)Covariancematrix:輸出方程中各解釋變量間的相關(guān)系數(shù)、協(xié)方差以及各回歸系數(shù)的方差。(8)CollinearityDiagnostics:多重共線性分析,輸出各個解釋變量的容忍度、方差膨脹因子、特征值、條件指標、方差比例等。(9)在Residual框中:Durbin-waston表示輸出DW檢驗值;CasewiseDiagnostic表示輸出標準化殘差絕對值大于等于3(SPSS默認值)的樣本數(shù)據(jù)的相關(guān)信息,包括預(yù)測值、殘差、杠桿值等。4/5/20241012、Options選項,出現(xiàn)的窗口可供用戶設(shè)置多元線性回歸分析中解釋變量篩選的標準以及缺失值的處理方式。3、Plot選項,出現(xiàn)的窗口用于對殘差序列的分析。4/5/2024102(1)窗口左邊框中各變量名的含義是:DEPENDNT表示被解釋變量,*ZPRED表示標準化預(yù)測值,*ZRESID表示標準化殘差,*DRESID表示剔除殘差,*ADJPRED表示調(diào)整的預(yù)測值,*SRESID表示學(xué)生化殘差,*SDRESID表示剔除學(xué)生化殘差。(2)繪制多對變量的散點圖,可根據(jù)需要在scatter框中定義散點圖的縱坐標和橫坐標變量。(3)在StandardizedResidualPlots框中選擇Histogram選項繪制標準化殘差序列的直方圖;選擇Normalprobabilityplot繪制標準化殘差序列的正態(tài)分布累計概率圖。選擇Produceallpartial

plots選項表示依次繪制被解釋變量和各個解釋變量的散點圖。4/5/20241034、Save選項,該窗口將回歸分析的某些結(jié)果以SPSS變量的形式保存到數(shù)據(jù)編輯窗口中,并可同時生成XML格式的文件,便于分析結(jié)果的網(wǎng)絡(luò)發(fā)布。(1)PredictedValues框中:保存非標準化預(yù)測值、標準化預(yù)測值、調(diào)整的預(yù)測值和預(yù)測值的均值標準誤差。(2)Distance框中:保存均值或個體預(yù)測值95%(默認)置信區(qū)間的下限值和上限值。(3)Residual框中:保存非標準化殘差、標準化殘差等。(4)InfluenceStatistics框中:保存剔除第i個樣本后統(tǒng)計量的變化量。5、WLS選項,采用加權(quán)最小二乘法替代普通最小二乘法估計回歸參數(shù),并指定一個變量作為權(quán)重變量。4/5/2024104

[07-4]為研究高等院校人文社會科學(xué)研究中立項課題數(shù)會受哪些因素的影響,收集某年31個省市自治區(qū)部分高校有關(guān)社科研究方面的數(shù)據(jù),以課題總數(shù)X5為被解釋變量,解釋變量為投入人年數(shù)X2、投入高級職稱的人年數(shù)X3、投入科研事業(yè)費X4、專著數(shù)X6、論文數(shù)X7、獲獎數(shù)X8,建立回歸方程進行分析。(1)解釋變量采用強制進入策略(Enter),并做多重共線性檢測。(2)解釋變量采用向后篩選策略讓SPSS自動完成解釋變量的選擇。(3)解釋變量采用逐步篩選策略讓SPSS自動完成解釋變量的選擇?;貧w分析應(yīng)用舉例

4/5/2024105線性回歸分析練習(xí)

[07-5]為了研究我國民航客運量的變化趨勢及其成因,我們以我國連續(xù)16年的數(shù)據(jù)進行分析。其中,民航客運量作為被解釋變量,以國民收入、消費額、鐵路客運量、民航航線里程、來華旅游入境人數(shù)為影響民航客運量的主要因素。

Y表示民航客運量(萬人),X1表示國民收入(億元),X2表示消費額(億元),X3表示鐵路客運量(萬人),X4表示民航航線里程(萬公里),X5表示來華旅游入境人數(shù)(萬人)。4/5/2024106二、曲線估計(CurveEstimation)對于回歸分析,若散點圖的趨勢不呈線性分布,可以利用曲線估計方便地進行線性擬合(liner)、二次曲線擬合(Quadratic)、三次曲線擬合(Cubic)等。采用哪種擬合方式主要取決于各種擬合模型對數(shù)據(jù)描述的充分性(看R2→1)不同模型的表示模型名稱回歸方程相應(yīng)的線性回歸方程Linear(線性)Y=b0+b1tQuadratic(二次)Y=b0+b1t+b2t2Compound(復(fù)合)Y=b0(b1t)Ln(Y)=ln(b0)+ln(b1)tGrowth(增長曲線)Y=eb0+b1tLn(Y)=b0+b1tLogarithmic(對數(shù))Y=b0+b1ln(t)Cubic(三次)Y=b0+b1t+b2t2+b3t3S(S型曲線)Y=eb0+b1/tLn(Y)=b0+b1/

tExponential(指數(shù))Y=b0*

eb1*tLn(Y)=ln(b0)+b1tInverse(雙曲線)Y=b0+b1/tPower(冪)Y=b0(tb1)Ln(Y)=ln(b0)+b1ln(t)Logistic(羅吉斯蒂)Y=1/(1/u+b0b1t)Ln(1/Y-1/u)=ln(b0+ln(b1)t)4/5/2024107可通過繪制并觀察樣本數(shù)據(jù)的散點圖粗略確定被解釋變量和解釋變量之間的相關(guān)關(guān)系,為曲線擬合中的模型選擇提供依據(jù)。SPSS曲線估計的基本操作步驟是:(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論