




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、摘 要因子分析是利用降維的思想,由研究原始變量相關矩陣內部的依賴關系出發(fā),把一些錯綜復雜關系的變量歸結為少數幾個綜合因子的一種多變量統(tǒng)計分析方法。它的基本思想是根據相關性大小把原始變量分組,使得同組之間變量相關性較高,不同組之間的變量的相關性則較低。學會應用SPSS軟件進行相關的因子分析,并將所學的知識結合SPSS對數據進行處理,可以更好地解決實際問題。K均值法是非譜系聚類法的一種,非譜系聚類法是把樣品聚類成K個類的集合,類的個數K可以預先給定,或者在聚類過程中確定,這種聚類方法在計算機計算過程中無須確定距離,也無須存儲數據。所以,K均值聚類可以應用于較大的數據組,它的思想是把每個樣品聚集到其
2、最近形心(均值)類中。第三產業(yè)是一個國家國民經濟中的重要組成部分,目前第三產業(yè)在世界各國得到了迅速的發(fā)展,已經成為發(fā)達國家的重要經濟支柱,我國自從改革開發(fā)以來,第三產業(yè)得到了長足發(fā)展。在發(fā)達國家,第三產業(yè)占國民經濟的比重非常大,影響第三產業(yè)的因素有很多,本文試著通過對交通運輸倉儲和郵政業(yè)、批發(fā)和零售業(yè)、住宿和餐飲業(yè)、金融業(yè)、房地產業(yè)和其他的增加值指數的聚類分析和因子分析,探討國家第三產業(yè)的發(fā)展情況。關鍵詞:spss;第三產業(yè);聚類;因子分析目錄1引言12數據來源13實驗原理23.1因子分析的方法原理23.2聚類分析的思想原理24數據處理34.1因子分析的數據處理34.2聚類分析的數據處理85結
3、果分析105.1因子分析的結果分析105.2聚類分析的結果分析11附 錄12參考文獻15II1引言第三產業(yè),又稱第三次產業(yè)是指除第一、二產業(yè)以外的其他行業(yè),是不生產物質產品的行業(yè),即服務業(yè)。第三產業(yè)一詞首先是英國經濟學家、新西蘭奧塔哥大學教授費希爾1935年在安全與進步的沖突一書中首先提出來的。第三產業(yè)主要包括流通、生產生活服務等部門。第三產業(yè)的發(fā)展水平是衡量一個國家經濟社會發(fā)展程度的重要標志。新中國成立后的二十多年,我國第三產業(yè)有所發(fā)展,但基本上處于被抑制狀態(tài)。中共十一屆三中全會以后,才獲得了新的生機。為適應加快改革開放和經濟發(fā)展的新形勢,中共中央、國務院于1992年6月16日做出關于加快發(fā)
4、展 第三產業(yè)的決定,確定發(fā)展第三產業(yè)的目標是:爭取用十年左右或更長一些時間,逐步建立起適合我國國情的社會主義統(tǒng)一市場體系、城鄉(xiāng)社會化綜合服務體系和 社會保障體系。 第三產業(yè)的增長速度要高于第一、 第二產業(yè),第三產業(yè)增加值占國民生產總值的比重和就業(yè)人數占社會勞動者總人數的比重,力爭達到或接近發(fā)展中國家的平均水平。中共十四大報告指出:“發(fā)展我國商業(yè)、金融、保險、旅游、信息、法律和會計審計咨詢、居民服務等 第三產業(yè),不僅有利于促進市場發(fā)育,提高服務的社會化、專業(yè)化水平,提高經濟效益和效率,方便和豐富人民生活,而且可以廣開就業(yè)門路,為 經濟結構調整、企業(yè)經營機制轉換和政府機構改革創(chuàng)造重要條件。我國確立
5、第三產業(yè)的發(fā)展目標是第三產業(yè)的增長速度要高于第一,第二產業(yè),因此,研究我國第三產業(yè)增加值的發(fā)展形勢是十分必要的,對我國第三產業(yè)以及整個經濟發(fā)展政策的制定有很大的影響。2數據來源本文數據來源于國家統(tǒng)計年鑒,記錄了從1978年到2011年我國第三產業(yè)的增加值指數,我們令第三產業(yè)的七類行業(yè)分別為:x1-交通運輸業(yè);x2郵政和倉儲業(yè);x3批發(fā)和零售業(yè);x4住宿和餐飲業(yè);x5金融業(yè);x6房地產業(yè);x7其他。原始數據見附表1,標準化后的數據見附表2。3實驗原理3.1因子分析的方法原理確定因子載荷:主成分法、主軸因子法、最小二乘法、極大似然法、因子提取法等。由于這些方法求解因子載荷的出發(fā)點不同,所得的結果也
6、不完全相同。因子旋轉:因子旋轉分為正交旋轉與斜交旋轉,正交旋轉由初始載荷矩陣左乘一正交陣而得到。經過正交旋轉而得到的新的公因子仍然保持彼此獨立的性質。而斜交旋轉則放棄了因子之間彼此獨立這個限制,因而可能達到更為簡潔的形式,其實際意義也更容易解釋。但不論是正交旋轉還是斜交旋轉,都應當使新的因子載荷系數要么盡可能地接近與零,要么盡可能地遠離零。因子得分:因子得分就是公共因子在每一個樣品點上的得分。根據因子得分我們可以知道我國哪幾年第三產業(yè)的發(fā)展水平較高,哪幾年我國第三產業(yè)發(fā)展速度較慢,可以根據發(fā)展情況來調整相關的政策。3.2聚類分析的思想原理 我們認為,我們研究的樣品和變量之間存在不同程度的相似性
7、(親疏關系)。于是根據一批樣品的多個觀測指標,具體找出一些能夠度量樣品或指標之間相似程度的統(tǒng)計量,以這些統(tǒng)計量作為劃分類型的依據,把一些相似程度較大的聚為一類,把另外一些相似程度較大的聚為另一類關系密切的聚合到一個小的分類單位,關系大的聚合到一個大的分類單位,直到把所有的樣品或指標都聚合完畢。聚類分析的目的是把相似的研究對象歸成類。不同的指標,在聚類分析中的處理方式是不一樣的,根據實際的需要可能有兩個方向,一是對樣品聚類,通常稱為Q型聚類分析,一是對變量分類,通常稱為R型聚類分析。K均值聚類是對樣品進行分類,它能清楚地展示樣品的分類情況,可以解決很多實際問題。4數據處理4.1因子分析的數據處理
8、將原數據表導入spss軟件,依次點選分析降維因子分析進入因子分析對話框。如圖3.1。圖3.1把七個指標變量選入變量,點擊抽取按鈕,在方法選項中選擇主成分分析,在輸出選項中選中碎石圖,點擊繼續(xù)按鈕,在抽取框中,選入3個公共因子如圖3.2。圖3.2點擊確定,得到總的變量解釋表如表3.1,可以看到按照特征值大于1的原則,選入3個公共因子分別為40.364%,18.454%,13.771%,累計方差為72.589%。表3.1元件起始特徵值擷取平方和載入總計變異的 %累加 %總計變異的 %累加 %12.82540.36440.3642.82540.36440.36421.29218.45458.8181
9、.29218.45458.8183.96413.77172.589.96413.77172.5894.93013.28585.8745.5387.68693.5596.4436.32699.8857.008.115100.000相關系數矩陣見表3.2:表3.2元件123x1.960.196.111x2.648.147-.408x3.607.417.225x4.378-.397.707x5.677-.526.043x6.670-.320-.462x7.256.722.138碎石圖如下:圖3.3由圖可知:橫坐標為因子分析數目,縱坐標為特征根。前三個的因子特征值很高,對解釋原有變量的貢獻大;以后的因
10、子特征根值都很小,對解釋原有變量的貢獻很小,已經成為可被忽略的,因此提取3個因子是合適的。此時得到的未旋轉的公共因子的實際意義不好解釋,因此,對公共因子進行方差最大化正交旋轉。在因子分析對話框中,點擊旋轉按鈕,進入因子分析:旋轉對話框,如圖3.4:圖3.4選中最大方差法進行方差最大化正交旋轉,得到輸出結果如表3.3和表3.4:表3.3元件123x1.598.692.367x2.686.348-.126x3.201.717.198x4-.021.071.891x5.635-.056.575x6.870-.031.083x7-.099.754-.166表3.4循環(huán)平方和載入總計變異的 %累加 %2
11、.04129.15029.1501.69224.16653.3161.34919.27372.589由輸出結果,原變量X1可由各因子表示為:X1=0.598*F1+0.692F2+0.367*F3原變量X2可由各因子表示為:X2=0.686*F1+0.348*F2-0.126*F3其余以此類推。為便于得出結論,在因子分析主對話框中點擊選項按鈕進入因子分析:選項對話框,如圖3.5:圖3.5在系數顯示格式框中選中按大小排序,使輸出的載荷陣中各列按載荷系數大小排列,在同一個公共因子上具有較高載荷的變量排在一起。然后點擊繼續(xù)確定運行。得到輸出結果如表3.5。表3.5元件123x6.870-.031.0
12、83x2.686.348-.126x5.635-.056.575x7-.099.754-.166x3.201.717.198x1.598.692.367x4-.021.071.891最后計算因子得分,以各因子的方差貢獻率占三個因子總方差貢獻率的比重作為權重進行加權匯總,得到各年份的綜合得分F:F=(29.150*F1+24.166*F2+19.273*F3)/72.589在因子分析主對話框中點擊得分按鈕進入因子得分對話框,如圖3.6。圖3.6選中保存為變量,在方法中選擇回歸計算因子得分。得到運行結果并計算因子綜合得分及其排名見附表3。依次點選圖標舊對話框散點/散狀進入散點圖對話框,選擇簡單分布
13、,點擊定義按鈕,彈出的簡單散點圖對話框如圖3.7:圖3.7分別選擇fac1-1,fac2-1作為X軸和Y軸,點擊確定運行,得到散點圖如圖3.8。從圖中可以清楚地看到原始數據的分布情況,如果研究需要,也可以輸出第一因子與第三因子、第二因子與第三因子和同時生成三個因子的散點圖。在這里只輸出第一因子與第二因子的散點圖。圖3.84.2聚類分析的數據處理將原數據導入spss軟件,依次點擊分析分類K均值聚類,進入K均值聚類分析對話框,如圖4.2.1圖4.2.1將七個變量指標選入變量列表,將年份選入個案標記依據,在方法中選擇迭代與分類,點擊保存按鈕,選擇聚類成員,點擊繼續(xù),回到K聚類聚類分析對話框,點擊確定
14、,得到聚類結果如下:表4.2.1顯示了2個類的初始類中心情況,可以看出,第二類的各指標值總體上較第一類為優(yōu)。表4.2.1聚類12交通運輸110.4113.0倉儲和郵政業(yè)101.9111.4批發(fā)和零售業(yè)129.599.3住宿和餐飲業(yè)117.5131.6金融業(yè)104.3144.6房地產業(yè)96.5109.1其他107.6113.6表4.2.2顯示了2個類中心點每次迭代的偏移情況,可知第一次迭代第一個類的中心點偏移了24.801,第二個類的中心點偏移了27.576,直到第三次迭代,2個類的中心點偏移才達到指定判定標準(0)。表4.2.2迭代聚類中心內的更改12124.80127.57623.3105.
15、4753.000.000表4.2.3展示了2個類的最終類中心情況,總體來看,第二類的各指標值仍是最優(yōu)的。 表4.2.3聚類12交通運輸109.6113.9倉儲和郵政業(yè)108.9111.1批發(fā)和零售業(yè)109.9114.0住宿和餐飲業(yè)110.5115.9金融業(yè)107.4125.6房地產業(yè)107.4120.5其他111.5110.4表4.2.4給出了各類的樣品數目,第一類包含23個,第二類包含11個 ,總計34個樣品。表4.2.4聚類123.000211.000有效34.000缺失.0005結果分析5.1因子分析的結果分析由旋轉后的因子載荷陣可以看出,公共因子F1在下X1(交通運輸業(yè)),X2(郵政和
16、倉儲業(yè)),X3(批發(fā)和零售業(yè)),X5(金融業(yè)),X6(房地產業(yè)),上的載荷值較大,因此,公共因子F1基本上可以反映我國第三產業(yè)的發(fā)展速度。公共因子F2在X1(交通運輸業(yè)),X2(郵政和倉儲業(yè)),X3(批發(fā)和零售業(yè))上的載荷較大,反映的則是我國在運輸物流方面的發(fā)展狀況。公共因子F3在X4(住宿和餐飲業(yè)),X5(金融業(yè))上的載荷較大,反映的是我國居民日常生活上的變化情況。結合我國1978年到2011年每一年在三個公共因子上的得分和綜合得分,便可以對每一年我國第三產業(yè)的發(fā)展情況進行評價了。在公共因子F1上,大致是1984-1989,2005-2010這幾年的得分較高,因此在這幾年我國第三產業(yè)的發(fā)展速
17、度較高,而1978-1981這幾年的因子得分較低,說明我國第三產業(yè)的發(fā)展才剛剛起步,發(fā)展速度很慢。在公共因子F2上,1999-2008這幾年的因子得分較高,說明這幾年我國的交通物流方面發(fā)展迅速。在公共因子F3上,1981-1989這幾年的因子得分較高,這幾年內我國居民的日常生活水平有很大改變,說明改革開放以來,我國居民的生活水平有顯著提高。從2008-2011年的各個因子得分、綜合得分以及綜合排名可以看出,這幾年的我國第三產業(yè)的發(fā)展情況不容樂觀,應該加速發(fā)展第三產業(yè),調整產業(yè)結構,只有這樣,國民經濟才能更好更快地發(fā)展。5.2聚類分析的結果分析由最終的聚類結果中可以看出,我國第三產業(yè)的發(fā)展十分迅
18、速,在數據表中可以看到名為QCL_1的變量,它表示案例的類別號,從中可以清楚地看出從1978到2011年種每一年被分到了哪一類。我們可以看到,從1982年到1989年都被聚到了第二類,說明自從改革開放以來,我國第三產業(yè)的發(fā)展非常迅速,從最終的聚類中心中可以看出,房地產業(yè)和金融業(yè)的發(fā)展速度尤為突出,而1993年到2005年都被聚到了第一類,說明這幾年房地產業(yè)的發(fā)展速度有所下降。總體來看,近幾年我國第三產業(yè)發(fā)展速度較慢,政府部門應當出臺相關政策,調整產業(yè)結構,加速發(fā)展第三產業(yè)。附 錄附表1 我國第三產業(yè)增加值指數年份交通運輸倉儲和郵政業(yè)批發(fā)和零售業(yè)住宿和餐飲業(yè)金融業(yè)房地產業(yè)其他1978113.81
19、08.9123.1118.1109.8105.7111.01979107.9108.3108.7111.197.2104.1110.11980106.0104.398.1103.9106.6107.9115.11981110.4101.9129.5117.5104.396.5107.61982113.0111.499.3131.6144.6109.1113.61983115.2109.5121.2119.4127.0105.2112.01984119.3114.9124.7108.1131.1127.7115.51985118.2113.8133.5106.3116.9125.0111.719
20、86112.0113.9109.4115.6131.6125.9103.01987114.4109.6114.7109.7123.3129.3110.41988113.2112.5111.8125.1119.5112.7109.41989105.4104.289.3109.9125.9115.9104.91990102.3108.394.7103.5101.9106.2103.71991108.9110.6105.2108.2102.3112.0115.71992112.4110.1110.5127.0108.0134.7111.51993112.2112.5108.6108.2110.911
21、0.8116.91994111.1108.5108.2127.1109.4112.0112.71995109.8111.0108.2110.2108.5112.4110.31996109.4111.0107.6106.8107.5104.0112.71997110.7109.2108.8110.9108.5104.1115.91998108.4110.6106.5111.1104.9107.7109.71999109.3112.2108.7107.7104.8105.9111.42000109.7108.6109.4109.3106.5107.1113.02001110.3108.8109.1
22、107.6106.4111.0112.92002110.4107.1108.8112.1106.9109.9113.62003109.5106.1109.9112.4107.0109.8110.82004110.1114.5106.6112.3103.7105.9112.62005112.2111.2113.0112.3113.8112.2111.92006114.1110.0119.5112.6125.9115.5110.82007116.0111.8120.2109.6127.6124.4111.32008110.4107.3115.9109.6113.3101.0111.02009109
23、.6104.2112.1105.5118.2111.3107.82010109.8109.8114.3110.0110.0107.0107.92011109.4109.4112.6106.6107.2106.7109.6附表2 第三產業(yè)增加值指數標準化后的數據年份x1x2x3x4x5x6x719780.82288-0.238051.314830.85534-0.32609-0.68863-0.023141979-0.93325-0.43536-0.27791-0.17358-1.50538-0.87329-0.328951980-1.48201-1.73844-1.45344-1.22199-
24、0.6276-0.437851.242311981-0.17756-2.536382.030440.76096-0.84274-1.75019-1.0730519820.576080.5855-1.329592.840472.94232-0.298550.7589619831.22437-0.030791.11081.04861.28443-0.750570.2783419842.456271.746211.49782-0.617061.669821.850041.3597819852.105891.384162.47723-0.875460.344891.543160.1711719860.
25、301441.4135-0.199010.491881.720481.63967-2.5153819870.983330.008270.38721-0.376270.941432.03489-0.2064719880.630480.968270.059421.882150.580940.11616-0.546221989-1.67029-1.77105-2.43574-0.346171.184620.49456-1.93781990-2.56273-0.40641-1.83172-1.2893-1.06949-0.62488-2.290321991-0.634160.3204-0.67209-
26、0.60163-1.026930.03431.4165419920.418910.15604-0.079832.16362-0.493432.659870.1201919930.34330.973-0.29463-0.59086-0.22579-0.103731.7941219940.02022-0.34819-0.33752.18273-0.364490.034710.503661995-0.348930.45868-0.33314-0.29783-0.446040.09019-0.244641996-0.470790.47883-0.39943-0.79651-0.53989-0.8802
27、50.489371997-0.09011-0.12522-0.27356-0.1945-0.45041-0.869121.474831998-0.781780.33128-0.52405-0.17658-0.78258-0.45975-0.449531999-0.499320.85201-0.28008-0.66761-0.79391-0.65990.081912000-0.37568-0.3295-0.20135-0.43002-0.63464-0.525830.5832001-0.22568-0.25475-0.23727-0.67829-0.63863-0.077350.54092200
28、2-0.17114-0.80786-0.26875-0.01837-0.59427-0.202170.780892003-0.44823-1.13665-0.143650.01334-0.59026-0.2145-0.104582004-0.284971.61003-0.517830.01061-0.89644-0.664870.4726720050.356150.533450.19929-0.000920.048370.066390.2311720060.919110.127030.913950.044231.185050.44086-0.1097620071.463590.730060.9
29、9731-0.388871.344221.465130.062172008-0.18275-0.742510.51274-0.391420.00715-1.23532-0.044722009-0.43031-1.778110.09671-0.996570.46557-0.04362-1.034462010-0.374770.068970.33991-0.33155-0.30214-0.53942-0.996212011-0.47759-0.066410.15291-0.83258-0.56814-0.57016-0.45676注:第三產業(yè)的七類行業(yè)分別為:x1-交通運輸業(yè);x2郵政和倉儲業(yè);x
30、3批發(fā)和零售業(yè);x4住宿和餐飲業(yè);x5金融業(yè);x6房地產業(yè);x7其他附表3 因子得分表年份F1F2F3F排名 1978-0.731581.033820.959230.305073111979-1.05738-0.18848-0.51151-0.62318311980-1.11396-0.44648-1.12192-0.89386331981-2.319660.54081.59627-0.327662619820.20854-0.360232.900270.73386541983-0.276530.970851.599140.636748519842.277751.65854-0.364521.37006119851.769821.60562-0.651841.072184219862.28189-1.852630.71170.4885461019871.58909-0.21961-0.047410.552441
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 軟件設計師考試知識點梳理試題及答案
- 突破難關的2025年軟件設計師考試試題答案
- 網絡工程師工作環(huán)境了解試題及答案
- 西方政治制度與全球治理體系的關系試題及答案
- 公共政策中的公平與效率辯證關系試題及答案
- 網絡連接的優(yōu)化策略試題及答案
- 軟件設計師考試2025年的重點科目試題及答案
- 探索西方政治制度中的現(xiàn)代挑戰(zhàn)試題及答案
- 醫(yī)療器械國產化替代進程中的國際市場拓展與本土化策略報告(2025年)
- 軟件設計師工具應用及試題及答案的技巧
- word基礎入門公開課課件
- 綜合、??漆t(yī)院執(zhí)業(yè)校驗標準
- 學習羅陽青年隊故事PPT在急難險重任務中攜手拼搏奉獻PPT課件(帶內容)
- 稀土元素的分離方法-icaredbd課件
- 四年級下數學課件-火車過橋-通用版
- 版式設計課件3,網格系統(tǒng)全攻略
- 船舶防臺風安全安全知識
- 國家開放大學《人文英語3》章節(jié)測試參考答案
- 用雙棱鏡干涉測光波(20149)
- 靜音房聲學設計方案
- 四年級滬教版語文下冊閱讀理解專項習題含答案
評論
0/150
提交評論