




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、用SPSS作聚類分析以經濟效益數(shù)據(jù)為例,用聚類分析法對各省市作分類 (見spssex-4/全國各省市經濟效益數(shù)據(jù))以城鎮(zhèn)居民消費資料為例,用聚類分析法對各省市作分類 (見spssex-4/城鎮(zhèn)居民消費支出資料) 1SPSS中的聚類分析Spss中的聚類功能常用的有兩種:快速聚類(迭代過程): K-Means Cluster系統(tǒng)聚類:Hierarchical Cluster2一、Hierarchical Cluster聚類系統(tǒng)聚類由兩種方法:分解法和凝聚法。系統(tǒng)聚類的功能:即可進行樣品的聚類,也可進行變量的聚類。系統(tǒng)聚類的原理:即我們前面介紹過的系統(tǒng)聚類方法的原理和過程。3系統(tǒng)聚類的中要進行以下的
2、選擇:數(shù)據(jù)的標準化測度方法的選擇:距離方法的選擇或相似性、關聯(lián)程度的選擇。聚類方法的選擇:即以什么方法聚類,spss中提供了7中方法可進行選擇。輸出圖形的選擇:樹形圖或冰柱圖。4系統(tǒng)聚類5見(一)聚類方法見( 二)各種距離和相似系數(shù)6Method聚類方法標準化變換親疏關系指標7(一)聚類方法1.Between-groups linkage 類間平均法 兩類距離為兩類元素兩兩之間平均平方距離2.Within-groups linkage 類內平均法兩類距離為合并后類中可能元素兩兩之間平均平方距離3.Nearest neighbor 最短距離法 4. Furthest neighbor 最長距離法
3、5.Centroid clustering 重心法 (歐式距離)6.Median clustering 中間距離法 (歐式距離)7.Ward Method 離差平方法 (歐式距離)8 1.squared euclidean distance 平方歐式距離2. euclidean distance 歐式距離3.cosine 夾角余弦(R型)4.pearson correlation 皮爾遜相關系數(shù)(R)5.chebychev 切比雪夫距離(二)各種距離和相似系數(shù)(親疏關系指標)96.block 絕對值距離7.minkowski 明考斯基8.customized 1011Statistics聚類進
4、度表相似矩陣樣品或變量的分類情況1213 凝聚狀態(tài)表的第一列表示聚類分析的第幾步;第二列、第三列表示本步聚類中哪兩個樣本或小類聚成一類;第四列是相應的樣本距離或小類距離;第五列、第六列表明本步聚類中,參與聚類的是樣本還是小類。0表示樣本,數(shù)字n(非0)表示由第n步聚類產生的小類參與本步聚類;第七列表示本步聚類的結果將在下面聚類的第幾步中用到。1415Plot樹狀結構圖冰柱圖冰柱的方向16Vertical Icicle6717 冰柱圖因其樣子非常象冬天房頂垂下的冰柱得名,它以圖形的方式顯示層次聚類分析結果,一般從冰柱圖的最后一行開始觀察,第一列表示類數(shù)。兩樣品之間的“”表示將其兩邊的樣品(類)聯(lián)
5、結起來聚成新類。1819應用舉例:4-120 首先對表4-1中的原始數(shù)據(jù)進行標準化變換處理,經過運算使數(shù)據(jù)標準化得到表4-2,使它的每列數(shù)據(jù)的平均值為0,方差為1,這樣表4-1中5列具有不同量綱、不同數(shù)量級的數(shù)據(jù)不同地區(qū)數(shù)據(jù)求出歐氏距離。就能放在一起比較;其次用表4-2中經過標準化處理后的30個212223表4-12425表 4-2262728K-Means Cluster聚類29K-Means Cluster原理首先,選擇n個數(shù)值型變量參與聚類分析,最后要求的聚類數(shù)為k個;其次,由系統(tǒng)選擇k個(聚類的類數(shù))觀測量(也可由用戶指定)作為聚類的種子。第三,按照距離這些類中心的距離最小的原則把所有
6、觀測量(樣品)分派到各類重心所在的類中去。第四,這樣每類中可能由若干個樣品,計算每個類中各個變量的均值,以此作為第二次迭代的中心;第五,然后根據(jù)這個中心重復第三、第四步,直到中心的迭代標準達到要求時,聚類過程結束。30K-Means Cluster聚類過程由AnalyzeClassify K-Means Cluster將個變量放入Variable ;輸入最后聚類的個數(shù);31例 飲料數(shù)據(jù)(spssex/drink.sav )16種飲料的熱量、咖啡因、鈉及價格四種變量 32 快速聚類33選項讀寫凝聚點人為固定分類數(shù)ANOVA表,初始凝聚點等34快速聚類法的聚類數(shù)由用戶指定,分類是唯一的。1.分類數(shù)
7、:如希望聚成K類2.聚類方法:method: iterate and clussify(聚類分析的 clussify only(聚類分析過程類中心3.聚類中心:centers4.迭代次數(shù):iterate5.保存分類結果:save每一步都重新計算新的類中心點)點始終為初始類中心點,僅作一次迭代)35Initial Cluster Center:快速聚類的初始類中心點(本例由系統(tǒng)自行指定四個類的初始類中心點)指定聚成四類36Iteration History:快速聚類的迭代步驟 在迭代過程中,完成第一次迭代后形成的四個新類中心點距初始類中心點的歐氏距離分別為5.065、12.532、12.275、25.901。第四次迭代后形成的四個新類
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030中國甲乙酮行業(yè)市場深度調研及發(fā)展策略與投資機會報告
- 2025至2030中國燃料柔性鍋爐行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 智能體育訓練系統(tǒng)定制協(xié)議
- 小學二年級數(shù)學100以內三數(shù)加減混合運算競賽考核練習題
- 反思整改活動方案
- 農村房屋修繕施工協(xié)議書條款
- 酒店運營管理權委托合同
- 旅游景區(qū)游客安全游玩免責合同書
- 農機五一活動策劃方案
- 農業(yè)實踐活動方案
- 2024年中考地理簡答題答題模板
- 農村自建房施工安全建議
- 廣東省深圳市龍崗區(qū)龍嶺中學2024年物理八下期末統(tǒng)考試題及答案解析
- 2024年湖北省丹江口市初中畢業(yè)生適應性考試地理·生物試題
- DZ∕T 0033-2020 固體礦產地質勘查報告編寫規(guī)范(正式版)
- 2024年輔警招聘考試試題庫附參考答案(完整版)
- NY-T 3213-2023 植保無人駕駛航空器 質量評價技術規(guī)范
- 2023年春季內蒙古高一化學學業(yè)水平合格性考試卷真題
- 北師大版六年級下學期小升初數(shù)學期末考試試題(含答案)
- 司母戊鼎的介紹
- 2024年兒童童車行業(yè)分析報告及未來發(fā)展趨勢
評論
0/150
提交評論