


版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、地球科學與學院中國地質大學(北京)遙感與地學信息教研室數學在地學中的應用實習三、聚類分析實驗目的:1.2.3.熟悉系統(tǒng)聚類和 k-均值聚類方法;熟悉 R 型、Q 型系統(tǒng)聚類分析 SPSS 操作流程; 理解聚類分析結果分析思路。一、系統(tǒng)聚類分析1.2.3.系統(tǒng)聚類主要有兩種方法:分解法和凝聚法; 系統(tǒng)聚類的功能:樣品的聚類和變量的聚類;系統(tǒng)聚類分析流程:數據的標準化à測度方法的選擇(距離方法的選擇或相似性、關聯(lián)程度的選擇)à聚類方法的選擇à輸出圖形的選擇1.數據的標準化處理導入數據。打開“實習三”文件夾中“實習三.xlsx”文件,在“打開 Excel 數據源” 擊確
2、定??蛑斜A裟J設置,點數據的標準化處理。點擊工具欄中的“分析”(A)à“描述統(tǒng)計”à“描述”,進入“描述性”框(B),選擇除 FID 以框中保留默認選擇,外所有元素變量進行分析,點擊“選項”à進入“描述:選項”框。在該系統(tǒng)將對所選元素含量的均值、標準差、最小值、最大值進行統(tǒng)計分析à點擊“繼續(xù)”返回“描述性”框(B)à“將標準化得分另存為變量(Z)”à點擊“確定”,得到各元素統(tǒng)計分析結果(D),并且可以在“變量視圖”中查看標準化后的各元素含量以新變量的形式出現在窗口中(E)。地球科學與學院中國地質大學(北京)遙感與地學信息教研室(A)
3、(B)(C)(D)(E)當重復步驟,對標準化后的數據進行統(tǒng)計分析時,可以得到新變量均值為 0,標準差為 1,如下圖分析結果所示。接下來的聚類分析過程,將使用標準化后的數據進行。地球科學與學院中國地質大學(北京)遙感與地學信息教研室2.Q 型(基于樣本)聚類分析點擊“分析”à“分類”à“系統(tǒng)聚類”進入“系統(tǒng)聚類分析”對數據進行 Q 型聚類分析???。選擇分群“個案”,即選擇“個案”,即對樣本進行聚類(Q 型聚類)設置分類方案。點擊“統(tǒng)計量”à進入“系統(tǒng)聚類分析:統(tǒng)計量”框。按圖計量à點擊“繼續(xù)”返回“系統(tǒng)聚類分析”框。分類信息表:ØØ無:
4、表示不列示分類信息表; 單一方案:指定分類數的分類信息表。若要顯示分為 6 類, 則在此填入 6;方案范圍:指定分為多類的分類信息。若要顯示分為 3、4、5、6 類的情況,則在最小和最大聚類數中分別填寫 3、6。也稱“凝聚狀態(tài)表”相似性矩陣表Ø設置繪圖方案。在“系統(tǒng)聚類分析”框中,點擊“繪制”,進入“系統(tǒng)聚類分析:圖”框。按下圖相應選項à點擊“繼續(xù)”,返回“系統(tǒng)聚類分析”框。地球科學與學院中國地質大學(北京)遙感與地學信息教研室輸出所有分類的冰柱圖輸出指定類分類結果冰柱圖不輸出分類結果冰柱圖冰柱圖水平或垂直顯示設置分類方法。在“系統(tǒng)聚類分析”框中,點擊“方法”,進入“系統(tǒng)聚
5、類分析:方法”框。按下圖相應選項à點擊“繼續(xù)”,返回“系統(tǒng)聚類分析”框。相似性度量指標:類間距離定義方法:數據標準化處理方式選擇;系統(tǒng)默認為不進行標準化處理。本實驗第一步已對數據按變量進行了標準化處理。設置保存方案。在“系統(tǒng)聚類分析”框中,點擊“保存”,進入“系統(tǒng)聚類分析:保存”框。在這里選擇是否將某分類信息以新變量的形式保存在數據文件中à按下圖在“單一方案聚類數”中填入 6à點擊“繼續(xù)”,返回“系統(tǒng)聚類分析”框à點擊“確定”,得到聚類分析結果。ØØ系統(tǒng)默認:不保存;單一方案:保存指定分類的分類結果。若要保存分為 6 類的情況, 則在
6、“聚類數”中填入 6。系統(tǒng)將產生一個新變量,將所有樣本分到 6 類中某一類結果標示在新變量中;方案范圍:保存指定分為某幾類Ø地球科學與學院中國地質大學(北京)遙感與地學信息教研室3.查看 Q 型聚類分析結果樣本基本情況。本例中有效分類樣本數量為 80 個。查看相似性矩陣。表中矩陣了 80 個樣本點兩兩之間的距離。凝聚狀態(tài)表。第五、六列(首次出現階群集):表示該步驟是樣本的聚類還是樣本與類的聚類或者是類與類的聚類; 0-樣本;非 0-類,數字表示第幾步聚成的類。第一列(階):聚類進行到第幾步。第二、三列(群集):表示是哪兩個樣本或類第四列(聚類系數):表示該步中實現聚類的兩樣本(或類)
7、之間的距離第七列(下一階):表示該果會在后面第幾步用到。類結 分類信息表。該表表示在設定為 6 類的情況下,各樣本點的分類情況。 冰柱圖。冰柱圖因其樣子形似冬天房頂上垂下的冰柱而得名。一般從冰柱圖的最后一行開始觀察,縱坐標表示類的順序,橫坐標表示樣品號。兩樣品之間實心部分,表示在該類上把這兩個樣品進行聚合地球科學與學院中國地質大學(北京)遙感與地學信息教研室形成一類。 系統(tǒng)聚類譜系圖(樹狀圖)。4. R 型(基于變量)聚類分析及結果 R 型聚類分析步驟與 Q 型聚類分析步驟雷同,僅需在“系統(tǒng)聚類分析”“變量”類型??虻摹胺秩骸狈桨钢羞x擇 用相同方法得到 R 型聚類分析結果,所得到的各種圖標均變
8、量進行聚類分析。二、K-means 聚類分析注意:K-均值聚類只能做 Q 型(樣本)聚類;如要做 R 型(變量)聚類,需要把數據陣進行轉置。以下過程為樣本聚類。1. k-均值聚類分析K-Means 聚類分析的步驟為:Step1:指定聚類的數目,假設要分成 k 類;Step2:確定類的初始中心??捎捎脩糇远x,也可讓系統(tǒng)選定;地球科學與學院中國地質大學(北京)遙感與地學信息教研室Step3:根據距離最近原則進行聚類; Step4:重新確定 K 個類的中心;Step5:重復 Setp3 Step4,直到滿足停止聚類分析的條件。點擊“分析”à“分類”à“k-均值聚類”進入“K-均
9、值聚類分析”框(A)。設置聚類變量和數目。將全部經過標準化后的變量導入“變量”欄中;聚類數量改為“6”。設置終止聚類分析的條件。點擊“迭代”à進入“K-均值聚類分析:寫入文件”框(B)à保留默認迭代次數為 10à點擊“繼續(xù)”返回“K 均值聚類分析”框。迭代次數:進行 10 次迭代后,聚類分析停止,不再重新確定K 個類的中心聚類數量應少于樣本數量收斂性標準:說明類中心點偏移的程度,即迭代前后中心點的最大偏移量是否超過預定值,一般取 0.02。設置初始聚類中心。點擊“選項”à進入“K 均值聚類分析:選項”點擊“繼續(xù)”返回“K 均值聚類分析”框。框(A),如圖
10、計量à輸出方差分析表,反映哪些變量對分類起著顯著作用樣本的處理,可不用選擇,默認即可。輸出每個樣本的分類信息設置保存方式。點擊“保存”à進入“K-Means 群集:保存新變量”框。如圖即將保存的結果à點擊“繼續(xù)”返回“K 均值聚類分析”框à點擊“確定”,得到聚類分析結果。以新變量“QCL_1”保存“分類信息”到 SPSS 數據文件中以新變量“QCL_2”保存“每個 樣本到各自所在類的類中心的距離”到 SPSS 數據文件中地球科學與學院中國地質大學(北京)遙感與地學信息教研室2.查看 K-Means 聚類分析結果初始聚類中心表和最終聚類中心表。表中給出了每一個變量所有樣品的聚類情況。由于沒有指定初始 聚類中心,對每一個變量的樣品進行聚類分析時,系統(tǒng)自動選取了初始聚類中心。經過聚類分析最終得到的聚類中心與初始聚類中心有差異。聚類成員。該表中顯示了每一個樣品其分類,及距離聚類中心的距離。聚類中心間的距離。該表顯示了兩兩類聚類中心間的距離。聚類案例數。該表反映了每一類樣本個數信息,本例中,第一類有 2 個樣本;第二類有 1 個樣本地球科學與學院中國地質大學(北京)遙感與地學信息教研室ANOVA 方差分析表。該表對各指數的均值在各類中的差異進行顯著性檢驗,反映了哪些聚類變量對分類起著顯著作
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司節(jié)能降耗活動方案
- 公司組織KTV唱歌活動方案
- 公司網絡經營活動方案
- 公司福利旅行活動方案
- 公司每月團聚活動方案
- 公司節(jié)日互動活動方案
- 公司組織娛樂活動方案
- 公司每日員工活動方案
- 公司組織去爬山活動方案
- 公司班組趣味活動方案
- 2023風光互補路燈設計方案
- 2023年山東省夏季普通高中學業(yè)水平合格考試會考生物試題及參考答案
- 2024年山東省青島市中考英語試卷附答案
- 2023-2024學年山東省臨沂市蘭山區(qū)八年級(下)期末數學試卷(含答案)
- 材料力學(山東聯(lián)盟-中國石油大學(華東))智慧樹知到期末考試答案章節(jié)答案2024年中國石油大學(華東)
- 江西省南昌二中心遠教育集團九灣學校2023-2024學年八年級下學期期末考試物理試題
- 深入理解Nginx(模塊開發(fā)與架構解析)
- MOOC 中國文化概論-華南師范大學 中國大學慕課答案
- 初中人教版八年級下冊期末物理真題模擬試卷經典套題
- JBT 11699-2013 高處作業(yè)吊籃安裝、拆卸、使用技術規(guī)程
- 家長會課件:初中七年級家長會課件
評論
0/150
提交評論