




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第六章 空間數據的量算及 統計分析方法6.1 空間數據的量算空間數據的量算主要量算方法有: 質心量算 幾何量算(長度、面積等) 形狀量算6.1.1 質心量算質心量算 地理目標的質心量算是描述地理目標空間分布的最有用的單一量算量之一。可通過對目標坐標值加權平均實現質心量算。iiiiiGXwxwiiiiiGYwyw式中,XG,YG為目標的質心坐標,i為離散目標物,wi為各離散目標物的權重,xi,yi為各離散目標物的坐標。 6.1.2 幾何量算幾何量算 對于點、線、面、體4類目標物而言,幾何量算的含義是不同的。(1)對于0維的點狀目標,幾何量算的主要內容是坐標; (2)對于1維的線狀目標,幾何量算的
2、主要內容包括長度、曲率、方向等; (3)對于2維的面狀目標,幾何量算的主要內容包括面積、周長、形狀等;(4)對于3維的體狀目標,幾何量算的主要內容包括表面積、體積等。 1、線狀地物的長度計算、線狀地物的長度計算 線狀地物對象最基本的幾何參數之一是長度。在矢量數據結構下,線表示為點對坐標(x,y)或(x,y,z)的序列,線長度計算的一般公式為n1ii211-n0i2i1i2i1i2i1i)()()(Llzzyyxx 對于復合線狀地物對象,則需要在對諸分支曲線求長度后,再求其長度之和。 在柵格數據結構里,線狀地物的長度就是累加地物骨架線通過的格網數目,骨架線通常采用8方向連接,當連接方向為對角線方
3、向時,還要乘上 。 2、面狀地物的面積 面積是面狀地物最基本的參數。 在矢量結構下,面狀地物以其輪廓邊界弧段構成的多邊形表示的。對于沒有空洞的簡單多邊形,假設有n個頂點,其面積計算公式為: )-()-(21S2n1in11ni1i1iiyxyxyxyx即:表示多邊形的面積等于相鄰兩頂點縱橫坐標交叉乘積之差的總和的一半。-.-21Sn11n344323321221)()()()(yxyxyxyxyxyxyxyx 對于柵格結構的數據,多邊形面積計算就是統計具有相同屬性值的格網數目。 但對計算破碎多邊形的面積有些特殊,可能需要計算某一個特定多邊形的面積,必須進行再分類,將每個多邊形進行分割賦給單獨的
4、屬性值,然后再進行統計。 3、面狀地物的周長量算、面狀地物的周長量算 在平面直角坐標系中,面狀地物的周長就是組成該面狀地物的各線段長度之和。周長的求取公式為:n1iiLd 式中,L為面狀地物的周長,di為組成面狀地物的每一線段的長度。 6.1.3 形狀量算形狀量算 在大多數情況下,面狀物體或線狀物體的形狀能提供對象與對象環(huán)境之間的認識。 例如,河流的彎曲程度與下列因素有關:河流的沉積負載、坡度以及河流的流量。 1、線狀地物的形狀量算、線狀地物的形狀量算 線狀地物的形狀分析具有重要意義。 例如,公路的急轉彎處常有可能導致事故; 在河流急轉彎的外側導致強烈侵蝕,在拐彎處內側則形成大量的沉積。 (1
5、)對象間直線距離與全長之比)對象間直線距離與全長之比 在起點和終點之間,測量線性地物對象的全長,再與直線距離加以比較。直線距離作為分子,實際距離作為分母,構成比率,如圖所示。 比值越接近1,線的彎曲度越小。 這種方法,能確定任何線性對象的彎曲度值。 對線性地物形狀的量算。通常有兩種方法:(2)曲率半徑法)曲率半徑法 確定曲線上彎曲半徑,假定這些曲線本質是圓形的,然后把半圓形對應到每個曲線上,并測定半徑。 2、面狀地物的形狀量算、面狀地物的形狀量算 面狀地物形狀量測的兩個方面:(1)空間一致性問題,即有孔多邊形和破碎多邊形的處理;(2)多邊形邊界特征描述問題。(1)空間一致性)空間一致性 度量空
6、間一致性最常用的指標是歐拉函數歐拉函數,用來計算多邊形的破碎程度和孔的數目。它只用一個單一的數描述這些函數,稱為歐拉數。 歐拉數=(空洞數)-(碎片數-1) 這里的空洞數是外部多邊形自身包含的多邊形空洞數量,碎片數是碎片區(qū)域內多邊形的數量。 (2)多邊形邊界特征描述問題)多邊形邊界特征描述問題 由于地物的外觀是多變的,很難找到一個準確的量對多邊形進行描述。因此,對目標屬緊湊型或膨脹型的判斷極其模糊。 最常用的指標包括: 1)多邊形長、短軸之比; 2)周長面積比。 其中絕大多數指標是基于面積和周長之比的。根據多邊形的周長面積之比確定的形狀系數計算公式如下: 式中,P為目標物周長,A為目標物面積。
7、 (1)r 1,表示目標物為膨脹型。 6.2 空間數據的內插空間數據的內插 空間數據往往是根據要求所獲取的采樣觀測值,諸如土地類型、地面高程等。 這些點的分布往往是不規(guī)則的,在用戶感興趣或模型復雜區(qū)域可能采樣點多,反之則少。 由此而導致所形成的多邊形的內部變化不可能表達得更精確、更具體,而只能達到一般的平均水平或“象征水平”。 但用戶在某些時候卻希望知道未觀測點的某種感興趣特征的精確值,這就導致了空間數據內插空間數據內插技術技術的誕生。 6.2 空間數據的內插空間數據的內插 空間內插算法空間內插算法是一種通過已知點的數據推求同一區(qū)域其它未知點數據的計算方法。空間外推算法空間外推算法則是通過已知
8、區(qū)域的數據,推求其它區(qū)域數據的方法。 空間數據插值經常用于以下的情況: 1、現有的離散曲面的分辨率,像元大小或方向與所要求的不符,需要重新插值。 例如將一個掃描影像(航空像片、遙感影像)從一種分辨率或方向轉換到另一種分辨率或方向的影像。 2、現有的連續(xù)曲面的數據模型與所需的數據模型不符,需要重新插值。 如將一個連續(xù)的曲面從一種空間切分方式變?yōu)榱硪环N空間切分方式,從TIN到柵格、柵格到TIN、或者是從矢量多邊形到柵格。 空間數據插值經常用于以下的情況: 3、現有的數據不能完全覆蓋所要求的區(qū)域范圍,需要進行插值。 如將離散的采樣點數據內插為連續(xù)的數據表面。 現實空間可分為具有漸變特征的連續(xù)空間和具
9、有跳躍特征的離散空間。 例如,土地類型的分布屬于離散空間,而地形表面分布則屬于連續(xù)空間,如圖所示。 對于離散空間,假定任何重要變化發(fā)生在邊界上,如bc段上方為土地類型B,下方則為類型C,其邊界內的變化則是均勻的、同質的,在各個方向都是相同的。 對于這種空間的最佳內插方法是鄰近元法,即以最鄰近圖元的特征值表征未知圖元的特征值。 這種方法在邊界會產生一定的誤差,但在處理大面積多邊形時,則十分方便。 對于連續(xù)空間表面,鄰近元法不合適。 連續(xù)表面的內插技術必須采用連續(xù)的空間漸變模型來實現這些連續(xù)變化,可用一種平滑的數學表面加以描述。 這類技術可分為整體擬合整體擬合和局部擬合局部擬合兩大類型。 整體擬合
10、技術整體擬合技術即擬合模型是由研究區(qū)域內所有采樣點上的全部特征觀測值建立的。 通常采用的技術是整體趨勢面擬合。 這種內插技術的特點是不能提供內插區(qū)域的局部特性,因此該模型一般用于模擬大范圍內的變化。 局部擬合技術局部擬合技術是僅僅用鄰近的數據點來估計未知點的值,因此可以提供局部區(qū)域的內插值,而不致受局部范圍外其它點的影響。 這類技術包括:雙線性多項式內插、移動擬合法、最小二乘配置法等。 由于整體插值方法將短尺度、局部的變化看作隨機的和非結構的噪聲,從而丟失了這一部分信息,局部插值方法恰好彌補了整體插值方法的缺陷,可以用于局部異常值的內插,而且不受插值表面上其它點的內插值影響。 6.2.1 整體
11、擬合技術整體擬合技術 1 1、趨勢面擬合技術、趨勢面擬合技術 (1)基本概念)基本概念 某種地理屬性在空間的連續(xù)變化,可以用一個平滑的數學平面加以描述。 思路是先用已知采樣點數據擬合出一個平滑的數學平面方程,再根據該方程計算無測量值的點上的數據。 這種只根據采樣點的屬性數據與地理坐標的關系,進行多元回歸分析得到平滑數學平面方程的方法,稱為趨勢面擬合趨勢面擬合。 (2)數學曲面類型的確定因素)數學曲面類型的確定因素 數學曲面類型的確定取決于以下兩個因素: 1)對空間分布特征的認識,對于在空間域上具有周期性變化特征的空間分布現象, 從理論上說宜選用一個周期函數作為數學表達式,但這在地理數據分析中使
12、用的并不多, 一般情況下多選用多項式函數作為數學表達式。 2)表達式確定的另外一個因素就是求解上的可行性和便利性, 目前趨勢面的求解大多采用最小二乘法。 (3)多項式回歸)多項式回歸 多項式回歸分析是描述大范圍空間漸變特征的最簡單方法。 多項式回歸的基本思想是用多項式表示線(數據是一維時)或面(數據是二維時),并按最小二乘法原理對數據點進行擬合,擬合時假定數據點的空間坐標(x,y)為獨立變量,而表征特征值的z坐標為因變量。 當數據為一維(x)時,這種變化可用回歸線近似表示為: 式中,a0,a1為多項式系數。 當n個采樣點上的方差和為最小時,則認為線性回歸方程與被擬合曲線達到最佳配準,如下圖。
13、在實際空間中,數據往往是二維的,而且以更為復雜的方式變化,如下圖所示,在這種情況下,需用二次或高次多項式:n1i2iimin)zz(其中,線性變化曲面方程為:2210XbXbbZ二次變化曲面方程為:25423210YbXYbXbYbXbbZ如圖所示為高次多項式的擬合曲線示意圖。 趨勢面的次數并非越高越好,超過三次的復雜多項式往往會導致解的奇異,因此,一般控制在二次變化曲面。 趨勢面是一種平滑函數,很難正好通過原始數據點,這就是說在多重回歸中的殘差屬正常分布的獨立誤差,而且趨勢面擬合產生的偏差幾乎都具有一定程度的空間非相關性。 整體趨勢面擬合除應用整體空間的獨立點內插外,另一個最有成效的應用之一
14、是揭示區(qū)域中不同于總趨勢的最大偏離部分。 因此,在利用某種局部內插方法以前,可以利用整體趨勢面擬合技術從數據中去掉一些宏觀特征。 (4)趨勢面擬合程度的檢驗)趨勢面擬合程度的檢驗 趨勢面擬合程度的檢驗,同多元回歸分析一樣,可用F分布進行檢驗,其檢驗統計量為: 式中,U為回歸平方和,Q為殘差平方和(剩余平方和),p為多項式項數(不包括常數項),n為使用數據點數目。當FFa時,趨勢面顯著,否則不顯著。2 2、變換函數插值、變換函數插值 根據一個或多個空間參量的經驗方程進行整體空間插值,也是經常使用的空間插值方法,這種經驗方程稱為變換函數變換函數。 下面以一個研究實例進行說明: 沖積平原的土壤重金屬
15、污染與幾個重要因子有關,其中距污染源(河流)的距離、高程這兩個因子最重要。 由于距河流的距離和高程是比較容易得到的空間變量,可以用各種重金屬含量與它們的經驗方程進行空間插值,提高對重金屬污染的預測精度。 本例回歸方程的形式如下: 式中:z(x)是某種重金屬含量,b0,b1,b2是回歸系數,p1,p2是獨立空間變量, 本例中:p1是距河流的距離因子,p2是高程因子。 這種回歸模型通常叫做轉換函數轉換函數,轉換函數可以應用于其它獨立變量,如溫度、高程、降雨量。 地理位置及其屬性可用盡可能多的信息組合成需要的回歸模型,然后進行空間插值。 但應該注意的一點是,必須清楚回歸模型的物理意義。 還要指出的是
16、所有的回歸轉換函數都屬于近似的空間插值。 整體插值方法通常使用方差分析和回歸方程等標準的統計方法,計算比較簡單。 其它的許多方法也可用于整體空間插值,如傅立葉級數和小波變換,特別是遙感影像分析方面,但它們需要的數據量大。 6.2.2 局部擬合技術局部擬合技術 實際連續(xù)空間表面很難用一種數學多項式表達,因此,常采用局部擬合技術局部擬合技術利用局部范圍內的已知采樣點擬合內差值。這在表達地形變化特征的數字高程模型(DEM)內插中應用尤為廣泛。 局部擬合方法只使用鄰近的數據點來估計未知點的值,包括以下幾個步驟: (1)定義一個鄰域或搜索范圍; (2)搜索落在此鄰域范圍的數據點; (3)選擇表達這有限點
17、的空間變化的數學函數; (4)為落在規(guī)則網格單元上的數據點賦值。 重復這個步驟直到網格上的所有點賦值完畢。 1、線性內插法 此方法用于三角網網格內的插值。假設ABCD為一平面,三頂點的(x,y,z)坐標已知,現求A點的插值 。插值函數為: AZ = a0+a1x+a2y AZ把B、C、D三點的坐標代入上式,聯立就可以解出a0,a1,a2三個系數,從而求出A點的內插值。如圖所示。 2、雙線性多項式內插法 此方法一般在格網插值時使用。假設插值點A的值在與x軸或y軸平行的方向上分別與坐標x和y成線性比例關系。其表達式為:AZ=a0+a1x+a2y+a3xy 利用格網的基本長度單位a,b以及矩形4頂點
18、E,F,C,D的坐標就可求得A點的內插值。如圖所示。 1)利用E,F,C,D四點的坐標線性內插出ZG,ZH。ZG= ZE+(ZF-ZE)* (公式1)ZH= ZC+(ZD-ZC)* (公式2)axax(1)假設E為坐標原點,EF= a ,EC= b 。過A點作EC或FD的平行線,它們與EF、CD邊分別交于G、H。2)利用ZG,ZH的值再次進行線性內插,就可得到:ZA= ZG+(ZH-ZG ) * (公式3)by聯立方程(1)、(2)、(3)得:)1 (*)1)(1 (*)1 (b*ZZCAbyaxZbyaxZbyaxZaxyFED帶入圖中點C,D,E,F的格網序號得到如下方程:)1 (*)1)
19、(1 (*)1 (b*ZZj1iji1j1i1)j(iAbyaxZbyaxZbyaxZaxy),(),(),(,3、移動擬合法 移動擬合法以待定點為中心進行內插。 其原理是:定義一個合適的局部函數去擬合周圍的數據點,通過求解擬合函數,求出待定點的內插值,如圖所示。 移動擬合法的過程如下:(1)確定內插候選點)確定內插候選點 為了選擇鄰近的數據點,以待定點P為圓心,以R為半徑確定一個圓,凡落在圓內的數據點即被選用。即所采用的數據點坐標(x,y)應滿足: 所選擇的點數根據所采用的局部擬合函數來確定,在二次曲面內插時,要求選用的數據點個數n6。 當數據點Pi(xi,yi)到待定點P (xp,yp)的
20、距離小于R時,該點即被選用。 若選擇的點數不夠時,則應增大R的數值,直至數據點的個數n滿足要求為止。 同時還應考慮數據表面的連續(xù)變化特征,在出現躍變的數據范圍,應另選局部函數。(2)列出誤差方程式)列出誤差方程式考慮到數據表面的光滑性,選擇二次曲面作為擬合曲面。其公式為:則數據點Pi對應的誤差方程式為: 由n個數據點列出的誤差方程為: (3)計算每一數據點的權 這里的權pi并不代表數據點Pi的觀測精度,而是反映了該點與待定點相關的程度。 因此,對于pi確定的原則應與該數據點與待定點的距離di有關,di愈小,它對待定點的影響應愈大,則權應愈大; 反之當di愈大,權應愈小。 具體地說,當內插點無限
21、接近于某個數據點時,則該數據點的權應無限大。 常用的權有如下幾種形式: 其中R是選點半徑;di為待定點到數據點的距離;K是一個供選擇的常數;e是自然對數的底。 這三種權的形式都可符合上述選擇權的原則,但是它們與距離的關系有所不同,究竟采用何種加權方式,應視具體的情況而定。 利用二次曲面移動擬合法內插DEM時,對點的選擇除了滿足n6外,還應保證各個象限都有數據點,而且當地形起伏較大時,半徑R不能取得很大。 4、克里金法、克里金法 (1)地統計學)地統計學 1)基本概念)基本概念 地統計(Geostatistics)又稱地質統計,是法國著名統計學家Georges Matheron在大量理論研究的基
22、礎上逐漸形成的一門新的統計學分支,它是以區(qū)域化變量為基礎,借助變異函數,研究既具有隨機性又具有結構性,或具有空間相關性和依賴性的自然現象的一門科學。 凡是與空間數據的結構性和隨機性,或空間相關性和依賴性,或空間格局與變異有關的研究,并對這些數據進行最優(yōu)無偏內插估計,或模擬這些數據的離散性、波動性時,皆可應用統計學的理論與方法。 2)地統計學與經典統計學的比較)地統計學與經典統計學的比較 共同點:共同點:它們都是在大量采樣的基礎上,通過對樣本屬性值的頻率分布、均值、方差等關系及其相應規(guī)則進行分析,確定其空間分布格局與相關關系。 不同點:不同點:地統計學區(qū)別于經典統計學的最大特點是:地統計學既考慮
23、到樣本值的大小, 又重視樣本空間位置及樣本間的距離和樣本之間的空間相關性,彌補了經典統計學忽略空間相關性的缺陷。 (2)克里金法)克里金法 克里金法(Kriging)是法國地理數學家Georges Matheron 和南非礦業(yè)工程師D.G. Krige創(chuàng)立的地質統計學中礦品位的最佳內插方法。 近年來它已廣泛用于地理信息系統中的空間內插,用于地下水制圖,土壤制圖和其它有關領域。 (2)克里金法)克里金法 這種方法充分吸收了地理統計地理統計的思想,認為任何在空間連續(xù)性變化的屬性是非常不規(guī)則的,不能用簡單的平滑數學函數進行模擬,可以用隨機表面給予較恰當的描述。 這種連續(xù)性變化的空間屬性稱為“ 區(qū)域性
24、變量”, 可以描述氣壓、高程及其它連續(xù)性變化的指標變量。 這種應用地理統計方法地理統計方法進行空間插值的方法,被稱為克里金克里金(Kriging)插值插值。 地理統計方法為空間插值提供了一種優(yōu)化策略,即在插值過程中根據某種優(yōu)化準則函數動態(tài)的決定變量的數值。 Matheron,Krige等人研究的插值方法著重于權重系數的確定,從而使內插函數處于最佳狀態(tài),要求插值方法滿足如下兩個要求: 要求插值方法滿足如下兩個要求: 1)對給定點上的變量值提供最好的線性無偏估線性無偏估計計。 所謂無偏估計是指待估計的樣本數據的實際值與其估計值之間的偏差平均數為0,即估計誤差的期望為0,則稱這種估計是無偏的。 無偏
25、的是指,平均來說樣本的任何過高或過低的估計都應該避免。 2)估計樣本與實際樣本之間的單個偏差應該盡可能小,即誤差平方的期望值應該盡可能小。 最合理的估計方法應該提供一個無偏估計且估計方差為最小的估計值。 克里金插值方法的區(qū)域性變量理論假設任何變量的空間變化都可以表示為下述三個主要成分的和來表示:1)與均值或趨勢面有關的結構部分;2)與局部變化有關的隨機變量;3)隨機噪聲或者稱觀測誤差。令x是一維、二維或三維空間中的某一位置,變量z在x處的值由下式計算: 式中,m(x)是描述z(x)的結構性成分的確定性部分; 是與空間變化有關的隨機變量項; 是剩余誤差項,空間上具有零平均值、與空間無關的高斯噪聲
26、項。 克里金法的第一步是確定合適的m(x)函數,最簡單的情況是,m(x)等于采樣區(qū)的平均值。 克里金法的第二步是確定合適的隨機變量項。 具體方法如下:距離h的兩點x和x+h間的差分期望值應為零。 式中,z(x),z(x+h)是隨機變量z在x和x+h處的值,同時假設兩點之間的方差只與兩位置之間的距離h有關。于是: 式中, 是一種函數,稱為半方差函數或者半變異函數。 半變異函數(半方差函數)是一個關于數據點的半變異值(或變異性)與數據點間距離的函數。 對半變異函數的圖形描述可得到數據點與其相鄰數據點的空間相關關系圖。 區(qū)域性變量理論的兩個內在假設條件是差異的穩(wěn)穩(wěn)定性定性和可變性可變性,一旦結構性成
27、分確定后,變量在一定范圍內的隨機變化是同性變化,因此位置之間的差異僅是位置間距離的函數。 這樣,區(qū)域性變量計算公式可以寫成下列形式:半方差值為:式中,n為分隔間隔數;hj稱為延遲,它可能有不同的間距,即hj有一系列的值,對應每個hj可以計算相應的 。)(jhr 以h為橫軸,以r(h)為縱軸,將實驗半方差值展到平面上得到半變異函數曲線圖,如圖所示。 可以根據實驗數據,選擇適當的理論模型進行擬合。主要的理論半變異函數有球狀模型、指數模型、高斯模型、冪函數模型和拋物線模型等。 半變異函數曲線反映了一個采樣點與其相鄰采樣點的空間關系,并且對異常采樣點具有很好的探測作用。 圖中關鍵參數解釋如下:1)C0
28、稱塊金方差塊金方差,表示區(qū)域化變量小于觀測尺度時的非連續(xù)變異。理論上,當采樣點間的距離為0時,半變異函數值應為0;但由于測量誤差和空間變異,使得兩采樣點非常接近時,它們的半變異函數值不為0,即存在塊金值。測量誤差是儀器內在誤差引起的,空間變異是自然現象在一定空間范圍內的變化,它們任意一方或兩者共同作用產生了塊金值。2)C0+C為基臺值,表示半變異函數隨著間距遞增到一定程度后出現的平穩(wěn)值。當采樣點間的距離h增大時,半變異函數r(h)從初始的塊金值達到一個相對穩(wěn)定的常數時,該常數值稱為基臺值。當半變異函數值超過基臺值時,即函數值不隨采樣點間隔距離而改變時,空間相關性不存在。 3)C為拱高或稱結構方
29、差,表示基臺值和塊金方差之間的差值。 4)a為變程,即半變異函數達到基臺值時的間距。 在變異理論中,通常把變程a視為空間相關的最大間距,也稱極限距離。 變程表示了在某種觀測尺度下,空間相關性的作用范圍,其大小受觀測尺度的限定。 在變程范圍內,樣點間的距離越小,其相似性,即空間相關性越大。 當樣點間距離h大于變程a時,區(qū)域化變量的空間相關性不存在,即當某點與已知點的距離大于變程時,該點數據不能用于內插或外推。 以上介紹了克里金插值法的基本原理。 克里金方法主要有以下幾種類型: 常規(guī)克里金插值法、簡單克里金插值法、泛克里金插值法、概率克里金插值法、指示克里金插值法、析取克里金插值法、協同克里金插值
30、法等。 以上介紹了4類局部內插法:線性內插法、雙線性多項式內插法、移動擬合法、克里金法。 除此之外,還有其它的一些內插方法,如最小二乘配置法,有限元內插法等。 但是這些方法一般用于數據表面復雜,待求點眾多的地形表面,用于生成規(guī)則的格網數字地面模型。 6.3 空間信息分類空間信息分類 空間信息分類是空間分析的基本功能之一。 空間信息分類和評價的問題通常涉及大量的相互關聯的地理因素。 常用的空間信息分類方法包括:(1)主成分分析法;(2)層次分析法;(3)系統聚類分析法;(4)判別分析法。 下面對這些空間信息分類方法分別加以介紹:6.3.1 主成分分析法主成分分析法 地理問題往往涉及大量相互關聯的
31、自然和社會要素,眾多的要素常常給分析帶來很大困難,同時也增加了運算的復雜性。 為使用戶易于理解和解決現有存儲容量不足的問題,有必要減少某些數據而保留最必要的信息。 主成分分析方法可以從統計意義上將各影響要素的信息壓縮到若干合成因子上,從而使模型大大地簡化。6.3.1 主成分分析法主成分分析法 主成分分析法通過數理統計分析,將眾多要素的信息壓縮表達為若干具有代表性的合成變量, 這就克服了變量選擇時的冗余和相關,然后選擇信息最豐富的少數因子進行各種聚類分析。 設有n個樣本,p個變量。將原始數據轉換成一組新的特征值主成分,主成分是原變量的線性組合且有正交特征。 即將x1,x2, ,xp綜合成m(mp
32、)個指標z1,z2, ,zm。具體的線性組合公式如下: 這樣決定的綜合指標z1,z2, ,zm分別稱做原指標的第一、第二、第m主成分。其中z1在總方差中占的比例最大,其余主成分z2,z3,zm的方差依次遞減。 在實際工作中常挑選前幾個方差比例最大的主成分,這樣既減少了指標的數目,又抓住了主要矛盾,簡化了指標之間的關系。 從幾何上看,找主成分的問題,就是找p維空間中橢球體的主軸問題,從數學上容易得到它們是x1,x2, ,xp的相關矩陣中m個較大特征值所對應的特征向量,通常用雅可比(Jacobi)法計算特征值和特征向量。 顯然,主成分分析這一數據分析技術是把數據減少到易于管理的程度,也是將復雜數據
33、變成簡單類別便于存儲和管理的有力工具。 6.3.2 層次分析法(層次分析法(AHPAHP) 層次分析法層次分析法(Analytic Hierarchy Process, AHP)是系統分析的數學工具之一,它把人的思維過程層次化、數量化,并用數學方法為分析、決策、預報或控制提供定量的依據。 這是一種定性和定量分析相結合的方法。 層次分析法在分析涉及到大量相互關聯、相互制約的復雜因素時,各因素對問題的分析有著不同程度的重要性,決定它們對目標的重要性序列,對問題的分析十分重要。6.3.2 層次分析法(層次分析法(AHPAHP) AHP方法把相互關聯的要素按隸屬關系劃分為若干層次,請有經驗的專家們對各
34、層次各因素的相對重要性給出定量指標,利用數學方法,綜合眾人意見給出各層次各要素的相對重要性權值,作為綜合分析的基礎。 例如要比較n個因素 對目標Z的影響,確定它們在Z中的比重,每次取兩個因素yi和yj,用aij表示yi與yj對Z的影響之比,全部比較結果可用矩陣表示 ,A稱為對比矩陣,它應滿足: 層次分析法的整個過程體現了人的決策思維的基本特征,即分解、判斷與綜合,易學易用,而且定性與定量相結合,便于決策者之間彼此溝通,是一種十分有效的系統分析方法, 廣泛地應用在經濟管理規(guī)劃、能源開發(fā)利用與資源分析、城市產業(yè)規(guī)劃、人才預測、交通運輸、水資源分析利用等方面。6.3.3 系統聚類分析系統聚類分析 聚
35、類分析可根據地理實體之間影響要素的相似程度,采用某種與權重和隸屬度有關的距離指標,將評價區(qū)域劃分若干類別。 系統聚類是根據多種地學要素對地理實體劃分類別的方法。 對不同的要素劃分類別往往反映不同目標的等級序列,如土地分等定級、水土流失強度分級等。6.3.3 系統聚類分析系統聚類分析 系統聚類根據實體間的相似程度逐步合并為若干類別,其相似程度由距離或相似系數定義, 主要有絕對值距離、歐氏距離、切比雪夫距離、馬氏距離等。 進行合并的準則是使得各類類間差異最大、類內差異最小。 下面給出一個用歐幾里德距離進行聚類的方法: 用xik表示第i個樣本的第k個指標的數據,xjk表示第j個樣本的第k個指標的數據
36、; dij表示第i個樣本和第j個樣本之間的距離,根據歐式距離法確定的距離計算公式如下: 依次求出任何兩個點的距離系數dij(i,jl,2,n)以后,就形成一個距離矩陣: 它反映了地理單元的差異情況,在此基礎上就可以根據最短距離法或最長距離法或中位線法等,進行逐步歸類,最后形成一張聚類分析譜系圖。6.3.4 判別分析判別分析 判別分析根據各要素的權重和隸屬度,采用一定的評價標準將各地理實體判歸最可能的評價等級或以某個數據值所示的等級序列上。 判別分析與聚類分析同屬分類問題 所不同的是:判別分析是預先確定出等級序列的因子標準,再將分析的地理實體安排到序列的合理位置上。 對于諸如水土流失評價、土地適
37、宜性評價等有一定理論根據的分類系統的定級問題比較適用。 判別分析依其判別類型的多少與方法的不同,可分為兩類判別、多類判別和逐步判別等。 通常在兩類判別分析中,要求根據已知的地理特征值進行線性組合,構成一個線性判別函數Y,即: 式中, 為判別系數,它反映各要素或特征值的作用方向、分辨能力和貢獻率的大小。 xk為已知各要素(變量)的特征值。只要確定了ck,判別函數Y就確定了。 確定判別函數后,根據每個樣本計算判別函數值,可以將其歸并到相應的類別中。 常規(guī)的判別分析主要有距離判別法和Bayes最小風險判別法等。 6.4 空間統計分析空間統計分析 空間統計分析主要用于空間數據的分類與綜合評價,它涉及到空間和非空間數據的處理和統計計算。 為了將空間實體的某些屬性進行橫向或縱向比較,往往將空間實體的某些屬性制成統計圖表,以便進行直觀的綜合評價。 6.4 空間統計分析空間統計分析 有時,人們不僅需要絕對指標的顯示與分析,同時還需要了解它的相對指標,因此反映相對指標的密度計算也是空間統計分析的常用方法。 另外,空間數據之間存在著許多相關性和內在聯系,為了找出空間數據之間的主要特征和關系,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 林麝代養(yǎng)協議書5篇
- 科技園區(qū)廠房租賃協議3篇
- 西昌學院本科畢業(yè)設計答辯匯報
- 大額流動資金貸款協議書6篇
- 產品承包合同范本8篇
- 無機膠粘劑項目績效評估報告
- 氨泄漏事故急救措施
- 陳涉世家板書設計
- 2025遼寧工業(yè)大學輔導員考試試題及答案
- 文創(chuàng)產業(yè)運營分析框架
- Unit 1 Section B(1a-Project)課件人教版2024新教材七年級上冊英語
- DL∕T 516-2017 電力調度自動化運行管理規(guī)程
- 古希臘文明智慧樹知到期末考試答案章節(jié)答案2024年復旦大學
- 2024年廣東省廣州市天河區(qū)七年級(下)期末數學試卷含答案
- DZ∕T 0399-2022 礦山資源儲量管理規(guī)范(正式版)
- 離婚糾紛-模擬法庭劇本
- 管培生(校招生)培養(yǎng)方案(計劃)落地完整版
- MOOC 計算機系統局限性-華東師范大學 中國大學慕課答案
- 六年級語文總復習課《修改病句》修改課件市公開課一等獎省賽課獲獎課件
- 位置度公差及其計算課件
- SJ-T 11841.2.2-2022 顯示系統視覺舒適度 第2-2部分:平板顯示-藍光測量方法
評論
0/150
提交評論