Python數(shù)據(jù)分析與應(yīng)用 第8章財(cái)政收入預(yù)測分析 第9章家用熱水器用戶行為分析與事件識(shí)別_第1頁
Python數(shù)據(jù)分析與應(yīng)用 第8章財(cái)政收入預(yù)測分析 第9章家用熱水器用戶行為分析與事件識(shí)別_第2頁
Python數(shù)據(jù)分析與應(yīng)用 第8章財(cái)政收入預(yù)測分析 第9章家用熱水器用戶行為分析與事件識(shí)別_第3頁
Python數(shù)據(jù)分析與應(yīng)用 第8章財(cái)政收入預(yù)測分析 第9章家用熱水器用戶行為分析與事件識(shí)別_第4頁
Python數(shù)據(jù)分析與應(yīng)用 第8章財(cái)政收入預(yù)測分析 第9章家用熱水器用戶行為分析與事件識(shí)別_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

財(cái)政收入預(yù)測分析18-5月-251了解相關(guān)性分析目錄分析財(cái)政收入預(yù)測背景2使用Lasso回歸選取財(cái)政收入預(yù)測的關(guān)鍵特征3使用灰色預(yù)測和SVR構(gòu)建財(cái)政收入預(yù)測模型4小結(jié)5財(cái)政收入,是指政府為履行其職能、實(shí)施公共政策和提供公共物品與服務(wù)需要而籌集的一切資金的總和。財(cái)政收入表現(xiàn)為政府部門在一定時(shí)期內(nèi)(一般為一個(gè)財(cái)政年度)所取得的貨幣收入。財(cái)政收入是衡量一國政府財(cái)力的重要特征,政府在社會(huì)經(jīng)濟(jì)活動(dòng)中提供公共物品和服務(wù)的范圍和數(shù)量,在很大程度上取決于財(cái)政收入的充裕狀況。在我國現(xiàn)行的分稅制財(cái)政管理體制下,地方財(cái)政收入不但是國家財(cái)政收入的重要組成部分,而且具有其相對獨(dú)立的構(gòu)成內(nèi)容。如何制定地方財(cái)政支出計(jì)劃,合理分配地方財(cái)政收入,促進(jìn)地方的發(fā)展,提高市民的收入和生活質(zhì)量是每個(gè)地方政府需要考慮的首要問題。因此,地方財(cái)政收入預(yù)測是非常必要的。分析財(cái)政收入預(yù)測背景1.財(cái)政收入簡介和需求考慮到數(shù)據(jù)的可得性,本項(xiàng)目所用的財(cái)政收入分為地方一般預(yù)算收入和政府性基金收入。地方一般預(yù)算收入包括以下2個(gè)部分。稅收收入。主要包括企業(yè)所得稅與地方所得稅中中央和地方共享的40%,地方享有的25%的增值稅,營業(yè)稅和印花稅等。非稅收收入。包括專項(xiàng)收入、行政事業(yè)性收費(fèi)、罰沒收入、國有資本經(jīng)營收入和其他收入等。政府性基金收入是國家通過向社會(huì)征收以及出讓土地、發(fā)行彩票等方式取得收入,并專項(xiàng)用于支持特定基礎(chǔ)設(shè)施建設(shè)和社會(huì)事業(yè)發(fā)展的收入。分析財(cái)政收入預(yù)測背景2.財(cái)政收入預(yù)測數(shù)據(jù)基礎(chǔ)情況由于1994年我國對財(cái)政體制進(jìn)行了重大改革,開始實(shí)行分稅制財(cái)政體制,影響了財(cái)政收入相關(guān)數(shù)據(jù)的連續(xù)性,在1994年前后不具有可比性。由于沒有合適的方法來調(diào)整這種數(shù)據(jù)的躍變,因此本項(xiàng)目僅對1994年至2013年的數(shù)據(jù)進(jìn)行分析(本項(xiàng)目所用數(shù)據(jù)均來自《統(tǒng)計(jì)年鑒》)。各項(xiàng)特征名稱及特征說明如下(共13項(xiàng)):社會(huì)從業(yè)人數(shù)(x1):就業(yè)人數(shù)的上升伴隨著居民消費(fèi)水平的提高,從而間接影響財(cái)政收入的增加。在崗職工工資總額(x2):反映的是社會(huì)分配情況,主要影響財(cái)政收入中的個(gè)人所得稅、房產(chǎn)稅以及潛在消費(fèi)能力。分析財(cái)政收入預(yù)測背景2.財(cái)政收入預(yù)測數(shù)據(jù)基礎(chǔ)情況社會(huì)消費(fèi)品零售總額(x3):代表社會(huì)整體消費(fèi)情況,是可支配收入在經(jīng)濟(jì)生活中的實(shí)現(xiàn)。當(dāng)社會(huì)消費(fèi)品零售總額增長時(shí),表明社會(huì)消費(fèi)意愿強(qiáng)烈,部分程度上會(huì)導(dǎo)致財(cái)政收入中增值稅的增長;同時(shí)當(dāng)消費(fèi)增長時(shí),也會(huì)引起經(jīng)濟(jì)系統(tǒng)中其他方面發(fā)生變動(dòng),最終導(dǎo)致財(cái)政收入的增長。城鎮(zhèn)居民人均可支配收入(x4):居民收入越高消費(fèi)能力越強(qiáng),同時(shí)意味著其工作積極性越高,創(chuàng)造出的財(cái)富越多,從而能帶來財(cái)政收入的更快和持續(xù)增長。城鎮(zhèn)居民人均消費(fèi)性支出(x5):居民在消費(fèi)商品的過程中會(huì)產(chǎn)生各種稅費(fèi),稅費(fèi)又是調(diào)節(jié)生產(chǎn)規(guī)模的手段之一。在商品經(jīng)濟(jì)發(fā)達(dá)的如今,居民消費(fèi)的越多,對財(cái)政收入的貢獻(xiàn)就越大。年末總?cè)丝?x6):在地方經(jīng)濟(jì)發(fā)展水平既定的條件下,人均地方財(cái)政收入與地方人口數(shù)呈反比例變化。分析財(cái)政收入預(yù)測背景2.財(cái)政收入預(yù)測數(shù)據(jù)基礎(chǔ)情況全社會(huì)固定資產(chǎn)投資額(x7):是建造和購置固定資產(chǎn)的經(jīng)濟(jì)活動(dòng),即固定資產(chǎn)再生產(chǎn)活動(dòng)。主要通過投資來促進(jìn)經(jīng)濟(jì)增長,擴(kuò)大稅源,進(jìn)而拉動(dòng)財(cái)政稅收收入整體增長。地區(qū)生產(chǎn)總值(x8):表示地方經(jīng)濟(jì)發(fā)展水平。一般來講,政府財(cái)政收入來源于即期的地區(qū)生產(chǎn)總值。在國家經(jīng)濟(jì)政策不變、社會(huì)秩序穩(wěn)定的情況下,地方經(jīng)濟(jì)發(fā)展水平與地方財(cái)政收入之間存在著密切的相關(guān)性,越是經(jīng)濟(jì)發(fā)達(dá)的地區(qū),其財(cái)政收入的規(guī)模就越大。第一產(chǎn)業(yè)產(chǎn)值(x9):取消農(nóng)業(yè)稅、實(shí)施三農(nóng)政策,第一產(chǎn)業(yè)對財(cái)政收入的影響更小。稅收(x10):由于其具有征收的強(qiáng)制性、無償性和固定性特點(diǎn),可以為政府履行其職能提供充足的資金來源。因此,各國都將其作為政府財(cái)政收入的最重要的收入形式和來源。分析財(cái)政收入預(yù)測背景2.財(cái)政收入預(yù)測數(shù)據(jù)基礎(chǔ)情況居民消費(fèi)價(jià)格指數(shù)(x11):反映居民家庭購買的消費(fèi)品及服務(wù)價(jià)格水平的變動(dòng)情況,影響城鄉(xiāng)居民的生活支出和國家的財(cái)政收入。第三產(chǎn)業(yè)與第二產(chǎn)業(yè)產(chǎn)值比(x12):表示產(chǎn)業(yè)結(jié)構(gòu)。三次產(chǎn)業(yè)生產(chǎn)總值代表國民經(jīng)濟(jì)水平,是財(cái)政收入的主要影響因素,當(dāng)產(chǎn)業(yè)結(jié)構(gòu)逐步優(yōu)化時(shí),財(cái)政收入也會(huì)隨之增加。居民消費(fèi)水平(x13):在很大程度上受整體經(jīng)濟(jì)狀況GDP的影響,從而間接影響地方財(cái)政收入。分析財(cái)政收入預(yù)測背景2.財(cái)政收入預(yù)測數(shù)據(jù)基礎(chǔ)情況結(jié)合財(cái)政收入預(yù)測的需求分析,本次數(shù)據(jù)分析建模目標(biāo)主要有以下2個(gè)。分析、識(shí)別影響地方財(cái)政收入的關(guān)鍵特征。預(yù)測2014年和2015年的財(cái)政收入。分析財(cái)政收入預(yù)測背景3.財(cái)政收入預(yù)測分析目標(biāo)眾多學(xué)者已經(jīng)對財(cái)政收入的影響因素進(jìn)行了研究,但是他們大多先建立財(cái)政收入與各待定的影響因素之間的多元線性回歸模型,運(yùn)用最小二乘估計(jì)方法來估計(jì)回歸模型的系數(shù),通過系數(shù)來檢驗(yàn)它們之間的關(guān)系,模型的結(jié)果對數(shù)據(jù)的依賴程度很大,并且普通最小二乘估計(jì)求得的解往往是局部最優(yōu)解,后續(xù)步驟的檢驗(yàn)可能就會(huì)失去應(yīng)有的意義。了解財(cái)政收入預(yù)測的方法方法選擇——最小二乘估計(jì)方法本項(xiàng)目在已有研究的基礎(chǔ)上運(yùn)用Lasso特征選擇方法來研究影響地方財(cái)政收入的因素。在Lasso特征選擇的基礎(chǔ)上,鑒于灰色預(yù)測對少量數(shù)據(jù)預(yù)測的優(yōu)良性能,對單個(gè)選定的影響因素建立灰色預(yù)測模型,得到它們在2014年及2015年的預(yù)測值。由于支持向量回歸較強(qiáng)的適用性和容錯(cuò)能力,對歷史數(shù)據(jù)建立訓(xùn)練模型,把灰色預(yù)測的數(shù)據(jù)結(jié)果代入訓(xùn)練完成的模型中,充分考慮歷史數(shù)據(jù)信息,可以得到較為準(zhǔn)確的預(yù)測結(jié)果,即2014年和2015年財(cái)政收入。了解財(cái)政收入預(yù)測的方法方法選擇——Lasso特征選擇方法熟悉財(cái)政收入預(yù)測的步驟與流程項(xiàng)目流程本項(xiàng)目的總體流程如圖所示,主要包括以下步驟。對原始數(shù)據(jù)進(jìn)行探索性分析,了解原始特征之間的相關(guān)性。利用Lasso特征選擇模型進(jìn)行特征提取。建立單個(gè)特征的灰色預(yù)測模型以及支持向量回歸預(yù)測模型。使用支持向量回歸預(yù)測模型得出2014-2015年財(cái)政收入的預(yù)測值。對上述建立的財(cái)政收入預(yù)測模型進(jìn)行評價(jià)。熟悉財(cái)政收入預(yù)測的步驟與流程項(xiàng)目流程1了解相關(guān)性分析目錄分析財(cái)政收入預(yù)測背景2使用Lasso回歸選取財(cái)政收入預(yù)測的關(guān)鍵特征3使用灰色預(yù)測和SVR構(gòu)建財(cái)政收入預(yù)測模型4小結(jié)5

了解相關(guān)性分析Pearson相關(guān)系數(shù)

了解相關(guān)性分析Pearson相關(guān)系數(shù)

x1x2x3x4x5x6x7x8x9x10x11x12x13yx11.000.950.950.970.970.990.950.970.980.98-0.290.940.960.94x20.951.001.000.990.990.920.990.990.980.98-0.130.891.000.98x30.951.001.000.990.990.921.000.990.980.99-0.150.891.000.99x40.970.990.991.001.000.950.991.000.991.00-0.190.911.000.99x50.970.990.991.001.000.950.991.000.991.00-0.180.900.990.99x60.990.920.920.950.951.000.930.950.970.96-0.340.950.940.91x70.950.991.000.990.990.931.000.990.980.99-0.150.891.000.99x80.970.990.991.001.000.950.991.000.991.00-0.150.901.000.99x90.980.980.980.990.990.970.980.991.000.99-0.230.910.990.98x100.980.980.991.001.000.960.991.000.991.00-0.170.900.990.99x11-0.29-0.13-0.15-0.19-0.18-0.34-0.15-0.15-0.23-0.171.00-0.43-0.16-0.12x120.940.890.890.910.900.950.890.900.910.90-0.431.000.900.87x130.961.001.001.000.990.941.001.000.990.99-0.160.901.000.99y0.940.980.990.990.990.910.990.990.980.99-0.120.870.991.00分析計(jì)算結(jié)果Pearson相關(guān)系數(shù)矩陣由上表可知,居民消費(fèi)價(jià)格指數(shù)(x11)與財(cái)政收入(y)的線性關(guān)系不顯著,呈現(xiàn)負(fù)相關(guān)。其余特征均與財(cái)政收入呈現(xiàn)高度的正相關(guān)關(guān)系。按相關(guān)性大小,依次是x3,x4,x5,x7,x8,x10,x13,x2,x9,x1,x6和x12。各特征之間存在著嚴(yán)重的多重共線性:特征x1,x4,x5,x6,x8,x9,x10與除了x11之外的特征均存在嚴(yán)重的共線性。特征x2,x3,x7與除了x11和x12外的其他特征存在著嚴(yán)重的多重共線性。x11與各特征的共線性不明顯。x12與除了x2,x3,x7,x11之外的其他特征有嚴(yán)重的共線性。x13與除了x11之外的各特征有嚴(yán)重的共線性。x2和x3,x2和x13,x3和x13等多對特征之間存在完全的共線性。由上述分析可知,選取的各特征除了x11外,其他特征與y的相關(guān)性很強(qiáng),可以用作財(cái)政收入預(yù)測分析的關(guān)鍵特征,但這些特征之間存在著信息的重復(fù),需要對特征進(jìn)行進(jìn)一步篩選。分析計(jì)算結(jié)果分析1了解相關(guān)性分析目錄分析財(cái)政收入預(yù)測背景2使用Lasso回歸選取財(cái)政收入預(yù)測的關(guān)鍵特征3使用灰色預(yù)測和SVR構(gòu)建財(cái)政收入預(yù)測模型4小結(jié)5Lasso回歸方法屬于正則化方法的一種,是壓縮估計(jì)。它通過構(gòu)造一個(gè)懲罰函數(shù)得到一個(gè)較為精煉的模型,使得它壓縮一些系數(shù),同時(shí)設(shè)定一些系數(shù)為零,保留了子集收縮的優(yōu)點(diǎn),是一種處理具有復(fù)共線性數(shù)據(jù)的有偏估計(jì)。了解Lasso回歸方法1.概念Lasso以縮小特征集(降階)為思想,是一種收縮估計(jì)方法。Lasso方法可以將特征的系數(shù)進(jìn)行壓縮并使某些回歸系數(shù)變?yōu)?,進(jìn)而達(dá)到特征選擇的目的,可以廣泛地應(yīng)用于模型改進(jìn)與選擇。通過選擇懲罰函數(shù),借用Lasso思想和方法實(shí)現(xiàn)特征選擇的目的。模型選擇本質(zhì)上是尋求模型稀疏表達(dá)的過程,而這種過程可以通過優(yōu)化一個(gè)“損失”+“懲罰”的函數(shù)問題來完成。了解Lasso回歸方法2.基本原理

了解Lasso回歸方法2.基本原理當(dāng)原始特征中存在多重共線性時(shí),Lasso回歸不失為一種很好的處理共線性的方法,它可以有效地對存在多重共線性的特征進(jìn)行篩選。在機(jī)器學(xué)習(xí)中,面對海量的數(shù)據(jù),首先想到的就是降維,爭取用盡可能少的數(shù)據(jù)解決問題,從這層意義上說,用Lasso模型進(jìn)行特征選擇也是一種有效的降維方法。Lasso從理論上說,對數(shù)據(jù)類型沒有太多限制,可以接受任何類型的數(shù)據(jù),而且一般不需要對特征進(jìn)行標(biāo)準(zhǔn)化處理。了解Lasso回歸方法3.適用場景優(yōu)點(diǎn):可以彌補(bǔ)最小二乘法和逐步回歸局部最優(yōu)估計(jì)的不足,可以很好地進(jìn)行特征的選擇,可以有效地解決各特征之間存在多重共線性的問題。缺點(diǎn):如果存在一組高度相關(guān)的特征時(shí),Lasso回歸方法傾向于選擇其中的一個(gè)特征,而忽視其他所有的特征,這種情況會(huì)導(dǎo)致結(jié)果的不穩(wěn)定性。雖然Lasso回歸方法存在弊端,但是在合適的場景中還是可以發(fā)揮不錯(cuò)的效果。在財(cái)政收入預(yù)測中,各原始特征存在著嚴(yán)重的多重共線性,多重共線性問題已成為主要問題,這里采用Lasso回歸方法進(jìn)行特征選取是恰當(dāng)?shù)摹A私釲asso回歸方法4.Lasso回歸方法優(yōu)缺點(diǎn)用Python編制相應(yīng)的程序后運(yùn)行得到如下表所示的結(jié)果。分析Lasso回歸結(jié)果分析系數(shù)表x1x2x3x4x5x6x7-0.00010.0000.124-0.0100.0650.0000.317x8x9x10x11x12x13

0.035-0.0010.0000.0000.000-0.040

由上表可看出,利用Lasso回歸方法識(shí)別影響財(cái)政收入的關(guān)鍵影響因素是社會(huì)從業(yè)人數(shù)(x1)、社會(huì)消費(fèi)品零售總額(x3)、城鎮(zhèn)居民人均可支配收入(x4)、城鎮(zhèn)居民人均消費(fèi)性支出(x5)、全社會(huì)固定資產(chǎn)投資額(x7)、地區(qū)生產(chǎn)總值(x8)、第一產(chǎn)業(yè)產(chǎn)值(x9)和居民消費(fèi)水平(x13)。1了解相關(guān)性分析目錄分析財(cái)政收入預(yù)測背景2使用Lasso回歸選取財(cái)政收入預(yù)測的關(guān)鍵特征3使用灰色預(yù)測和SVR構(gòu)建財(cái)政收入預(yù)測模型4小結(jié)5灰色預(yù)測法是一種對含有不確定因素的系統(tǒng)進(jìn)行預(yù)測的方法。在建立灰色預(yù)測模型之前,需先對原始時(shí)間序列進(jìn)行數(shù)據(jù)處理,經(jīng)過數(shù)據(jù)處理后的時(shí)間序列即稱為生成列?;疑到y(tǒng)常用的數(shù)據(jù)處理方式有累加和累減兩種。了解灰色預(yù)測算法1.概念

了解灰色預(yù)測算法2.基本原理后驗(yàn)差檢驗(yàn)?zāi)P途热缦卤硭尽A私饣疑A(yù)測算法2.基本原理PC模型精度>0.95<0.35好>0.80<0.5合格>0.70<0.65勉強(qiáng)合格<0.70>0.65不合格灰色預(yù)測法的通用性比較強(qiáng)些,一般的時(shí)間序列場合都可以用,尤其適合那些規(guī)律性差且不清楚數(shù)據(jù)產(chǎn)生機(jī)理的情況。了解灰色預(yù)測算法3.適用場景優(yōu)點(diǎn):具有預(yù)測精度高、模型可檢驗(yàn)、參數(shù)估計(jì)方法簡單、對小數(shù)據(jù)集有很好的預(yù)測效果。缺點(diǎn):對原始數(shù)據(jù)序列的光滑度要求很高,在原始數(shù)據(jù)列光滑性較差的情況下灰色預(yù)測模型的預(yù)測精度不高甚至通不過檢驗(yàn),結(jié)果只能放棄使用灰色模型進(jìn)行預(yù)測。4.灰色預(yù)測優(yōu)缺點(diǎn)

了解SVR算法1.基本原理由于支持向量機(jī)擁有完善的理論基礎(chǔ)和良好的特性,人們對其進(jìn)行了廣泛的研究和應(yīng)用,涉及分類、回歸、聚類、時(shí)間序列分析、異常點(diǎn)檢測等諸多方面。具體的研究內(nèi)容包括統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)、各種模型的建立、相應(yīng)優(yōu)化算法的改進(jìn)以及實(shí)際應(yīng)用。支持向量回歸也在這些研究中得到了發(fā)展和逐步完善,已有許多富有成果的研究工作。了解SVR算法2.適用場景優(yōu)點(diǎn):支持向量回歸不僅適用于線性模型,對于數(shù)據(jù)和特征之間的非線性關(guān)系也能很好抓?。怀窒蛄炕貧w不需要擔(dān)心多重共線性問題,可以避免局部極小化問題,提高泛化性能,解決高維問題;支持向量回歸雖然不會(huì)在過程中直接排除異常點(diǎn),但會(huì)使得由異常點(diǎn)引起的偏差更小。缺點(diǎn):計(jì)算復(fù)雜度高,在面臨數(shù)據(jù)量大的時(shí)候,計(jì)算耗時(shí)長。了解SVR算法3.SVR算法優(yōu)缺點(diǎn)sklearn庫的LinearSVR函數(shù)實(shí)現(xiàn)了線性支持向量回歸,其使用語法如下。classsklearn.svm.LinearSVR(epsilon=0.0,tol=0.0001,C=1.0,loss=’epsilon_insensitive’…)常用參數(shù)及說明如下。了解SVR算法4.主要參數(shù)介紹參數(shù)名稱說明epsilon接收float。用于loss參數(shù)中的

參數(shù)。默認(rèn)為0.1。tol接收float。指定終止迭代的閾值。默認(rèn)為0.0001。C接收float。表示罰項(xiàng)系數(shù)。默認(rèn)為1.0。loss參數(shù)名稱說明fit_intercept接收boolean。表示是否計(jì)算模型的截距。默認(rèn)為True。intercept_scalingdual接收boolear。選擇解決對偶問題或原始問題。如果為True,則解決對偶問題;如果是False,則解決原始問題。默認(rèn)為True。verbose接收int。表示是否開啟verbose輸出。默認(rèn)為0。random_state輸入int,或者一個(gè)RandomState實(shí)例,或者None。表示使用的隨機(jī)數(shù)生成器的種子。默認(rèn)為None。1.如果為整數(shù),則它指定隨機(jī)數(shù)生成器的種子。2.如果為RandomState實(shí)例,則指定隨機(jī)數(shù)生成器。3.如果為None,則使用默認(rèn)的隨機(jī)數(shù)生成器。max_iter接收int。指定最大迭代次數(shù)。默認(rèn)為1000。了解SVR算法續(xù)表使用sklearn構(gòu)建的SVR模型屬性及其說明如下表所示。了解SVR算法4.主要參數(shù)介紹屬性名稱說明coef_返回array。給出各個(gè)特征的權(quán)重。intercept_返回array。給出截距,即決策函數(shù)中的常數(shù)項(xiàng)。社會(huì)從業(yè)人數(shù)(x1)、社會(huì)消費(fèi)品零售總額(x3)、城鎮(zhèn)居民人均可支配收入(x4)、城鎮(zhèn)居民人均消費(fèi)性支出(x5)、全社會(huì)固定資產(chǎn)投資額(x6)、地區(qū)生產(chǎn)總值(x7)、第一產(chǎn)業(yè)產(chǎn)值(x8)和居民消費(fèi)水平(x13)特征的2014年及2015年通過建立的灰色預(yù)測模型得出的預(yù)測值,如下表所示。分析預(yù)測結(jié)果通過灰色預(yù)測模型得出的預(yù)測值2014預(yù)測值2015預(yù)測值預(yù)測精度等級x18142148.28460489.3好x37042.318166.92好x443611.8447792.22好x535046.6338384.22好x685055238627139好x74600.45214.78好x818686.2821474.47好x1344506.4749945.88好將上表的預(yù)測結(jié)果代入地方財(cái)政收入建立的支持向量回歸預(yù)測模型,得到1994年至2015年財(cái)政收入的預(yù)測值,其中Y_pred表示預(yù)測值。分析預(yù)測結(jié)果預(yù)測結(jié)果對比采用回歸模型評價(jià)指標(biāo)對地方財(cái)政收入的預(yù)測值進(jìn)行評價(jià),得到的結(jié)果如下表所示??梢钥闯銎骄^對誤差與中值絕對誤差較小,可解釋方差值與R方值十分接近1,表明建立的支持向量回歸模型擬合效果優(yōu)良,可以用于預(yù)測財(cái)政收入。分析預(yù)測結(jié)果平均絕對誤差34.2036806008中值絕對誤差17.4157390837可解釋方差值0.990889695375R方值0.990878079078模型評價(jià)指標(biāo)1了解相關(guān)性分析目錄分析財(cái)政收入預(yù)測背景2使用Lasso回歸選取財(cái)政收入預(yù)測的關(guān)鍵特征3使用灰色預(yù)測和SVR構(gòu)建財(cái)政收入預(yù)測模型4小結(jié)5本項(xiàng)目財(cái)政收入預(yù)測,主要介紹了原始數(shù)據(jù)的相關(guān)性分析、特征的選取、構(gòu)建灰色預(yù)測和支持向量回歸預(yù)測模型、模型的評價(jià)四部分內(nèi)容。在財(cái)政收入相關(guān)數(shù)據(jù)的相關(guān)性分析中,采用了簡單相關(guān)系數(shù)對數(shù)據(jù)進(jìn)行了分析。在特征選取中,運(yùn)用了廣泛使用的Lasso回歸模型。在模型的構(gòu)建階段,針對歷史數(shù)據(jù)首先構(gòu)建了灰色預(yù)測模型,對所選特征的2014年與2015年的值進(jìn)行預(yù)測。然后根據(jù)所選特征的原始數(shù)據(jù)與預(yù)測值,建立支持向量回歸模型,得到財(cái)政收入的最終預(yù)測值。最后用平均絕對誤差、中值絕對誤差、可解釋方差值和R方值進(jìn)行模型的評價(jià)。本項(xiàng)目建立的財(cái)政收入預(yù)測模型,通過圖8?2可以看出,很好的擬合了財(cái)政收入的變化情況。同時(shí),模型還具有很高的預(yù)測精度,可以用來指導(dǎo)實(shí)際的工作。小結(jié)家用熱水器用戶行為分析

與事件識(shí)別18-5月-251預(yù)處理熱水器用戶用水?dāng)?shù)據(jù)目錄了解家用熱水器用戶行為分析的背景與步驟2構(gòu)建用水行為特征并篩選用水事件3構(gòu)建行為事件分析的BP神經(jīng)網(wǎng)絡(luò)模型4小結(jié)5隨著國內(nèi)大家電品牌的進(jìn)入和國外品牌的涌入,電熱水器相關(guān)技術(shù)在過去20年間得到了快速發(fā)展,屢屢創(chuàng)新。首次提出封閉式電熱水器的概念到水電分離技術(shù)的研發(fā)。漏電保護(hù)技術(shù)的應(yīng)用及出水?dāng)嚯娂夹g(shù)和防電墻技術(shù)專利的申請突破如今高效能技術(shù)顛覆了業(yè)內(nèi)對電熱水器“高能耗”的認(rèn)知。分析家用熱水器行業(yè)現(xiàn)狀技術(shù)的突破當(dāng)下的熱水器行業(yè)也并非一片太平盛世,行業(yè)內(nèi)正在上演一幕弱肉強(qiáng)食的“叢林法則”戲碼,市場份額逐步向龍頭企業(yè)集中,尤其是那些在資金、渠道和品牌影響力等方面擁有實(shí)力的綜合家電品類巨頭,正在不斷蠶食鯨吞市場蛋糕。要想在該行業(yè)立足,只能走產(chǎn)品差異化的路線,提升技術(shù)實(shí)力和產(chǎn)品質(zhì)量,在功能賣點(diǎn)、外觀等方面做出自身特色。分析家用熱水器行業(yè)現(xiàn)狀殘酷的競爭國內(nèi)某熱水器生產(chǎn)廠商新研發(fā)的一種高端智能熱水器,在狀態(tài)發(fā)生改變或者有水流狀態(tài)時(shí),會(huì)采集各項(xiàng)數(shù)據(jù)。抽取200個(gè)熱水器用戶的用水記錄作為原始建模數(shù)據(jù),熱水器采集到用戶用水?dāng)?shù)據(jù)如下表所示。了解熱水器采集數(shù)據(jù)基本情況熱水器用戶用水?dāng)?shù)據(jù)熱水器編號(hào)發(fā)生時(shí)間開關(guān)機(jī)狀態(tài)加熱中保溫中有無水流實(shí)際溫度熱水量水流量節(jié)能模式加熱剩余時(shí)間當(dāng)前設(shè)置溫度R_0000120141019160855開開關(guān)無47°C25%0關(guān)4分鐘50°CR_0000120141019160954開開關(guān)無47°C25%0關(guān)2分鐘50°CR_0000120141019161040開開關(guān)無48°C25%0關(guān)2分鐘50°CR_0000120141019161042開開關(guān)無48°C25%0關(guān)1分鐘50°CR_0000120141019161106開開關(guān)無49°C25%0關(guān)1分鐘50°CR_0000120141019161147開開關(guān)無49°C25%0關(guān)0分鐘50°CR_0000120141019161149開關(guān)開無50°C100%0關(guān)0分鐘50°CR_0000120141019172319開關(guān)開無50°C50%0關(guān)0分鐘50°C熱水器采集的用水?dāng)?shù)據(jù)包含12個(gè)特征:熱水器編碼,發(fā)生時(shí)間,開關(guān)機(jī)狀態(tài),加熱中,保溫中,有無水流,實(shí)際溫度,熱水量,水流量,節(jié)能模式,加熱剩余時(shí)間和當(dāng)前設(shè)置溫度。其解釋說明如下表所示。了解熱水器采集數(shù)據(jù)基本情況熱水器數(shù)據(jù)特征說明特征名稱說明熱水器編碼熱水器出廠編號(hào)發(fā)生時(shí)間記錄熱水器處于某狀態(tài)的時(shí)刻開關(guān)機(jī)狀態(tài)熱水器是否開機(jī)加熱中熱水器處于對水進(jìn)行加熱的狀態(tài)保溫中熱水器處于對水進(jìn)行保溫的狀態(tài)有無水流熱水水流量大于等于10L/min為有水,否則為無實(shí)際溫度熱水器中熱水的實(shí)際溫度熱水量熱水器熱水的含量水流量熱水器熱水的水流速度,單位:L/min節(jié)能模式熱水器的一種節(jié)能工作模式加熱剩余時(shí)間加熱到設(shè)定溫度還需多長時(shí)間當(dāng)前設(shè)置溫度熱水器加熱時(shí)熱水能夠到達(dá)的最大溫度在熱水器用戶行為分析過程中,用水事件識(shí)別是最為關(guān)鍵的環(huán)節(jié)。根據(jù)該熱水器生產(chǎn)廠商提供的數(shù)據(jù)熱水器用戶用水事件劃分與識(shí)別項(xiàng)目的整體目標(biāo)如下。根據(jù)熱水器采集到的數(shù)據(jù),劃分一次完整用水事件。在劃分好的一次完整用水事件中,識(shí)別出洗浴事件。熟悉家用熱水器用戶行為分析的步驟與流程用水事件識(shí)別熟悉家用熱水器用戶行為分析的步驟與流程總體流程熱水器用戶用水事件劃分與識(shí)別項(xiàng)目主要包括以下5個(gè)步驟。對熱水用戶的歷史用水?dāng)?shù)據(jù)進(jìn)行選擇性抽取,構(gòu)建專家樣本。對①形成的數(shù)據(jù)集進(jìn)行數(shù)據(jù)探索分析與預(yù)處理,包括探索用水事件時(shí)間間隔的分布,刪除冗余特征,識(shí)別用水?dāng)?shù)據(jù)的缺失值,并對缺失值作處理,根據(jù)建模的需要進(jìn)行特征構(gòu)造等。根據(jù)以上處理,對用水樣本數(shù)據(jù)建立用水事件時(shí)間間隔識(shí)別模型和劃分一次完整的用水事件模型,再在一次完整用水事件劃分結(jié)果的基礎(chǔ)上,剔除短暫用水事件縮小識(shí)別范圍等。在②得到的建模樣本數(shù)據(jù)基礎(chǔ)上,建立洗浴事件識(shí)別模型,對洗浴事件識(shí)別模型進(jìn)行模型分析評價(jià)。對③形成的模型結(jié)果應(yīng)用并對洗浴事件劃分進(jìn)行優(yōu)化。調(diào)用洗浴事件識(shí)別模型,對實(shí)時(shí)監(jiān)控的熱水器流水?dāng)?shù)據(jù)進(jìn)行洗浴事件自動(dòng)識(shí)別。熟悉家用熱水器用戶行為分析的步驟與流程用水事件識(shí)別1預(yù)處理熱水器用戶用水?dāng)?shù)據(jù)目錄了解家用熱水器用戶行為分析的背景與步驟2構(gòu)建用水行為特征并篩選用水事件3構(gòu)建行為事件分析的BP神經(jīng)網(wǎng)絡(luò)模型4小結(jié)5由于熱水器采集的用水?dāng)?shù)據(jù)特征較多,本項(xiàng)目特征刪除對分析無影響的特征。最終用來建模的特征如下表所示。刪除冗余特征刪除冗余特征后的數(shù)據(jù)發(fā)生時(shí)間開關(guān)機(jī)狀態(tài)加熱中保溫中實(shí)際溫度熱水量水流量加熱剩余時(shí)間當(dāng)前設(shè)置溫度20141019161042開開關(guān)48°C25%01分鐘50°C20141019161106開開關(guān)49°C25%01分鐘50°C20141019161147開開關(guān)49°C25%00分鐘50°C20141019161149開關(guān)開50°C100%00分鐘50°C20141019172319開關(guān)開50°C50%00分鐘50°C20141019172321關(guān)關(guān)關(guān)50°C50%620分鐘50°C20141019172323關(guān)關(guān)關(guān)50°C50%630分鐘50°C為了探究用戶真實(shí)用水停頓時(shí)間間隔的分布情況,通過頻率分布表分析用戶用水停頓時(shí)間間隔的規(guī)律性,從而探究劃分一次完整用水事件的時(shí)間間隔閾值。具體的數(shù)據(jù)如下表所示。劃分用水事件用水停頓時(shí)間間隔頻數(shù)分布表間隔時(shí)長0~0.10.1~0.20.2~0.30.3~0.50.5~11~22~33~44~5停頓頻率78.71%9.55%2.52%1.49%1.46%1.29%0.74%0.48%0.26%間隔時(shí)長5~66~77~88~99~1010~1111~1212~1313以上停頓頻率0.27%0.19%0.17%0.12%0.09%0.09%0.10%0.11%2.36%分析上表可知:停頓時(shí)間間隔為0~0.3分鐘的頻率很高,根據(jù)日常用水經(jīng)驗(yàn)可以判斷其為一次用水時(shí)間中的停頓。停頓時(shí)間間隔為6~13分鐘的頻率較低,分析其為兩次用水事件之間的停頓間隔。兩次用水事件的停頓時(shí)間間隔分布在3~7分鐘。根據(jù)現(xiàn)場實(shí)驗(yàn)統(tǒng)計(jì)用水停頓的時(shí)間間隔近似。劃分用水事件用水停頓時(shí)間間隔頻數(shù)分布表用戶的用水?dāng)?shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫中,記錄了各種各樣的用水事件,包括洗浴,洗手,刷牙,洗臉,洗衣,洗菜等,而且一次用水事件由數(shù)條甚至數(shù)千條的狀態(tài)記錄組成。所以本項(xiàng)目首先需要在大量的狀態(tài)記錄中劃分出哪些連續(xù)的數(shù)據(jù)是一次完整的用水事件。用水狀態(tài)記錄中,水流量不為0表明用戶正在使用熱水;而水流量為0時(shí)用戶用熱水發(fā)生停頓或者用熱水結(jié)束。對于任一個(gè)用水記錄,如果它的向前時(shí)差超過閾值T,則將它記為事件的開始編號(hào);如果向后時(shí)差超過閾值T,則將其記為事件的結(jié)束編號(hào)。劃分模型的符號(hào)說明如下表。劃分用水事件一次完整用水事件模型構(gòu)建符號(hào)釋義t1所有水流量不為0的用水行為的發(fā)生時(shí)間T時(shí)間間隔閾值一次完整用水事件的劃分步驟如下:讀取數(shù)據(jù)記錄,識(shí)別到所有水流量不為0的狀態(tài)記錄,將它們的發(fā)生時(shí)間記為序列t1。對序列t1構(gòu)建其向前時(shí)差列和向后時(shí)差列,并分別與閾值進(jìn)行比較。向前時(shí)差超過閾值T,則將它記為新的用水事件的開始編號(hào);如果向后時(shí)差超過閾值T,則將其記為用水事件的結(jié)束編號(hào)。循環(huán)執(zhí)行步驟②直到向前時(shí)差列和向后時(shí)差列與均值比較完畢,結(jié)束事件劃分。劃分用水事件一次完整用水事件模型構(gòu)建對用戶的用水?dāng)?shù)據(jù)進(jìn)行劃分結(jié)果如下表所示。劃分用水事件一次完整用水事件模型構(gòu)建

發(fā)生時(shí)間...事件編號(hào)22014-10-1907:01:56...1562014-10-1907:38:16...23812014-10-1909:46:38...33822014-10-1909:46:40...33842014-10-1909:47:15...34042014-10-1911:50:17...4............對某熱水器用戶的數(shù)據(jù)根據(jù)不同的閾值劃分用水事件,得到了相應(yīng)的事件個(gè)數(shù),閾值變化與劃分得到事件個(gè)數(shù)如下。確定單次用水事件時(shí)長閾值閾值與劃分事件個(gè)數(shù)關(guān)系圖中某段閾值范圍內(nèi),下降趨勢明顯,說明在該段閾值范圍內(nèi),用戶的停頓習(xí)慣比較集中。如果趨勢比較平緩,則說明用戶的停頓熱水的習(xí)慣趨于穩(wěn)定,所以取該段時(shí)間開始的時(shí)間點(diǎn)作為閾值,既不會(huì)將短的用水事件合并,又不會(huì)將長的用水事件拆開。在上圖中,用戶停頓熱水的習(xí)慣在方框的位置趨于穩(wěn)定,說明熱水器用戶的用水的停頓習(xí)慣用方框開始的時(shí)間點(diǎn)作為劃分閾值會(huì)有一個(gè)好的效果。確定單次用水事件時(shí)長閾值閾值與劃分事件個(gè)數(shù)關(guān)系曲線在上圖中方框趨于穩(wěn)定時(shí),其方框開始的點(diǎn)的斜率趨于一個(gè)較小的值。為了用程序來識(shí)別這一特征,將這一特征提取為規(guī)則。根據(jù)下圖說明如何識(shí)別上圖方框中的起始的時(shí)間。確定單次用水事件時(shí)長閾值閾值與劃分事件個(gè)數(shù)關(guān)系每個(gè)閾值對應(yīng)一個(gè)點(diǎn),給每個(gè)閾值計(jì)算得到一個(gè)斜率指標(biāo),如上圖所示。其中,

A點(diǎn)是要計(jì)算的斜率指標(biāo)點(diǎn)。為了直觀的展示,用下表所示的符號(hào)來進(jìn)行說明。確定單次用水事件時(shí)長閾值閾值與劃分事件個(gè)數(shù)關(guān)系符號(hào)名稱符號(hào)說明kK五個(gè)點(diǎn)的斜率之和的平均值

確定單次用水事件時(shí)長閾值閾值與劃分事件個(gè)數(shù)關(guān)系

確定單次用水事件時(shí)長閾值閾值與劃分事件個(gè)數(shù)關(guān)系1預(yù)處理熱水器用戶用水?dāng)?shù)據(jù)目錄了解家用熱水器用戶行為分析的背景與步驟2構(gòu)建用水行為特征并篩選用水事件3構(gòu)建行為事件分析的BP神經(jīng)網(wǎng)絡(luò)模型4小結(jié)5不同用水事件的用水時(shí)長是基礎(chǔ)特征之一。根據(jù)用水時(shí)長這一特征可以構(gòu)建下表所示的事件開始時(shí)間、事件結(jié)束時(shí)間、洗浴時(shí)間點(diǎn)、用水時(shí)長、總用水時(shí)長和用水時(shí)長/總用水時(shí)長這6個(gè)特征。構(gòu)建用水時(shí)長與頻率特征用水時(shí)長類特征構(gòu)建特征構(gòu)建方法說明事件開始時(shí)間熱水事件開始發(fā)生的時(shí)間。事件結(jié)束時(shí)間熱水事件結(jié)束發(fā)生的時(shí)間。洗浴時(shí)間點(diǎn)洗浴時(shí)間點(diǎn)=事件開始時(shí)間的小時(shí)點(diǎn),如時(shí)間為“20:00:10”,則洗浴時(shí)間點(diǎn)為“20”開始用水的時(shí)間點(diǎn)用水時(shí)長一次用水過程中有熱水流出的時(shí)長總用水時(shí)長從劃分出的用水事件,起始數(shù)據(jù)的時(shí)間到終止數(shù)據(jù)的時(shí)間間隔﹢發(fā)送閾值記錄整個(gè)用水階段的時(shí)長用水時(shí)長/總用水時(shí)長用水時(shí)長/總用水時(shí)長判斷用水時(shí)長占總用水時(shí)長的比重構(gòu)建用水開始時(shí)間或結(jié)束的時(shí)間兩個(gè)特征時(shí)分別減去或加上了發(fā)送閾值(發(fā)送閾值是指熱水器傳輸數(shù)據(jù)的頻率的大?。F湓蛉缦?,取平均值會(huì)導(dǎo)致很大的偏差。綜合分析構(gòu)建“用水開始時(shí)間”為起始數(shù)據(jù)的時(shí)間減去“發(fā)送閾值”的一半。構(gòu)建用水時(shí)長與頻率特征用水時(shí)長類特征構(gòu)建用水時(shí)長相關(guān)的特征只能夠區(qū)分出一部分用水事件,不同用水事件的用水停頓和頻率也不同。構(gòu)建用水時(shí)長與頻率特征用水頻率類特征構(gòu)建特征構(gòu)建方法說明停頓時(shí)長一次完整用水事件中,對水流量為0的數(shù)據(jù)做計(jì)算停頓時(shí)長=每條用水停頓數(shù)據(jù)時(shí)長的和=(和下條數(shù)據(jù)的間隔時(shí)間/2﹢和上條數(shù)據(jù)的間隔時(shí)間/2)的和標(biāo)記一次完整用水事件中的每次用水停頓的時(shí)長總停頓時(shí)長一次完整用水事件中的所有停頓時(shí)長之和標(biāo)記一次完整用水事件中的總停頓時(shí)長平均停頓時(shí)長一次完整用水事件中的所有停頓時(shí)長的平均值標(biāo)記一次完整用水事件中的停頓的平均時(shí)長停頓次數(shù)一次完整用水事件中斷用水的次數(shù)之和幫助識(shí)別洗浴及連續(xù)洗浴事件除了用水時(shí)長,停頓和頻率外,用水量也是識(shí)別該事件是否為洗浴事件的重要特征。可以構(gòu)建出下表所示的兩個(gè)用水量特征。構(gòu)建用水量與波動(dòng)特征用水量化特征構(gòu)建特征構(gòu)建方法說明總用水量一次用水過程中使用的總的水量,單位為L。平均水流量一次用水過程中,開花灑時(shí)平均水流量大?。闊崴瑔挝粸長/min同時(shí)用水波動(dòng)也是區(qū)分不同用水事件的關(guān)鍵。根據(jù)不同用水事件的這一特征可以構(gòu)建下表所示的水流量波動(dòng)和停頓時(shí)長波動(dòng)兩個(gè)特征。構(gòu)建用水量與波動(dòng)特征用水波動(dòng)特征構(gòu)建特征構(gòu)建方法說明水流量波動(dòng)一次用水過程中,開花灑時(shí)水流量的波動(dòng)大小停頓時(shí)長波動(dòng)一次用水過程中,用水停頓時(shí)長的波動(dòng)情況洗浴事件的識(shí)別是建立在一次用水事件識(shí)別的基礎(chǔ)上,也就是從已經(jīng)劃分好的一次用水事件中識(shí)別出哪些一次用水事件是洗浴事件??梢允褂?個(gè)比較寬松的條件篩選掉那些非常短暫的用水事件,確定不可能為洗浴事件的數(shù)據(jù)去除掉,剩余的事件稱為“候選洗浴事件”。這三個(gè)條件是“或”的關(guān)系,也就是說,只要一次完整的用水事件滿足任意一個(gè)條件,就被判定為短暫用水事件,即會(huì)被篩選掉。3個(gè)篩選條件如下:一次用水事件中總用水量小于5升。用水時(shí)長小于100秒??傆盟畷r(shí)長小于120秒。篩選候選洗浴事件篩選條件經(jīng)過篩選后,用水事件數(shù)目從172個(gè)減少為75個(gè)。結(jié)合日志,最終用于建模的特征的總數(shù)為11個(gè),如下。篩選候選洗浴事件特征基本狀況特征名稱均值中位數(shù)標(biāo)準(zhǔn)差洗浴時(shí)間點(diǎn)19.00000020.0000003.263227總用用水時(shí)長529.506667503.000000261.902621總停頓時(shí)長57.8933334.00000095.050566停頓次數(shù)1.2133331.0000001.544767平均停頓時(shí)長34.1673022.00000051.083390用水時(shí)長471.613333461.000000206.411416用水/總時(shí)長0.9217990.9898990.116112總用水量241.015556235.116667127.539757平均水流量0.4977940.4988530.118436水流量波動(dòng)0.1556090.0195340.728971停頓時(shí)長波動(dòng)619.6758230.0000001999.4492481預(yù)處理熱水器用戶用水?dāng)?shù)據(jù)目錄了解家用熱水器用戶行為分析的背景與步驟2構(gòu)建用水行為特征并篩選用水事件3構(gòu)建行為事件分析的BP神經(jīng)網(wǎng)絡(luò)模型4小結(jié)5神經(jīng)網(wǎng)絡(luò),全稱人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN),是一種模仿生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能的數(shù)學(xué)模型或計(jì)算模型。以誤差逆?zhèn)鞑ニ惴ǎ碆P算法)而得名的BP神經(jīng)網(wǎng)絡(luò)模型(BackPropagationANNS,簡稱BP網(wǎng)絡(luò))是神經(jīng)網(wǎng)絡(luò)中重要的網(wǎng)絡(luò)之一。具有很強(qiáng)的非線性動(dòng)態(tài)處理能力無須知道輸入與輸出之間的關(guān)系可實(shí)現(xiàn)高度的非線性映射由于其結(jié)構(gòu)簡單、可塑性強(qiáng),在電力、交通和醫(yī)療等許多領(lǐng)域得到了廣泛的應(yīng)用。了解BP神經(jīng)網(wǎng)絡(luò)算法原理神經(jīng)網(wǎng)絡(luò)與BP神經(jīng)網(wǎng)絡(luò)模型BP神經(jīng)網(wǎng)絡(luò)由輸入層、一個(gè)或多個(gè)隱藏層以及輸出層構(gòu)成。同層節(jié)點(diǎn)中沒有任何耦合,每一層節(jié)點(diǎn)的輸出只影響下一層節(jié)點(diǎn)的輸出。網(wǎng)絡(luò)的學(xué)習(xí)過程由正向和反向傳播兩部分組成。反向傳播其節(jié)點(diǎn)單元特征通常為Sigmoid函數(shù),如下。S(x)=1/(1+e^(-x))在訓(xùn)練階段用準(zhǔn)備好的樣本數(shù)據(jù)以此通過輸入層、隱藏層和輸出層,比較輸出結(jié)果和期望值,若沒有達(dá)到要求的誤差程度或者訓(xùn)練次數(shù),即通過輸出層、隱藏層和輸入層,來調(diào)節(jié)權(quán)值,以便使網(wǎng)絡(luò)成為一定適應(yīng)能力的模型。了解BP神經(jīng)網(wǎng)絡(luò)算法原理1.原理簡述BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如下圖所示。了解BP神經(jīng)網(wǎng)絡(luò)算法原理1.原理簡述BP神經(jīng)網(wǎng)絡(luò)是目前應(yīng)用最多的一種神經(jīng)網(wǎng)絡(luò)形式,它具備神經(jīng)網(wǎng)絡(luò)的普遍優(yōu)點(diǎn)。有以下幾個(gè)方面:非線性映射能力。自學(xué)習(xí)和自適應(yīng)能力。泛化能力。容錯(cuò)能力。雖然BP網(wǎng)絡(luò)得到了廣泛的應(yīng)用,但自身也存在一些缺陷和不足,主要包括以下幾個(gè)方面的問題:由于學(xué)習(xí)速率是固定的,因此網(wǎng)絡(luò)的收斂速度慢,需要較長的訓(xùn)練時(shí)間。BP算法可以使權(quán)值收斂到某個(gè)值,但并不保證其為誤差平面的全局最小值,這是因?yàn)椴捎锰荻认陆捣赡墚a(chǎn)生一個(gè)局部最小值。網(wǎng)絡(luò)隱含層的層數(shù)和單元數(shù)的選擇尚無理論上的指導(dǎo),一般是根據(jù)經(jīng)驗(yàn)或者通過反復(fù)實(shí)驗(yàn)確定。網(wǎng)絡(luò)的學(xué)習(xí)和記憶具有不穩(wěn)定性。了解BP神經(jīng)網(wǎng)絡(luò)算法原理2.優(yōu)缺點(diǎn)與應(yīng)用領(lǐng)域BP神經(jīng)網(wǎng)絡(luò)以其獨(dú)特的結(jié)構(gòu)和處理信息的方法,在許多實(shí)際應(yīng)用領(lǐng)域中取得顯著的成效,主要應(yīng)用如下:圖像處理信號(hào)處理模式識(shí)別機(jī)器人控制。衛(wèi)生保健,醫(yī)療焊接領(lǐng)域。經(jīng)濟(jì)。此外,在電力系統(tǒng)、交通、軍事、礦業(yè)、農(nóng)業(yè)和氣象等方面也有應(yīng)用。了解BP神經(jīng)網(wǎng)絡(luò)算法原理2.優(yōu)缺點(diǎn)與應(yīng)用領(lǐng)域?qū)τ诙鄬由窠?jīng)網(wǎng)絡(luò),scikit-learn提供了MLPClassifier類。其使用語法如下。(只展示了常用參數(shù))MLPClassifier(hidden_layer_sizes=(100,),activation=’relu’,solver=’adam’,alpha=0.0001,max_iter=200,tol=0.0001,verbose=False…)常用參數(shù)及說明如下。了解BP神經(jīng)網(wǎng)絡(luò)算法原理3.主要參數(shù)介紹參數(shù)名稱說明hidden_layer_sizes接收tuple。代表隱含層的結(jié)構(gòu),其長度表示隱含層的層數(shù),元素則指定了每一層隱含層中功能神經(jīng)元的數(shù)量。如(80,90)表示隱含層有兩層:第一層有80個(gè)功能神經(jīng)元,第二層有90個(gè)功能神經(jīng)元

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論