上市公司財(cái)務(wù)危機(jī)預(yù)警研究

上傳人：灰*** IP屬地：寧夏上傳時(shí)間：2021-11-25 格式：DOCX 頁(yè)數(shù)：11 大?。?11.84KB 積分：10.8 舉報(bào) 版權(quán)申訴

免費(fèi)預(yù)覽已結(jié)束，剩余6頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、上市公司財(cái)務(wù)危機(jī)預(yù)警研究張志敏提要本文以a股上市公司作為研究對(duì)象，運(yùn)用python中的sklearn模塊，以隨機(jī)森林算法對(duì)上市公司財(cái)務(wù)危機(jī)預(yù)警指標(biāo)進(jìn)行選取，并與依據(jù)顯著性相關(guān)性選取出的指標(biāo)進(jìn)行對(duì)比，找出兩者在指標(biāo)選取上存在的差異，并依據(jù)選取的財(cái)務(wù)指標(biāo)分別建立隨機(jī)森林模型;與此同時(shí)，還分別構(gòu)建logistic回歸模型、svm支持向量機(jī)模型、決策樹(shù)模型，并進(jìn)行展開(kāi)比較。分析表明：充分利用隨機(jī)森林展開(kāi)上市公司財(cái)務(wù)危機(jī)預(yù)警研究比傳統(tǒng)的方式更準(zhǔn)確，更能夠精確預(yù)判上市公司財(cái)務(wù)危機(jī)。關(guān)鍵詞：特征遞歸消除;隨機(jī)森林;logistic回歸;財(cái)務(wù)危機(jī)預(yù)警：

2、f23 ：a收錄日期：2020年7月2日一、引言近年來(lái)，我國(guó)a股市場(chǎng)每年都會(huì)出現(xiàn)許多被特殊處理的公司，且上市公司在資本市場(chǎng)上占有很重要的地位，因此，對(duì)上市公司的財(cái)務(wù)危機(jī)預(yù)警展開(kāi)研究有著重要的戰(zhàn)略意義。上市公司作為推動(dòng)經(jīng)濟(jì)發(fā)展的重要主體，對(duì)其進(jìn)行財(cái)務(wù)危機(jī)預(yù)警規(guī)避財(cái)務(wù)風(fēng)險(xiǎn)顯得尤為重要，出現(xiàn)財(cái)務(wù)危機(jī)既不利于公司的穩(wěn)定發(fā)展，還減少了經(jīng)營(yíng)管理者及投資人的合法利益，通過(guò)財(cái)務(wù)危機(jī)預(yù)警分析模型可以對(duì)公司財(cái)務(wù)展開(kāi)預(yù)估，給扭轉(zhuǎn)財(cái)務(wù)危機(jī)局面提供充裕的空間，減少公司倒閉的概率。隨著機(jī)器學(xué)習(xí)算法、大數(shù)據(jù)、人工智能的發(fā)展，越來(lái)越多的學(xué)者將其引入到風(fēng)險(xiǎn)識(shí)別及危機(jī)預(yù)警中，并有研究表明機(jī)器學(xué)習(xí)算法在風(fēng)險(xiǎn)識(shí)別及危機(jī)預(yù)警方面具有較

3、大的優(yōu)勢(shì)。二、隨機(jī)森林概述隨機(jī)森林算法是有由leo breiman和adele cutler（2001）最早提出的，是一種集成學(xué)習(xí)算法，它將不同的決策樹(shù)進(jìn)行組合，利用這種組合降低單一決策樹(shù)有可能帶來(lái)的片面性和判斷不準(zhǔn)確性，它也是目前機(jī)器學(xué)習(xí)算法和數(shù)據(jù)挖掘算法最為熱門(mén)的研究領(lǐng)域之一。他的基本思想是：首先利用bootstrap重抽樣方法從n個(gè)原始訓(xùn)練樣本中抽取n（n< p>本文會(huì)用到隨機(jī)森林的一大特點(diǎn)，即利用oob評(píng)估來(lái)評(píng)估模型的分類效果。所謂oob評(píng)估是指：當(dāng)采用bootstrap重抽樣方法時(shí)，原始訓(xùn)練樣本中每個(gè)樣本未被選取的（1-1/n）n，n表示訓(xùn)練集樣本的個(gè)數(shù)。當(dāng)n足夠大時(shí)，根

4、據(jù)重要極限的推到，（1-1/n）n將近似收斂于1/e36.8，這表示原始訓(xùn)練集中會(huì)有將近37%的樣本不會(huì)出現(xiàn)在bootstrap樣本中，這些數(shù)據(jù)被稱為袋外數(shù)據(jù)。由于有接近37%的誤差不會(huì)出現(xiàn)在訓(xùn)練集中，所以oob數(shù)據(jù)也可以起到測(cè)試集作用，檢驗(yàn)?zāi)Ｐ皖A(yù)測(cè)效果。另外，本文還利用隨機(jī)森林模型的另一個(gè)特點(diǎn)變量重要性的度量來(lái)對(duì)原始變量做篩選，從而建立合理的指標(biāo)體系。鑒于以上對(duì)隨機(jī)森林的介紹，本文建立基于隨機(jī)森林遺傳算法的財(cái)務(wù)危機(jī)預(yù)警模型。在已有文獻(xiàn)研究中，充分利用組合分類算法進(jìn)行研究的學(xué)者還較少，而隨機(jī)森林作為一種集成學(xué)習(xí)算法，具有不易過(guò)擬合、善于處理高維度數(shù)據(jù)、對(duì)存在噪聲和缺失的樣本具有很好的魯棒性、具

5、有較高的預(yù)測(cè)精度等優(yōu)點(diǎn)。三、研究樣本、研究變量和研究設(shè)計(jì)（一）研究樣本。為保證數(shù)據(jù)的真實(shí)性和可靠性，所選數(shù)據(jù)全部來(lái)自于國(guó)泰安數(shù)據(jù)庫(kù)。以公司是否被特殊處理即是否被st及*st為標(biāo)識(shí)，選取2019年首次被特殊處理的82家公司及19902019年上市以來(lái)從未被特殊處理過(guò)的2，859家公司為研究對(duì)象。由于企業(yè)在第t年被宣布st或者*st是由于公司在第t-1年及第t-2年財(cái)務(wù)上出現(xiàn)較差的情況，所以選用公司在第t-3年財(cái)務(wù)數(shù)據(jù)指標(biāo)基礎(chǔ)上進(jìn)行建模，當(dāng)公司在2019年被特殊處理時(shí)賦值為1，否則賦值為0。即，選擇2，941家樣本公司在2016年所有可以獲取的財(cái)務(wù)數(shù)據(jù)指標(biāo)進(jìn)行建模。（二）研究變量。財(cái)務(wù)危機(jī)預(yù)警模型

6、包含兩個(gè)主要工作：一是從初始財(cái)務(wù)指標(biāo)中篩選出危機(jī)預(yù)警指標(biāo)，即存在財(cái)務(wù)危機(jī)的企業(yè)都含有怎樣的特征組合;二是進(jìn)行預(yù)警模型算法的選擇。前者是對(duì)企業(yè)財(cái)務(wù)危機(jī)預(yù)警信息進(jìn)行深層次的挖掘，后者是對(duì)財(cái)務(wù)危機(jī)預(yù)警算法技術(shù)的應(yīng)用，兩者同時(shí)對(duì)企業(yè)財(cái)務(wù)危機(jī)預(yù)警產(chǎn)生影響。目前，危機(jī)預(yù)警理論還缺乏系統(tǒng)的理論支持，學(xué)者們對(duì)企業(yè)危機(jī)預(yù)警的研究大都是從可獲得的實(shí)際數(shù)據(jù)出發(fā)，采用實(shí)際經(jīng)驗(yàn)進(jìn)行研究討論，用試錯(cuò)的方法，逐個(gè)考察變量的組合在實(shí)際訓(xùn)練樣本數(shù)據(jù)中的體現(xiàn)，挑選出能夠突出判斷能力的變量組合來(lái)構(gòu)建最終的預(yù)估分析模型。本文借鑒已有學(xué)者的研究，選取了能代表企業(yè)償債能力、經(jīng)營(yíng)能力、盈利能力、發(fā)展能力、企業(yè)現(xiàn)金流量、比率結(jié)構(gòu)這六類指標(biāo)下

7、29個(gè)具體的財(cái)務(wù)指標(biāo)，具體變量如表1所示。（表1）（三）隨機(jī)森林模型的構(gòu)建。分析預(yù)警模型構(gòu)建之前應(yīng)該對(duì)于數(shù)據(jù)展開(kāi)預(yù)處理，包括異樣系數(shù)缺失系數(shù)的處理、訓(xùn)練樣本不太平衡的處理、經(jīng)濟(jì)指標(biāo)正態(tài)性檢驗(yàn)、相關(guān)性顯著性檢驗(yàn)。1、樣本缺失值異常值的處理。對(duì)于缺失值，一般可以選擇用這一列數(shù)據(jù)的“平均值”、“中位數(shù)”、“眾數(shù)”進(jìn)行填補(bǔ)，也可以對(duì)缺失數(shù)據(jù)進(jìn)行整行刪除。但由于本文是以機(jī)器學(xué)習(xí)算法進(jìn)行建模，是在大數(shù)據(jù)的基礎(chǔ)上進(jìn)行建模，如果樣本量過(guò)少，會(huì)造成模型精度的降低，所以對(duì)于缺失值，本文沒(méi)有進(jìn)行刪除，而是以樣本均值對(duì)缺失值進(jìn)行填補(bǔ)。2、類別不均衡的處理。由于2019年首次被st公司只有82家，只占所選樣本的2.8%

8、，出現(xiàn)數(shù)據(jù)偏斜，即樣本不均衡。樣本不均衡會(huì)造成樣本量低的分類所包含的特征過(guò)少，并很難從中提取規(guī)律，即使得到分類模型，也很容易產(chǎn)生過(guò)度依賴于有限的數(shù)據(jù)而導(dǎo)致過(guò)擬合的問(wèn)題，當(dāng)模型應(yīng)用到新的數(shù)據(jù)上時(shí)，模型的準(zhǔn)確性將會(huì)很差。本文通過(guò)利用python中的smote算法對(duì)樣本不均衡進(jìn)行過(guò)采樣處理。smote算法的基本原理為：合成新的少數(shù)類樣本，合成的策略是對(duì)少數(shù)類樣本a，從它的最近鄰中隨機(jī)選一個(gè)樣本b，然后在a、b之間的連線上隨機(jī)選一點(diǎn)作為新合成的少數(shù)類樣本。進(jìn)行smote處理后的樣本分布如圖2。（圖1、圖2）3、隨機(jī)森林模型的構(gòu)建。在構(gòu)建危機(jī)預(yù)警分析模型時(shí)，不能將所選用的所有初始財(cái)務(wù)指標(biāo)均作為預(yù)警模型的

9、輸入變量，倘若初始指標(biāo)很多，反而可能由于指標(biāo)間的相關(guān)關(guān)系等問(wèn)題降低模型的預(yù)測(cè)性能。特征遞歸消除的隨機(jī)森林算法（rfe-rf）把需要的特征集合初始化為整個(gè)數(shù)據(jù)集合，每次去掉一個(gè)排序準(zhǔn)則分?jǐn)?shù)最小的數(shù)據(jù)，直到取得最后的特征集，由此可知rfe-rf應(yīng)是一個(gè)基于rf的最大間隔原理的序列后向選擇算法。在本文中，首先根據(jù)各指標(biāo)對(duì)模型的貢獻(xiàn)程度進(jìn)行排序，可以看到排在最前面的指標(biāo)即貢獻(xiàn)度最大的指標(biāo)為x27全部現(xiàn)金回收率，排在最末尾的是x16營(yíng)業(yè)利潤(rùn)率。然后，我們利用python中的序列后向選擇算法逐一刪除指標(biāo)，并計(jì)算出在該指標(biāo)下的模型精確度。由圖3我們可以看出，當(dāng)隨機(jī)森林的輸入變量為9個(gè)時(shí)，此時(shí)所挑選的指標(biāo)最少

10、且模型的精確度較高，由圖4我們可以看出，每個(gè)指標(biāo)對(duì)上市公司危機(jī)預(yù)警的重要程度及重要性排名。（圖3、圖4）本文選取圖4中排名前9位的財(cái)務(wù)變量作為隨機(jī)森林的輸入變量，分別為x27、x5、x28、x4、x13、x26、x8、x24、x6，模型的輸出結(jié)果為0.95979，說(shuō)明他的識(shí)別精度為0.95979。4、進(jìn)一步檢驗(yàn)。為了進(jìn)一步驗(yàn)證隨機(jī)森林在進(jìn)行上市公司財(cái)務(wù)危機(jī)預(yù)警時(shí)的準(zhǔn)確性，本文又進(jìn)行了進(jìn)一步的研究。在選擇企業(yè)財(cái)務(wù)預(yù)警指標(biāo)時(shí)選用傳統(tǒng)的相關(guān)性顯著性方式選取指標(biāo)，比較其與充分利用隨機(jī)森林展開(kāi)指標(biāo)選取時(shí)的差異，進(jìn)而進(jìn)一步驗(yàn)證隨機(jī)森林的精確性。（1）財(cái)務(wù)指標(biāo)的正態(tài)性檢驗(yàn)。在展開(kāi)顯著檢驗(yàn)之前，應(yīng)當(dāng)考察樣本的

11、分布情況，并以此來(lái)確定使用哪種方法來(lái)進(jìn)行預(yù)警指標(biāo)的差異顯著性檢驗(yàn)。本文使用算法來(lái)做k-s檢驗(yàn)，來(lái)判斷各個(gè)財(cái)務(wù)指標(biāo)是否服從正態(tài)分布，檢驗(yàn)結(jié)果在所有的p值均小于0.05，說(shuō)明所有的財(cái)務(wù)指標(biāo)均不服從正態(tài)分布。對(duì)于不遵從正態(tài)分布的財(cái)務(wù)指標(biāo)的差異顯著性檢驗(yàn)應(yīng)當(dāng)選用非參數(shù)的檢驗(yàn)方法。（2）財(cái)務(wù)指標(biāo)的差異顯著性檢驗(yàn)。選用mannwhitneyu檢驗(yàn)法，對(duì)2個(gè)獨(dú)立樣本進(jìn)行非參數(shù)檢驗(yàn)。找出對(duì)于分辨st公司和非st公司有貢獻(xiàn)的財(cái)務(wù)指標(biāo)。檢驗(yàn)結(jié)果如表2所示。可以看出，財(cái)務(wù)指標(biāo)x1、x2、x3、x4、x5、x6、x7、x8、x10、x12、x14、x15、x16、x23、x24、x26、x28的p值均小于0.05，通

12、過(guò)了顯著性檢驗(yàn)，剩余其他指標(biāo)均予以剔除。（表2）（3）財(cái)務(wù)指標(biāo)的相關(guān)性顯著性檢驗(yàn)。通過(guò)mannwhitneyu顯著性檢驗(yàn)的指標(biāo)可能存在相關(guān)關(guān)系，且本文的財(cái)務(wù)指標(biāo)數(shù)據(jù)均不服從正態(tài)分布，因而本文選擇用斯皮爾曼相關(guān)性檢驗(yàn)方法。通過(guò)檢驗(yàn)，發(fā)現(xiàn)x1、x2、x3具有高度關(guān)聯(lián)性，去掉x2、x3;x4、x5具有高度關(guān)聯(lián)性，去掉x5;x7、x8具有高度關(guān)聯(lián)性，x8、x10具有高度關(guān)聯(lián)性，去掉x8;x12、x14、x15、x16具有高度關(guān)聯(lián)性，去掉x1、x15、x16;x23、x26具有高度關(guān)聯(lián)性，去掉x23。最后剩余的指標(biāo)為x1、x4、x6、x7、x10、x12、x24、x26、x28。其中，x1、x4為償債能

13、力指標(biāo)，x6、x7、x10為經(jīng)營(yíng)能力指標(biāo)，x12為盈利能力指標(biāo)，x24、x26為發(fā)展能力指標(biāo)，x28為企業(yè)的比率結(jié)構(gòu)。（4）隨機(jī)森林模型的構(gòu)建。將通過(guò)顯著顯著性檢驗(yàn)的指標(biāo)輸入到隨機(jī)森林中建模，得到模型的識(shí)別精度為0.94732。將此結(jié)果與利用隨機(jī)森林的遞歸特征指標(biāo)篩選法篩選的指標(biāo)的建模結(jié)果進(jìn)行比較，發(fā)現(xiàn)利用隨機(jī)森林篩選出的指標(biāo)識(shí)別率更高些，而且利用隨機(jī)森林篩選特征更簡(jiǎn)單些。四、模型比較現(xiàn)階段，關(guān)于危機(jī)預(yù)警的分析模型已有很多，但是以往的分析模型一多半采納的是多元線性判斷分析模型，少部分開(kāi)始采納機(jī)器學(xué)習(xí)算法分析模型，如決策樹(shù)模型、支持向量機(jī)模型等，因此為了進(jìn)一步驗(yàn)證隨機(jī)森林在危機(jī)預(yù)警識(shí)別上的優(yōu)勢(shì)及

14、準(zhǔn)確性，本文又分別建立了logistic、svm向量機(jī)、決策樹(shù)模型。并比較各個(gè)模型在accuracy_score、precision_score、recall_score、f1_score、auc_score上的差異，其中accuracy_score表示模型精度，precision_score表示模型準(zhǔn)確率，recall_score表示模型召回率，f1_score表示模型f1得分，auc_score表示roc曲線下面積。（表3）表3結(jié)果表明，在所有財(cái)務(wù)指標(biāo)度量中，隨機(jī)森林也體現(xiàn)出較高的精確性，從而意味著隨機(jī)森林分析模型可以將盡量多的存有企業(yè)財(cái)務(wù)經(jīng)營(yíng)風(fēng)險(xiǎn)的公司找出來(lái)。五、結(jié)論本文的財(cái)務(wù)危機(jī)預(yù)警是

15、針對(duì)我國(guó)a股市場(chǎng)所有上市公司開(kāi)展的，在借鑒已有學(xué)者研究的基礎(chǔ)上，從償債能力、發(fā)展能力、經(jīng)營(yíng)能力、每股指標(biāo)、盈利能力及比率結(jié)構(gòu)這6個(gè)方面構(gòu)建財(cái)務(wù)危機(jī)預(yù)警指標(biāo)，并采用隨機(jī)森林算法構(gòu)建財(cái)務(wù)危機(jī)預(yù)警模型。一方面指標(biāo)的選用對(duì)于企業(yè)財(cái)務(wù)危機(jī)預(yù)警具有至關(guān)重要的影響，本文統(tǒng)計(jì)已有研討文獻(xiàn)中選用頻次較高的辦法，一定程度上可以提升企業(yè)財(cái)務(wù)預(yù)警指標(biāo)的可靠性。與此同時(shí)，研討中不但考慮到預(yù)警的正確率，并且重點(diǎn)剖析了特性指標(biāo)的選用，得知隨機(jī)森林在妥善處理高維數(shù)據(jù)指標(biāo)上具備很大的優(yōu)勢(shì)，而且通過(guò)實(shí)證得知隨機(jī)森林遺傳算法比logistic回歸、svm方程機(jī)、決策樹(shù)分析模型更適合展開(kāi)危機(jī)預(yù)警，原因是隨機(jī)森林遺傳算法是一種集成學(xué)習(xí)遺傳算法，在對(duì)我國(guó)所有上市公司樣本展開(kāi)危機(jī)預(yù)警時(shí)，不但能夠確保不會(huì)預(yù)警過(guò)分。另一方面對(duì)處于危機(jī)中的公司有較高的準(zhǔn)確率。研究表明

人人文庫(kù)> 全部分類> 生活休閑 > 科普知識(shí)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

上市公司財(cái)務(wù)危機(jī)預(yù)警研究

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

上市公司財(cái)務(wù)危機(jī)預(yù)警研究

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔