《金融大數(shù)據(jù)分析》-課件 第 19 章_第1頁
《金融大數(shù)據(jù)分析》-課件 第 19 章_第2頁
《金融大數(shù)據(jù)分析》-課件 第 19 章_第3頁
《金融大數(shù)據(jù)分析》-課件 第 19 章_第4頁
《金融大數(shù)據(jù)分析》-課件 第 19 章_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第十九章

大數(shù)據(jù)機(jī)器學(xué)習(xí)方法在金融學(xué)中的應(yīng)用

學(xué)習(xí)目標(biāo)1.理解大數(shù)據(jù)機(jī)器學(xué)習(xí)方法在金融研究中的一些應(yīng)用2.了解非線性Lasso方法3.了解工具變量主成分分析法(IPCA)4.了解如何使用機(jī)器學(xué)習(xí)進(jìn)行糾偏

章節(jié)簡介本章聚焦于股票收益率的樣本外預(yù)測、潛在因子模型的構(gòu)建和從大量可觀測因子中篩選出最有定價(jià)效能的因子這三個(gè)方面,介紹機(jī)器學(xué)習(xí)方法在其中的實(shí)證應(yīng)用。識別并驗(yàn)證哪些變量具有真正的解釋力和定價(jià)能力

強(qiáng)調(diào)機(jī)器學(xué)習(xí)模型在處理高維數(shù)據(jù)和復(fù)雜關(guān)系中的應(yīng)用股票收益率橫截面預(yù)測實(shí)證高維問題和機(jī)器學(xué)習(xí)解決方案:傳統(tǒng)線性模型(如Fama-MacBeth回歸)在高維情況下容易出現(xiàn)多重共線性和過擬合問題。機(jī)器學(xué)習(xí)方法通過正則化和降維(如PCA)解決這些問題。機(jī)器學(xué)習(xí)可以更好地處理非線性關(guān)系,如神經(jīng)網(wǎng)絡(luò)模型可以近似任意非線性函數(shù)。Gu,Kelly,andXiu(2020)的研究:機(jī)器學(xué)習(xí)方法用于預(yù)測股票收益,包括彈性網(wǎng)、主成分回歸(PCR)、偏最小二乘(PLS)、回歸樹和神經(jīng)網(wǎng)絡(luò)。回歸樹表現(xiàn)優(yōu)于廣義線性模型,神經(jīng)網(wǎng)絡(luò)表現(xiàn)最好,淺層學(xué)習(xí)效果優(yōu)于深層學(xué)習(xí)。重要特征包括動(dòng)量、流動(dòng)性、風(fēng)險(xiǎn)測度、估值比率和基本面信號,宏觀經(jīng)濟(jì)變量中賬面市值比最重要。由散戶投資者主導(dǎo),導(dǎo)致高波動(dòng)性和短線交易行為。中央控制的銀行主導(dǎo)金融體系,市場自動(dòng)修正機(jī)制受政府影響。賣空限制導(dǎo)致市場定價(jià)效率低于西方市場。相關(guān)研究:Leippold,Wang,andZhou(2021)的研究:流動(dòng)性成為最重要的預(yù)測因子,中國市場顯示出更大的可預(yù)測性,特別是小規(guī)模和非國有企業(yè)的股票。散戶投資者對短期可預(yù)測性有正向影響,長期來看大盤股和國有企業(yè)有較高可預(yù)測性。Freybergeretal.(2020)和Wangetal.(2023)的研究:在美國和中國市場應(yīng)用非線性Lasso方法,展示了機(jī)器學(xué)習(xí)在處理高維股票收益預(yù)測和非線性問題方面的優(yōu)勢。中國市場的特點(diǎn)Fama-Macbeth回歸是一個(gè)兩步截面回歸檢驗(yàn)方法,它非常巧妙排除了殘差在截面上的相關(guān)性對標(biāo)準(zhǔn)誤的影響,適用于預(yù)測股票收益率等殘差項(xiàng)橫截面相關(guān)性高、時(shí)間序列相關(guān)性不高的情況。

首先基于時(shí)間序列回歸估計(jì)每個(gè)測試資產(chǎn)的因子暴露

第二步是橫截面回歸,在每個(gè)橫截面上計(jì)算如下回歸

然后將每個(gè)橫截面的估計(jì)取均值作為Fama-MacBeth回歸的估計(jì)

基于回歸的預(yù)測方法

基于回歸的預(yù)測方法Lasso

非線性Lasso(非參數(shù)組Lasso)假設(shè)特征與條件預(yù)期收益之間存在非線性關(guān)系,在??時(shí),第??個(gè)特征與股票條件預(yù)期收益之間的關(guān)系可以描述為

自適應(yīng)LassoLasso在變量選擇和參數(shù)估計(jì)上不具有一致性,使用自適應(yīng)Lasso(AdaptiveLasso)則可以解決這一問題

即基于第一輪Lasso訓(xùn)練的參數(shù)對不同參數(shù)的懲罰項(xiàng)進(jìn)行加權(quán),對第一輪訓(xùn)練得到的估計(jì)值較大的參數(shù)進(jìn)行較低的懲罰,從而在第二輪Lasso中獲得具有一致性的估計(jì)結(jié)果。

類似地可以得到自適應(yīng)組Lasso模型,即基于第一輪每組參數(shù)的訓(xùn)練結(jié)果對每組的懲罰項(xiàng)進(jìn)行加權(quán)后進(jìn)行第二輪訓(xùn)練。

交叉驗(yàn)證

機(jī)器學(xué)習(xí)模型確定超參數(shù)比如上面Lasso中的超參數(shù)??時(shí)往往采用交叉驗(yàn)證的方法

5折交叉驗(yàn)證:劃分訓(xùn)練集和測試集之后,再進(jìn)一步將訓(xùn)練集隨機(jī)劃分為5等份;選定一個(gè)超參數(shù)值,第一輪訓(xùn)練模型時(shí),采用第2、3、4、5份訓(xùn)練集數(shù)據(jù)訓(xùn)練模型,使用第1份訓(xùn)練集數(shù)據(jù)作為驗(yàn)證集,計(jì)算驗(yàn)證集上目標(biāo)測度比如均方誤差的值;第二輪訓(xùn)練時(shí)采用第1、3、4、5份訓(xùn)練集數(shù)據(jù)訓(xùn)練模型,使用第2份訓(xùn)練集數(shù)據(jù)作為驗(yàn)證集,測度驗(yàn)證集上模型的表現(xiàn);由此進(jìn)行5輪訓(xùn)練后得到5個(gè)模型表現(xiàn)測度值進(jìn)而計(jì)算出模型表現(xiàn)平均值,對比不同超參數(shù)值下模型表現(xiàn)的好壞,取模型在驗(yàn)證集上表現(xiàn)最好時(shí)的超參數(shù)并重新使用完整的訓(xùn)練集訓(xùn)練模型。

使用k折交叉驗(yàn)證的弊端:如果使用未來股票信息訓(xùn)練模型而使用過去的數(shù)據(jù)檢驗(yàn)“預(yù)測”股票收益的好壞,存在前瞻性偏差

時(shí)間序列交叉驗(yàn)證:將訓(xùn)練集按時(shí)間順序從早到晚劃分成均勻的5份,第1份時(shí)間最早,第一輪訓(xùn)練模型時(shí),采用第1份訓(xùn)練集數(shù)據(jù)訓(xùn)練模型,使用第2份訓(xùn)練集數(shù)據(jù)作為驗(yàn)證集,第二輪則用第1、2份數(shù)據(jù)訓(xùn)練,第3份用來驗(yàn)證,直至第五輪用前4份數(shù)據(jù)訓(xùn)練,第5份數(shù)據(jù)驗(yàn)證

預(yù)測因子的實(shí)證表現(xiàn)對股票橫截面收益率具有預(yù)測作用的因子類型:應(yīng)計(jì)負(fù)債、債務(wù)發(fā)行、投資、低杠桿、低風(fēng)險(xiǎn)、動(dòng)量、盈利能力、質(zhì)量、季節(jié)性、短期逆轉(zhuǎn)、價(jià)值等

主流的多因子模型都是稀疏的,即一般不超過5個(gè)因子,稀疏因子模型之間發(fā)生了激烈的競爭對比

Fama-French五因子(FF5)模型、Hou-Xue-Zhang四因子(q4)模型、BarillasandShanken(2018)根據(jù)對FF5、q4等模型進(jìn)行貝葉斯因子檢驗(yàn)的結(jié)果提出的六因子模型、Hou-Mo-Xue-Zhang五因子模型

下面展示一些常用因子在中國和美國市場上的表現(xiàn)

表1記錄了2000年1月至2023年12月中國和美國市場上部分常用因子的表現(xiàn)

MKtRf——市場因子、SMB——市值因子、VMG/HML——價(jià)值因子

表1:因子歷史平均月度表現(xiàn)(2000年1月至2023年12月)

在基于Fama-French三因子構(gòu)造中國三因子時(shí),Liuetal.(2019)剔除了市值最小的后30%的股票以避免殼價(jià)值污染

根據(jù)表1,經(jīng)過Liuetal.(2019)改造后的規(guī)模因子和價(jià)值因子在近24年都有著顯著的正收益,相比之下PanelB中Fama-French因子在近24年并沒有取得顯著的正收益,PanelA中Liuetal.(2019)規(guī)模因子和價(jià)值因子的累積收益也遠(yuǎn)高于PanelB

中美國市場上Fama-French因子的表現(xiàn)

預(yù)測因子的實(shí)證表現(xiàn)基于Wangetal.(2023)構(gòu)建的132個(gè)中國股票收益預(yù)測指標(biāo),使用機(jī)器學(xué)習(xí)方法對滬深300成分股的收益進(jìn)行預(yù)測

使用Fama-MacBeth回歸、自適應(yīng)Lasso、自適應(yīng)組Lasso三種方法,采用12年窗口的滾動(dòng)估計(jì),股票特征在橫截面上進(jìn)行排序并轉(zhuǎn)換為0到1之間的取值

表2:股票收益預(yù)測多空組合表現(xiàn)

AGLasso、ALasso、FMB分別代表自適應(yīng)組Lasso、自適應(yīng)Lasso、Fama-MacBeth回歸,KFold和TSCV則分別代表普通5折交叉驗(yàn)證和5折時(shí)間序列交叉驗(yàn)證

Fama-MacBeth回歸選股能力最弱,最優(yōu)的方法是使用基于時(shí)間序列交叉驗(yàn)證的自適應(yīng)Lasso

組Lasso樣本外存在過擬合現(xiàn)象,與滬深300的樣本空間較小有關(guān)

預(yù)測因子的實(shí)證表現(xiàn)工具變量主成分分析法簡介

將股票(或其他資產(chǎn))的收益率用以下的線性因子模型來描述

相對于經(jīng)典的因子定價(jià)模型,IPCA方法具有兩個(gè)顯著的優(yōu)勢

第一,IPCA模型結(jié)合了來自資產(chǎn)特征的附加信息來估計(jì)資產(chǎn)收益的潛在因子結(jié)構(gòu),而經(jīng)典的基于主成分分析的潛在因子模型的則只使用資產(chǎn)的收益率信息

第二,IPCA模型是一個(gè)條件資產(chǎn)定價(jià)模型,可以描述因子載荷的動(dòng)態(tài)變化。此特性可以緩解定價(jià)研究中的兩個(gè)挑戰(zhàn),高維性和遷移資

檢驗(yàn)資產(chǎn)特征變量在收益率截面定價(jià)能力的常用方法是投資組合排序法;

IPCA模型拓展投資組合排序法到高維空間,構(gòu)造了特征與期望超額收益的關(guān)系

投資組合排序和IPCA有兩點(diǎn)不同

1.投資組合排序在檢驗(yàn)特征的定價(jià)能力的時(shí)候只能同時(shí)控制一個(gè)或者兩個(gè)特征,而IPCA方法不受特征數(shù)量的限制2.投資組合排序構(gòu)造的是可觀測的因子,但是IPCA沒有預(yù)設(shè)定價(jià)方程的因子結(jié)構(gòu),而是通過統(tǒng)計(jì)方法來估計(jì)潛在因子。

工具變量主成分分析法簡介

線性映射參數(shù)的估計(jì)

目標(biāo)是最小化復(fù)合模型的誤差平方和,即

線性映射參數(shù)的估計(jì)

對于無約束模型,截距??????+1是工具變量的線性函數(shù),允許超額收益以與系統(tǒng)性風(fēng)險(xiǎn)無關(guān)的方式依賴于特征變量

這可以理解為動(dòng)態(tài)貝塔對超額異常回報(bào)的橫截面回歸系數(shù)估計(jì)量

線性映射參數(shù)的估計(jì)

IPCA方法的資產(chǎn)定價(jià)實(shí)證檢驗(yàn)

檢驗(yàn)?zāi)P驮O(shè)定為

原假設(shè)和備擇假設(shè)分別為

假設(shè)推斷通過bootstrap完成第二個(gè)非常有用的檢驗(yàn)是,具有預(yù)先指定的可觀察因素的有影響力的模型是否可以為IPCA模型增加解釋能力,從而可以比較不同的定價(jià)模型。模型設(shè)定為

對應(yīng)的Wald型檢驗(yàn)統(tǒng)計(jì)量為

它測量模型(19.14)和不包括可觀察因子的IPCA模型之間的距離。假設(shè)推斷通過bootstrap完成

相應(yīng)的,Wald型檢驗(yàn)統(tǒng)計(jì)量為

IPCA方法的資產(chǎn)定價(jià)實(shí)證檢驗(yàn)

IPCA在美國市場的實(shí)證表現(xiàn)

Kellyetal.(2019)使用美國股票數(shù)據(jù)表明,IPCA解釋股票超額收益率的表現(xiàn)優(yōu)于傳統(tǒng)的資產(chǎn)定價(jià)模型,并給出了一個(gè)很好的例子來實(shí)施和解釋IPCA的潛在因子。

股票回報(bào)和特征數(shù)據(jù)來自Freybergeretal.(2020)。時(shí)間段介于1962年7月至2014年5月之間,股票數(shù)量為12,813只,每只股票都有36個(gè)特征。

為了消除異常值的影響,我們對每個(gè)橫截面的股票應(yīng)用秩變換

它衡量了模型對條件預(yù)期回報(bào)的描述能夠解釋的已實(shí)現(xiàn)回報(bào)變化的比例

表3:IPCA模型美國市場實(shí)證表現(xiàn)

表3的面板A報(bào)告了當(dāng)潛在因子數(shù)量為1至6時(shí)個(gè)股的擬合優(yōu)度。

受限制的單因素IPCA模型無法解釋條件預(yù)期回報(bào)的異質(zhì)性

當(dāng)我們考慮多個(gè)IPCA因素時(shí),約束模型和無約束模型的差距逐漸縮小

表3的結(jié)果表明,如果規(guī)范中至少包含五個(gè)因素,IPCA基本上解釋了與股票特征相關(guān)的平均股票回報(bào)的所有異質(zhì)性。它通過識別一組因素和相關(guān)負(fù)載來做到這一點(diǎn),使股票的預(yù)期回報(bào)與其對系統(tǒng)性風(fēng)險(xiǎn)的敞口保持一致,而無需訴諸異常收益來解釋特征的預(yù)測作用

IPCA在美國市場的實(shí)證表現(xiàn)

如何從大量可觀測定價(jià)因子中識別出有效定價(jià)因子

本節(jié)主要探討資產(chǎn)定價(jià)研究中的一個(gè)核心問題:哪些因子才是構(gòu)成真實(shí)因子定價(jià)模型的有效因子。

經(jīng)典的多因子模型,如Fama-French的三因子、五因子模型,用因子風(fēng)險(xiǎn)溢價(jià)來解釋資產(chǎn)的預(yù)期收益,這些風(fēng)險(xiǎn)溢價(jià)是基于市場對于承擔(dān)特定風(fēng)險(xiǎn)的額外補(bǔ)償。然而,檢驗(yàn)一個(gè)因子是否具有顯著的風(fēng)險(xiǎn)溢價(jià)并不足以證明該因子真正具有定價(jià)能力

一個(gè)有效的因子,是指其與SDF的相關(guān)性顯著,即該因子捕捉到了資產(chǎn)定價(jià)中的系統(tǒng)性風(fēng)險(xiǎn),而不是指它具有顯著的風(fēng)險(xiǎn)溢價(jià)

隨機(jī)貼現(xiàn)因子理論

我們可以用兩個(gè)基本公式來描述資產(chǎn)定價(jià)(HansenandRichard,1987和Cochrane,2005)

為了更深入理解這個(gè)概念,讓我們來看一個(gè)關(guān)于效用最大化的問題

隨機(jī)貼現(xiàn)因子理論

隨機(jī)貼現(xiàn)因子與多因子模型

多因子模型通過分析各種經(jīng)濟(jì)因素,比如GDP增長率、消費(fèi)增長率,來解釋資產(chǎn)價(jià)格為何各不相同。實(shí)際上隨機(jī)貼現(xiàn)因子與多因子模型是等價(jià)的

因此研究者將GDP增長率、消費(fèi)增長率、匯率走勢以及其他評估經(jīng)濟(jì)狀態(tài)發(fā)生可能性的宏觀變量定義為“定價(jià)因子”(pricingfactor)。(19.27)式中提到的邊際效用增長率難以直接度量,因此實(shí)證中研究者常用這些定價(jià)因子作為增長率的代理變量:

這里將隨機(jī)貼現(xiàn)因子表達(dá)為一系列定價(jià)因子的組合,這和我們通常見到的多因子模型非常相似

公式(19.31)展示了多因子模型的一般形式:

我們可以證明公式(19.30)和(19.31)在數(shù)學(xué)上是等價(jià)的。

對比(19.31)式與(19.33)式,易推出:

這些推導(dǎo)顯示了隨機(jī)貼現(xiàn)因子和多因子模型在數(shù)學(xué)上是等價(jià)的。這意味著,一旦我們有了一個(gè)多因子模型,我們就可以找到相應(yīng)的隨機(jī)貼現(xiàn)因子表達(dá)式,反之亦然

隨機(jī)貼現(xiàn)因子與多因子模型

雙重Lasso回歸方法

當(dāng)我們有大量數(shù)據(jù)并想找出哪些因素真正影響資產(chǎn)定價(jià)時(shí),傳統(tǒng)方法如最小二乘法可能不太適用。這時(shí),Lasso回歸、決策樹和神經(jīng)網(wǎng)絡(luò)這樣的機(jī)器學(xué)習(xí)方法能有效處理這種高維數(shù)據(jù),但它們可能因?yàn)檫^分適應(yīng)數(shù)據(jù)中的“噪聲”而無法提供無偏的估計(jì)結(jié)果。

為了解決這個(gè)問題,F(xiàn)engetal.(2020)提出了一種新的方法:雙重選擇Lasso模型。這個(gè)方法首先用Lasso回歸挑選出最能解釋收益率的因子,然后再用Lasso回歸找出可能被遺漏的變量。這樣一來,我們就能在一定條件下滿足估計(jì)的一致性。在這一節(jié)中,我們將討論如何運(yùn)用雙重選擇Lasso法來估計(jì)隨機(jī)貼現(xiàn)因子載荷,并將這個(gè)方法應(yīng)用到對中國A股市場的實(shí)證研究中

雙重Lasso回歸方法

對股票收益率和所有基準(zhǔn)因子之間的關(guān)系進(jìn)行Lasso回歸分析:

由于實(shí)際中樣本量有限,傳統(tǒng)的Lasso回歸可能無法百分之百準(zhǔn)確地選出真正的模型,可能會(huì)遺漏一些重要變量。這意味著單純依賴一次Lasso回歸可能會(huì)導(dǎo)致對SDF載荷的錯(cuò)誤統(tǒng)計(jì)推斷。因此,我們需要進(jìn)行第二步的Lasso回歸,以找出那些在第一步中可能被遺漏的、但仍對解釋資產(chǎn)收益率有貢獻(xiàn)的因子:

雙重Lasso回歸方法

雙重Lasso回歸方法

因子與測試資產(chǎn)

在這一節(jié)中,我們的目標(biāo)是探索一些新的定價(jià)因子,看看它們在基準(zhǔn)因子的基礎(chǔ)上是否對測試資產(chǎn)有邊際解釋力。首先介紹A股市場主流定價(jià)因子的定義,并在本章的附錄一中給出了因子的詳細(xì)構(gòu)建方法,之后介紹如何構(gòu)建測試資產(chǎn)去檢驗(yàn)這些因子和其他潛在因子的解釋力。更多關(guān)于主流因子模型在A股市場的實(shí)證研究,可以參考Chen,Wu,andZhu(2022)和Chen,Shen,andLiu(2021)的研究。

表19.4:A股市場基準(zhǔn)定價(jià)因子描述性統(tǒng)計(jì)

在表19.4中列出了金融學(xué)文獻(xiàn)中的主流因子模型,和這些模型在中國A股市場的表現(xiàn)。除此之外,我們還考慮了兩個(gè)額外的因子。第一個(gè)是基于Amihud(2002)的非流動(dòng)性測度構(gòu)建的流動(dòng)性因子AMI,第二個(gè)是Asnessetal.(2013)提出的QMJ因子(Quality-Minus-Junkfactor)。在A股市場這兩個(gè)因子也有顯著的正收益率。

表19.5:CH-4四因子模型下顯著的市場異象單變量分組檢驗(yàn)

除此之外,我們還考慮了其他7個(gè)在文獻(xiàn)中提出,并在A股市場表現(xiàn)顯著的市場異象,包括季度總資產(chǎn)比市值(amq)、總資產(chǎn)收益率變化(droa)、凈資產(chǎn)收益率變化(droe)、Fama-French三因子調(diào)整的異質(zhì)性波動(dòng)率(ivff)、季度銷售增長(sgq)、短期收益反轉(zhuǎn)(srev)和股票換手率變化(vturn)。對于每一個(gè)異象,我們根據(jù)每個(gè)特征的30%和70%將股票分成3個(gè)投資組合,并且對變量進(jìn)行調(diào)整,保證高排名與更高的平均回報(bào)相關(guān)聯(lián)。同時(shí),我們根據(jù)市值的中位數(shù)將股票分成兩組,因子的收益是兩個(gè)高特征投資組合的平均值與兩個(gè)低特征投資組合的平均值之間的收益差。表19.4提供了這些待測試因子的平均值、標(biāo)準(zhǔn)差、??值、年化夏普比率、偏度和峰度

因子與測試資產(chǎn)

為了確保我們的測試資產(chǎn)不會(huì)受到某些特定因子結(jié)構(gòu)的影響,我們選擇了大量的特征變量,并通過分組排序的方法來構(gòu)建測試資產(chǎn)。我們選擇了26個(gè)顯著的公司特征變量來構(gòu)造投資組合作為因子檢驗(yàn)的測試資產(chǎn)。這26個(gè)顯著的特征變量包括盈余公告日前后累積超額收益率、換手率、Amihud非流動(dòng)性比率、季度總資產(chǎn)比市值、Dimson貝塔值、凈值市價(jià)比、資產(chǎn)回報(bào)率變化、凈資產(chǎn)回報(bào)變化、美元計(jì)價(jià)交易量、預(yù)期投資增長、收益價(jià)格比率、投資增長、Fama-French三因子調(diào)整的異質(zhì)性波動(dòng)率、長期收益率反轉(zhuǎn)、前24個(gè)月收益價(jià)格動(dòng)量、最高日度收益、前5年年末平均收益附近的累積異常收益率、11個(gè)月動(dòng)量、研發(fā)費(fèi)用占市值比、凈資產(chǎn)回報(bào)率、季度銷售增長、季度股價(jià)與銷售額比率、短期收益反轉(zhuǎn)、總波動(dòng)率、股票美元交易量變化和股票換手率變化。我們采用獨(dú)立雙重分組排序方法,將所有A股上市公司根據(jù)它們的市值和這26個(gè)公司特征變量分別構(gòu)建5×5的投資組合,共構(gòu)建了650個(gè)(25×26)投資組合。這些投資組合將作為我們因子識別檢驗(yàn)的測試資產(chǎn)。

表19.6:待測試因子的描述性統(tǒng)計(jì)表

因子與測試資產(chǎn)

實(shí)證結(jié)果

繼上一小節(jié)介紹了因子模型和測試資產(chǎn)構(gòu)建之后,這一節(jié)我們將探討使用雙重選擇Lasso方法在中國A股市場上進(jìn)行因子識別的實(shí)證研究結(jié)果。我們從表19.6中選取了10個(gè)因子作為我們的待測試因子,接下來的目標(biāo)是檢驗(yàn)這些具有顯著風(fēng)險(xiǎn)溢價(jià)的因子是否能夠幫助我們解釋不同測試資產(chǎn)的收益率差異。

考慮所有20個(gè)基準(zhǔn)因子,應(yīng)用雙重選擇Lasso法的兩步篩選共選出了4個(gè)基準(zhǔn)因子,包括預(yù)期增長(??????)、流動(dòng)性(AMI)、質(zhì)量因子(QMJ)和市場超額回報(bào)(MKT),其中前三個(gè)因子來自第一步,最后一個(gè)因子來自第二步。我們選擇這些因子而不是Liu-Stambaugh-Yuan提出的中國市場CH-4模型中的因子,是因?yàn)檫x定的基準(zhǔn)因子能更好地適應(yīng)我們的測試資產(chǎn)。事實(shí)上,相較于CH-4模型,這些因子對于我們650個(gè)測試資產(chǎn)的收益有更強(qiáng)的解釋力。

表19.7:隨機(jī)貼現(xiàn)因子載荷估計(jì)

從表19.7的結(jié)果中我們可以看到,在10個(gè)待測試因子中,有8個(gè)在5%的顯著性水平下具有顯著的隨機(jī)貼現(xiàn)因子載荷,這些因子多數(shù)被歸類為交易摩擦類因子。相比之下,當(dāng)我們使用Liu-Stambaugh-Yuan的CH-4模型作為對照時(shí),有7個(gè)因子具有顯著性。兩種基準(zhǔn)因子模型下都顯著的因子包括盈余公告日前后累積超額收益率(abr)、Dimson貝塔值(betad)、總資產(chǎn)收益率變化(droa)以及Fama-French三因子調(diào)整的異質(zhì)性波動(dòng)率(ivff)。這種差異的出現(xiàn)是因?yàn)閮煞N方法使用了不同的基準(zhǔn)因子,而基準(zhǔn)因子的選擇對于評估新因子的額外貢獻(xiàn)有著重要影響。

實(shí)證結(jié)果

表19.8:因子模型定價(jià)能力對比

實(shí)證結(jié)果

自糾偏機(jī)器學(xué)習(xí)法識別有效因子

介紹了在線性的隨機(jī)貼現(xiàn)因子假設(shè)下如何識別能夠解釋橫截面股票收益的因子。但實(shí)際上,這種線性關(guān)系并不一定成立。例如JagannathanandKorajczyk(1986)表明,與期權(quán)特征相類似的股票(如高杠桿公司股票)的被動(dòng)投資組合收益可能與市場收益有非線性關(guān)系。因此,本節(jié)在假設(shè)隨機(jī)貼現(xiàn)因子具有非線性結(jié)構(gòu)的基礎(chǔ)上,介紹Chernozhukovetal.(2022)提出的自糾偏機(jī)器學(xué)習(xí)(AutomaticDebiasedMachineLearning,ADML)方法,并采用該方法來估計(jì)A股市場定價(jià)因子的隨機(jī)貼現(xiàn)因子載荷。

自糾偏機(jī)器學(xué)習(xí)法

自糾偏機(jī)器學(xué)習(xí)法

自糾偏機(jī)器學(xué)習(xí)法

自糾偏機(jī)器學(xué)習(xí)法

數(shù)值模擬過程

數(shù)值模擬結(jié)果

圖19.1:數(shù)值模擬結(jié)果

定價(jià)因子識別實(shí)證研究

在這一節(jié)中,我們探討了在解釋中國和美國股票市場的收益方面,哪些因子起到了重要作用。作為世界上最大的新興資本市場,中國股市的散戶投資者占比很大,套利的限制性也相對更強(qiáng),這使得它與美國股市的交易和定價(jià)性質(zhì)具有顯著的差異。

仿效Houetal.(2020)和Chenetal.(2022),我們使用國泰安數(shù)據(jù)庫(CSMAR)的交易和財(cái)務(wù)數(shù)據(jù),構(gòu)建了132個(gè)描述中國股票市場的公司特征。在該實(shí)證研究中,使用了762個(gè)3×2的投資組合作為測試資產(chǎn),樣本期覆蓋了2000年1月到2021年12月。另一方面,美股市場作為一個(gè)更成熟的資本市場,我們參考了Fengetal.(2020)的方法,選取了150個(gè)風(fēng)險(xiǎn)定價(jià)因子作為美國市場的因子庫,并使用750個(gè)3×2的投資組合作為測試資產(chǎn)。這部分?jǐn)?shù)據(jù)的樣本期是從1976年6月到2017年12月。

我們使用自糾偏機(jī)器學(xué)習(xí)(ADML)方法來分析在中國A股市場和美國股市中各個(gè)因子相對于其他因子的邊際貢獻(xiàn)。有趣的是,我們在這兩個(gè)市場中發(fā)現(xiàn)了一些相似和不同的特點(diǎn)。

首先,在兩個(gè)市場中,與估值比率、盈利能力和投資相關(guān)的因子都非常重要。但是動(dòng)量和反轉(zhuǎn)類因子,比如動(dòng)量因子(UMD)和36個(gè)月的動(dòng)量(mom36m),在解釋美國股市的收益時(shí)非常顯著。而在中國A股市場,與動(dòng)量相關(guān)的因子,如過去6個(gè)月的回報(bào)(r6)、過去11個(gè)月的回報(bào)(r11)和短期反轉(zhuǎn)(srev)在A股市場不具有顯著的增量定價(jià)能力。這些發(fā)現(xiàn)與Lietal.(2010)和Cheungetal.(2015)一致,體現(xiàn)了我國A股市場的動(dòng)量效應(yīng)較弱。

另外,與博彩效應(yīng)相關(guān)的因子,在解釋中國股市的收益方面非常重要。這些因子包括采用FamaandFrench(1993)三因子模型計(jì)算的特質(zhì)波動(dòng)率(ivff)以及最大日收益率(mdr)。相比之下,在美國股市中,這些彩票類因子的表現(xiàn)較弱。中國股市中的大量交易由個(gè)人投資者而非機(jī)構(gòu)投資者主導(dǎo)(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論