因子模型理論與實踐及因子檢驗的實證_第1頁
因子模型理論與實踐及因子檢驗的實證_第2頁
因子模型理論與實踐及因子檢驗的實證_第3頁
因子模型理論與實踐及因子檢驗的實證_第4頁
因子模型理論與實踐及因子檢驗的實證_第5頁
已閱讀5頁,還剩23頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1.資產定價理論之回望

1.1.引言——從絕對定價到收益率研究

資產定價是金融理論的核心。在投資過程中,資產估計價值與其市場價格的比較為

投資決策提供了重要的參考依據。理性的投資者往往會選擇投資于被市場顯著低估

的資產,這其中一個隱含的假設是資產的價格會圍繞其價值進行波動,但顯著的偏

離一般會被認為是異常的。

資產定價的一個自然的研究領域就是對資產的絕對價值或內在價值進行估計。例如

權益類資產定價理論中的股利貼現模型(Dividenddiscountmodel),通過對未來股

利及股利增長率,必要收益率進行估計,從而得到對當前時刻股票內在價值的評估。

然而,模型中參數的選擇具有一定的主觀性,另一方面,模型的假設也很難與實際

情況保持一致。

資產定價的另一分支轉而對資產的收益率進行研究。其思想是通過市場中的某些共

有因素去解釋資產的收益率,將資產的收益分解為可被共有因素即因子解釋的收益

部分以及無法被解釋的特異性收益部分。由于市場中資產數量龐大,直接去研究資

產收益是難以實現的,這種從資產收益到因子收益的映射,極大地降低了研究難度

并賦予其更多的解釋意義。

1.2.風險與效用

為了規范地闡述后續的因子模型與框架,在本節我們首先引入標準的數學記號,并

介紹投資組合理論的基本概念:風險與效用。

考慮離散時間市場模型,為了規范定義,我們記概率空間為(0,咒P),其中方是6代

數(c-algebra),記信息過程/:7x0-賬,其中7=(0,…,T)使得兒表示t時刻可以獲

得的市場信息,域流(Filtration)F=(%)/。,…,?■被信息過程/生成。假設市場中有幾

個風險資產(Riskyasset)和1個無風險資產(Risk-freeasset)?記第i個資產在t時刻

的價格為可,i=0,-,n,t=0,-.T,其中S。表示無風險資產的價格過程。類似地,

記第i個資產在t時刻的收益率為R=S,/Si-1,i=0,…,n,t=1,…,7,其中R。

ttt—1

表示無風險資產的收益率過程。記第i個資產在t時刻的超額收益率為必#=R'-R。,

i=1,…,n,t=l,-,To記上=(R1,R2,…,Rn)T,t=1,…,7為風險資》在t臺刻盛

收益率的向量表示,8的均值為生「方協方%.矩陣為易。記RP=WT殳為投資組

合在t時刻的收益率,其中Wt-I=(w],W2,■■■,Wn)T表示t時亥『到t時刻組合

t—1t-1t—1

中風險資產的持有權重,那么

TT

Et-i[/?P]=w生,Vart-i[Rp]=iv

tt-itt-i

在進行投資決策時,不僅僅需要考慮資產的預期收益,未來收益的不確定性同樣是

一個重要的影響因素。我們定義風險度量(Riskmeasure)。:X->R,其中%={X:。t

喝是隨機變量集合。風險度量反映隨機變量的某種不確定性程度。我們期望風險度

量這類泛函(Functional)具有良好的性質,如單調性(Monotonicity),不變性(Cash

invariance),凸性(Convexity)等等,可參考[1]。常見的風險度量有標準差、方差

等。另外還有在險價值(ValueatRisk,VaR),當X€〃(。月,P)時,

VaRa(X)—q_x(a)=inf{xEIR:P{—X<x}>a},

其中q表示隨機變量的下分位數,當X代表收益率或者P&L時,VaRa(X)表示一種最

大虧損,換句話說,有1一a的概率認為最大虧損在VQRQ(X)以內。另外一個重要的

風險度量是Expectedshortfall(ES),相對于VaR,它更全面地衡量尾部風險,

11

ESaW=-——fVaRuCX)du,

—a&

一般來說,ESa(X)包含尾部損失更全面的信息,它可以捕捉到不同水平下的平均在

險價值。可以證明,VaR與ES均是凸風險度量(Convexriskmeasure),且它們具有

更好的性質。

另外一個重要的概念是效用(Utility),它是投資者決策與風險的聯接。效用函數

(Utilityfunction)是一類非減的連續映射U:E->眩,Eu眩,它綜合考量了收益與

風險。一般而言,風險厭惡(Risk-averse)投資者的效用函數是下凹的(Concave)。

效用函數的選擇有多種方式,可以刻畫不同的風險厭惡程度,例如,一類常見的效

用為指數效用:

U(x)=-ae-ax+b,

其中,a是風險厭惡系數。在投資決策中,我們面臨的問題便是在一些風險控制的限

制條件下優化期望效用(ExpectedUtility)o

1.3.理論之聯系

1.3.1.有效前沿

在上一節引入風險與效用的基本概念后,本節中我們首先回顧Markowitz的組合理

論以及有效前沿(Efficientfrontier)的概念。當市場中只包含風險資產時,如果用收

益率的均值衡量收益,用標準差衡量風險,我們總希望找到在相同期望收益水平〃下

風險最小的組合,即我們在每個時刻都有以下優化問題:

min卬乙27卬-1

僅一1

s.t.WTn=i,wT林t=

t-it-i

可以通過Lagrange優化進行求解,得到最優的權重此時最優組合的收益率標

準差為,(w;_pT2w;_f對于所有的“,(,(卬".?丁曷卬*”#)表示一個最優投資組合

的標準差與均值。當風險即標準差一定時,投資者往往會選擇更高均值的組合,所

以有效前沿定義為最優組合的上半部分。

圖1:僅有風險資產時的有效前沿圖1:加入無風險資產后的有效前沿

如果我們引入無風險資產,那么優化問題將變為:

min卬工1工”—1

w,一l

s.t.wTjtz+(1-wTH)R°=fi.

tt-1t-1t

同樣地,通過Lagrange優化,可以得到最優的權重卬彳一卜此時的有效前沿組合為切

點組合(Tangencyportfolio)與無風險資產的任意線性組合,其中切點組合仍在當市

場中只包含風險資產時的有效前沿上。切點組合是僅包含風險資產得到的最優組合,

它也代表著市場組合。

1.3.2.SDF與Beta定價模型

接下來,我們重新聚焦資產定價理論,首先引入隨機折現因子(Stochasticdiscount

factor,SDF)與Beta定價模型(Betapricingmodel),之后揭示它們與投資組合中

的有效前沿這三大理論之間的緊密聯系。

在離散時間市場模型中,無套利條件(Noarbitrary,NA)保證了隨機折現因子的存

在性。隨機折現因子(SDF)”是一個初值為0的隨機過程使得它與任意資產價格Si,

i=0,…的乘積MSi是一個IP-鞅(P-martingle)。換句話說,對于任意的t=,T-

1,有瓦[%+5]=MtS,。從SDF的定義可以得到,S<=E[MSq,即資產當前的

t+itott

價格可以被解釋為未來某時間價格折現的期望。如何確定SDF是資產定價領域中的

一個重要問題。

SDF隱含著資產價格與未來收益的關系。而另外一種資產定價理論用因子收益去線

性解釋資產收益。Beta多因子定價模型假設對于任意的t=瓦是配的隨機

向量,它表示在t-1到t時刻k個因子的因子收益。記瓦的方差協方差矩陣為2%我

們說在某個t時刻存在一個Beta多因子定價模型,如果存在人G呼使得Vi=1,…,n,

其中,

伊=("尸CO%(E+l,?,e)

ttt+1

表示資產i在t時刻對々個因子的因子暴露(Factorexposure),2亡表示t時刻/c個因子的

風險溢價(Riskpremium)o當/c=l時,其退化為單因子模型(Singlefactormodel)

Et[/?i,e]=6°%(耳+1,喀1)人,

,+1Vart[Ft+i]

如果我們將單因子選為市場組合收益率,即瓦=/?¥,那么可以將左端的任意資產t

的超額收益Rie替換成市場組合的超額收益RM,e,這是由于市場組合收益是n個資產

t+1t+1

收益的某種線性組合。這樣我們可以得到

乙=瓦[/?陽,

它表明這里的市場因子風險溢價其實是市場因子超額收益率的期望。此時的單因子

模型就是著名的資本資產定價模型(CAPM),

E[Rl'e]=/?;IE伊=缶巧丑性4

tt+it-t+i?Vart[R^

Beta因子定價模型的意義在于,將資產收益解釋為各個因子上獲得的收益之和。對

于不同的資產而言,因子收益是一致的,我們只需要確定資產對于各個因子的暴露

程度。另外,通過數量有限的因子收益去研究數量龐大的資產收益,很大程度上提

升了研究效率,另一方面,增加了資產收益的可解釋性。

1.3.3.聯系

本節介紹SDF、因子模型以及有效前沿的緊密聯系,可參考[2][3]。以下討論假設市

場是無套利的,無套利假設等價于SDF的存在性。由SDF的定義,

EJMt+iR焊J=0,

?Et[Ri,e]=(一£。女(Mt+i,R慳J)MarjK+i]:=仗A.

"1Vart[Mt+1]Et[Mt+1]'

上面式子表明SDF隱含著一個單因子模型,其中母是因子暴露,人是因子的風險溢

價。⑵認為SDF可以看作是切點組合的仿射變換(A由netransformation),不失一

般性,類似于[3],我們考慮具有如下形式的SDF,

Mt+1=1—wTRe,

tt+1

將其代入lE/Mc+iRW+JnO,可知

死=IEjRe(Re刃TJEjRe].

t+1t+1t+1

可以驗證組合權重wt就在有效前沿上,我們定義&H=wTRe為切點組合的超額收

tt+1

益。那么SDF隱含的單因子模型可以重寫為

%網e]=―紐)西瓦+1]=僅院及+1].

t+1Vart[Ft+i]t

R"=(瓦+1+^,

t+itt+i

其中,及⑻]=0,C。/(£i,及+1)=0。至此,我們將SDF、因子模型、有效前

t+it+i

沿三部分聯接起來,將其近似她歸為同一問題。只要獲得了有效前沿上切點組合的

權重,就可以構建SDF,并蘊含一個因子模型。

1.4.Fama—French因子模型

在CAPM被提出之后,實證研究者通過歷史時間序列的統計分析發現,除市場組合

之外還有許多因子可以捕捉資產的超額收益。額外的因子解釋了具有不同規模

(Size)、賬面市值比(Book-to-marketratio)、盈利性(Profitability)等的公司的超

額收益率。

Fama—French3因子模型⑷在1992年被提出,有如下形式:

Re=a+0iRM,e+B2SMB+B3HML+E,

其中,SMB是小市值股票組合與大市值股票收益率之差,反映了規模效應,HML是

高賬面市值比組合與低賬面市值比組合收益率之差,反映了價值效應。

它在提出之時引發對于市場有效性的爭論,支持市場有效性假設的人認為因子帶來

的收益來自于所承擔的風險,因為通常而言,小市值公司具有更高的風險,應該獲

得更高的收益作為補償。另一部分人則認為是源于市場參與者的錯誤定價。

Fama—French5因子模型⑸在2015年被提出,有如下形式:

Re=a+0iRM,e+/MB+p3HML+p4RMW+psCMA+£,

其中,RMW表示強盈利性組合與弱盈利性組合收益率之差,CMA表示低內部投資與

高內部投資組合收益率之差。5因子模型考慮了更多的風險因素,提升了解釋與預

測能力。研究表明這些因子依賴于國家與市場,所以它們并不是通用的,然而,

Fama—French因子模型啟發我們不斷去尋找有解釋意義的因子。

2.多因子模型之實踐

2.1.兩類多因子模型

在多因子模型的理論與實踐中,有兩類模型,前者是我們在第一章中提到的Beta多

因子定價模型或Fama一French類型多因子模型,在學術界較為常用。通過對每個截

面的資產收益率按因子大小排序分層得到因子收益序列,然后通過時間序列回歸得

到因子暴露的估計。模型對數據質量的要求并不是非常強,因為每期的新增因子值

信息僅用于排序計算因子收益。模型中因子收益的定義是自然且可得的,然而,因

子暴露卻是我們回歸計算得來的,這就默認了在過去一個窗口期內單個資產的因子

暴露不發生變化,這樣得到的因子暴露可能有所偏差。

另外一類重要的多因子模型是Barra類型的因子模型。這類模型直接將標準化后的

因子值作為因子暴露,在每個截面上通過資產收益對因子暴露進行回歸得到因子收

益。這類模型對于數據質量的要求較高,但是反映出的因子暴露值更為精確,所以

這類因子模型常常被用于風險管理與因子選股中。

Fama—Macbeth回歸網在某種程度說明了兩種因子模型形式的聯系。Fama-

Macbeth回歸通常被應用于面板數據(Paneldata)的分析,排除了殘差截面相關性

對標準誤的影響。它是一個兩步的回歸,首先是資產收益率對因子收益或某些指標

做時間序列回歸得到因子暴露的估計,這與Fama—French類多因子模型類似。然后

在每個橫截面,通過資產收益率對因子暴露進行回歸得到當期的因子收益率以及殘

差,再將每個截面回歸得到的參數取均值作為回歸的估計。

2.2.收益模型

收益和風險是進行主動投資組合管理的主角,對于一個風險厭惡的投資來說,投資

的第一目標都是在既定的風險條件下追求更高的預期收益,或者在既定的預期收益

水平下,降低投資組合的風險。這種最優的投資組合被稱為有效前沿,有效前沿理

論是現代投資組合理論的基石。對收益和風險的預期是我們計算有效前沿的基礎,

本章我們介紹預測收益和風險的模型。

圖3:收益模型與風險模型

使用多因子模型進行投資組合的主動管理實踐中,收益模型無疑是最重要的模塊,

收益模型的作用就是預測股票收益率,因子研究的主要工作便是聚焦于此。主動投

資管理的目標是通過比基準投資組合做得更好來增加投資過程中的價值,基準組合

一般選取市場組合或者某個寬基指數,開發收益模型的目標便是尋找可以預測收益

率的變量以獲取超越基準的收益,這種變量我們稱作alpha因子。一般而言,Alpha

因子值與未來的股票收益率是較強相關的,且相關性會在一段時間內保持,這種相

關性代表著對未來收益的預測意義,這是超額收益的本質來源。

收益率的分解:

根據APT模型,我們可以把任一股票或投資組合的超額收益率分解為由因子解釋的

共同部分和殘差部分:

k

Ri,eiTii(\i

t+i=(Xt)及+1+ut+1=Z:(Xt)/Ft+i。+%+i,

7=1

其中R(e為股票i在t+1時刻的超額收益率:X,為股票i在t時刻對k個因子的因子暴

t+1t

露,一般使用因子值,是在投資期初可以觀測到的;瓦+1是k個因子在t+1時刻的因

子收益,可以在投資期末歸因到因子上;叫+i是股票i在t+1時刻的特異收益率。

在此種收益率分解方式下,我們可以將股票的預期超額收益率用一組因子的暴露表

示出來

1GM;:i]=(£)Et%+J:=(X;)%,

其中,mt是對k個因子在t到t+1時刻的因子收益預測。

這樣,我們進行投資組合管理的主要工作變聚焦到尋找有效的因子上來。后文將詳

細介紹收益率模型的構建方法。

圖4:收益模型框架流程

量價數據

財務數據

機器學習

收益率模型的構建步驟:

1、尋找alpha因子

有效的alpha因子是進行主動投資管理的關鍵,開發alpha模型是量化研究的主要工

作,目前尋找alpha因子的方法主要有IC法、分組回測法、回歸法和機器學習挖掘

等方法。而尋找alpha因子的方向主要有三個方向:

(1)在傳統的量價數據和財務數據中發掘新的預測變量;

(2)對已有的alpha因子進行優化和改進;

(3)使用高頻數據、另類數據等尋找新的alpha因子。

2,挑選納入模型的因子

在尋找alpha因子之后,投資組合管理人會形成自己的因子庫,然而納入模型的因

子并非越多越好,納入模型的因子需滿足以下特性:

(1)邏輯性,預測因子需要有理論支撐,不得違背經濟金融運行的底層邏輯;

(2)持續性,在有金融學理論支撐的同時,實證檢驗的結果能夠支撐理論邏輯也

尤為重要,在考慮納入模型時,應關注因子的有效性和預測能力的持續性;

(3)信息增量性,在因子納入模型前,應檢驗因子和其他已有因子之間的相關,

確保新的因子可以對預測未來收益率提供增量信息;

(4)穩健性,穩健性好的因子,在不改變預測邏輯的前提下,改變變量構建的參

數和檢驗區間,也能保持較好的預測能力。

(5)可投資性,從理論落實到投資的過程中,我們還須考慮信息衰減、換手率和

交易成本等問題。

3、收益率預測

確定了納入模型的因子后,下一步就是進行收益率預測,目前收益率預測的方法主

要分為非參數化預測和參數化預測兩種。非參數化預測方法主要利用因子和收益率

之間的單調相關性進行收益率預測,包括條件選股法和排序打分法;參數化預測方

法試圖研究因子和收益率之間的具體關系,其中線性回歸模型最為常用,近年來,

隨著機器學習的發展,一些非線性模型也被應用到收益率預測之中。

(1)條件選股法,條件選股法是指對選定的每一個因子設置一個篩選條件,并選

取滿足的所有條件的股票構建組合的方法。條件選股法的特點是簡單易行,

但也存在諸多局限性,比如因子不能選取過多或過少,持股數量不穩定,難

以和投資組合優化模型結合等。

(2)排序打分法,遵照因子和預期收益率正相關的原則,使用每個因子對股票進

行排序,按照排序高低進行打分,最后將股票在每個因子上的得分加總,選

取得分最高的前N只股票構建組合。排序打分法一定程度上彌補了條件選股

法的缺陷,但它假定每個因子的權重相同,沒有考慮不同因子預測能力的差

異。

(3)線性回歸模型,線性回歸法是在截面上對因子進行標準化后,對收益率和滯

后一期的因子值進行回歸,估計每一期的因子收益,再取平均用以估計下一

期的因子收益的方法;除了每期截面回歸取平均的方法,面板回歸也是常用

的因子收益預測方法。估計出下一期的因子收益之后,帶入當期因子值,即

可獲得下一期的預期收益率。

2.3.風險模型

風險管理也是主動投資組合管理中的關鍵模塊,風險是對收益率的不穩定性的度量。

風險的定義有多種,如標準差、半方差、目標半方差、損失概率和在險價值等,其

中Markowitz將風險定義為資產收益率的標準差,一直被投資界沿用至今,此定義

滿足普適、對稱、靈活和可精確預測的要求。

圖5:風險模型框架流程

風險預測的模型主要有單因子風險模型、假設任意兩只股票之間相關系數相同的模

型、用歷史收益率估計協方差矩陣中每一項的模型和結構化多因子風險模型。其中

結構化多因子模型可以實現降維,更為簡便的計算股票的協方差矩陣,最為實用可

行,是投資界最常用的風險模型。多因子模型將股票的收益率分解為兩個部分,由

一系列共同因子帶來的收益以及僅和股票自身相關的特異因子帶來的收益。其中,

每個因子代表解釋風險的不同維度。資產在某個因子上暴露度越高,意味著其承擔

的風險越高,也會獲得更多的由該維度風險帶來的收益率。

與上一節中對收益率的分解相同,結構化風險模型首先將股票超額收益率分解為如

下形式:

..T

Dlfe11

t+i=(XJFt+i+"t+i,

其中Ri,e為股票i在t+1時刻的超額收益率;X,為股票i在t時刻對k個風險因子的因

t+it

子暴露,一般使用因子值;8+i是k個風險因子在t+1時刻的因子收益;比。+1是股票

i在t+1時刻的特異收益率。特異收益率與因子收益率不相關。

在此種假設下,n個股票超額收益的協方差矩陣為:

匕=(力》>兒+以,

tt

其中,”是因子收益的協方差矩陣,/為n個股票在t時刻在k個因子上的因子暴露

矩陣,為n個股票的特異方差矩陣。匕和工"都是股’加上取值的,但通常是對角

ttt

矩陣,邛是股小上取值的,而Xt是股總上取值的。經過上述分解后,可以使風險模

型估計的參數數量大大降低,即從提高了可操作性。

建立風險模型的關鍵是選取合適的因子。因子的選擇主要基于經濟邏輯與市場經臉,

常見的因子可以大致分為三類,宏觀因子,統計因子與橫截面比較類因子。宏觀因

子反應資產對于外部經濟的反應。統計因子是使用統計工具推導出的因子。橫截面

比較類因子比較股票的各種屬性,反應股票自身情況的基本面因子(如規模因子)

和反應市場行為的市場因子(如波動率因子)都屬于橫截面比較類因子。風險模型

的因子挑選應遵循有區分能力、直觀、有意義的原則。有區分能力是指因子可以區

分呢收益率特征顯著不同的股票群,直觀的因子有著可靠的經濟學含義,有意義的

因子可以解釋股票的部分表現。風險因子(beta因子)與alpha因子有著很大的不

同,它與未來收益率的相關性是顯著的,但是相關性的方向或大小難以在一段時間

內保持;它對于收益率有較強的解釋意義,但是預測意義較弱,因此依靠投資這類

beta因子而獲得的收益來自于承擔風險而獲得的補償,并非超額收益。

Barn模型是最著名的結構化多因子風險模型,CNE5與CNE6是針對中國股權市場

的多因子模型的典例。例如,CNE6包含規模因子、波動率因子、流動性因子、估

值因子、質量因子、動量因子、成長因子、分紅因子與情緒因子9個一級因子和國

家因子、行業因子,解釋風險的不同層面。

風險模型常常被用來估計資產收益率的協方差矩陣,然后可以進行投資組合優化,

即在一定的風險限制條件下,尋找最優的權重最大化期望效用;或是在期末根據風

險模型對投資組合表現進行歸因:還可以通過限制某些風險因子的因子暴露來進行

風險管理。

3.因子檢驗

前兩章我們介紹了多因子模型的理論與實踐,本章我們聚焦于單因子的有效性檢臉,

并構建一個因子表現的評估體系。

圖6:因子檢驗框架流程

3.1.數據處理

在實際操作中,數據通常是不完整的(存在缺失值)、不一致的、易受到噪聲(錯誤

或異常值)侵擾的。因此我們在使用因子數據進行投資時,需要對因子數據進行預

處理。因子數據預處理一般包括缺失值處理、去極值、標準化、市值中性化、行業

中性化與因子正交化等。

3.1.1.缺失值處理

因子數據可能存在少量缺失值,在單因子檢驗時可以不填補缺失值,避免對測試結

果產生影響,但多因子模型的建模過程中,應考慮對缺失值進行填補。缺失值填補

的方法包括插值法、前值填充法、中位數填充法等,為保證處理方法可回測,我們

采取前值填充的方式填補缺失值。

3.1.2.去極值

因子值是股票某個特征的代理變量,需要滿足一個合理的分布區間,在數據搜集和

計算的過程中,可能會產生異常值,影響我們對因子的后續研究,因此需要在截面

上對因子的極端值進行處理,這一方面可以排除錯誤數據,另一方面使因子的分布

更合理。

極值包括異常值和離群值,去極值并不是將這些異常或者離群的數據刪除,而是將

這些數據修正為正常值。去極值可以有效避免出現異常的個股被選入策略組合對策

喀收益造成負面影響。常見的去極值方法包括縮尾法、中位數法和三倍標準差法。

縮尾法:將因子值在截面上從小到大排序,然后將指定分位數區間之外的極端值替

換為分位點的值。

qi-a(x),Xi>qi-a(x),

*={qaM,Xi<qa(x),

Xi,else.

其中,qa(x)為因子序列x的下a分位數,,為看去極值以后的修正值。

中位數法:首先在截面上找出因子序列Xi的中位數XM,計算每個因子項與中位數XM

的絕對偏差|看一xM\,并找出絕對偏差值序列|看一XMI的中位數DM/W,確定參數n,

計算閾值XM+和XM—nDMAD,最后將闕值之外極端值修正。

XM+nD/viAD,Xi>XM+KDMAD,

,={XM—TIDMAD,Xt<XM—710M皿

Xi,else.

其中,XM為因子序列x的中位數,DM/ID為絕對偏差序列出一%MI的中位數,,為々去

極值以后的修正值。

三倍標準差法:求出因子序列々的均值KM和標準差。。將[%M-3GxM+3。]區間之

外的極端值替換為區間的端點。

XM+3<7,Xi>XM+3cr,

*=1%M—3c,Xi<XM—3<7,

Xi,

其中,為因子序列x的均值,。為因子序列的標準差,,為演去極值以后的修正值。

3.1.3.標準化

在多因子模型構建的過程中,因為不同因子的量綱有差別,所以需要對數據進行標

準化,以便于對不同量綱的因子進行比較和分析。我們使用z-score方法,對因子數

據進行標準化。

其中,〃為截面上因子暴露序列符的均值,(T為因子暴露序列左的標準差,*為標準化

的因子值。

3.1.4.因子中性化

不同行業、不同市值、不同風格的股票因子分布可能會存在顯著差異,所以在單因

子測試之前,應對因子進行處理,剔除掉因子中包含的其他因素。在實際操作中,

我們一般會考慮行業、市值的中性化。

(1)行業中性化

行業中性化的方法有兩種,一是使用行業啞變量對因子進行OLS回歸,使用得到的

殘差代替因子值;第二種方法是分行業對因子進行標準化。第一種方法操作相對簡

單,并且可以同時剔除其他因素,因此一般采取第一種方法。

(2)市值中性化

市值中性化采用市值(或對數市值)對因子值進行OLS回歸,使用得到的殘差代替

因子值。由于回歸后的殘差與所有自變量均正交,在實際操作中我們一般會同時進

行行業和市值的中性化處理,將行業因子和市值因子一起納入線性模型進行回歸,

回歸后得到的殘差即為去除了行業因素和市值因素影響后的因子值。公式如下:

Xt=£bt,jInduj+bt,mvmvt+Et,

其中,Xt為t時刻單因子在截面上的因子暴露向量,/nd%為所有股票在/行業的暴露

向量,Tn%為股票在市值(或對數市值)上的暴露向量,瓦,公為對應的行業和

市值因子收益率,々為回歸取得的殘差,即行業市值中性化后的因子暴露。

3.1.5.因子正交化

由于不同因子之間可能存在較強的相關性,所以在多因子模型中分析結果可能會出

現不穩定,回歸參數偏誤等問題,因此我們需要對因子進行正交化以降低不同因子

之間的截面相關性。因子正交化的方法有多種,回歸法、Schmidt正交化、規范正交

化、對稱正交化等。目前業界主要使用回歸法構建相互正交的因子。

3.2.IC分析

IC即信息系數(InformationCoefficient),IC分析可以衡量因子在截面的選股能力。

因子的IC值指的是因子在第t期的暴露值Xt與t+1期的收益率凡+i之間的Pearson

相關系數,即

ICt=Corr(Xt,Rt+i),

其中凡+1為時刻t到時刻t+1的所有股票的收益率序列,Xt為數據預處理后的因子

暴露。IC值衡量了一個股票池中,因子本期暴露度和個股下期收益率之間的線性相

關程度,也可認為其反映了利用該因子預測下期股票收益率的穩健程度。IC的絕對

值越大表明該因子越有效,選股能力越強。在實際應用中,Pearson相關系數易受到

極端值的影響,先對因子暴露和收益率序列在截面上進行排序得到排序值,再求相

關系數得到的Spearman秩相關系數則能更穩健的表現因子與收益率之間的相關關

系,所以通常使用Spearman秩相關系數(RankIC)進行IC分析。

在實際操作中,也可按照因子暴露從小到大排列分為若干組按照等權或市值加權的

方式構建組合,并記錄每組在時刻t至時刻t+1的組合收益,再計算RankIC。一般

地,我們使用RankIC序列的均值、方差、RankIC的分布、ICJR以及累計Rank

IC來分析因子的選股能力。一般認為,RankIC序列的均值絕對值較大,方差較小,

RankIC在一段時間內維持相同的方向即累計RankIC曲線回撤較小時,單因子與

未來收益有較強且穩定的相關關系,即有較強的選股能力。

3.3,分層回測

分層回測類似與Fama—French類型因子模型獲得因子收益的方法。在每一期截面

上對因子暴露進行排序打分,根據因子得分將股票池分為N層,然后觀測每一層資

產組合累計收益的表現情況,這是進行因子有效性評價最直觀的方法。分層回測法

不僅可以觀測因子與股票收益之間的線性關系,也可以輔助判斷因子與股票收益之

間是否存在非線性關系,比如分層回測的結果顯示,某因子值排名屬于Middle組的

個股表現明顯比Top組和Bottom組的個股要好,說明該因子和股票收益之間存在

非線性關系。分層回測在實際操作中簡單方便,結果直觀,并且能夠挖掘出因子的

單調性,是接受度非常高的一種單因子測試手段。

分層回測法的構建步驟:

(1)確定股票池、回溯區間、調倉周期。

(2)調倉:根據調倉周期,計算調倉日因子值,并于下一個交易日以收盤價調倉。

(3)分層:對因子值進行預處理,在調倉日按照因子值大小排序將股票池平均分

為N層,在每層內對個股按照等權重或者市值加權的方式進行配比形成N個

投資組合。

(4)回測:每個調倉日的下一個交易日按照分層結果調倉,賣出不在相應組合的

股票,買入重新分入該組合的股票,直至回測結束。

(5)評價指標:每一層的年化收益率、Sharperatio年化波動率、信息比率、最

大回撤、勝率等。

我們可以通過每一層的組合表現評估指標和凈值的單調性等指標評價因子的有效

性。一般來說,有較好選股能力的因子具有較為明顯且穩定的分層效果。

3.4.回歸分析

回歸分析也是一種常用的檢臉因子有效性的方法。具體是將t期的因子暴露與t+1

期的股票收益率進行線性回歸,回歸得到的系數即為該因子的因子收益。由于股票

收益率會受到行業因素和市值因素的影響,因此在進行單因子回歸分析時,需要控

制行業和市值因素。回歸模型如下:

Rt+i=WbtijInduj+bt,mvmvt+bt,fXt+£tl

其中,&+1為股票在時刻t至時刻t+1的收益率向量,Xt為t時刻的因子暴露向量,

瓦/為回歸得到時刻t至時刻t+1的因子收益率向量,/nd%?為所有股票在J行業的暴

露向量,Tn%為股票在市值(或對數市值)上的暴露向量,btj、瓦,小為對應的行業

和市值因子收益率,%為回歸取得的殘差。

在每個裁面上對該模型進行回歸,可以得到因子收益率的時間序列和t值序列。t值

指的是單因子回歸系數的t檢驗統計量,反映了回歸系數的顯著水平。我們使用因子

收益率序列均值,t值均值,因子收益率大于0的比率,t值絕對值大于2的比率評

價因子的選股能力。

回歸分析與IC分析是相輔相成的。一般來說,單因子回歸系數的方向與大小反映了

當期因子值與下期股票收益率的相關程度。有選股意義的因子,其回歸系數序列在

一段時間內較為穩定,方向不發生大的變化,且t值絕對值序列一般都較大,反映了

期間具有顯著的因子收益。

以上是我們單因子測試測試框架的全部方法,下一章我們將用實例展示單因子測試

的效果。

4.常見因子跟蹤與測試

本節中我們用前文中介紹的數據處理與單因子檢驗方法對各因子大類包括規模、波

動率、流動性、價值、動量、盈利質量、成長、盈利能力、經營效率與償債能力中

的常見因子進行測試。樣本期為2012年1月I日至2022年9月14日,樣本股票

范圍為Wind全A指數的成分股。行業選擇中信一級行業分類。分層回測時將股票

按因子值排序等分為5組,月頻調倉,每組的股票等權配置。多頭收益是指按照因

子的方向做多第一組或最后一組的年化收益。IC分析取RankIC的結果,即下期月

頻收益與當期因子值的秩相關系數。回歸分析時,對于規模因子的檢驗不額外引入

市值變量。

在數據預處理方面,波動率、流動性、動量反轉偏量價類因子進行分位數去極值以

及截面標準化處理;對數市值因子去極值后做行業中性化,再進行假面標準化;其

余因子去極值,然后行業市值中性化,最后進行截面標準化。

表1:測試因子介紹

因子類別因子名稱簡寫計算方式

規模對數市值Incap市值的對數

12月波動率vol_ly12個月日收益率波動率

波動率

betabeta12個月CAPM系數

1月換手率turnover_lm1個月日換手率平均

流動性3月換手率tumovej3m3個月日換手率平均

12月換手率turnover_ly12個月日換手率平均

倒數市盈率ep市盈率的倒數

價值倒數市凈率bp市凈率的倒數

倒數市銷率sp市銷率的倒數

12月動量momentum_ly除當月的12月漲跌幅

動量

1月反轉reserval_lm當月漲跌幅

經營性利泗占比operprofit_to_totprofit_ttm經營活動凈收益TTM/利潤總額TTM

盈利質量

扣非凈利泗占比deducled_profit_prop_ttm扣除非經常性損益后的凈利潤TTM/凈利潤TTM

營業利泗同比增長opprofit_qua_yoy單季度營業利潤同比增長率

成長ROA同比增長roa_qua_yoy單季度總資產收益率ROA同比增長率

毛利率同比增長gross_margin_qua_yoy單季度毛利率同比增長率

ROAroa_ttm總資產收益率ROA_TTM

ROEroe_ttm凈資產收益率ROE_TTM

盈利能力

成本費用利潤率profits_to_cost_ttm凈利泗TTM/營業總成本TTM

投入資本回報率roic_ttm息前稅后經營利潤TTM/全部投入資本

存貨周轉率inventory_tumover_ttm營業成本TTM/平均存貨

經營效率固定資產周轉率fixedasset_tumover_ttm營業收入TTM/平均固定資產

應收賬款周轉率acct_rcv_tumover_ttm營業收入TTM/平均應收賬款

利潤債務比profit_to_debt_ttm凈利潤TTM/平均總負債

償債能力

流動比率current_ratio流動資產/流動負債

,wind

表2:因子測試結果總表

IC絕對值t值絕對值

最近一期多頭t值絕對值

因子名稱IC均值大于0.021R多頭夏普大于2

IC年化的均值

的概率的概率

對數市值-0.0480.871-0.049-0.31231.47%1.26.4520.593

波動率-0.0640.919-0.271-0.36019.08%15.5540.740

beta-0.0120.895-0.170-0.1069.32%0.34.6770.740

1月換手率-0.0890.952-0.376-0.50316.36%0.736.6300.854

3月換手率-0.0740.927-0.297-0.39915.60%0.75.7000.772

1年換手率-0.0540.935-0.256-0.22618.11%0.793.5570.602

倒數市盈0.0490.8470.0480.59925.89%13.8380.748

倒數市凈0.0530.8710.1230.49424.31%0.934.8840.707

倒數市銷0.0380.8060.0690.47922.61%0.873.5620.602

12月動量-0.0070.8790.105-0.05010.91%0.434.1560.772

1月反轉-0.0740.855-0.230-0.49820.06%0.775.0120.707

經營性利0.0240.8230.0430.22022.18%0.841.0030.114

泗占比

扣非凈利-0.0020.790-0.004-0.02014.57%0.570.8560.073

洞占比

營業利泄0.0170.758-0.0510.22817.20%0.670.7710.057

同比增長

ROA同比0.0180.7420.0370.23714.72%0.580.8840.081

增長

毛利率同0.0240.7340.0100.23920.86%0.840.8450.073

比增長

ROA0.0250.758-0.0860.31016.55%0.642.1980.358

ROE0.0290.742-0.0400.35017.52%0.71.6570.163

成本費用0.0120.774-0.0590.13917.18%0.661.9300.341

利潤率

投入資本0.0340.782-0.0920.43418.09%0.711.6240.301

回報率

存貨周轉-0.0030.863-0.087-0.02612.89%0.510.7350.065

固定資產-0.0050.726-0.151-0.06015.02%0.590.9150.122

周轉率

應收賬款-0.0130.790-0.100-0.13915.63%0.640.7290.041

周轉率

利泗債務0.0180.742-0.0180.27715.23%0.582.2120.472

流動比率-0.0110.734-0.005-0.17716.77%0.651.8130.374

,wind

在規模因子中我們測試了對數市值Incap,從分析結果來看,IC均值為負且絕對值

接近0.05,多頭年化收益較高,回歸系數顯著。分層回測效果表明10年的回測區間

內,A股總體呈現出明顯的小市值效應,但在2017年至2019年小市值組合出現了

較大回撤。另外,最近一期的IC值說明,上月規模因子在全A股票池中仍然具有

一定的表現。

圖7:Incap因子IC序列及累計IC圖8:Incap因子IC分布

A

o5

u

a

n

b

e0

u.

5

0

,wind,wind

圖9:Incap因子分層回測圖10:Incap因子回歸系數

,wind,wind

在波動率因子中,12月波動率vol_ly相對于beta表現較好,因子值與下期收益率

存在較強的負相關,回測結果顯示出因子具有良好的分層效果,反映出A股低波動

溢價明顯。最新一期的絕對值較高的IC值說明在過去一個月中波動率因子表現較

好。

圖11:vol」y因子IC序列及累計IC圖12:vol」y因子IC分布

,wind,wind

圖13:vol」y因子分層回測圖14:volly因子回歸系數

,wind,wind

在流動性因子中,我們測試的三個因子1月換手率turnover_lm、3月換手率

turnover_3m、12月換手率

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論