




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、內容目錄 HYPERLINK l _TOC_250012 一、綜述 3 HYPERLINK l _TOC_250011 二、行業內因子篩選 4 HYPERLINK l _TOC_250010 基礎因子 6 HYPERLINK l _TOC_250009 特質因子 10 HYPERLINK l _TOC_250008 2.2.1 銀行 10 HYPERLINK l _TOC_250007 2.2.2 券商 11 HYPERLINK l _TOC_250006 2.2.3 地產 11 HYPERLINK l _TOC_250005 2.2.4 其他 12 HYPERLINK l _TOC_2500
2、04 2.3 匯總 14 HYPERLINK l _TOC_250003 三、組合構建 14 HYPERLINK l _TOC_250002 四、總結、思考與展望 20 HYPERLINK l _TOC_250001 五、參考文獻 21 HYPERLINK l _TOC_250000 風險提示 21圖表目錄圖表 1:各行業樣本數 4圖表 2:因子列表 5圖表 3:因子無效行業 6圖表 4:周期行業yoy_np_q 因子與 sue 因子ICIR 值對比 6圖表 5:單季度營收增長因子測試 7圖表 6:存貨周轉率變化因子測試 8圖表 7:應收賬款占比與應收賬款周轉率變化因子表現 9圖表 8:應收賬
3、款周轉率變化因子測試 9圖表 9:凈息差因子分組超額收益 10圖表 10:撥備覆蓋率因子第一組超額收益 11圖表 11:券商估值因子第一組超額收益 11圖表 12:地產行業成長因子第一組超額收益 12圖表 13:流動負債增長因子第一組超額收益 12圖表 14:商譽占比因子IC 累計值 13圖表 15:各行業研發強度第一組超額收益 13圖表 16:各行業選取因子匯總 14圖表 17:模型表現對比 15圖表 18:全市場模型和行業選股模型相關系數 16圖表 19:各模型表現 16圖表 20:各模型表現對比 17圖表 21:300 增強策略凈值 18圖表 22:300 增強結果對比 18圖表 23:
4、300 增強歸因分析 18圖表 24:500 增強策略凈值 19圖表 25:500 增強結果對比 19圖表 26:500 增強歸因分析 19一、綜述隨著全市場基本面 alpha 增量信息的挖掘變得越來越困難,行業內選股模型開始備受關注。一方面是因為有很多因子只在某一行業,或者某些特定行業有效,而全市場建模無法方便的加入這些信息。另一方面,由于不同行業的屬性不同,細分行業建模可能比全市場建模預測的更加準確。基于上述兩個原因,我們嘗試構建行業內選股模型,期望該方法能夠對原有的全市場模型有所改進。目前市場上對行業內選股的研究已經有很多,我們將其分為三類:第一類是純測試的方法。給定一個標準,例如 IC
5、 或者 ICIR 的閾值,然后滾動篩選出每個行業滿足該篩選標準的因子,分行業進行預測,最后合起來構建組合。通過回測,我們發現此方法最終的策略表現相對于原來的全市場策略并沒有增強,即使是全樣本篩選因子而不是滾動篩選,在可能過擬合的情況下,該方法也并沒有顯著的好于原策略。究其原因,我們認為有兩點:不同行業應該有不同的篩選標準。由于不同行業的股票數量相差較大,對不同行業有相同預測能力的因子,在股票數量少的行業,其穩定性即 ICIR 也會較低。過嚴的篩選標準會使得某些行業沒有有效因子,而過松的篩選標準會使得某些行業加入過多的噪聲。而對不同行業使用不同篩選標準,則會增加大量的參數而導致模型容易過擬合。行
6、業內股票數量過少,盡管篩選出來的因子可能更加符合行業特征,使得預測的偏差更小,但是由于行業樣本少,預測的方差會增大。考慮一種特殊情況,假設某行業股票收益的預測函數與全市場股票完全一致。那么行業內選股是用該行業(50 只股票)的歷史數據進行訓練來預測該行業股票收益,而全市場模型是用 3000 只股票的歷史數據來進行預測,顯然后者的預測會更加準確。在實驗中我們也發現像綜合行業的樣本內選股收益總是要弱于全市場選股的。第二類是純邏輯的方法。即先有行業的邏輯,再根據邏輯構造因子。這個方法是最為理想的方法,我們也嘗試通過行業研究的邏輯來尋找因子,但遇到了一些困難:行業研究的精力集中在對公司業務的拆解,通過
7、對子行業發展或者公司業務的發展的分析來預測公司未來的營收以及凈利潤,這種基于公司業務的邏輯較難形成選股因子。例如對于凈利率和毛利率這兩個因子,在每個行業都是有用的基本面指標,但如果去測試,會發現不同行業毛利率和凈利率的因子表現相差巨大。行業研究和因子選股的是兩種思路,不管是毛利率還是凈利率,都只是研究員對公司未來盈利預測時需要考慮的變量之一,除此之外,他們更加關心的是公司業務或者所屬子行業的發展,實地調研的結果等。而從因子選股的角度來說,對于基本面因子,我們是需要該變量有預測公司未來基本面的能力,從而才可能預測股票未來的收益。行業研究的邏輯較為微觀,一個細分領域的可比公司可能只有不到十家,這與
8、我們量化選股要求廣度的思路相違背。第三類是測試和邏輯相結合的方法,即先測試每個行業每個因子的表現,然后從中找到一些行業邏輯。這類方法較為方便,但十分容易找到偽邏輯,從而陷入過擬合。例如我們在交運行業測試因子,發現資產周轉率增長表現很好,在所有測試的因子中 ICIR 排名第一,我們認為這是由于交運行業較為重視公司的周轉率,于是將該因子納入交運行業的因子池,但這顯然是靠測試得到的邏輯,有很高的過擬合的概率。因為資產周轉率的提升在每個行業都代表著公司運營效率的提升,按照這個邏輯,資產周轉率增長因子應該在每個行業都表現較好,但事實是只有部分行業中該因子有選股能力。因此如果我們沒有找到為何資產周轉率在不
9、同行業表現不同的核心邏輯,那么我們在交運行業中就不該選入資產周轉率增長這一因子。對于這類邏輯在各個行業都通用的傳統財務因子,我們需要進行行業間的橫向比較,從而找出因子適用的行業。對于純邏輯的方法,我們目前還沒有找到一個有效的構建選股因子或者模型的方法。因此,在本篇報告中,我們還是使用測試和邏輯相結合的方法來構建行業內模型。那么對于這個方法,最需要注意的就是其過擬合的可能性,我們在研究中盡量避免這一問題,使得模型在樣本外有較好的表現。本報告的研究主要分為兩部分,第一部分是行業內因子的選取,第二部分是如何將各行業的預測結合起來最后形成投資組合。由于行業內選股是偏基本面的策略,因此本文只采用線性加權
10、的方式進行預測,我們將重點放在第一部分,即尋找各個行業適用的因子。二、行業內因子篩選由于行業內的樣本過少,當前成分股最多的行業也只有不到 300 只股票,而最少的只有30 只左右,在我們樣本區間的早期,大部分行業成分股的樣本數量都不到 100 只。因此在選取行業內因子時,我們必須找到因子的邏輯。圖表 1:各行業樣本數2009 年 1 月2019 年 6 月機械86328基礎化工109273醫藥105270電子元器件62207計算機29191汽車61173電力及公用事業67150電力設備47149房地產108134傳媒15132通信30118建筑31117輕工制造31103交通運輸66101有色
11、金屬5097食品飲料3795商貿零售7991紡織服裝5584建材4183農林牧漁4876家電2365國防軍工1956石油石化1845鋼鐵4044證券839綜合2338煤炭2834餐飲旅游2030銀行1426多元金融217保險36資料來源: ,Wind我們將因子分為兩類,之所以這樣分類,是因為我們認為對于這兩類因子,我們尋找邏輯的方式是不同的:基礎因子:這類因子基本都是各行業適用的傳統財務指標,全市場有效,但在不同行業的表現不同。這類因子由于已經通過全市場的驗證,在大樣本下證明了其有效性,且一般來說都有一個較為合理的全市場邏輯,因此不會存在過擬合的可能。對于這類因子,我們的假設是這些因子在不同行
12、業表現不同,從而通過行業的橫向比較,尋找到哪些行業更適用的邏輯,并在這些行業使用該因子。特質因子:這類因子是只有某些特定行業邏輯的因子,一般來說全市場無效,只在少數幾個行業有效,例如研發、商譽、經營類、杠桿類因子等。這類因子是最需要注意過擬合風險的。對于一個因子,分二十多個樣本測試一遍,幾乎總可能找到顯著的子樣本。那么對于這類因子,必須要先有邏輯,然后再進行測試。或者是該因子足夠顯著,能夠通過多重檢驗。為了避免過擬合,我們選取盡可能少的,邏輯清晰的因子作為我們的基礎因子池。圖表 2:因子列表類別指標含義1估值ep市盈率倒數2估值bp市凈率倒數3成長yoy_np_q單季度凈利潤增長4成長yoy_
13、or_q單季度營收增長5成長roe_q_delta單季度 roe 變化6盈利roe_q單季度 roe7盈利netmargin_ratio_q單季度凈利率8盈利grossmargin_ratio_q單季度毛利率9盈利netmargin_ratio_q_delta單季度凈利率變化10盈利grossmargin_ratio_q_delta單季度毛利率變化11運營inv_turnover_q_delta單季度存貨周轉率變化12運營asset_turnover_q_delta單季度資產周轉率變化13運營acct_rcv_q_delta單季度應收賬款周轉率變化14特質nim銀行業凈息差15特質npc銀行業
14、撥備覆蓋率16特質ep_12m券商月報數據構建的 ep17特質sp_12m券商月報數據構建的 sp18特質adv_to_sales房地產行業業績保證系數19特質yoy_cur_liab流動負債增長20特質rd_or研發強度21特質goodwill_to_bv商譽占比資料來源: ,Wind下面我們分別對這些因子進行測試以及分析,以下測試中剔除了綜合行業以及金融行業。我們首先對所有因子進行異常值處理,然后分別在行業內對市值進行中性化。由于 12 年之前的股票數量過少,我們的樣本從 13 年開始。不同行業的股票數量不一樣,其 ICIR的大小不具備可比性,對于不滿足硬性標準(ICIR0.6)的因子,我
15、們還會綜合考慮該因子在行業內的相對表現。基礎因子在基礎因子中,經過測試我們發現其中有幾個因子幾乎在所有行業中的有效。可以看到,這幾個因子都與公司的凈利潤相關,這也是公司基本面最核心的因素。同時這幾個指標分別代表了公司的三的方面,估值,盈利能力,以及成長性。圖表 3:因子無效行業指標無效行業roe_q餐飲旅游ep餐飲旅游yoy_np_q餐飲旅游,零售,農林牧漁roe_q_delta家電,農林牧漁,餐飲旅游資料來源: 我們發現餐飲旅游行業,這些最基本的因子都沒有效果。我們認為可能有兩點原因。第一是餐飲旅游行業的股票數量過少,截止目前只有 30 只左右,因子中包含的噪聲較多。同時其子行業又分旅行社、
16、景區、酒店、餐飲,成分股之間差異較大,題材頻出,因此市場表現可能會與基本面有較大的偏離。對于餐飲旅游行業,我們將不進行單獨的行業內預測。在農林牧漁行業,成長因子凈利潤增長和 roe 變化并沒有效果。但我們測試農林牧漁行業的其他因子,會發現 sue 因子表現很好,這可能是由于農林牧漁行業的凈利潤波動性較大,單季度的凈利潤增長可能是由于周期性原因導致,并不代表公司過去業績的穩定增長。因此使用 sue 能夠幫助我們過濾掉利潤波動大的公司。這一邏輯在可能在其他周期性的行業中也同樣適用,我們比較了周期性行業 sue 與 yoy_np_q 的 ICIR 值,在周期性行業中,sue 確實要穩定好于單季度凈利
17、潤的增長。圖表 4:周期行業yoy_np_q 因子與 sue 因子 ICIR 值對比yoy_np_qsue基礎化工1.3322.085電力設備1.2351.430機械0.9581.199鋼鐵0.7441.109建材0.6751.027有色金屬0.8810.916輕工制造0.6290.901石油石化0.7640.864農林牧漁0.6000.829建筑工程0.4210.590煤炭0.5940.569資料來源: ,Wind除了上述四個因子之外,其他因子基本上都只在半數行業顯著。對于這類因子,我們根據測試結果提出猜想,然后尋找行業的邏輯,且在有邏輯的行業使用他們。需要注意的是我們不可能找到所有表現好的
18、行業的邏輯,一些行業因子表現較好可能剛好是隨機樣本造成的,其表現并不可持續。因此,我們盡可能找到一些簡單直觀的邏輯,并只在有邏輯的行業中使用他們。yoy_or_q:營收增長按道理在每個行業都是較為重要的指標,但是在很多行業中,其并沒有選股效果例如煤炭,農林牧漁,軍工,食品飲料,輕工,公用,石油石化,紡織服裝,建材。這些行業并沒有明顯的共性。但是在 TMT 行業,營收增長因子效果非常好,排在所有行業的前列。這可能的原因是在 TMT 行業中,有較多公司或者項目尚未盈利,但其未來成長性較好,因此在評價公司成長性時會更加重視公司的營收增長。圖表 5:單季度營收增長因子測試ICICIR通信0.0531.
19、368計算機0.0481.575傳媒0.0450.856商貿零售0.0421.320餐飲旅游0.0420.684電力設備0.0371.007基礎化工0.0371.439機械0.0351.042醫藥0.0351.091有色金屬0.0310.950電子元器件0.0311.026建筑0.0310.751家電0.0300.671鋼鐵0.0290.611石油石化0.0290.495汽車0.0260.874交通運輸0.0260.746建材0.0250.567紡織服裝0.0230.535國防軍工0.0210.313輕工制造0.0210.470食品飲料0.0180.452電力及公用事業0.0160.488農林
20、牧漁0.0080.196煤炭-0.002-0.041資料來源: ,Windbp: 按照邏輯我們應該在強周期行業中使用 bp 指標,這是由于強周期行業在不同時期市盈率波動較大,而企業的凈資產相對于盈利來說周期性并不強,因此 bp 是一個較為有效的指標。我們在金融和周期板塊中測試了該因子,均有不錯的表現。inv_turnover_q_delta:Alan 等(2014)研究了存貨周轉率在零售行業的表現,他們認為存貨周轉率的提升代表著企業效率的提升,其未來的營收和利潤也會有所增加,而這一因子并不能被市場及時的定價。之所以在零售行業分析是因為零售行業的主要業務就是直接進行商品的買賣,其存貨周轉率對盈利
21、有較大的影響。其他消費類行業例如食品飲料,家電與此有類似的邏輯。我們在這些行業測試了存貨周轉率因子,除了紡服行業,都有較好的表現。圖表 6:存貨周轉率變化因子測試ICICIR通信0.0421.094交通運輸0.0381.174食品飲料0.0350.819電力設備0.0331.008醫藥0.0331.298石油石化0.0300.696基礎化工0.0291.116家電0.0280.695商貿零售0.0260.817汽車0.0250.845有色金屬0.0240.725鋼鐵0.0220.536煤炭0.0220.434建材0.0220.538電子元器件0.0190.792電力及公用事業0.0160.56
22、0計算機0.0130.482建筑0.0110.294機械0.0090.405紡織服裝0.0070.189國防軍工0.0070.140農林牧漁-0.009-0.215輕工制造-0.010-0.291傳媒-0.015-0.351資料來源: ,Windacct_rcv_turnover_q_delta:應收賬款周轉率增長代表企業的回款速度變快,也代表著企業面對下游供應更加強勢。但在許多行業中,應收賬款并不是問題,例如上游資源型行業,石油石化,煤炭等,應收賬款占總營收比率不到 5。而在一些行業,例如機械,建筑,應收賬款比例非常高達到 20甚至 30。這是由于這些行業很多時候都是賒賬進行購買。例如機械行
23、業,對于一些零售端客戶,會使用分期付款的方式進行促銷,導致該行業應收賬款占比較高。而對于這些行業,應收賬款周轉率的變化顯得非常重要。我們將各行業應收賬款占比與因子表現進行回歸,回歸系數非常顯著。因此我們在較為重視應收賬款的機械,建筑,電力設備,計算機行業使用該因子。圖表 7:應收賬款占比與應收賬款周轉率變化因子表現資料來源: ,Wind圖表 8:應收賬款周轉率變化因子測試應收賬款占比ICICIR電力設備0.3830.0230.663國防軍工0.3530.0360.687機械0.3240.0190.812計算機0.3190.0210.613電子元器件0.2510.0150.592醫藥0.2500
24、.0130.567傳媒0.1990.0340.854建筑0.1960.0290.821通信0.1910.0330.800電力及公用事業0.175-0.001-0.044輕工制造0.1490.0020.048建材0.1310.0120.374基礎化工0.1260.0160.758紡織服裝0.1260.0170.418汽車0.1220.0230.823家電0.0990.0060.164交通運輸0.0700.0230.767餐飲旅游0.0650.0120.248煤炭0.060-0.005-0.085農林牧漁0.059-0.015-0.475有色金屬0.0470.0120.377商貿零售0.0360.
25、0140.423食品飲料0.0330.0060.176鋼鐵0.0310.0090.168石油石化0.0300.0250.487資料來源: ,Wind還有一些因子,例如 asset_turnover_q_delta,netmargin_ratio_q 等,盡管它們有很強的全市場邏輯以及全市場表現,但是我們在測試中發現只有半數行業這些因子有顯著的選股效果,我們并沒有找到在哪些行業這些因子更加適用的邏輯,也有可能該因子在不同行業的表現本身并沒有顯著的差異,我們測試的結果是由于歷史樣本造成的,因此我們不在模型中加入他們。而對于上述找到邏輯的因子,由于因子和股票未來收益的邏輯并不是那么直接,我們基本上都
26、是通過尋找子樣本的方法來尋找邏輯,這一方法在學術研究中也非常常見,例如 Titman(2004)通過尋找子樣本因子表現的方法來證明過度投資是導致超額資本支出和股票收益負相關的原因。但由于上述的一些因子我們是先測試再尋找的邏輯,我們不排除該方法存在過擬合的可能性。特質因子特質因子由于只在某些行業里面有特定的邏輯,因此不需要進行行業的橫向比較。對于這類因子,最好是自上而下的尋找行業的邏輯,然后再進行測試。而對于先測試出來的結果,我們需要謹慎對待。因為盡管某個因子全市場無效,但分 29 個樣本測試,在其中一個樣本有效的概率也較大,對于這類因子,我們需要進行多重檢驗。由于財務指標例如運營效率類指標,負
27、債類指標大多都是各行業均較為適用的指標,因此行業內特質的財報因子并不多,下面我們列出了一些常見的行業特質因子。銀行通過參考我們前期的報告銀行行業基本面量化選股與擇時,我們選取了凈息差和和撥備覆蓋率兩個因子。其中凈息差代表了銀行的盈利能力,凈息差越高,說明銀行單位生息資產的盈利能力。因此凈息差越高的公司,未來營收和凈利潤的增長也會越快。圖表 9:凈息差因子分組超額收益資料來源: ,Wind撥備覆蓋率本來是一個衡量銀行風險的因子,指貸款損失準備對不良貸款的比率,主要反映商業銀行對貸款損失的彌補能力和對貸款風險的防范能力。但是這個指標經常被銀行作為調節利潤的工具。例如某銀行資產規模和營收同步增長,對
28、應的不良資產也同比例增長,如果要維持前期的撥備覆蓋率,就要計提更多的減值準備,從而使得凈利潤的增長降低。有些銀行會選擇不計提,保持較高的報表凈利潤增速,但使得撥備覆蓋率降低。因此維持一個較高的撥備覆蓋率代表公司對其當前以及未來盈利有足夠的信心。但這個因子未來有失效的可能,這是由于新政策規定銀行的撥備覆蓋率不得高于 2,使得銀行無法通過提高減值準備的計提來隱藏利潤。圖表 10:撥備覆蓋率因子第一組超額收益資料來源: ,Wind券商估值因子是券商行業最有效的因子。由于券商行業每個月會及時的發布其上月的經營情況,我們根據最新的月報數據構造估值因子 ep、bp、sp,并與使用財務報表構建的估值因子相比
29、較。盡管 IC 和 ICIR 上與原因子沒有顯著差別,但是 ep,sp 因子的單調性變好,第一組的收益有略微提升,bp 幾乎沒有差別。圖表 11:券商估值因子第一組超額收益資料來源: ,Wind地產受“預售制”的影響,房企利潤表通常為歷史項目的現實確認,因此利潤表科目是滯后于企業當前的經營狀況的,我們需要從另外兩張報表來尋找地產企業當前的增長情況。現金流量表相比利潤表更能反映地產公司目前的經營狀況,但是銷售商品提供勞務獲得的現金流增長這一指標最近幾年表現一般。我們使用業績保障系數=預收賬款/營業收入 TTM 來作為房地產公司增長的代理指標。預收賬款代表著企業當前的銷售情況,而營業收入代表這過去
30、,業績保障系數越大,代表企業未來年度的業績更有保障。圖表 12:地產行業成長因子第一組超額收益資料來源: ,Wind另外,流動負債和總負債增長因子在地產行業有較好的表現。這是由于房地產行業為高杠桿經營的行業,發債是其主要的融資渠道。負債的增長能夠側面反映公司的業務的擴張,能夠預測其未來營收的增長。但隨著宏觀去杠桿的進行,該因子在 18 年之后表現一般,其未來的表現需要進一步的觀察。圖表 13:流動負債增長因子第一組超額收益資料來源: ,Wind其他傳媒行業近年來最受關注的便是商譽因子。我們測了商譽占凈資產比例這一因子,發現其效果較好。但這個因子更多的是一個負向因子,即商譽占比最高的一組,幾乎穩
31、定跑輸市場。圖表 14:商譽占比因子IC 累計值資料來源: ,Wind電子,計算機,醫藥行業,研發強度因子均有較好的表現。圖表 15:各行業研發強度第一組超額收益資料來源: ,Wind除此之外,對于那些并不是行業特有的邏輯,而是在測試中發現的特質因子,我們需要使用多重檢驗來排除過擬合的可能。尤其是一些經營類因子,或者杠桿類因子,由于其全市場并沒有穩定的 alpha,只是在某些行業測出來好,因此很容易得出某行業較為重視該方面的經營效率或者杠桿風險這樣的偽邏輯而陷入過擬合。從純測試的角度來說,我們對一個因子在所有行業內的測試結果進行多重檢驗,采用 BHY調整,發現大部分原本在少數兩三個行業中有效的
32、因子,經過調整之后變得都不顯著了。這可能是由于財務因子顯著性相對于價量因子不是特別高,在多重檢驗下,我們通過單純的測試得到的財務因子基本上都不能通過檢驗。因此通過純測試的方法得到的因子我們需要謹慎考慮其過擬合的可能性。匯總圖表 16:各行業選取因子匯總在上述的分析中,我們盡可能的從邏輯出發,針對因子在不同行業的適用性,以及一些行業的特質邏輯,選取了每個行業適用的因子。因子最少的行業只有 3 個因子,而因子最多的行業也只有 8 個因子。雖然我們選取的因子不多且都是一些常見的因子,但是基本能夠保證這些因子在行業內是有邏輯的,其因子表現是可以持續的。如果今后能夠再找到某些因子的行業邏輯,我們可以對該
33、因子列表進行持續的填充。行業因子交通運輸ep、yoy_np_q、roe_q_delta、roe_q證券bp、ep_12m、sp_12m有色金屬ep、yoy_np_q、roe_q_delta、roe_q、bp醫藥ep、yoy_np_q、roe_q_delta、roe_q、rd_or、inv_turnover_q_delta銀行bp、ep、yoy_or_q、yoy_np_q、roe_q_delta、roe_q、nim、npc通信食品飲料ep、yoy_np_q、roe_q_delta、roe_q、yoy_or_qep、yoy_np_q、roe_q_delta、roe_q、inv_turnover_q
34、_delta石油石化ep、yoy_np_q、roe_q_delta、roe_q、bp商貿零售ep、yoy_or_q、roe_q_delta、roe_q、inv_turnover_q_delta汽車ep、yoy_np_q、roe_q_delta、roe_q、inv_turnover_q_delta輕工制造ep、yoy_np_q、roe_q_delta、roe_q農林牧漁煤炭ep、bp、sue1ep、yoy_np_q、roe_q_delta、roe_q、bp建筑ep、yoy_np_q、roe_q_delta、roe_q、bp、acct_rcv_turnover_q_delta建材ep、yoy_np
35、_q、roe_q_delta、roe_q、bp計算機ep、yoy_np_q、roe_q_delta、roe_q、yoy_or_q、acct_rcv_turnover_q_delta、rd_or家電ep、yoy_np_q、roe_q、inv_turnover_q_delta基礎化工機械ep、yoy_np_q、roe_q_delta、roe_qep、yoy_np_q、roe_q_delta、roe_q、bp、acct_rcv_turnover_q_delta國防軍工ep、yoy_np_q、roe_q_delta、roe_q鋼鐵ep、yoy_np_q、roe_q_delta、roe_q、bp房地產b
36、p、cur_liab_yoy、adv_to_sales紡織服裝ep、yoy_np_q、roe_q_delta、roe_q電子元器件電力設備ep、yoy_np_q、roe_q_delta、roe_q、yoy_or_q、rd_orep、yoy_np_q、roe_q_delta、roe_q、acct_rcv_turnover_q_delta傳媒ep、yoy_np_q、roe_q_delta、roe_q、yoy_or_q、goodwill_to_bv電力及公用事業ep、yoy_np_q、roe_q_delta、roe_q資料來源: 三、組合構建得到每個行業適用的指標之后,我們嘗試構建行業內的選股模型。
37、我們將因子分為估值,成長,盈利和其他四類,然后在小類中等權合成,再將大類因子用 ICIR 加權。由于行業中樣本過少,ICIR 較為不穩定,這里我們使用過去 24 個月的 ICIR 值作為權重。得到各行業內的組合之后,我們將其和全市場選股的模型進行對比。圖表 17:模型表現對比第二節中提到餐飲旅游行業的股票過少,而且常見的因子對其也沒有預測能力,因此我們不對餐飲旅游行業進行行業內預測。綜合行業沒有特定的行業邏輯,我們也不對其進行行業內的預測。對于銀行券商行業,全市場模型幾乎沒有預測能力。其他行業中,建筑,國防,石油石化等行業,行業內模型是要略好于全市場模型的,但是電力設備,建材等行業,行業模型要
38、略差于全市場模型。全市場選股行業內選股年化收益年化波動IR最大回撤年化收益年化波動IR最大回撤銀行0.000.060.010.170.080.061.430.04證券0.010.070.180.260.090.071.290.10建筑0.090.081.150.110.110.081.450.10國防軍工0.040.080.560.110.060.080.750.12石油石化0.070.080.860.160.090.081.170.07汽車0.060.070.790.100.100.051.950.04有色金屬0.060.061.030.120.070.061.190.07紡織服裝0.030
39、.070.620.090.050.050.960.08計算機0.080.061.190.050.080.061.240.07房地產0.030.050.580.140.060.051.150.09交通運輸0.070.060.990.090.060.070.820.08家電0.040.080.570.140.050.090.570.22食品飲料0.080.081.080.190.110.061.690.05輕工制造0.090.081.170.070.110.071.500.08傳媒0.060.080.680.120.080.080.870.12電力及公用事業0.060.061.100.080.08
40、0.071.170.12商貿零售0.050.070.800.100.080.061.330.06醫藥0.090.051.870.050.100.042.230.02煤炭0.100.071.290.090.090.071.310.13電子元器件0.100.061.620.050.100.051.860.04農林牧漁0.090.081.140.100.070.051.150.05通信0.110.071.420.080.090.071.320.05鋼鐵0.110.110.960.100.080.100.830.11基礎化工0.100.051.840.040.100.051.960.02機械0.100
41、.042.230.030.080.041.850.05建材0.120.091.240.100.100.081.140.09電力設備0.120.062.150.030.100.061.710.03資料來源: ,Wind由上表我們發現,即使我們按照行業的邏輯選取了因子,我們也很難做到在所有行業中都能夠跑贏全市場模型。我們認為這也是做行業選股一個常見的誤區,就是希望每個行業我們都能做的較好,戰勝全市場模型。可能從理論上,這個結論就無法實現。在綜述中我們提到,行業股票的數量是制約行業選股效果最重要的原因。盡管我們能夠選取出行業適用的因子,但是由于行業樣本量太少,我們的對行業內股票收益的估計仍然可能不太
42、準確。這其實對應著機器學習中的 bias variance trade off。行業內選股減小了 bias,但是增加了 variance,因此最后的結果不一定比原來高 bias 低 variance 的全市場模型好。另一方面,我們在行業模型中加入的因子信息較少,這是由于很多因子沒有典型的行業邏輯,例如薪酬類,分析師類因子,以及我們前一部分沒有找到邏輯的財務因子。因此我們發現盡管我們有針對性的對每個行業選取了因子,還是有很多行業的行業內模型要弱于全市場模型。行業內選股模型的 alpha 的整體 IC 要低于全市場模型(圖表 18)從邏輯上來講,我們認為券商,銀行,地產這三個行業行業內選股模型預測
43、的會更加準確,因為其行業邏輯與其他行業有較大差別。而綜合,餐飲旅游這兩個行業由于股票數量過少,且沒有共同的行業內邏輯,我們使用全市場模型。對于其他行業,我們無法從邏輯出發來判定哪個模型會更好。但值得注意的是,兩個模型的預測值相關度較低,平均只有 0.4 左右。因此對于其他行業,一個更好的方法就是將兩個預測結合起來從而進一步提高模型預測的準確性。圖表 18:全市場模型和行業選股模型相關系數資料來源: ,Wind我們分別測試兩種結合預測的方法:在每個行業內,將兩個預測按其過去兩年 ICIR 進行加權,如果其中一個模型過去兩年無效,即 ICIR 為負,則使用另外一個預測,如果兩個模型都無效,則等權加
44、權。 2)不區分行業,直接用全截面過去兩年的表現進行加權,其他細節與方法一一致。圖表 19:各模型表現第一組年化收益第一組年化波動信息比ICICIR全市場選股0.0840.0282.8960.0633.443行業內選股0.0950.0214.4430.0553.741方法一0.0990.0243.9740.0704.186方法二0.1030.0254.0470.0704.135資料來源: ,Wind盡管行業內選股模型的 IC 值要低于全市場選取模型,但是將二者結合之后,alpha 信號的 IC 以及其 ICIR 都有顯著的提高。但是對于結合方法,方法一和方法二并無顯著的差別。圖表 20:各模型
45、表現對比方法二合成行業內選股全市場模型合成模型-全市場模型年化收益IC年化收益IC年化收益IC收益差值IC 差值石油石化0.1360.0950.0940.0810.0700.0660.0660.028傳媒0.1100.0600.0750.0470.0610.0490.0490.011計算機0.1180.0670.0840.0570.0780.0520.0400.015輕工制造0.1250.0820.1160.0690.0910.0660.0350.016食品飲料0.1050.0950.1000.0840.0820.0810.0230.014基礎化工0.1210.0800.0910.0620.1
46、000.0790.0210.001建材0.1390.1030.0970.0690.1180.0910.0210.012汽車0.0760.0660.0980.0680.0560.0540.0210.012建筑0.1050.0790.1100.0880.0850.0530.0190.027通信0.1260.0830.0760.0670.1070.0780.0190.005鋼鐵0.1270.0900.0810.0690.1100.0810.0170.009國防軍工0.0600.0620.0610.0730.0430.0490.0160.014有色金屬0.0710.0640.0670.0610.059
47、0.0510.0120.012家電0.0540.0550.0430.0530.0440.0490.0100.006商貿零售0.0600.0530.0750.0510.0510.0510.0080.002醫藥0.1000.0770.0930.0680.0920.0730.0080.003煤炭0.1030.0990.0830.0790.0960.0860.0070.013電力及公用事業0.0670.0680.0750.0600.0610.0590.0060.009電子元器件0.1090.0780.0980.0690.1060.0790.002-0.001交通運輸0.0690.0610.0590.0
48、540.0690.0470.0010.014機械0.0980.0720.0780.0600.0970.0770.001-0.005電力設備0.1200.0840.0970.0630.1210.094-0.001-0.009紡織服裝0.0220.0400.0460.0450.0330.035-0.0110.004農林牧漁0.0780.0560.0600.0420.0920.052-0.0140.004資料來源: ,Wind分行業來看,合成后的預測模型不管是從 IC 的角度還是從分組收益的角度,基本在所有行業都優于全市場模型。但只在少數行業有顯著的提升,大部分行業提升較少,分組收益和 IC 都僅在
49、 1%左右。我們用上述兩個方法分別構建 500 增強和 300 增強組合,結果如下圖表 21:300 增強策略凈值資料來源: ,Wind圖表 22:300 增強結果對比全市場模型行業內模型方法一方法二年化收益0.0770.0980.1000.109年化波動0.0530.0480.0500.051IR1.4522.0612.0172.140最大回撤0.0610.0460.0480.041資料來源: ,Wind圖表 23:300 增強歸因分析資料來源: ,Wind圖表 24:500 增強策略凈值資料來源: ,Wind圖表 25:500 增強結果對比全市場模型行業內模型方法一方法二年化收益0.175
50、0.0950.1790.171年化波動0.0610.0540.0580.058IR2.8801.7773.0962.928最大回撤0.0550.0510.0550.051資料來源: ,Wind圖表 26:500 增強歸因分析資料來源: ,Wind從測試結果來看,行業內選股模型對 300 增強有較為顯著的提升作用,但通過歸因,我們發現超額收益的來源主要是銀行和券商兩個行業。由于全市場模型對這兩個行業沒有任何超額收益,行業內模型對這個行業有較為顯著的提升。另一方面,銀行和券商占 300指數的權重較大,因此 300 增強模型提升較為顯著。而對于 500 增強模型,我們發現行業內選股基本上沒有任何的提升,從歸因結果來看,也是一半行業變好,一半行業變差。這可能是由于 500 的權重行業例如醫藥、電子等,我們并沒有找到很多的特質因子,因此增量信息并不多,另一方面,500 的行業權重較為分散,如果想要有顯著的提升,可能需要對大部分行業都要有比較明顯的提升。四、總結、思考與展望如何將行業內的信息納入進傳統的多因子模型是大家一直較為關心的問題。本報告對行業內選股模型進行了初步的探索,試圖尋找到行業內選股的有效解決辦法。通過閱讀已有的報告和結論,我們放棄了純測試的方法。但在試圖通過純邏輯的方法去尋找有效因子時,總是會跟隨著行業研究的思路把邏輯拆的越來越細,從而很難形成
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 健康管理專業教學標準(高等職業教育專科)2025修訂
- 視覺訓練與康復專業教學標準(高等職業教育專科)2025修訂
- 期末復習《第7-8章》選擇題常考熱點專題訓練 2024-2025學年魯教版(五四制)八年級數學下冊
- 垃圾分類調研報告7
- 2023-2029年中國壓合板行業市場調查研究及發展戰略規劃報告
- 2025年中國雄安新區建設行業市場運行現狀及投資規劃建議報告
- 2025年中國油炸面食行業發展趨勢預測及投資戰略咨詢報告
- 2022-2027年中國SLG頁游市場前景預測及行業投資潛力預測報告
- 中國汽車外飾行業發展潛力分析及投資方向研究報告
- 2024-2030年中國金摩卡薄板行業市場發展監測及投資潛力預測報告
- 餐飲連鎖企業品牌授權與經營管理協議
- 學習解讀《水利水電建設工程驗收規程》SLT223-2025課件
- 應急第一響應人理論考試試卷(含答案)
- DZ∕T 0213-2020 礦產地質勘查規范 石灰巖、水泥配料類(正式版)
- 會計知識大賽初賽題庫
- 消防檔案模板(完整版)
- 日本文學概論1
- 《鐵路貨車運用維修規程》2018年10月
- 關口電能計量裝置管理辦法
- 公交站臺候車亭施工設計
- 浮選柱使用說明書
評論
0/150
提交評論