最新基于多因子模型的量化选股分析-精品

基于多因子模型的量化选股分析

随着中国资本市场复杂程度日渐加深和规模日益庞大，投资品种和数量与日俱增，无论是个人或是机构投资者所拥有的投资渠道与投资方法也在逐渐增多。量化投资作为一种来自海外资本市场的先进技术，在海外资本市场中受到了广泛追捧，著名的西蒙斯与大奖章基金便是利用了量化投资技术，于1989~2007年间获得了高达38.5%的平均年收益率。中国的量化投资发展虽仍在起步阶段，、金融学、科学相结合的优势来寻求超额收益。据统计显示，截至2016年10月，中国公募基金中共有48支基金以“量化”命名，其中长信量化先锋基金（519983），申万菱信量化小盘股票基金（163110）与大摩多因子策略混合基金（233009）等均表现出色，具有较高的年化收益率。而无论是在个体投资或是基金投资中，多因子选股模型均是较为广泛的量化模型之一。本文基于多因子模型策略，利用2011~2015年的数据对投资过程中的常用因子进行有效性检验，并使用有效因子构建基本多因子模型，根据假设创造性地使用简单打分法构建投资组合，基于2014~2016年的历史数据进行实证分析，为广大一般投资者提供了一种简单可行且收益率超过市场表现的投资策略。最后结合行业轮动效应与面板数据的多元回归分析对基本模型进行了深化与修正，创新性地提出了基于多因子模型的更多投资策略，也为较深层次的理论研究者提供了思路与数据参考。

一、文献综述

关于量化投资选股策略的研究涉及许多方面，常见的包括多因子模型、风格轮动模型、动量反转模型、趋势追踪模型等。对于多因子模型，最重要的环节便是有效因子的选取。大多数论文对于有效因子的选取通常采用因子评分法，此方法最早由Piotroski（2000）提出，常见操作为：将股票池中的股票按N个候选因子的大小依次排序，按照每个排序选取排名靠前的股票等权重构建N个极端的股票组合持有到期末，计算N个组合的平均收益率并与基准的指数收益率进行比较，用此方法能成功获取alpha收益组合所使用的排序因子即为有效因子[1]。另外一种方法则是回归法，通过计量模型求得单个因子对股价波动的贡献与显著性。丁鹏曾在其《量化投资——策略与技术》一书中使用1997~2006年的历史数据对常用的因子进行了有效性检验

[2]，大多数检验多因子模型的论文所使用的数据也均在2012年前。本文所选数据在2011~2016年间，更具有时效性，且本文在选取有效因子的部分中采用Fama-Macbeth regression的基本思路，对候选因子进行时间序列回归，再对得到的所有β值求t统计量检验其显著性，通过检验的即为有效因子。关于行业轮动效应的研究，有学者将行业轮动与多因子模型相结合，对基于经济周期的行业板块轮动效应进行了实证分析，后续相关文章也大多照此思路，运用宏观经济指标来调整不同行业间的权重。本文在吸取前人研究的基础上，结合最新的货币周期动态，提出以货币增速剪刀差为分界点的行业轮动策略，并使用2014~2016年的最新数据进行了实证分析。

二、多因子模型的理论基础

三、候选因子与有效性检验

首先使用多因子模型将量化投资中的11个常见因子按价值因子、成长因子、质量因子、动量因子进行划分，如表1所示。

可见，在2011~2015年间的中国股市中，较为有效的因子有市盈率、市净率、净资产收益率增长率、资产负债率与月平均换手率。由于市盈率与市净率同属于价值因子部分，为了追求基本模型的简单明确，防止冗杂因子出现，比较之下本文选择市净率作为价值因子代表，成长因子中选择ROE增长率为代表，质量因子中选择资产负债率为代表，动量因子中选择月平均换手率为代表，用以构建后续的基本模型。

四、基本的多因子模型构建与实证分析重新回顾Fama-French三因素与五因素模型，两个模型在多次修正与检验中都坚持使用了一个重要的影响收益的因素——市值。从上文的有效检关的有效因子。从现实来看，A股市场的投资者结构表明，大多数投资者的确是对高市盈率、总市值大的股票避而远之，对该类股票不拥有持有的信心，甚至具有较强的看跌预期。本文选用市净率作为价值因子的代表，但是考虑到市盈率与市值的影响，本文将市值加入多因子选股策略中，强调选择股票池中市值较小的股票进行优先投资，结合上文中提到的另外四个有效因子，构建基本的多因子模型如下：

其中，PB代表市净率，MV代表总市值，MTO代表月平均换手率，从上文的因子有效性分析可知，这三个因子与投资组合预期收益存在负相关关系；ROEg表示净资产收益率的同比增长率，DAR表示

资产负债率，与投资组合预期收益存在正相关关系。该因子模型的选股思路在于，选用ROE增长率与资产负债率作为两个有效因子挑选符合条件的股票同时，考虑到市值、市净率与月平均换手率对收益的负作用，在进行比较时倾向选择总市值小、市净率低且换仓月平均换手率较低的股票建立投资组合。首先，采用简单打分法进行投资组合的构建。按照每个因子值进行排序，正相关的因子按降序排列，负相关的因子按升序排列，并按照该排序给沪深300中的每只股票从1到300给每项因子排序并依次打分，最后将5项因子得分的平均成绩按升序排列，股票得分越低表示在该模型上的表现越好。注意，此处打分法中最后的平均得分是基于因子等权重的假设，目的是方便一般投资者能简单运用该模型进行选股策略，同时也为了验证量化选股的强有效性。后文中会放开该假定重新计算不同因子的各项权重。其次，考虑组合中的股票个数。根据Fama对资产组合中证券数量与资产组合风险关系的实证分析结论可知，最初几种股票加入资产组合时能显著降低组合标准差，但当股票数量增加到20种时，再增加证券就不能明显降低资产组合标准差。所以本文在剔除缺省值与极端值影响的情况下，选取得分表现最好的前20只股票构建资产组合，半年进行一次调仓。由于进行因子打分时需要使用上市公司半年报与年报的相关披露数据，根据相关法律规定，上市公司年度报告的披露不应当晚于次年的4月30日，半年度报告的披露不应当晚于当年的8月31日。因此，将实证分析的起始时间定于2014年11月1日，半年调仓时间为2015年4月23日左右，该时间已确保了在进行调仓时上市公司的数据已披露，所构建的投资组合如表3所示。本文选取2014年11月1日至2016年11月4日的历史数据对投资组合的收益进行实证分析。选取该时间段的原因是：首先该数据时效性较强，可证明该模型在现今中国股市中的有效性；其次考虑到该时间段经历了牛市开始、牛市顶点、牛熊市切换、熊市低点与市场回升五个阶段，具有比较全面的覆盖性，可以得出该模型在市场的不同阶段的具体表现。选用的基准指数为沪深300指数，比较沪深300指数收益与多因子模型所构建的资产组合在2年内收益，具体操作为：每半年视为一期，每期采用相同的初始资金，每期初均对投资组合的股票进行等金额的投资，半年后清仓并调仓，比较每期投资组合与同期沪深300指数的持有至到期收益，如图1、图2和表4所示。

由多因子选股模型运行结果和基准收益率的趋势对比我们可以看出，当股市处于牛市行情时（2014.11~2015.5），多因子选股模型相对于基准收益率而言有极好的表现，半年间持有至收益率高达135.05%，远高于基准收益率89.35%，说明该模型在牛市的环境下选股能力比较强。当股市处于牛熊市切换时（2015.6~2015.11），该模型开始时同样有较好的表现，半年累计收益率维持在-16.7%，相对于指数在牛熊市切换时产生的大幅下跌（-25.6%），该模型在该阶段表现出较强的防御能力。当市场进一步下跌处于熊市低点时

（2015.11~2016.2），该模型在前半段时间仍表现出很强的防御能力，但后期市场开始出现反弹行情时（2016.2~2016.5），略低于基准收益率，不过差别较小。而一旦市场出现持续较强反弹回升的行情时（2016.6~2016.11），该模型也能成功获得较高超额收益。总体来看，该多因子选股模型在样本期间总体表现较为优异，但当该投资收益相对应的波动率超过了市场的总体水平时，该模型仍存在一定风险。且该模型的选用具有较强的阶段性，适合在整体股市进入牛市、牛熊市切换或是出现较强反弹行情时使用，但在市场出现剧烈波动时有效性有所下降。修正根据行业轮动模型来看，自上而下的投资分析方法认为，宏观经济决定了资产的收益率。所以投资者应先关注宏观经济运行状况再进行资产配置或是调整投资组合的风格。利用宏观经济指标驱动行业配置的理念与作用在行业因子中也是股票收益的重要贡献因子，通过行业层面分析，选择适合当前经济运行状况的行业进行配置，获得超额收益的概率也会较高。当宏观经济指标下行时，应投资于非周期性行业；当宏观经济指标上行时，则投资于周期性行业。而中国资本市场的投资者在近几年来经常参考的一个宏观经济指标便是货币政策与货币周期。狭义的货币政策股市传导机制由Chami 等（1999）提出，主要分析了货币政策影响通货膨胀率而导致股东权益变化进而引起的投资变化；广义的货币政策传导机制认为货币政策影响股市的两个重要操作指标是利率和货币供应，通过资产替代效应、预期效应、成本效应、股票定价效应等一系列机制影响股票市场[5]。可见掌握货币政策，分析货币周期的确对投资者的资产配置有着一定的指导意义。我国的货币政策主要通过中央银行调整存款准备金率、调整再贴现率与公开市场操作等手段来控制货币供应量。我国现行的货币统计制度将货币供应量划分为三个层次：第一，流通中现金（M0），指单位库存现金和居民手持现金之和。第二，狭义货币供应

量（M1），指M0加上单位在银行的可开支票进行支付的活期存款。第三，广义货币供应量（M2），指M1加上单位在银行的定期存款和城乡居民个人在银行的各项储蓄存款以及证券公司的客户保证金。统计2014~2016年中国M1与M2的同比增长率，如图3所示。

其中，y为沪深300指数收益率序列数据，x 为行业指数收益率序列数据，n为区间内根据时间频度决定的收益率个数，此处均采用年化数据进行计算。行业划分按照Wind一级行业划分，行业指数使用Wind资讯行业指数，计算出以沪深300为样本数据的行业β值，如表5所示。

根据前文所选出的投资组合，进行考虑行业β时，赋予β值较小的行业较高的仓位，当货币周期处于扩张时，则做相反处理，具体仓位计算如下：

六、基于多元回归分析的多因子模型修正

在前文的基本多因子模型中曾使用简单的打分法，假设因子同权重时对股票池中的股票进行排序打分建立投资组合。但现实中每个因子对收益率的贡献一般不会出现均等情况。为了修正该假设，本文采用构建面板数据进行多元回归分析的方式来比较因子间的权重大小。具体操作为：利用2012~2015年间的历史数据建立短面板数据，由于不同因子间的量纲差距较大，先对单项因子进行线性标准化处理，即通过数学变换将各因子的取值换算为（0，1）内的数字来解决因子间的不可公度性，计算公式为：

其中，n代表沪深300中不同股票的观测值（n=1，2，…，300），t代表时间。CHGnt+1为股票在下一期的涨跌幅；ROEgnt代表净资产收益率的同比增长率；DARnt代表资产负债率；MTOnt为月平均换手率；PBnt为市净率；MVnt代表总市值；an为非观测效应，概括了影响着CHGnt但又不随着时间而变化的因素；unt为特异性误差。

在使用该模型进行回归分析前，对该模型进行Hausman检验来确定是使用随机效应模型还是固定效应模型更为有效。Hausman检验结果表明p=0，强烈拒绝随机效应模型会提供一致性估计的原假设，因此决定采用固定效应模型进行回归分析。为避免异方差性，在回归前对各变量进行取对数处理，回归后结果如表8所示。

最后检验该5项有效因子间的相关系数，结果如表9所示。

取阈值为0.5，由数据可证明并未有两两因子间出现较高的相关系数，证明最初的基本多因子模共线性。

通过面板数据的计量模型实证分析来看，净资产收益率同比增长率与资产负债率的确均与股票涨跌幅存在正相关性，且资产负债率对股价涨跌仍存在显著性影响。但净资产收益率的同比增长率虽然通过了单因子回归的有效性检验，但在多元回归模型中并未通过显著性检验；而月平均换手率、市净率与总市值则与前文描述一致，存在严格的负相关性。由于篇幅原因，本文在此未做实证分析，而是根据这一结果对前文的打分法提出如下两种修正策略，供投资者参考：第一，在进行打分法排序时加入因子权重的具体数值，具体计算为：单个因子得分Si=?茁i·R。其中i表示不同有效因子，?茁i为不同因子由多元回归模型所计算出的权重，R为排名得分（R=1，2，…，300），通常正相关因子按升序排列给予1~300得分，负相关因子按降序排列给予1~300得分，每只股票总得分为∑Si，根据∑Si选出得分最高的20只股票构建投资组合。

第二，综合比较多元回归的因子权重?茁i，以及显著性检验统计量|t-value|的绝对值大小，对影响最大的因子进行优先筛选，影响越小的因子筛选顺序越靠后。例如在本文模型中的具体操作为：选出有效因子中影响最大的因子并按其值在沪深300股票池中优先筛选出前100只股票，再按照第二有效因子的排序筛选出前60只股票，第三、第四、第五有效因子分别选出前40、前30、前20只股票，最后筛选出的20只股票即为构建的投资组合。

七、结论

本文以量化投资中最常用的多因子模型为基础，从一元回归对因子进行有效性检验开始，筛选出近年来从数据上较为有效的因子，构建了基本的多因子模型，采用简单打分法为广大投资者提供了一个简单可操作、无需太多复杂整理运算的选股策略，并放入近期的市场中，用历史数据验证了该多因子选股模型的投资效果的确高于市场的表现，从而证明了量化选股策略的强有效性。随后进一步修正了多因子模型，从货币周期的角度出发验证了中国股市近年来存在的行业轮动效应，启发了投资者在构建资产组合或分配仓位时要考虑宏观经济指标与行业因素；再加入较为复杂的面板数据多元回归，使用固定效

应估计法，在模型中修正了各有效因子的权重，为较深层次的理论研究者与量化投资者提供了相关数据与分析思路。

总体来看，量化投资依靠较大的数据量与科学的数理统计相关运算，的确能提供寻求超额收益的有效策略，同时也证明了量化投资在中国股票市场具有很强的可行性与市场潜力，多因子模型只是量化投资策略中的简单一种，还有更多丰富的策略等待广大的投资者去验证与修正。肯定的是，量化投资会随着中国资本市场的复杂深化而日渐普及。

［1］PIOTROSKI，J D. Value Investing: The Use of Historical Financial Statement Information to Separate Winners from Losers ［J］. Journal of Accounting Research，2000（38）.

［2］丁鹏.量化投资——策略与技术［M］. 北京：电子工业出版社，2012.

［3］桂荷发，吕江林. 证券投资理论与实务［M］. 北京：出版社，2012.

［4］FAMA，E F，FRENCH K R. A Five-Factor Asset Pricing Model［J］. Journal of Financial Economics，2015（116）.

［5］CHAMI R，COSIMANO T F，FULLENKAMP C. The Stock Market Channel of Monetary Policy［J］. Social Science Electronic Publishing，1999（22）.

［6］范立夫，周亚，史欣沂. 货币增速剪刀差与宏观经济关系的实证研究［J］.宏观经济研究，2016（8）.

7种量化选股模型

7种量化选股模型 1、【多因子模型】 2、【风格轮动模型】 3、【行业轮动模型】 4、【资金流模型】 5、【动量反转模型】 6、【一致预期模型】 7、【趋势追踪模型】 1、【多因子模型】多因子模型是应用最广泛的一种选股模型，基本原理是采用一系列的因子作为选股标准，满足这些因子的股票则被买入，不满足的则卖出。基本概念举一个简单的例子：如果有一批人参加马拉松，想要知道哪些人会跑到平均成绩之上，那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员，获得超越平均成绩的可能性较大。多因子模型的原理与此类似，我们只要找到那些对企业的收益率最相关的因子即可。各种多因子模型核心的区别第一是在因子的选取上，第二是在如何用多因子综合得到一个最终的判断。一般而言，多因子选股模型有两种判断方法，一是打分法，二是回归法。打分法就是根据各个因子的大小对股票进行打分，然后按照一定的权重加权得到一个总分，根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归，得到一个回归方程，然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判，然后再以此为依据进行选股。多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。

候选因子的选取候选因子的选择主要依赖于经济逻辑和市场经验，但选择更多和更有效的因子无疑是增强模型信息捕获能力，提高收益的关键因素之一。例如：在2011年1月1日，选取流通市值最大的50支股票，构建投资组合，持有到2011年底，则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间，流通市值与最终的收益率之间存在正相关关系。从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的，可以选择其他的因子，例如可能是一些基本面指标，如 PB、PE、EPS 增长率等，也可能是一些技术面指标，如动量、换手率、波动等，或者是其它指标，如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段，也是一个重要的参数指标，到底是持有一个月，还是两个月，或者一年，对最终的收益率影响很大。选股因子有效性的检验一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如：可以每月检验，具体而言，对于任意一个候选因子，在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小，按从小到大的顺序对样本股票进行排序，并平均分为n个组合，一直持有到月末，在下月初再按同样的方法重新构建n 个组合并持有到月末，每月如此，一直重复到模型形成期末。上面的例子就已经说明了这种检验的方法，同样的可以隔N个月检验，比如2 个月，3个月，甚至更长时间。还有一个参数是候选组合的数量，是50支，还是100支，都是非常重要的参数。具体的参数最优的选择，需要用历史数据进行检验。有效但冗余因子的剔除不同的选股因子可能由于内在的驱动因素大致相同等原因，所选出的组合在个股构成和收益等方面具有较高的一致性，因此其中的一些因子需要作为冗余因子剔除，而只保留同类因子中收益最好，区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的，成交量一般也会比较大，因此在选股模型中，这两个因子只选择其中一个。冗余因子剔除的方法：假设需要选出k 个有效因子，样本期共m 月，那么具体的冗余因子剔除步骤为：（1）先对不同因子下的n个组合进行打分，分值与该组合在整个模型形成期的收益相关，收益越大，分值越高（2）按月计算个股的不同因子得分间的相关性矩阵；（3）在计算完每月因子得分相关性矩阵后，计算整个样本期内相关性矩阵的平均值（4）设定一个得分相关性阀值 MinScoreCorr，将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子，而其它因子则作为冗余因子剔除。

7种量化选股模型

【多因子模型】多因子模型是应用最广泛的一种选股模型，基本原理是采用一系列的因子作为选股标准，满足这些因子的股票则被买入，不满足的则卖出。基本概念举一个简单的例子：如果有一批人参加马拉松，想要知道哪些人会跑到平均成绩之上，那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员，获得超越平均成绩的可能性较大。多因子模型的原理与此类似，我们只要找到那些对企业的收益率最相关的因子即可。各种多因子模型核心的区别第一是在因子的选取上，第二是在如何用多因子综合得到一个最终的判断。一般而言，多因子选股模型有两种判断方法，一是打分法，二是回归法。打分法就是根据各个因子的大小对股票进行打分，然后按照一定的权重加权得到一个总分，根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归，得到一个回归方程，然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判，然后再以此为依据进行选股。多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。候选因子的选取候选因子的选择主要依赖于经济逻辑和市场经验，但选择更多和更有效的因子无疑是增强模型信息捕获能力，提高收益的关键因素之一。例如：在2011年1月1日，选取流通市值最大的50支股票，构建投资组合，持有到2011年底，则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间，流通市值与最终的收益率之间存在正相关关系。从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的，可以选择其他的因子，例如可能是一些基本面指标，如 PB、PE、EPS 增长率等，也可能是一些技术面指标，如动量、换手率、波动等，或者是其它指标，如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段，也是一个重要的参数指标，到底是持有一个月，还是两个月，或者一年，对最终的收益率影响很大。选股因子有效性的检验一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如：可以每月检验，具体而言，对于任意一个候选因子，在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小，按从小到大的顺序对样本股票进行排序，并平均分为n个组合，一直持有到月末，在下月初再按同样的方法重新构建n个组合并持有到月末，每月如此，一直重复到模型形成期末。上面的例子就已经说明了这种检验的方法，同样的可以隔N个月检验，比如2个月，3个月，甚至更长时间。还有一个参数是候选组合的数量，是50支，还是100支，都是非常重要的参数。具体的参数最优的选择，需要用历史数据进行检验。有效但冗余因子的剔除不同的选股因子可能由于内在的驱动因素大致相同等原因，所选出的组合在个股构成和收益等方面具有较高的一致性，因此其中的一些因子需要作为冗余因子剔除，而只保留同类因子中收益最好，区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的，成交量一般也会比较大，因此在选股模型中，这两个因子只选择其中一个。冗余因子剔除的方法：假设需要选出k 个有效因子，样本期共m 月，那么具体的冗余

多因子量化选股模型建立及优化

多因子量化选股模型建立及优化股市在不断的变化,所以从目前来看,不断探讨哪些指标在量化选股中更为有效,是具有现实意义的。这也是本文研究工作开始的初衷。在整个研究过程中,保持数据的严谨性、中立性、数据处理方法的科学性对于研究结论的准确性来说至关重要。本文首先构建了一个比较全面的候选因子库,通过对候选因子数据进行异常值、缺失值、标准化、市值中性化、行业中性化等一系列的处理之后,本文对候选因子进行有效性检验及再筛选,最终认为 RP_TTM(净利润TTM/总市值)、BP_LF(净资产TTM/总市值)、operete_profin gr_TM(营业利润增长率TTM)、sales_gr_TTM(营业收入增长率)、BOOK_LEVEL(账面杠杆)、stock_to market_volatility(个股与市场波动率比值)、 REV_LAST1M_MAX(近一个月日收益率最大值)、RSI(相对强弱)等八个因子是较为有效的因子。在得出有效因子之后,本文利用打分法来构建八因子选股模型,回测区间选定为2016年1月至2019年4月。通过对模型的回测,我们发现本文构建的八因子模型相比于沪深300,有着较为稳定的超额收益。在整个回测时间段内,八因子模型的总收益为41.02%,年化收益为11.07%。相比于基准的收益情况,八因子模型相对总收益为32.28%,年化平均超额收益为8.92%。为了深入研究,我们对原有模型进行优化,优化方案为“在利用八因子模型进行正式选股之前,首先以增长率-经营活动产生的现金流量净额(TTM)指标对股票池进行初步筛选”。通过对优化八因子模型进行回测,我们发现加入增长率-经营活动产生的现金流量净额(TTM)指标优化后的八因子模型回测表现更好。

多因子选股策略经典梳理

多因子选股策略经典梳理股市之道无非三点：1择时，2选股，3 仓控。精通这三点中的任何一点，都足以在股市中所向披靡。但是精通二字何其艰难。在量化选股策略中。多因子策略作为一个主要武器，被各种公募基金和私募基金长期使用（小编注：国内策略同质化相当严重，本文仅作为交流探讨推荐）。在此我们为不熟悉多因子的各位朋友梳理一下不同风格的因子，以及他们的有效性。股价是由资金推动的（上涨为正向推动，下跌为反向推动）。但是影响资金进入和推出的因子确实千千万万，有基本面的，有消息面的，有人看国家政策，有人看分析师预测，有人听朋友介绍，有人跟风大V等等不一二足。下面我将从9大类33个因子来给各位逐一分析。首先给出在长时间来看表现优秀的因子。 1、规模因子，小市值效应。（推荐指数5颗星）。在国内外不管是成熟市场还是我国的不成熟市场，小市值效应一直存在。并且小市值的逻辑也很清晰，市值越小被操纵的可能性就越来大，推动的估价上涨的资金需求就越小。试用注意事项（震荡市或牛市表现优秀，下跌市跌幅大幅快于大盘---牛市买小股，熊市进蓝筹）2、动量反转因子。（推荐

指数5颗星）前一个月的涨跌幅度的反转效应明显。长得多了当然要跌，跌得多了当然要涨，均值回归远离。这个其实和我们所说的补跌补涨类似，从长期来看如果牛市来了，大家都会涨，只不过有的先涨，有的后涨；熊市来了大家一块跌（贪婪与恐惧的典型表现） 3 、交投因子，即换手率因子。（推荐指数4颗星）（我们选取一个月日均换手率）。换手率高的后面表现的貌似都不佳（但经过测算新股和次新股貌似并不适用）。逻辑依然很清晰，长期换手率高，总让人觉得有点出货的嫌疑，不是么？4、预测因子。（推荐指数5颗星）预测当年主营业务收入增长率（平均值）。预测收入增长但是是利好了，预测收入增长越高，利好越高。不是么，逻辑依然清晰。这个因子在万德等软件上有统计，各位可能不太容易获得。因子包括9类，规模因子，估值因子，成长因子，盈利因子，动量反转因子，交投因子，波动率因子，分析师预测因子。 1.规模类因子。包括：总市值，流通市值，自由流通市值 2.估值类因子。包括：市盈率（TTM），市净率，市销率，市现率，企业价值倍数 3.成长类因子。营业收入同比增长率、营业利润同比增长率，归属于母公司的近利润同比增长率、经营活动产生的现金流

量化多因子选股简论(下)

太极量化多因子选股模型简论B 第二：因子的选取候选因子的选取（一）大数据因子搜索数据因子，搜索频率因子，搜索关键词因子，关注度因子，大众情绪因子等。其中搜索数据因子影响较为显著。（二）规模因子通过对给定时间内（时间为为6年）市场的分析，不管是从总市值、还是流通市值和自由流通市值看，A股市场存在较为显著的小盘股效应。市值较小股票构造的组合整体上大幅超越沪深300指数，也**优于总市值较大股票构造的组合。规模因子（总市值、流通市值、自由流通市值）是影响股票收益的重要因子，其中总市值因子最为显著。（三）估值因子通过6年内市场的分析，整体上来说，从市盈率、市净率、市销率、市现率、企业价值倍数等估值指标看，估值较低的股票组合表现较好。估值较低股票构造的组合整体上超越沪深300指数，也优于估值较高股票构造的组合。估值因子（市盈率、市净率、市销率、市现率、企业价值倍数）是影响股票收益的重要因子，其中市盈率（PE,TTM）因子最为显著，其次是市现率（PCF,TTM）。（四）成长类因子，营业收入同比增长率、营业利润同比增长率，归属于母公司的近利润同比增长率、经营活动产生的现金流金额

同比增长率。（五）盈利因子通过对时间内市场的分析，整体上来说，从净资产收益率、总资产报酬率和销售毛利率等盈利性指标看，盈利能力较强的股票组合表现较好。盈利能力较强股票构造的组合整体上超越沪深300指数，也优于盈利能力较弱股票构造的组合。但销售净利率较高股票构造的组合表现反而较差，落后于沪深300指数，也落后于销售净利率较低股票构造的组合。盈利因子（净资产收益率、总资产报酬率、销售毛利率）对股票收益的影响不是特别显著，其中净资产收益率指标较为显著。（六）股东因子户均持股比例、、户均持股比例变化、机构持股比例变化。其中机构持仓比例变化影响较为显著。（七）分析师预测因子分析师预测因子（预测当年净利润增长率、预测当年主营业务收入增长率、最近1个月预测净利润上调幅度、最近1个月预测主营营业收入上调幅度、最近1个月盈利预测调高占比、最近1个月上调评级占比）是影响股票收益的重要因子，其中最近1个月净利润上调幅度是最为显著的正向因子。（八）动量反转因子通过对时间内市场的分析，整体上来说，A 股市场上存在较为显著的反转效应，从前1个月涨跌幅、前两个月涨跌幅、前3个月涨跌幅、前6个月涨跌幅看，前期涨幅较小的股票组合表现较好，而前期涨幅较大的股票组合表现较差。前期涨幅较小的股票构造的组合整体上超越沪深300指数，也优于盈前期涨幅较大的股票构造的组合。动量反转因子（前1个月

7种量化选股模型

业的收益率最相关的因子即可。各种多因子模型核心的区别第一是在因子的选取上，第二是在如何用多因子综合得到一个最终的判断。一般而言，多因子选股模型有两种判断方法，一是打分法，二是回归法。打分法就是根据各个因子的大小对股票进行打分，然后按照一定的权重加权得到一个总分，根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归，得到一个回归方程，然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判，然后再以此为依据进行选股。多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。候选因子的选取候选因子的选择主要依赖于经济逻辑和市场经验，但选择更多和更有效的因子无疑是增强模型信息捕获能力，提高收益的关键因素之一。例如：在2011年1月1日，选取流通市值最大的50支股票，构建投资组合，持有到2011年底，则该组合可以获得10%的超额收益率。这就说明了在2011 年这段时间，流通市值与最终的收益率之间存在正相关关系。从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的，可以选择其他的因子，例如可能是一些基本面指标，如PB、PE、EPS 增长率等，也可能是一些技术面指标，如动量、换手率、波动

等，或者是其它指标，如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段，也是一个重要的参数指标，到底是持有一个月，还是两个月，或者一年，对最终的收益率影响很大。选股因子有效性的检验一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如：可以每月检验，具体而言，对于任意一个候选因子，在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小，按从小到大的顺序对样本股票进行排序，并平均分为n个组合，一直持有到月末，在下月初再按同样的方法重新构建n 个组合并持有到月末，每月如此，一直重复到模型形成期末。上面的例子就已经说明了这种检验的方法，同样的可以隔N个月检验，比如2 个月，3个月，甚至更长时间。还有一个参数是候选组合的数量，是50支，还是100支，都是非常重要的参数。具体的参数最优的选择，需要用历史数据进行检验。有效但冗余因子的剔除不同的选股因子可能由于在的驱动因素大致相同等原因，所选出的组合在个股构成和收益等方面具有较高的一致性，因此其中的一些因子需要作为冗余因子剔除，而只保留同类因子中收益最好，区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的，成交量一般也会比较大，因此在选股模型中，这两个因子只选择其中一个。冗余因子剔除的方法：假设需要选出k 个有效因子，样本期共m 月，那么具体

行业轮动多因子选股模型及投资效果实证分析

行业轮动多因子选股模型及投资效果实证分析量化投资因其非凡的业绩表现引起了投资者的广泛关注,在过去的40年里颠覆了传统的投资哲学,被誉为“投资界的革命”。随着计算机技术的高速发展,该模式得到了更加迅速的进步和发展。许多把量化策略作为主要投资技术的资产管理公司已经发展成为同行中的佼佼者,这也说明了量化投资理念已经深入人心,量化投资技术渐渐成为主要的投资方法之一虽然我国在量化投资方面开始较晚,起点较低,且在量化投资策略研究、开发工具人才及交易技术等方面相较于国际水平比较落后,但是通过各方努力,已经在迅速发展了且取得了不错的成绩。根据统计资料可知,到2014年上半年为止我国资本市场上已有超过200只私募量化基金、87只公募量化基金和将近200只券商理财量化产品,去除大量小型化专户理财和有限合伙人投资企业等,这些量化产品管理着近千亿元人民币。从量化产品占理财资金的比例和资本市场上现有量化策略方法的多少、量化投资思想的普及和认可度等多个角度都可以看出量化投资在我国有着非常大的发展空间。作为资本市场发展的必经阶段,量化投资也是市场有效性不断进步和发展的一种趋势。本文构建了多因子选股模型和行业轮动多因子选股模型,并采用沪深300指数成分股数据进行实证分析,实证结果表明文中构建的多因子选股模型和行业轮动多因子选股模型均可战胜沪深300指数表现,并且从多方面证明了行业轮动多因子选股模型的投资效果要好于多因子选股模型。文中第二章主要介绍了国内外量化投资的发展、经济周期的相关概念与货币周期的划分,从经济逻辑上论证了行业轮动策略的有效性及行业周期性非周期性划分依据,详细地说明了多因子选股模型的构建步骤。第三章是对第二章中阐述的方法原理的实证检验。由实证结果可得,无论是战胜基准的概率还是信息比率和累计收益率,行业轮动多因子选股模型都好于多因子选股模型。在实证过程中还发现,行业轮动多因子选股模型优于多因子选股模型的关键之处在于当经济处于收缩阶段时非周期性行业的风险防御效果较好。

量化选股系列报告之六：基于纯技术指标的多因子选股模型

证券研究报告 | 金融工程量化投资基于纯技术指标的多因子选股模型 2014年4月11日——量化选股系列报告之六样本内各策略累计超额收益资料来源：聚源数据、招商证券样本外各策略累计超额收益资料来源：聚源数据、招商证券综合策略与沪深300收益资料来源：聚源数据、招商证券相关报告《量化选股因子测试系列报告之五－基于股票风格特征的量化评分模型》2011/8/1 传统的多因子选股，主要考虑使用价值、成长、质量以及市场等四大类因子，采用打分模型，构建月度选股策略。本报告尝试仅使用技术指标构建多因子选股策略。在本报告中主要考察超买超卖型和趋势型指标的月度选股效果。 ?技术指标选股策略构建框架：在对单个技术指标测试时，使用优化后的参数计算相应指标。为避免空仓月份较多的问题，提出以相对价格方式。在考虑多个指标叠加的问题上，本文尝试：指标等权叠加、个股阈值限制、资金等权分配以及个股多倍权重共四种方法检验模型效果。 ?趋势型指标死叉组合优于金叉组合：无论在哪种价格下，趋势型指标金叉组合月均超额收益和累计超额收益几乎均为负，反而死叉信号给出组合这两者基本为正值。显示股票反转效应更为明显：在趋势性指标给出买入信号后的一个月时间，股价很可能已经反转，并且反转效应大于之前的动量效应，导致持有金叉组合收益为负。因此基于反转效应，在处理趋势型指标的问题上本文以死叉信号作为构建Top组合的依据。 ?样本内策略表现：在综合价格下以综合策略Ⅱ为例，样本内月均超额收益为1.79%，月胜率在65%左右，年化信息比率达1.47。若以年化信息比率、月均超额收益为评价标准，该方法具有明显优势。因此本文选择综合价格下的综合策略Ⅱ作为样本内建模。 ?样本外策略检验：策略依然保持着相对于沪深300稳定的优势。过去15 个月沪深300收益率为-15%左右，而同期综合策略Ⅱ累计收益11.09%，超额收益达26%左右，月均超额收益为1.85%，年化信息比率为1.57。 ?整体收益特征分析：综合策略Ⅱ与沪深300月收益的相关系数高达 92.36%，由此来看二者相关性非常显著。从回归方程的结果来看，相对于沪深300的β系数为1.07，略大于1；α为1.13％，显著大于0。此外值得注意的是，回归方程的拟合优度R 为0.853，拟合效果非常好。 ?未来可改进的方向：1、可以考虑以滚动5年作为样本内进行参数优化，并用接下来1年作为样本外测试，构造动态选股模型；2、可在中证500、中证800乃至全市场股票池中验证本文提出的选股策略效果；3、继续挖掘其他类型指标。陈军华 0755-******** chenjh2@https://www.360docs.net/doc/14614311.html, S1090513080001 罗业华 0755-******** luoyh@https://www.360docs.net/doc/14614311.html, -14% -12% -10% -8% -6% -4% -2% 0% 0% 50% 100% 150% 200% 250% 300% 350% 回撤超买超卖型趋势型综合策略Ⅰ综合策略Ⅱ

多因子选股模型

————————————————————————————————作者: ————————————————————————————————日期：

多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准，满足这些因子的股票则被买入,不满足的则卖出。基本概念举一个简单的例子：如果有一批人参加马拉松，想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。一般而言,多因子选股模型有两种判断方法，一是打分法，二是回归法。打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程，然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。候选因子的选取候选因子的选择主要依赖于经济逻辑和市场经验，但选择更多和更有效的因子无疑是增强模型信息捕获能力，提高收益的关键因素之一。

例如：在20１1年１月１日,选取流通市值最大的50支股票，构建投资组合,持有到２011年底，则该组合可以获得1０％的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在正相关关系。从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子，例如可能是一些基本面指标,如 PB、ＰE、EＰS 增长率等，也可能是一些技术面指标，如动量、换手率、波动等，或者是其它指标，如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段，也是一个重要的参数指标,到底是持有一个月，还是两个月，或者一年，对最终的收益率影响很大。选股因子有效性的检验一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验，具体而言，对于任意一个候选因子，在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小，按从小到大的顺序对样本股票进行排序,并平均分为n个组合，一直持有到月末，在下月初再按同样的方法重新构建ｎ个组合并持有到月末，每月如此,一直重复到模型形成期末。上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支，都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。

多因子选股

多因子选股多因子模型是应用最广泛的一种选股模型，基本原理是采用一系列的因子作为选股标准，满足这些因子的股票则被买入，不满足的则卖出。基本概念举一个简单的例子：如果有一批人参加马拉松，想要知道哪些人会跑到平均成绩之上，那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员，获得超越平均成绩的可能性较大。多因子模型的原理与此类似，我们只要找到那些对企业的收益率最相关的因子即可。各种多因子模型核心的区别第一是在因子的选取上，第二是在如何用多因子综合得到一个最终的判断。一般而言，多因子选股模型有两种判断方法，一是打分法，二是回归法。打分法就是根据各个因子的大小对股票进行打分，然后按照一定的权重加权得到一个总分，根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归，得到一个回归方程，然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判，然后再以此为依据进行选股。多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。候选因子的选取候选因子的选择主要依赖于经济逻辑和市场经验，但选择更多和更有效的因子无疑是增强模型信息捕获能力，提高收益的关键因素之一。例如：在2011年1月1日，选取流通市值最大的50支股票，构建投资组合，持有到2011年底，则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间，流通市值与最终的收益率之间存在正相关关系。从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的，可以选择其他的因子，例如可能是一些基本面指标，如 PB、PE、EPS 增长率等，也可能是一些技术面指标，如动量、换手率、波动等，或者是其它指标，如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段，也是一个重要的参数指标，到底是持有一个月，还是两个月，或者一年，对最终的收益率影响很大。选股因子有效性的检验一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如：可以每月检验，具体而言，对于任意一个候选因子，在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小，按从小到大的顺序对样本股票进行排序，并平均分为n个组合，一直持有到月末，在下月初再按同样的方法重新构建n个组合并持有到月末，每月如此，一直重复到模型形成期末。

7种量化选股模型

7 种量化选股模型 1、【多因子模型】【风格轮动模型】 2、【行业轮动模型】 3、【资金流模型】 4、【动量反转模型】 5、【一致预期模型】 6、【趋势追踪模型】 7、 1、【多因子模型】多因子模型是应用最广泛的一种选股模型，基本原理是采用一系列的因子作为选股标准，满足这些因子的股票则被买入，不满足的则卖出。基本概念举一个简单的例子：如果有一批人参加马拉松，想要知道哪些人会跑到平均成绩之上，那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员，获得超越平均成绩的可能性较大。多因子模型的原理与此类似，我们只要找到那些对企业的收益率最相关的因子即可。各种多因子模型核心的区别第一是在因子的选取上，第二是在如何用多因子综合得到一个最终的判断。一般而言，多因子选股模型有两种判断方法，一是打分法，二是回归法。打分法就是根据各个因子的大小对股票进行打分，然后按照一定的权重加权得到一个总分，根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归，得到一个回归方程，然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判，然后再以此为依据进行选股。多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5 个步骤。候选因子的选取

候选因子的选择主要依赖于经济逻辑和市场经验，但选择更多和更有效的因子无疑是增强模型信息捕获能力，提高收益的关键因素之一。例如：在2011年1月1日，选取流通市值最大的50支股票，构建投资组合，持有到2011 年底，则该组合可以获得10%的超额收益率。这就说明了在2011 年这段时间，流通市值与最终的收益率之间存在正相关关系。从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的，可以选择其他的因子，例如可能是一些基本面指标，如PB、PE、EPS 增长率等，也可能是一些技术面指标，如动量、换手率、波动等，或者是其它指标，如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段，也是一个重要的参数指标，到底是持有一个月，还是两个月，或者一年，对最终的收益率影响很大。选股因子有效性的检验一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如：可以每月检验，具体而言，对于任意一个候选因子，在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小，按从小到大的顺序对样本股票进行排序，并平均分为n 个组合，一直持有到月末，在下月初再按同样的方法重新构建n 个组合并持有到月末，每月如此，一直重复到模型形成期末。上面的例子就已经说明了这种检验的方法，同样的可以隔N 个月检验，比如2 个月，3 个月，甚至更长时间。还有一个参数是候选组合的数量，是50支，还是100 支，都是非常重要的参数。具体的参数最优的选择，需要用历史数据进行检验。有效但冗余因子的剔除不同的选股因子可能由于内在的驱动因素大致相同等原因，所选出的组合在个股构成和收益等方面具有较高的一致性，因此其中的一些因子需要作为冗余因子剔除，而只保留同类因子中收益最好，区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的，成交量一般也会比较大，因此在选股模型中，这两个因子只选择其中一个。冗余因子剔除的方法：假设需要选出k 个有效因子，样本期共m 月，那么具体的冗余因子剔除步骤为：（1）先对不同因子下的n 个组合进行打分，分值与该组合在整个模型形成期的收益相关，收益越大，分值越高（2）按月计算个股的不同因子得分间的相关性矩阵；（3）在计算完每月因子得分相关性矩阵后，计算整个样本期内相关性矩阵的平均值（4）设定一个得分相关性阀值MinScoreCorr ，将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子，而其它因子则作为冗余因子剔除。综合评分模型的建立和选股综合评分模型选取去除冗余后的有效因子，在模型运行期的某个时间开始，例如每个月初，对市场中正常交易的个股计算每个因子的最新得分并按照一定的权重求得所有因子的平均分。最后，根据模型所得出的综合平均分对股票进行排序，然后根据需要选择排名靠前的股票。例如，选取得分最高的前20%股票，或者选取得分最高的50 到100 只股票等等。举个例子：可以构建一个多因子模型为（PE，

多因子选股模型打分法

多因子选股模型打分法，是对于影响股票股价的因素给予相关的分值评定。然后将这些分值根据影响股票程度事先设定的权值加权得出的分数。是十分常见和成熟的一种选股方法。但打分法主观性较强，需要人为设定各个因子的权重，这也是比较困难的地方。根据打分法确定基本面因子6个，其中成长性包括净利润增长率、主营业务收入增长率;盈利能力包括净资产收益率、总资产报酬率、收益质量(经营收益现金流/营业收入总额);现金流状况为经营活动产生的现金流净额/经营收入;估值因子2个，包括市盈率(个股PE值/行业PE平均值)和市净率(个股PB值/行业PB平均值);技术因子3个，包括资金流向(资金流入净额)、主力集中度(前十大流通股东持股占总流通股比例)和换手率(月均日换手率)。具体方法如下： (1)在对因子值进行排序打分时，分为100级。正向指标从低到高排序，反向指标从高到低排序，根据上述指标将公司分为100级，第i级的打分为i。因子值异常或者为0的股票不参与打分。 (2)股票综合得分为基本面、估值面和技术面按权重5:3:2计算得到。 (3)按照股票综合得分对所有股票进行排序，分值相同的股票按照流通市值排序，最后选择得分最靠前的30只股票。 (4)持有期为1个月。即股票调整周期为1个月，每个月的月末对个股综合打分进行更新，以确定下一期的股票组合。按照以上选股策略，回测策略的实证效果，自2007年初至2011年12月底，策略组合取得了较为优异的绝对收益和明显的超额收益。实证期间策略组合累计收益为384.54%，同期沪深300累计收益15%，策略组合相对于沪深300的超额收益为369.53%，单期胜率为68.33%。该策略组合在2012年1月至3月的累计收益，从图中可以看出，多因子选股组合扣除成本后在整个期间内累计获利为11.65%， HS300同期累计上涨 4.65%，相对于HS300的累计超额收益为7.0%。从周收益来看，多因子组合在三个月份中的2个月获得正收益、2个月获得超额收益。

多因子选股模型

多因子模型是应用最广泛的一种选股模型，基本原理是采用一系列的因子作为选股标准，满足这些因子的股票则被买入，不满足的则卖出。基本概念举一个简单的例子：如果有一批人参加马拉松，想要知道哪些人会跑到平均成绩之上，那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员，获得超越平均成绩的可能性较大。多因子模型的原理与此类似，我们只要找到那些对企业的收益率最相关的因子即可。各种多因子模型核心的区别第一是在因子的选取上，第二是在如何用多因子综合得到一个最终的判断。一般而言，多因子选股模型有两种判断方法，一是打分法，二是回归法。打分法就是根据各个因子的大小对股票进行打分，然后按照一定的权重加权得到一个总分，根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归，得到一个回归方程，然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判，然后再以此为依据进行选股。多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。候选因子的选取候选因子的选择主要依赖于经济逻辑和市场经验，但选择更多和更有效的因子无疑是增强模型信息捕获能力，提高收益的关键因素之一。

例如：在2011年1月1日，选取流通市值最大的50支股票，构建投资组合，持有到2011年底，则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间，流通市值与最终的收益率之间存在正相关关系。从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的，可以选择其他的因子，例如可能是一些基本面指标，如PB、PE、EPS 增长率等，也可能是一些技术面指标，如动量、换手率、波动等，或者是其它指标，如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段，也是一个重要的参数指标，到底是持有一个月，还是两个月，或者一年，对最终的收益率影响很大。选股因子有效性的检验一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如：可以每月检验，具体而言，对于任意一个候选因子，在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小，按从小到大的顺序对样本股票进行排序，并平均分为n个组合，一直持有到月末，在下月初再按同样的方法重新构建n个组合并持有到月末，每月如此，一直重复到模型形成期末。上面的例子就已经说明了这种检验的方法，同样的可以隔N个月检验，比如2个月，3个月，甚至更长时间。还有一个参数是候选组合的数量，是50支，还是100支，都是非常重要的参数。具体的参数最优的选择，需要用历史数据进行检验。

最新 基于多因子模型的量化选股分析-精品

7种量化选股模型

7种量化选股模型

多因子量化选股模型建立及优化