6月11日上市的双色球杀号定胆必赢网币是高频交易旗下的一个交易平台吗？

点击联系发帖人 时间：2015-06-10 02:23

双色球杀号定胆必赢网

作为一个卖方structurer，跟quant和trader都打交道，试着回答下，只针对equity derivative desk。&br&&br&1. 是，Quant 需要和 Trader 解释模型的用处和限制，尤其是在有新产品出现时。据我所知目前业内的标准是Local Volatility Model和Stochastic Volatility Model。一般的产品（例如barrier, rainbow option...）用Local Vol match market skew就可以了。而有的产品（例如cliquet）对volatility forward skew比较敏感，用Stochastic Vol能更好地hedge。&br&&br&如果trader不懂金融数学的话，这些模型大概能让他们感到比亏钱还痛苦吧。不过好在trader们大多有math、FE背景，有些还是quant PHD, 之前没准还干过quant、structuring。所以这些模型对他们来说也不会陌生。就算不懂也没关系，只要会用就好了。Model calibration, risk exposure, hedging methodology什么的交给quant抓脑门研究就好了（好心疼组里的quant，年纪不大，头发不多lol）。&br&&br&2.配合是要的。之前也提到了，比如calibrate模型的参数，分析产品对不同变量的sensitivity，怎么去hedge...&br&冲突还没见过，大家合作得挺愉快的，因为没有利益纠葛。冲突一般是发生在trader和sales之间。以下一幕是常常喜闻乐见的：&br&Sales: XXX, can you give me 5 bps? This is for a new client, they want to trade 100million(notional)! Let's both improve a little bit to build the relationship. Cuz they are also interested in other structures, if we are done on this one, they will definitely come back later.&br&Trader: No
╮(╯?╰)╭&br&Sales:
(? ?皿?)?&br&&br&如有错误，还请指正。
作为一个卖方structurer，跟quant和trader都打交道，试着回答下，只针对equity derivative desk。 1. 是，Quant 需要和 Trader 解释模型的用处和限制，尤其是在有新产品出现时。据我所知目前业内的标准是Local Volatility Model和Stochastic Volatility Mod…
&figure&&img src=&/v2-bcbd25c24e81ac22f6a1a773db86c4b0_b.jpg& data-rawwidth=&1000& data-rawheight=&558& class=&origin_image zh-lightbox-thumb& width=&1000& data-original=&/v2-bcbd25c24e81ac22f6a1a773db86c4b0_r.jpg&&&/figure&&p&在多因子量化投资体系中，具有稳定的预期收益，可解释的经济驱动理论，与其他因子的低相关性是选择alpha因子的关键指标。本篇文章中，我们以此为因子选取标准，简单地构建了自己的因子库，总共包括八个大类因子，每个大类因子中包含四到五个子类细分因子。为了比较不同的权重优化方法的优劣，本文首先采取不同的方法对各个大类因子下的细分因子进行&b&合成&/b&，确定了不同大类因子的各自最优的合成方法；其次，通过不同权重合成方法对合成的大类代理因子进行二次权重合成，并比较了这些不同合成方法下的因子表现差异。基于上述多因子权重优化建模体系，我们初步得出以下结论：&/p&&ol&&li&同一大类因子下细分因子之间存在高相关性，表现为细分因子IC值整体变化方向相同。&/li&&li&不同大类因子适合不同的合成方式，PCA方法适用于具有较强相关性的细分因子，在选股绩效指标中，具有更大的累积收益和更低的回撤值，同时夏普比率和胜率表现也更加良好，平均换手率更低。&/li&&li&在细分因子的合成方法中，逐步回归（stepwise regression）方法稳健性较差，其平均换手率较高，同一大类因子在不同时期其解释力度强的因子经常发生改变。同时，逐步回归法对应的最大夏普率次数最多，侧面说明了其具有挖掘最大收益的潜力。&/li&&li&在大类代理因子权重配置上，通过计算大类因子的IC进一步配置权重，可以看出合成后的因子受市场风格轮动影响，权重取值波动频繁，通过观察选股绩效指标，使用压缩矩阵最大化复合因子IR的权重配置方式可以达到较佳权重优化的效果。使用平均IC赋予大类因子权重时，选股结果显示这种方式对市场风格变化的敏感程度较强。&/li&&/ol&&h2&一、逻辑与框架&/h2&&p&在前两篇文章中，我们对估值因子和波动率因子进行了详细的分析，但是前文的分析仅仅局限于某个大类因子中其包含的细分因子的有效性检验。然而在真实的市场环境下，投资者将所有的风险都暴露在某一个因子下，显然是不够理性的。为此，本篇将对因子的合成方法进行探讨，以求能最大化各因子有效性带来的溢价的同时降低单个因子带来的风险暴露，达到二者之间的一个动态平衡。&br&&/p&&p&常见的多因子合成方法包括：&/p&&ol&&li&等权加权&/li&&li&IC均值加权&/li&&li&IR_IC加权&/li&&/ol&&p&以往的多因子合成方法的研究，很少考虑到大类因子本身的合成，仅纯粹地对所选定的因子进行合成，用某一个大类因子下的细分因子代替该大类因子，具有一定的随意性。本文尝试首先对大类因子内的细分因子进行选取合成，然后利用相对表现较好的合成方法得到的大类因子的代理变量来进一步合成最终的选股因子。&/p&&p&通过前两篇对估值因子和波动率因子的分析，我们发现大类因子中的细分因子之间存在较高的相关性。具有高相关性的细分因子大多代表了相同的一类信息，为了消除细分因子之间的共线性，最大化地提取该大类因子的信息，本文对大类因子下的细分因子信息进行提取，主要采取了以下三种方法。&/p&&p&方法一：基于等权的思想对大类因子下的细分因子进行加权&/p&&p&方法二：利用PCA方法对具有高相关性的因子进行降维，使用降维后的特征变量作为该大类因子的代理变量，其中方差解释率最低要求为70%&/p&&p&方法三：利用逐步回归法对各大类因子下的细分因子进行回归，选取能够最大程度提升模型解释力度的细分因子进入备选因子集，对所有备选因子进行简单平均得到合成后的大类因子代理变量&/p&&figure&&img src=&/v2-776aa8f48bc3e3ee442a16e9f3f1d550_b.jpg& data-size=&normal& data-rawwidth=&1418& data-rawheight=&871& class=&origin_image zh-lightbox-thumb& width=&1418& data-original=&/v2-776aa8f48bc3e3ee442a16e9f3f1d550_r.jpg&&&figcaption& 图1 逐步回归（stepwise）流程图&/figcaption&&/figure&&p&&b&
注：图片来源于&/b&&a href=&/?target=https%3A//en.wikipedia.org/wiki/Stepwise_regression& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&wikipedia&i class=&icon-external&&&/i&&/a&&/p&&p&在根据以上三种方法合成得到大类因子后，我们选取整体表现最好的合成方法作为大类因子的代理变量生成器，在此基础上，对各大类因子进行再次合成。此时，大类因子之间的合成将采用以下四种方法：&/p&&p&方法一：大类因子之间进行等权处理，即赋予每个大类因子相同的权重。该种处理方法没有考虑到各大类因子之间的有效性以及稳定性的差异，也忽略了因子之间的相关性。&/p&&p&方法二：根据大类因子的IC均值加权合成。不同的大类因子之间其因子有效性是存在差异的，根据以往的研究结果，一般而言估值因子和规模因子都是表现相对显著的，而杠杆，运营因子都是表现相对较差的因子，如果以等权的方式来对各大类因子进行加权，则忽略了不同因子的解释力度。&/p&&p&方法三：基于大类因子的IR_IC值进行加权。基于IR_IC的加权方法综合考虑了因子有效性和稳定性，在保证因子收益的同时也考虑了因子的波动性。其中IR的定义为IC的均值除以IC的标准差。&/p&&p&方法四：最大化复合因子IR。根据Qian在《Quantitative Equity Portfolio&br&Management》中提出的方法，我们可以通过最大化复合因子的IR来获得因子最优权重，利用求解得到的最优权重去合成新的因子。假设测试期内N个因子的权重向量分别为 &img src=&/equation?tex=w_%7B1%7D%2C+w_%7B2%7D%2C...%2C+w_%7Bn%7D& alt=&w_{1}, w_{2},..., w_{n}& eeimg=&1&& ，因子IC值的向量分别为 &img src=&/equation?tex=IC_%7B1%7D%2C+IC_%7B2%7D%2C+...%2C+IC_%7Bn%7D& alt=&IC_{1}, IC_{2}, ..., IC_{n}& eeimg=&1&& ，IC构成的协方差矩阵为 &img src=&/equation?tex=%5CSigma& alt=&\Sigma& eeimg=&1&& ，则复合因子的 &img src=&/equation?tex=IR+%3D+%5Cfrac%7BW%5E%7BT%7D%2AIC%7D%7BW%5E%7BT%7D%2A%5CSigma%2AW%7D& alt=&IR = \frac{W^{T}*IC}{W^{T}*\Sigma*W}& eeimg=&1&& ，其中 &img src=&/equation?tex=W+%3D+%5BW_%7B1%7D%2C+W_%7B2%7D%2C+...%2C+W_%7Bn%7D%5D& alt=&W = [W_{1}, W_{2}, ..., W_{n}]& eeimg=&1&& ， &img src=&/equation?tex=IC+%3D+%5BIC_%7B1%7D%2C+IC_%7B2%7D%2C+...%2C+IC_%7Bt%7D%5D& alt=&IC = [IC_{1}, IC_{2}, ..., IC_{t}]& eeimg=&1&& ，通过对W求导，可以直接解得最优权重的解析解为 &img src=&/equation?tex=W%5E%7B%2A%7D+%3D+%5Csigma+%2A+%5CSigma%5E%7B-1%7D_%7BIC%7D+%2A+IC& alt=&W^{*} = \sigma * \Sigma^{-1}_{IC} * IC& eeimg=&1&& 。&/p&&p&&br&&/p&&h2&&b&二、数据选取&/b&&/h2&&p&本文将所有细分因子划分为八个大类因子，分别为估值因子、波动率因子、营运能力因子、规模因子、技术因子、杠杆因子、财务质量因子以及成长性因子。因子股票池为扣除上市时间不满一年的次新股后的全市场A股，测试区间为~，涵盖一轮牛熊周期。因子调仓周期统一设置为月调仓，每月月底根据合成因子值更新股票池，表现最好的前20%的股票进入股票池。数据来源为米筐平台数据库。&/p&&figure&&img src=&/v2-abef7df9dee9388dee5f436b5f052368_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&472& data-rawheight=&687& class=&origin_image zh-lightbox-thumb& width=&472& data-original=&/v2-abef7df9dee9388dee5f436b5f052368_r.jpg&&&/figure&&figure&&img src=&/v2-dac7be0cc4ddb345f147_b.jpg& data-size=&normal& data-rawwidth=&477& data-rawheight=&757& class=&origin_image zh-lightbox-thumb& width=&477& data-original=&/v2-dac7be0cc4ddb345f147_r.jpg&&&figcaption&表1 因子定义&/figcaption&&/figure&&h2&三、大类代理因子合成&/h2&&p&在前两篇文章中，我们对估值类和波动率类大类因子的细分因子进行了详细测试，本文为节约篇幅，仅计算了其余各大类因子的细分因子的IC表现，具体表现可参考附录1，此处以规模类因子为例：&/p&&figure&&img src=&/v2-2e29ec644b48a24ae5b8fea0dbbdd5b7_b.jpg& data-size=&normal& data-rawwidth=&1729& data-rawheight=&1026& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&/v2-2e29ec644b48a24ae5b8fea0dbbdd5b7_r.jpg&&&figcaption&图2 规模细分因子的IC变化图&/figcaption&&/figure&&p&可以发现在规模类因子下，其细分因子的IC值整体变化方向一致，只是强弱有差异。方向一致说明了细分因子之间存在显著相关性，即各细分因子蕴含着对未来收益率变化的一致信息。而强度不同则表明某些细分因子更加有效，而其他因子有效性相对较差。如对数流通市值IC的绝对值峰值达到了0.5以上，而对数总市值的IC峰值则在0.3附近，说明流通市值相比于总市值具有更好的预测能力。若此时简单地对各细分因子等权加权，则有时会损失某些表现较强的因子的信息价值。顺便提一下，从规模类因子的各细分因子的IC方向来看，从16年12月开始，整个市场的市值风格偏好发生了明显的变化，以往以小为美的偏好开始转变为以大为美，且整个17年上半年IC值全部为正，若此时继续坚持购买小盘股，恐怕投资者不得不为自己的执着买单。&br&&/p&&p&通过对同类细分因子的分析，我们可以了解到细分因子之间存在较强的相关性，对大类因子的解释程度上存在冗余信息；基于大类因子下的细分因子蕴含相同的信息的前提，本文对大类因子下的细分因子进行了合成处理，以期得到一个能够更好代理该大类因子的变量。根据前文所提出的三个方法，我们来一一验证。以估值因子为例，我们列举了三种方法下各因子占比前20%的股票构成的股票池所得到的累积收益率、最大回撤、年化波动率、夏普比率、胜率占比以及换手率。&/p&&figure&&img src=&/v2-b2b0fd3bbb1f4afdce5356883cbccc69_b.jpg& data-size=&normal& data-rawwidth=&581& data-rawheight=&177& class=&origin_image zh-lightbox-thumb& width=&581& data-original=&/v2-b2b0fd3bbb1f4afdce5356883cbccc69_r.jpg&&&figcaption&表2 三种合成估值代理因子方式的绩效指标（前20%股票）&/figcaption&&/figure&&figure&&img src=&/v2-e3e6d51d5dd9d86cc5a6b3_b.jpg& data-size=&normal& data-rawwidth=&1729& data-rawheight=&1093& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&/v2-e3e6d51d5dd9d86cc5a6b3_r.jpg&&&figcaption&图3 三种合成估值代理因子方式的累计收益对比（前20%股票）&/figcaption&&/figure&&figure&&img src=&/v2-faa451f5c2b8a4dd1d94cb_b.jpg& data-size=&normal& data-rawwidth=&1729& data-rawheight=&1558& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&/v2-faa451f5c2b8a4dd1d94cb_r.jpg&&&figcaption&图4 三种合成估值代理因子方法的累积收益图&/figcaption&&/figure&&p&根据表格数据可知，针对特定的估值类因子而言，PCA方法合成得到的因子综合表现更好，具有更大的累积收益和更低的回撤值，同时夏普比率和胜率都是表现最好的，而且其平均换手率最低，仅为13.87%，如果考虑手续费对回测结果的影响，PCA方法合成得到的因子将具有更加优秀的表现。在逐步回归方法中，合成得到的估值因子的换手率达到了惊人的56.67%，一定程度上说明了逐步回归法得到的结果不具有稳健性，导致不同月份有效因子的细分成分存在很大差异。&/p&&p&为了节约行文的篇幅，此处仅列举出以&b&夏普率&/b&为比较基准的条件下不同合成方法对大类因子细分因子合成的影响。对于其他大类因子各合成方法的具体表现，就不再赘述，有兴趣的读者可以联系作者获取。&/p&&figure&&img src=&/v2-1e41a9ffeb00e0913533_b.jpg& data-size=&normal& data-rawwidth=&579& data-rawheight=&263& class=&origin_image zh-lightbox-thumb& width=&579& data-original=&/v2-1e41a9ffeb00e0913533_r.jpg&&&figcaption& 表3 不同合成方法下不同大类因子的夏普率比较&/figcaption&&/figure&&p&根据表格内容可知，不同大类因子对应的最优合成方法存在差异，总体而言，相比于纯粹的等权组合，PCA和逐步回归法具有一定的比较优势。在八大类因子中，逐步回归法占优的次数为4次，PCA的方法占优的次数为3次，而等权的方法仅有一次占优。同时，结合我们对各大类因子下细分因子的定义，可以发现PCA方法更适用于细分因子之间具有高相关性的大类因子。以波动率因子和技术因子为例，技术因子的各细分因子的平均相关系数值为0.41，而此时合成的技术大类因子夏普值为0.48，波动率因子之间的平均相关系数为0.90，而合成的波动率类因子的夏普值为1.03。&/p&&p&基于以上的统计结果，我们对不同的大类因子应用不同的合成方法，作为该大类因子的代理变量。即杠杆率因子采用等权方法，估值因子、波动率因子和营运能力因子采用PCA方法，而成长、质量、规模和技术类因子则采用逐步回归法。在得到新和成的大类因子后，我们对不同的大类因子进行IC分析，如下表所示：&/p&&figure&&img src=&/v2-02d743eee59bbdcb7bb3b1_b.jpg& data-size=&normal& data-rawwidth=&646& data-rawheight=&532& class=&origin_image zh-lightbox-thumb& width=&646& data-original=&/v2-02d743eee59bbdcb7bb3b1_r.jpg&&&figcaption&表4 代理大类因子的IC统计分析&/figcaption&&/figure&&h2&四、大类因子的权重配置&/h2&&p&由于投资者的行为偏差导致的市场异象，alpha因子的效果已经衰减，面对因子这片蓝海，我们需要挖掘新的可以解释市场异象的因子或者运用新的因子构建方法；上文我们已经通过三种方式对细分因子进行的合成，构建了能够解释细分因子，充当大类因子的代理因子，接下来我们对合成之后的大类因子构建多因子模型，在对大类代理因子的权重设定上我们采用了四种方式：&/p&&ol&&li&大类代理因子的等权配置；这里的等权是指每个代理因子的权重绝对值为1，权重的正负由前几期的大类因子RANK IC决定。此次报告我们将大类因子的RANK IC均值与RANK IC均值绝对值的比值作为新大类代理因子的方向，即每个大类因子的权重为1或者-1。&/li&&li&大类代理因子的IC均值加权配置，即根据前几期大类因子的RANK IC的均值对当期的代理因子配置权重。此次报告我们将大类因子在过去45天IC均值作为新大类代理因子的权重。&/li&&li&大类代理因子的IR加权配置，即根据前几期大类因子的IR对当期代理因子配置权重。此次报告我们将大类因子在过去45天IR作为新大类代理因子的权重。&/li&&li&通过最大化复合大类因子的IR，利用前几期大类代理因子的绩效指标即IC，利用上文提及的公式，假设测试期内N个因子的权重向量分别为 &img src=&/equation?tex=W_%7B1%7D%2C+W_%7B2%7D%2C+...%2C+W_%7Bn%7D& alt=&W_{1}, W_{2}, ..., W_{n}& eeimg=&1&& ，因子IC值的向量分别为 &img src=&/equation?tex=IC_%7B1%7D%2C+IC_%7B2%7D%2C+...%2C+IC_%7Bn%7D& alt=&IC_{1}, IC_{2}, ..., IC_{n}& eeimg=&1&& ，IC构成的协方差矩阵为 &img src=&/equation?tex=%5CSigma& alt=&\Sigma& eeimg=&1&& ，则复合因子的 &img src=&/equation?tex=IR+%3D+%5Cfrac%7BW%5E%7BT%7D%2AIC%7D%7BW%5E%7BT%7D%2A%5CSigma%2AW%7D& alt=&IR = \frac{W^{T}*IC}{W^{T}*\Sigma*W}& eeimg=&1&& ，其中 &img src=&/equation?tex=W+%3D+%5BW_%7B1%7D%2C+W_%7B2%7D%2C+...%2C+W_%7Bn%7D%5D%2C+IC+%3D+%5BIC_%7B1%7D%2C+IC_%7B2%7D%2C+...%2C+IC_%7Bt%7D%5D& alt=&W = [W_{1}, W_{2}, ..., W_{n}], IC = [IC_{1}, IC_{2}, ..., IC_{t}]& eeimg=&1&& ，通过对W求导，可以直接解得最优权重的解析解为 &img src=&/equation?tex=W%5E%7B%2A%7D+%3D+%5Csigma+%2A+%5CSigma%5E%7B-1%7D_%7BIC%7D+%2A+IC& alt=&W^{*} = \sigma * \Sigma^{-1}_{IC} * IC& eeimg=&1&& ，用此权重对当期代理因子配置权重。此次报告我们将大类因子在过去45天IC序列作为计算新大类代理因子的权重的依据。其中，在计算协方差矩阵时，考虑到矩阵的可逆性，我们使用了两种方式，分别是普通的协方差矩阵和使用Ledoit-Wolf压缩方法计算得到协方差矩阵。&/li&&/ol&&p&由于我们选取的因子大部分为财务因子，因子的更新速度较缓慢，所以在月调仓的前提下，我们在计算因子的IC时，将采取固定因子暴露度，将之与当期与下期之间的所有日收益率序列进行相关系数计算，将得到的IC序列对下期大类代理因子运用上述四种方法进行权重设定。&/p&&p&通过以上四种方式计算的大类因子的权重中，在大部分情况下使用压缩矩阵计算最大化复合IR的权重相比使用普通协方差矩阵计算最大化复合IR权重的波动幅度较小，稳定性较佳。&/p&&p&关于不同方式的大类代理因子的权重配置时间序列对比图详见附录2。&/p&&p&以估值大类因子的权重配置统计分析为例，下面的表格展示了对于估值类代理因子，即使同样是使用最大化复合IR的方式优化权重，使用压缩矩阵和一般矩阵的权重偏度明显有差异，使用一般矩阵时权重右偏，而使用压缩矩阵时权重分布则是左偏，并且峰度大于3，比正态分布陡峭，有最小的离散系数，说明相比其他权重配置方式，使用压缩矩阵的权重配置在单位均值上的离散程度最小，稳定性较好；使用IC均值加权时离散系数最大，说明使用此种方式配置权重时受市场风格影响较大，对市场变化的敏感程度更强，跟下面实际选股结果吻合。&/p&&p&&br&&/p&&figure&&img src=&/v2-f47e236be6ed08195ca15a_b.jpg& data-size=&normal& data-rawwidth=&633& data-rawheight=&223& class=&origin_image zh-lightbox-thumb& width=&633& data-original=&/v2-f47e236be6ed08195ca15a_r.jpg&&&figcaption&表5 估值大类因子权重配置统计分析&/figcaption&&/figure&&p&关于不同方式的大类因子的权重配置统计分析对比表格详见附录3。&/p&&p&以考察各种权重配置方式下选择后20%股票进行交易的绩效指标为例，下面的表格使用常见的绩效指标综合评价各种配置权重的方式，可以看出在夏普比率上各种权重配置方式相比单个大类因子选股有提高，其中使用压缩矩阵最大化复合IR的方式相比使用一般矩阵高0.15左右；使用多因子策略时的换手率相比单因子有明显的增大，也说明了权重配置上受市场风格的影响较大，资产配置在时间序列上分散程度较广泛，使用IR加权时，换手率高达66%，说明此种权重配置方式受市场风格轮动的影响程度较大；使用压缩矩阵最大化复合IR的权重配置方式拥有最小的最大回撤，而等权方式拥有最大的最大回撤值，与通过观察权重配置统计分析的结论相同；在所有权重配置方式中，除了等权配置外，其余方式选股的胜率都在60%以上，并且使用压缩矩阵最大化复合IR比使用一般矩阵的胜率高出2.5个百分点。综合上面的绩效指标考察，使用压缩矩阵最大化复合IR的权重配置方式的选股优势较明显。&/p&&figure&&img src=&/v2-a0fa904bfb7c6171d60effe7e033ed48_b.jpg& data-size=&normal& data-rawwidth=&636& data-rawheight=&247& class=&origin_image zh-lightbox-thumb& width=&636& data-original=&/v2-a0fa904bfb7c6171d60effe7e033ed48_r.jpg&&&figcaption&表6 不同大类因子权重配置方式的选股绩效指标（后20%股票）&/figcaption&&/figure&&p&关于不同方式配置权重的大类因子的选股绩效指标详见附录4.&/p&&p&图5展示了等权配置的累积收益率，可以看出等权配置大类代理因子的多因子策略中第三、四、五组的绩效区分度较不明显，除了第一组在2015年牛市期间的涨幅不大之外，其余各组均在此段时间内的收益有大幅提高，其中第二组在熔断股灾期间跌幅较大。&/p&&p&图6展示了在IC均值配置权重下的累计收益，可以看出相比等权重配置大类因子的权重，使用IC均值使得各组的累计收益的区分度更加明显，其中第五组的收益长期高于其余各组，对市场变化的敏感程度更强。&/p&&p&图7展示了在IR配置权重上各组累积收益图，可以看出相比等权重配置大类因子的权重，使用IR均值使得各组的累计收益的区分度更加明显，但其效果逊色于使用IC均值配置大类代理因子权重的效果。&/p&&p&图8和图9展示了在通过最大化复合IR获得下期因子权重的方法各组累积收益图，可以看出使用Lediot-Wolf计算协方差矩阵各组累积收益的区分度更明显，累计收益更高，稳定性更好。因此，Lediot-Wolf提供的估计协方差矩阵，在一定程度上将各大类因子的IC中存在的噪音减弱，将偏离平均水平的IC协方差矩阵系数压缩至中心水平，进而可以获得更高的IR，达到权重优化的效果。&/p&&figure&&img src=&/v2-7cf0c0be848_b.jpg& data-size=&normal& data-rawwidth=&1730& data-rawheight=&1079& class=&origin_image zh-lightbox-thumb& width=&1730& data-original=&/v2-7cf0c0be848_r.jpg&&&figcaption& 图5 等权配置大类因子的多因子累积收益图&/figcaption&&/figure&&figure&&img src=&/v2-05c7b2acdc2ae6075507e_b.jpg& data-size=&normal& data-rawwidth=&1729& data-rawheight=&1137& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&/v2-05c7b2acdc2ae6075507e_r.jpg&&&figcaption&图6 IC均值加权配置大类因子的多因子累积收益图&/figcaption&&/figure&&figure&&img src=&/v2-61e8c01d9e65cfd3e23ea_b.jpg& data-size=&normal& data-rawwidth=&1766& data-rawheight=&1220& class=&origin_image zh-lightbox-thumb& width=&1766& data-original=&/v2-61e8c01d9e65cfd3e23ea_r.jpg&&&figcaption&图7 IR-IC加权配置大类因子的多因子累积收益图&/figcaption&&/figure&&figure&&img src=&/v2-313ff3cc7c7d605e173cf422cf81bab3_b.jpg& data-size=&normal& data-rawwidth=&1728& data-rawheight=&1155& class=&origin_image zh-lightbox-thumb& width=&1728& data-original=&/v2-313ff3cc7c7d605e173cf422cf81bab3_r.jpg&&&figcaption&图8 最大化复合IR配置大类因子的多因子累积收益图（普通协方差矩阵）&/figcaption&&/figure&&figure&&img src=&/v2-4f258c42e9f8af10f84ff_b.jpg& data-size=&normal& data-rawwidth=&1741& data-rawheight=&1141& class=&origin_image zh-lightbox-thumb& width=&1741& data-original=&/v2-4f258c42e9f8af10f84ff_r.jpg&&&figcaption&图9 最大化复合IR配置大类因子的多因子累积收益图（收缩协方差矩阵）&/figcaption&&/figure&&h2&五、结论&/h2&&p&在对因子的配置上，通常需要从收益率，风险，风格变动，可投资容量上进行综合考虑，配置因子和配置一般资产一样需要从风险溢价上进行权衡，而因子作为资产风险收益的底层驱动力，合理的因子配置无疑可以捕捉到资产的价格趋势，本次报告涉及了常见的因子合成方式和因子权重配置方式，在大类因子合成方式上采取了PCA，逐步回归，等权的方式，在因子权重配置上采取了等权，IC均值加权，IR-IC加权，最大化复合IR的方式。通过本次报告的研究，我们可以了解到：&/p&&ol&&li&大类因子下细分因子存在一定的相关性，因子之间的多重共线性会导致因子的权重配置不合理，可能导致选股结果对个别因子的暴露纯度过大，资产分散化程度不足。&/li&&li&大类因子在不同的合成方式下效果差异较大，因此针对不同大类因子宜采用不同的合成(降维)方式；PCA方法适用于具有较强相关性的细分因子，降维效果明显，在一定程度上解决了多重共线性问题，但是主成分代表的经济含义不明；逐步回归（stepwise）方法稳健性不佳，在不同的时期上同一大类因子下不同的细分因子的占比可能存在较大差异，这可能导致选股的换手率过大，增大投资者在佣金上的开销。&/li&&li&通过计算大类因子的IC进行配置权重时，权重取值波动频繁，说明大类因子同样受到市场风格轮动的影响，并且这种程度不亚于普通细分因子。&/li&&li&在数种大类因子权重配置方式中，通过观察各种选股绩效指标，使用压缩矩阵最大化复合因子IR的权重配置方式的效用最好，此种方式可以将各大类因子的IC中存在的噪音减弱，将偏离平均水平的IC协方差矩阵系数压缩至中心水平，进而可以获得更高的IR，达到权重优化的效果。&/li&&/ol&&p&&br&&/p&&h2&六、附录&/h2&&p&---------------------------------------------------------------------------------------
细分因子IC变化图&/p&&p&---------------------------------------------------------------------------------------&/p&&figure&&img src=&/v2-624aada9e578_b.jpg& data-size=&normal& data-rawwidth=&1729& data-rawheight=&1189& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&/v2-624aada9e578_r.jpg&&&figcaption&图10 估值因子IC变化图&/figcaption&&/figure&&figure&&img src=&/v2-5af0eafb25b89d17d1caea_b.jpg& data-size=&normal& data-rawwidth=&1729& data-rawheight=&1189& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&/v2-5af0eafb25b89d17d1caea_r.jpg&&&figcaption&图 11 波动率因子IC变化图&/figcaption&&/figure&&figure&&img src=&/v2-f10ee492860bbb2ff3f5f0fdd64af119_b.jpg& data-size=&normal& data-rawwidth=&1729& data-rawheight=&871& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&/v2-f10ee492860bbb2ff3f5f0fdd64af119_r.jpg&&&figcaption& 图 12 营运能力因子IC变化图&/figcaption&&/figure&&figure&&img src=&/v2-2e29ec644b48a24ae5b8fea0dbbdd5b7_b.jpg& data-size=&normal& data-rawwidth=&1729& data-rawheight=&1026& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&/v2-2e29ec644b48a24ae5b8fea0dbbdd5b7_r.jpg&&&figcaption&图13 规模类因子IC变化图&/figcaption&&/figure&&figure&&img src=&/v2-e4f50cb8ebc74cae3adecff_b.jpg& data-size=&normal& data-rawwidth=&1741& data-rawheight=&1068& class=&origin_image zh-lightbox-thumb& width=&1741& data-original=&/v2-e4f50cb8ebc74cae3adecff_r.jpg&&&figcaption&图14 技术因子IC变化图&/figcaption&&/figure&&figure&&img src=&/v2-b06de5bcd904fbf116bc5591caebdba3_b.jpg& data-size=&normal& data-rawwidth=&1729& data-rawheight=&1189& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&/v2-b06de5bcd904fbf116bc5591caebdba3_r.jpg&&&figcaption&图15 杠杆因子IC变化图&/figcaption&&/figure&&figure&&img src=&/v2-b23ad2ecfeeff638f326012ebc869193_b.jpg& data-size=&normal& data-rawwidth=&1729& data-rawheight=&1189& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&/v2-b23ad2ecfeeff638f326012ebc869193_r.jpg&&&figcaption&图16 质量因子IC变化图&/figcaption&&/figure&&figure&&img src=&/v2-3559465fbe6c79aaa6ab312d4d9f73c2_b.jpg& data-size=&normal& data-rawwidth=&1729& data-rawheight=&1189& class=&origin_image zh-lightbox-thumb& width=&1729& data-original=&/v2-3559465fbe6c79aaa6ab312d4d9f73c2_r.jpg&&&figcaption&图17 成长因子IC变化图&/figcaption&&/figure&&p&---------------------------------------------------------------------------------------
IR相关权重对比图&/p&&p&---------------------------------------------------------------------------------------
&/p&&figure&&img src=&/v2-bb3bcb1baf564b876f7e_b.jpg& data-size=&normal& data-rawwidth=&1728& data-rawheight=&1283& class=&origin_image zh-lightbox-thumb& width=&1728& data-original=&/v2-bb3bcb1baf564b876f7e_r.jpg&&&figcaption&图18 估值大类因子权重对比&/figcaption&&/figure&&figure&&img src=&/v2-d6ceb301dcdea5c8c812d5_b.jpg& data-size=&normal& data-rawwidth=&1728& data-rawheight=&1226& class=&origin_image zh-lightbox-thumb& width=&1728& data-original=&/v2-d6ceb301dcdea5c8c812d5_r.jpg&&&figcaption&图19 波动率大类因子权重对比&/figcaption&&/figure&&p&&br&&/p&&figure&&img src=&/v2-86b1ec34e60a197493fec00e3a4c6acf_b.jpg& data-size=&normal& data-rawwidth=&1728& data-rawheight=&1276& class=&origin_image zh-lightbox-thumb& width=&1728& data-original=&/v2-86b1ec34e60a197493fec00e3a4c6acf_r.jpg&&&figcaption&图20 运营能力大类因子权重对比&/figcaption&&/figure&&figure&&img src=&/v2-e77b48a33bfe26f28ea77_b.jpg& data-size=&normal& data-rawwidth=&1728& data-rawheight=&1256& class=&origin_image zh-lightbox-thumb& width=&1728& data-original=&/v2-e77b48a33bfe26f28ea77_r.jpg&&&figcaption&图21 规模大类因子权重对比&/figcaption&&/figure&&figure&&img src=&/v2-86d589f768fac92d95e4b_b.jpg& data-size=&normal& data-rawwidth=&1728& data-rawheight=&1240& class=&origin_image zh-lightbox-thumb& width=&1728& data-original=&/v2-86d589f768fac92d95e4b_r.jpg&&&figcaption&图22 技术大类因子权重对比&/figcaption&&/figure&&figure&&img src=&/v2-098ed2f68b325f2215d3adf473f21c6f_b.jpg& data-size=&normal& data-rawwidth=&1728& data-rawheight=&1240& class=&origin_image zh-lightbox-thumb& width=&1728& data-original=&/v2-098ed2f68b325f2215d3adf473f21c6f_r.jpg&&&figcaption&图23 杠杆大类因子权重对比&/figcaption&&/figure&&figure&&img src=&/v2-d08aceab4e0eb68b601c2b_b.jpg& data-size=&normal& data-rawwidth=&1728& data-rawheight=&1226& class=&origin_image zh-lightbox-thumb& width=&1728& data-original=&/v2-d08aceab4e0eb68b601c2b_r.jpg&&&figcaption&图24 财务质量大类因子权重对比&/figcaption&&/figure&&figure&&img src=&/v2-e40a159c97b42c56bd287facc08f10fd_b.jpg& data-size=&normal& data-rawwidth=&1728& data-rawheight=&1292& class=&origin_image zh-lightbox-thumb& width=&1728& data-original=&/v2-e40a159c97b42c56bd287facc08f10fd_r.jpg&&&figcaption&图25 成长大类因子权重对比&/figcaption&&/figure&&p&---------------------------------------------------------------------------------------
大类因子权重配置统计分析&/p&&p&---------------------------------------------------------------------------------------&/p&&figure&&img src=&/v2-b9e45b4d332b51f7da0c_b.jpg& data-size=&normal& data-rawwidth=&635& data-rawheight=&225& class=&origin_image zh-lightbox-thumb& width=&635& data-original=&/v2-b9e45b4d332b51f7da0c_r.jpg&&&figcaption&表7 估值大类因子权重配置统计分析&/figcaption&&/figure&&figure&&img src=&/v2-cf3b4cf20a1f588da575e8f_b.jpg& data-size=&normal& data-rawwidth=&639& data-rawheight=&223& class=&origin_image zh-lightbox-thumb& width=&639& data-original=&/v2-cf3b4cf20a1f588da575e8f_r.jpg&&&figcaption&表8 波动率大类因子权重配置统计分析&/figcaption&&/figure&&figure&&img src=&/v2-fae5810dffadefb56854ee_b.jpg& data-size=&normal& data-rawwidth=&639& data-rawheight=&222& class=&origin_image zh-lightbox-thumb& width=&639& data-original=&/v2-fae5810dffadefb56854ee_r.jpg&&&figcaption&表9 营运能力大类因子权重配置统计分析&/figcaption&&/figure&&figure&&img src=&/v2-6b67ed653a12a6dd37278a_b.jpg& data-size=&normal& data-rawwidth=&635& data-rawheight=&225& class=&origin_image zh-lightbox-thumb& width=&635& data-original=&/v2-6b67ed653a12a6dd37278a_r.jpg&&&figcaption&表10 规模大类因子权重配置统计分析&/figcaption&&/figure&&figure&&img src=&/v2-67dbaecc23cb74bd58da_b.jpg& data-size=&normal& data-rawwidth=&639& data-rawheight=&225& class=&origin_image zh-lightbox-thumb& width=&639& data-original=&/v2-67dbaecc23cb74bd58da_r.jpg&&&figcaption&表11 技术大类因子权重配置统计分析&/figcaption&&/figure&&figure&&img src=&/v2-d94f71e26a6da88eb8af6f67bfde8c19_b.jpg& data-size=&normal& data-rawwidth=&644& data-rawheight=&289& class=&origin_image zh-lightbox-thumb& width=&644& data-original=&/v2-d94f71e26a6da88eb8af6f67bfde8c19_r.jpg&&&figcaption&表12 杠杆大类因子权重配置统计分析&/figcaption&&/figure&&figure&&img src=&/v2-eaf9cb1b3f2_b.jpg& data-size=&normal& data-rawwidth=&638& data-rawheight=&226& class=&origin_image zh-lightbox-thumb& width=&638& data-original=&/v2-eaf9cb1b3f2_r.jpg&&&figcaption&表13 财务大类因子权重配置统计分析&/figcaption&&/figure&&figure&&img src=&/v2-ac470a53aa5e573acbbbe10b8ff5dfda_b.jpg& data-size=&normal& data-rawwidth=&643& data-rawheight=&225& class=&origin_image zh-lightbox-thumb& width=&643& data-original=&/v2-ac470a53aa5e573acbbbe10b8ff5dfda_r.jpg&&&figcaption&表14 成长大类因子权重配置统计分析&/figcaption&&/figure&&p&---------------------------------------------------------------------------------------
不同权重配置方法下的大类因子选股绩效指标比较&/p&&p&---------------------------------------------------------------------------------------&/p&&figure&&img src=&/v2-2d7bfa14f5af43b7432909_b.jpg& data-size=&normal& data-rawwidth=&637& data-rawheight=&137& class=&origin_image zh-lightbox-thumb& width=&637& data-original=&/v2-2d7bfa14f5af43b7432909_r.jpg&&&figcaption&表15 等权配置绩效指标统计&/figcaption&&/figure&&figure&&img src=&/v2-c9ba82f8ca690d383d3ca7cdf2944144_b.jpg& data-size=&normal& data-rawwidth=&628& data-rawheight=&135& class=&origin_image zh-lightbox-thumb& width=&628& data-original=&/v2-c9ba82f8ca690d383d3ca7cdf2944144_r.jpg&&&figcaption&表16 IC均值加权配置绩效指标统计&/figcaption&&/figure&&figure&&img src=&/v2-f131db1e51f94cddd93309a_b.jpg& data-size=&normal& data-rawwidth=&631& data-rawheight=&137& class=&origin_image zh-lightbox-thumb& width=&631& data-original=&/v2-f131db1e51f94cddd93309a_r.jpg&&&figcaption&表17 IR加权配置绩效指标统计&/figcaption&&/figure&&figure&&img src=&/v2-f1d70a8dce2dcc0ec866ff5aaea4a291_b.jpg& data-size=&normal& data-rawwidth=&631& data-rawheight=&137& class=&origin_image zh-lightbox-thumb& width=&631& data-original=&/v2-f1d70a8dce2dcc0ec866ff5aaea4a291_r.jpg&&&figcaption&表18 最大化复合IR配置绩效指标统计&/figcaption&&/figure&&figure&&img src=&/v2-de5c440da56824bfb3f335f_b.jpg& data-size=&normal& data-rawwidth=&630& data-rawheight=&137& class=&origin_image zh-lightbox-thumb& width=&630& data-original=&/v2-de5c440da56824bfb3f335f_r.jpg&&&figcaption&表19 收缩矩阵最大化复合IR配置绩效指标统计&/figcaption&&/figure&&p&作者：戴宇、HooH&/p&
在多因子量化投资体系中，具有稳定的预期收益，可解释的经济驱动理论，与其他因子的低相关性是选择alpha因子的关键指标。本篇文章中，我们以此为因子选取标准，简单地构建了自己的因子库，总共包括八个大类因子，每个大类因子中包含四到五个子类细分因子。…
&p&关于关注点偏…楼下一些答案本身已经给出了诠释…&br&建议大家在讨论问题前先去了解一下“写出赚钱的策略”这种类型quant占整个数量行业的多少，国内外分别占多少，其他种类分别都是啥，站多少；然后再研究下仅在数量投资这个子领域里，国内做那些“策略”的quant占整个数量投资领域多少。综合起来就知道为啥叫关注点偏了。这也不奇怪为啥人人都开口2acj（就不谈d了）&/p&&p&还有一个最大的误解是某些人口中的“理论”和“顶尖的数学家才能做好的”，真的只是这个行业的基础，而且稍好一点的本科生就能掌握，而且一点也不“理论”，相反《超应用》：&/p&&p&“老子做应用的”&br&“老子做应用的”&br&“老子做应用的，洗数据用py…&/p&&p&原文：&br&我不劝退quant，我只是不劝进。&/p&&p&这个行业方差很高，但均值甚至没有银行职员和贷款公司高，且入行门槛和技能需求一年比一年高。&/p&&p&同时很多人对这个行业抱有了太多不切实际的幻想，相当一部分人因为国内行业，政策和从业者的局限性的这个行业有着畸形地窄且偏的看法。关注点全部堆在了几个在整个行业甚至占不了多少比重的小点上。在毫无基础建设的情况下蜂窝般的涌向个别看起来十分高端的方向，个个仿照2acj。误解一年深于一年，以至于“量化”一次在黑猫的字典里已经成为骂人的话。&/p&&p&一个特别需要长期雕琢的行业里，短时间内竟然爆炸般的涌入了无数技术投机者，虽不至于药丸，但前景也绝不光明。&/p&&p&国外的形势也同样严峻，1:300的pk率还是有的。&/p&&p&总之，虽不主动劝退，但是不劝进，望大家理智对待这个行业&/p&
关于关注点偏…楼下一些答案本身已经给出了诠释… 建议大家在讨论问题前先去了解一下“写出赚钱的策略”这种类型quant占整个数量行业的多少，国内外分别占多少，其他种类分别都是啥，站多少；然后再研究下仅在数量投资这个子领域里，国内做那些“策略”的qu…
&figure&&img src=&/v2-fdc0f1a83af_b.jpg& data-rawwidth=&852& data-rawheight=&480& class=&origin_image zh-lightbox-thumb& width=&852& data-original=&/v2-fdc0f1a83af_r.jpg&&&/figure&&p&我于2015年回到国内，至今已经过去两年。我和我的小伙伴们在这段时间里一直工作在国内量化行业的一线，期间支持过股票、股指期货、商品期货的各种中低高频策略，积累了丰富的实操经验。现在，我们成立了一家金融科技公司，已经获得千万级天使轮投资，以后将专注于国内金融市场上量化交易相关的各种科技服务。在这个人工智能盛行的时代，我们也赶了回时髦，给公司取名 &a href=&/?target=http%3A//taurus.ai/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&taurus.ai&i class=&icon-external&&&/i&&/a& ，寓意金牛座，希望给客户爸爸们带来好运气。&/p&&p&&br&&/p&&p&量化交易是当前国内一个极速发展中的行业，按照统计数据，当前量化私募在整体私募的占比只有大约10%，与海外30-40%的占比还有很大距离。从管理规模上看，国内的私募基金也在快速扩张。私募资管总量持续增加，并且量化私募的占比继续扩大，带来的是量化私募行业爆发式发展。同时，公募、券商、银行的资管需求，也会有一部分需要有量化类策略来承担。在未来几年，行业有巨大发展空间，作为行业内独树一帜的科技服务商，taurus.ai 也将随着浪潮一起攀登颠覆。&/p&&p&&br&&/p&&p&我们的核心产品，汇聚了团队成员过去多年一线经验的交易技术，帮助客户解决执行量化交易策略等时必须的技术难点。我们会提供极低延迟的交易执行系统，人工智能加持的交易执行算法，以及丰富的盘后统计分析工具。我们所具备的度独家技术方案，以及团队成员过去多年的交易一线的实际工作经验，使我们可以打造出市场上独一无二的产品型态，并以此形成我们的核心竞争力。&/p&&p&&br&&/p&&p&新公司创立伊始，我们急需召唤各种神通广大的工程师们。公司现有十人，团队氛围以互相伤害（帮助）为荣，日常工作极度烧脑，迫切欢迎有技术有热情的小伙伴们加入。我们将提供有竞争力的薪资（全职20k-40k／月及期权，实习3k-10k／月），最新的高性能办公设备，丰富的团队活动【及程序员鼓励师（误）】，以及无尽的技术难题以供满足高智商大神的动脑需求。公司在北京和上海都设有办公室，两地成员各半，所求职位如下：&/p&&p&&br&&/p&&p&实习&/p&&p&地点：北京（五道口同方科技广场）&/p&&p&技能：深入了解至少一门编程语言（C++/Python/Java/Javascript等）&/p&&p&加分项：深入理解计算机体系结构、操作系统原理及网络原理，或了解机器学习原理及常见算法，或参与过开源项目，或有程序竞赛获奖经历、发表过学术论文等&/p&&p&工作内容：&/p&&p&o 参与全栈开发流程，完成Mentor分配的小型独立项目&/p&&p&o 参与优化系统性能&/p&&p&o 参与讨论交易算法，对数据进行实证研究&/p&&p&o 参与开源计划，帮助维护开源版本的发布和社区建设&/p&&p&&br&&/p&&p&时间要求：实习期至少三个月，每周至少三天&/p&&p&人数：2-5&/p&&p&&br&&/p&&p&全栈开发&/p&&p&地点：北京&/p&&p&技能：Javascript/CSS/Python，Websocket，ReactJS，RxJS&/p&&p&工作内容：&/p&&p&o 完善基于Web（ReactJS）的UI对接后台系统&/p&&p&o 实现UI端交易策略控制及手动交易&/p&&p&o 实现UI端交易数据实时更新，支持各类图表展示&/p&&p&o 优化前后台数据通讯模型，提升高速实时行情的显示刷新性能，保障前后台数据同步&/p&&p&人数：1-2&/p&&p&&br&&/p&&p&交易系统开发&/p&&p&地点：北京&/p&&p&技能：C++，Python&/p&&p&工作内容：&/p&&p&o 开发交易撮合模拟器，设计模拟撮合算法，提供系统离线测试环境&/p&&p&o 完善交易回放功能&/p&&p&o 完善内存数据库后台，支持分布式架构，支持实时Replication&/p&&p&o 优化系统内部延迟&/p&&p&人数：2-3&/p&&p&&br&&/p&&p&高级运维工程师&/p&&p&地点：北京或上海&/p&&p&职责：定制生产系统&/p&&p&技能：git，cmake，rpm，docker&/p&&p&工作内容：&/p&&p&o 制定代码版本控制策略，实现一套代码支持多客户、多版本&/p&&p&o 升级现有的自动编译系统，提供自动测试、集成测试框架&/p&&p&o 改善系统安装程序&/p&&p&人数：1&/p&&p&&br&&/p&&p&请有兴趣的小伙伴发送简历至 &a href=&mailto:jobs@taurus.ai&&jobs@taurus.ai&/a& 。我们将提供优厚的薪酬，宽松的办公环境和超专业的领路人，以及更重要的，一个安全探索国内量化交易行业发展的生存空间，无论风吹雨打，我们与你一同前行。&/p&
我于2015年回到国内，至今已经过去两年。我和我的小伙伴们在这段时间里一直工作在国内量化行业的一线，期间支持过股票、股指期货、商品期货的各种中低高频策略，积累了丰富的实操经验。现在，我们成立了一家金融科技公司，已经获得千万级天使轮投资，以后将…
&figure&&img src=&/v2-b66ae3d3ad194f9d4da85e84_b.jpg& data-rawwidth=&791& data-rawheight=&383& class=&origin_image zh-lightbox-thumb& width=&791& data-original=&/v2-b66ae3d3ad194f9d4da85e84_r.jpg&&&/figure&&p&&a href=&/?target=https%3A///taurusai/kungfu& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&功夫&i class=&icon-external&&&/i&&/a& 是一款为速度而生的量化交易执行系统，它能帮助对速度有极致要求的交易者大幅降低系统内延迟，内建的内存数据库会自动存储纳秒级时间精度的交易相关全部数据，赋予策略师在盘后进行高精度数据研究的能力。功夫的架构设计，绝非一朝一夕的灵感突发，而是浸淫多年的心得体会，是经年累月的实践打磨，更是实盘拼杀验证出的唯一选择。今后我会在本专栏发布系列文章详细解释功夫的设计思路。本篇作为开篇，首先要从整体上介绍功夫的设计原则和运行机制，希望读者可以在头脑中形成系统运行的整体图景，也希望你在读完全篇后，可以同意这个观点：功夫的设计和实现没有第二选择，是一种「非如此不可」的方案。&/p&&h2&通信机制&/h2&&p&功夫使用共享内存作为核心通信机制。在通信延迟这个指标上，共享内存远远领先于其他一切诸如消息队列、网络协议之类的方法（实测数据可参考：&a href=&/?target=http%3A//psy-lob-/2013/07/a-java-ping-buffet.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&psy-lob-&/span&&span class=&invisible&&/2013/07/a-java-ping-buffet.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&）。在功夫内部，通信功能的基础设施实际上由内存数据存储模块易筋经兼任，易筋经使用内存映射文件（Memory Mapped File - &a href=&/?target=http%3A//man7.org/linux/man-pages/man2/mmap.2.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&mmap&i class=&icon-external&&&/i&&/a& ）作为共享内存的创建方式。内存映射文件 mmap 的引入使得系统可以兼顾进程间通信及数据实时存储，这在高频交易的世界早已是公开的秘密和事实上的技术标准，任何一个初步了解高频架构的工程师都会采用这个技术实现系统底层，但现实中却从未有任何一个开源项目针对这一点做出标准化封装，使得无数高频团队内部的工程师不得不重复造轮子。功夫需要实现这样一个标准工具，免去重复开发的苦恼，这是「非如此不可」之其一。&/p&&h2&存储模型&/h2&&p&使用内存映射文件之后，在解决通信问题的同时，我们事实上还同时得到了实时存储的能力，因为 mmap 的运行原理是，操作系统会在后台 kernel 进程中保证磁盘上的映射文件内容和内存映射区域同步，使得你对该内存的任何写入操作，都会异步的持久化到磁盘上。这完美的解决了其他存储模型（文件、数据库等）写入耗时的问题，我们再也不用担心存储功能会影响系统处理速度。之前有人&a href=&/p/#comments& class=&internal&&评论&/a&，认为 SSD 写入已经很快，写磁盘等于写内存，这显然是对延迟没有深入研究的想当然，请看下图（引自 &a href=&/?target=https%3A//www.slideshare.net/shinolajla/cpu-caches-& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://www.&/span&&span class=&visible&&slideshare.net/shinolaj&/span&&span class=&invisible&&la/cpu-caches-&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&）：&/p&&figure&&img src=&/v2-f0b82a8d4aec2b2416542a_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&638& data-rawheight=&479& class=&origin_image zh-lightbox-thumb& width=&638& data-original=&/v2-f0b82a8d4aec2b2416542a_r.jpg&&&/figure&&p&对SSD的操作仍然比内存更耗时，并且写入 SSD 意味着一次额外的复制操作，而写入 mmap 映射的内存区域则是 Zero-Copy，孰优孰劣一目了然。&/p&&p&单纯使用 mmap，每次映射的文件是固定大小，这对于需要连续存储的应用来说是不可接受的，写入内容无法超过映射文件的大小。因此，必须有一个更上层的存储模型完成底层的存储文件拼接工作，通过自动管理链接映射文件，使得上层应用得到一个可以连续无上限写入的内存区域。这便是易筋经的主要职能。易筋经采用流式存储，每个流定义为 Journal，每个 Journal 内部由一系列内存映射文件组成，每个文件定义为 Page。按照这个机制，在读写进行到文件边界的时候，系统内会自动进行换页，对于追求速度的应用来说，换页所产生的巨大耗时是不可接受的，为了解决这个问题，易筋经内设后台进程进行换页预处理，使得应用层在需要换页时可以瞬时完成。&/p&&p&要兼顾通信和极速异步存储，必须使用 mmap 技术，使用 mmap 技术则必须有一套代码完成内存管理和换页操作才能提供无限长存储，因此易筋经的设计和实现成为必然选择，这是「非如此不可」之其二。&/p&&h2&线程模型&/h2&&p&交易程序必然是多线程架构，需要不同的线程同时处理接收行情、策略运算、柜台交互等任务。然而在这个世界上，如果有什么人天生无法理解多线程概念，我一定会说是我那些可爱的 Quant 朋友们。Quant 是一群数字天才，他们精于数学模型，可以在无尽的数字海洋中寻找到哪怕最微弱的信号，但是要让他们理解一台机器的内部运行机制和各种内部状态的同步异步问题，那可真的要了命。的确，曾经世界上有那么一种神奇的职位叫做 Quant Developer，专门负责把数学模型翻译成 C++ 代码，但是大浪红尘，君不见在这个24小时速成深度学习的年代，无数未经专业计算机培训的年轻人已经来到这个迅速数字化的世界寻求机会，让他们支付高昂的学习成本理解多线程已经是一个不可能的任务。&/p&&p&针对于此，功夫特别对策略实现部分采用了单进程单线程模型。使得策略开发者可以不再担心回调函数中的代码是否会引发线程安全问题。同时，不同的策略运行在不同的进程中，极大增强了系统稳定性，单一策略的崩溃不会影响系统的其他部分，极端情况下，即使你的策略程序全部异常崩溃，系统仍然会为你保持行情和交易连接，落地存储所有行情数据。&/p&&p&在策略引擎咏春的代码中，大家可以看到行情处理（MD - Market Data）、策略计算（BL - Business Logic）、柜台交互（TD - Trade）是分别独立的模块，每个模块都运行在自己独立的进程空间中。其中 MD 和 TD 由于是建立在诸如 CTP 之类的交易柜台 API 基础上，天然是一种多线程结构，我们会在系统内完成多线程处理；而 MD - BL - TD 的交互，则是通过前述基于易筋经共享内存通信的方式实现。这使得 BL 部分可以完全隔离在单独的单进程单线程中进行处理，从而实现单线程策略模型，这是「非如此不可」之其三。&/p&&h2&确定性计算&/h2&&p&对于一个复杂的计算机系统，因为内部多进程/线程处理的运行机制，不可避免的会产生一个极其复杂的内部状态机，这个状态机的状态迁移在系统运行期间往往具有很高的不确定性，由于变量众多，任何一个变量的变化都可能影响全局，这使得系统开发进入后期后，错误定位和排查工作变得异常艰难。由于采用了共享内存进行通信，进程隔离的设计机制，功夫进一步采用了完全确定性的处理方式。所有内部处理，都是基于从共享内存中的单线程数据输入，到向共享内存中的单线程数据输出这一链条进行，使得在同时拥有输入数据和处理代码这个先决条件下，可以完全重现处理过程和得到相同的处理结果。由于共享内存中的数据会经由
mmap 机制自动异步存储到磁盘，这个先决条件就变成了必然具备的条件，使得用户可以在系统运行结束后随时再次重现当时的运算处理场景，使 Debug 调试和修复都不依赖于实盘环境。要做到这一点，确定性计算的原则必须严格贯彻到系统的方方面面，这是「非如此不可」之其四。&/p&&h2&数据标准&/h2&&p&国内的量化交易行业方兴未艾，作为从业者，面对数十种风格迥异的交易柜台API，我常常感到十分头大和痛苦。很多时候，同样的交易策略，只是因为切换了交易柜台，就不得不进行重新开发，浪费大量的时间精力。这让我十分怀念在国外市场上大家都基于标准的 FIX 协议，以 TCP/UDP 协议的形式进行交互的友好环境。有感于此，我们尝试在长拳中抽象和规范化我们接触过的所有主流柜台数据格式。对于每一个希望快速移植策略程序的交易者，都一定需要这样的一个标准格式，这是「非如此不可」之其五。&/p&&p&&br&&/p&&p&============&/p&&p&&br&&/p&&p&综上，功夫的核心设计原则是对非常非常基础，但是非常非常重要的几个关键问题采取专门针对性措施。可以看到这些问题全部都和具体的交易逻辑无关，不论你使用什么类型的交易策略，这些问题都是必须要面对和解决的。你必须有这样一个坚如磐石的底层系统，上层应用才能得以生生不息，而非每次交易需求变化都需要对系统进行彻底重构，这是「非如此不可」之其五。&/p&&p&&br&&/p&&p&============&/p&&p&&br&&/p&&p&开源上线以来，有朋友表示并不是非常理解我们为什么要开源，有这样几种典型顾虑：&/p&&ol&&li&开源以后，无法形成有效的商业模式和收费方式；&/li&&li&竞争对手可能利用我们的开源代码进行二次开发；&/li&&li&既然技术有优势，自己利用优势做交易赚大钱更好；&/li&&/ol&&p&关于这些问题，我们并非没有经过深思熟虑。做为一个在量化交易行业一线工作多年的“老兵”，我有幸见识了很多非常优秀的交易团队和各种罕见的科技方案，然而时过境迁，当年辉煌的精英团队隐退之后，那些神乎其技往往也从此埋没，江湖中只剩只言片语，往往进而形成吹牛不上税的浮夸风气。&/p&&p&工程师出身的我更希望交易这个世界可以出现更多公平、透明、规范的工具，对于每一个有志进入这个领域的人，可以不再关起门来自己造轮子，花费无数精力去解决一个又一个被前人解决了一次又一次只是没有传承的问题。当然我们也可以提供低价或免费但不开源的产品来解决这个问题，但是我始终相信没有形成有效交互的社区是不会长久的，在这个领域，我们需要一个有公信力、质量过硬、支持到位的产品，这个产品必须得到广泛的使用和贡献，基于此，开源是一个唯一的选择。如果我们有幸做到这一点，我相信一个有价值的产品并不难寻求商业上的成功。&/p&&p&我们并不奢望所有人都必须基于完整的功夫系统来实现全部交易功能，一款产品不可能面面俱到，但是功夫中的易筋经、咏春、长拳做为基础设施，应该具备独立使用的价值，我们希望你会愿意引入其中一些模块来加强你自己的系统。对于潜在的竞争对手，如果愿意基于功夫进行二次开发，我认为是我们的荣幸，我们也会开放正规的合作渠道，希望你也愿意自己的产品上有一个 Powered by 功夫的标记。&/p&&p&这是「非如此不可」之其六。&/p&&p&&br&&/p&&p&============&/p&&p&&br&&/p&&p&要进一步了解功夫的代码和相关文档，请关注我们在 Github 上的地址：&a href=&/?target=https%3A///taurusai/kungfu& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/taurusai/kun&/span&&span class=&invisible&&gfu&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&同时我们建立了 QQ 交流群（，入群问题答案：taurus.ai），欢迎尝鲜的朋友进来，有任何使用问题，可在群内找我们答疑。项目初创，我们暂时不会对入群进行审核，以后会根据需要定期清理，所以入群还需谨慎。&/p&
是一款为速度而生的量化交易执行系统，它能帮助对速度有极致要求的交易者大幅降低系统内延迟，内建的内存数据库会自动存储纳秒级时间精度的交易相关全部数据，赋予策略师在盘后进行高精度数据研究的能力。功夫的架构设计，绝非一朝一夕的灵感突发，而…
&figure&&img src=&/v2-b66ae3d3ad194f9d4da85e84_b.jpg& data-rawwidth=&791& data-rawheight=&383& class=&origin_image zh-lightbox-thumb& width=&791& data-original=&/v2-b66ae3d3ad194f9d4da85e84_r.jpg&&&/figure&&p&&a href=&/?target=https%3A///taurusai/kungfu& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&功夫开源版&i class=&icon-external&&&/i&&/a& 上线后，得到很多朋友的关注，其中不少人关心内存数据库易筋经的架构设计。的确，做为功夫架构中最核心的精华，易筋经的设计并不那么直观的容易理解，我就在本文对易筋经做一次初步的剖析。&/p&&p&首先我需要回答这样一个问题：为什么你的交易程序需要一个新型的数据库？这是因为，当前市面上主流的数据库，不管是SQL还是NoSQL，第一优先的核心功能是查询，他们需要解决的，是在海量数据中快速定位到你真正需要的那一条，所以在设计上，如何快速定位就成了数据结构的重点。以 &a href=&/?target=https%3A//redis.io/topics/data-types-intro& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Redis&i class=&icon-external&&&/i&&/a& 为例，它更像是一个巨大的哈希表，这导致在内存分配上注定了相邻数据不会存在连续内存区域，访问和写入数据都存在一定的开销。&/p&&p&而在金融实时交易场景下，以最快的速度处理当前最新的行情或是成交数据，才是第一优先需要考虑的，如果你同时需要保存这些数据，那么传统数据库那些难以割舍的写入耗时就会让你泪流满面。土法炼钢众会说，那我多开几个线程，用专门的线程来负责存储不就行了吗？这样看似在功能上实现了数据保存，但是系统内因此产生的诸多内存拷贝、网络冗余请求都会在不知不觉中加重你的延迟，并且臃肿的架构也会让你在数据种类增多时难以维护。&/p&&p&因此，一个可用来快速处理时间序列类型数据，并且保证存储的数据库产品就十分必需，这正是易筋经的定位目标。同时，如&a href=&/p/& class=&internal&&前文&/a&所述，由于使用了 &a href=&/?target=http%3A//man7.org/linux/man-pages/man2/mmap.2.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&mmap&i class=&icon-external&&&/i&&/a& 做为底层存储机制，易筋经还同时肩负起了进程间通信的功能，使你不再需要一个诸如 ZeroMQ 或是 Redis 这样的消息队列中间件，一举两得。&/p&&p&我注意到有些朋友难以理解 mmap 对于性能提升的意义。这个问题的确在概念上有一些含糊之处，所以特别先做说明。原则上 mmap 并不会提升你访问内存的速度，共享内存名为最快的 IPC 机制，但我们也可以使用其他的方式（&a href=&/?target=http%3A//man7.org/linux/man-pages/man2/shmget.2.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&shmget(2) - Linux manual page&i class=&icon-external&&&/i&&/a&）来创建共享内存，并不是非得以 mmap 形式；但你要理解 mmap 本质上是通过操作系统 kernel 后台进程异步完成内存内容到磁盘文件的同步操作，意味着它赋予你了一种在操作内存同时以零延时来操作磁盘文件的能力，使得你无需担心数据持久化方面的耗时，帮助我们同时完成通信和存储这两个重要任务，这是使用 mmap 方法的精髓所在。&/p&&p&下面介绍易筋经的设计方案。&/p&&p&首先我们为每个需要写数据的角色规定好属于他自己的一个写入单元（Journal），我们规定一个 Journal 只能有一个写入线程，从而保障它的进程/线程安全。写入者 Writer 在写入内容时，每一次都是通过一个原子操作在 Journal 中形成一个 Frame。Frame 结构包含一个头部（Header）信息和数据部分，Header 中定义跟该次写入有关的一些元信息，例如写入时间，数据类型等。数据部分的格式由数据类型定义，访问者利用元信息中的数据类型即可调用对应的解码器。这样，每一个 Journal 都可以看成由无数相邻 Frame 所组成的流式数据链。但是由于底层使用 mmap 进行磁盘回写，而 mmap 本身只能创建定长文件，所以我们定义每次 mmap 创建的文件为 Journal 的一个页（Page），结构如下：&/p&&figure&&img src=&/v2-c5e6b77dd4d639_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1392& data-rawheight=&221& class=&origin_image zh-lightbox-thumb& width=&1392& data-original=&/v2-c5e6b77dd4d639_r.jpg&&&/figure&&p&每个 Page 是一个定长的文件（目前在功夫中我们定义为 128MB 大小），易筋经会根据使用者需要进行拼接，使得访问者透明的得到一个无限长（当然，真正的容量上限取决于磁盘大小）的 Journal：&/p&&figure&&img src=&/v2-1c7b17f35f1dee366c0e_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1382& data-rawheight=&207& class=&origin_image zh-lightbox-thumb& width=&1382& data-original=&/v2-1c7b17f35f1dee366c0e_r.jpg&&&/figure&&p&在每次读写进行到 Page 边界的时候，易筋经需要小心进行一系列细节操作，使得访问者可以无缝的切换到下一个 Page，涉及到诸如调用 mmap 创建新的内存映射文件，对内存映射文件进行预处理等，这些操作往往相当耗时（毫秒级别），我们无法在实时读写数据时承受这个负担。易筋经的解决方案，是在后台启动并维护一个 PageEngine 进程，该进程负责提前载入缓存一些备用 Page，在需要时便可以立刻交付使用。在这种结构设计下，由于我们是夸进程的申请、分配、释放资源，所以需要多做一些安保工作，确保资源不会泄漏。PageEngine 内部会小心的记录申请者的进程编号 pid ，定期查询客户进程是否仍然健康存在，发现僵尸进程则会对其申请的资源进行释放操作。&/p&&p&至此，易筋经就具备了基础的数据读写能力。我们限定每个 Journal 只能有一个写入线程，但是可以有任意多个读取线程。一般而言每个写入线程都对应了一种特定的应用，例如行情接收，交易下单等。对于应用层的策略程序来说，往往需要关注多个 Journal，例如你很可能需要同时根据最新的行情和上一次的委托回报来决定下一次操作是追单还是撤单。为了支持这种需求，易筋经提供了一个特殊的 Journal Reader API，可以透明的把多个独立的 Journal 合并成一个虚拟的单独 Journal，使得在这个合并 Journal 中可以读取到各种不同 Writer 写入的数据：&/p&&figure&&img src=&/v2-7c83ecd246999aadabc5ccd7_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1032& data-rawheight=&586& class=&origin_image zh-lightbox-thumb& width=&1032& data-original=&/v2-7c83ecd246999aadabc5ccd7_r.jpg&&&/figure&&p&&br&&/p&&p&如上，我们就拥有了一整套支持极速读写时间序列流式数据，保证零延时存储，且支持最低延迟跨进程通信的解决方案，这就是易筋经的基础架构。需要注意的是，这个相当简洁的设计，在实现上仍有相当多的细节需要打磨，我们希望以开源的形式接受更广泛的审核和检验，来确保易筋经最终是一个工业级的数据库产品。&/p&&p&除了上述特性外，需要强调的是，当共享内存通信和实时存储这两个特点完美结合到一起的时候，实际上还根本的改变了整个系统数据处理的方式。我们知道典型的交易应用里数据流动的形态是，柜台 API 从网络接受数据，分发至策略线程进行运算处理，产生交易信号后调用柜台 API 发送下单指令，在这个模式下，系统的输入是 API 回调，输出是 API 调用，所有的中间状态都是通过临时变量的形式记录在内存里。这决定了系统运行必需依赖于外部系统（柜台）的开通和运行，并且内部状态的变更并不透明，例如你很难简单的获得系统内记录的委托单状态，除非修改程序增加暴露状态的功能。&/p&&p&在使用易筋经架构的情况下，我们事实上改变了系统的数据流动模式。系统的输入和输出，都变成了同时持久到磁盘的 Journal ，你会发现正像是它的名字所代表的那个神奇的武学秘籍一样，它突然赋予了你无数新的能力，例如：&/p&&ol&&li&获取委托单状态，无需修改交易程序，只需单独编写一个程序读取交易 Journal，里面含有所有委托请求和回报信息；&/li&&li&实时延迟计算，利用合并过的行情（MD）和交易（TD）Journal ，你可以直接获得触发委托的行情和下单记录，利于 Frame Header 中记录的纳秒时间戳便可以计算出触发这次下单的策略代码运行时间，同样的，这个功能可以在不修改、影响交易程序的情况下单独开发；&/li&&li&盘后回放，根据行情和交易记录，你可以在盘后重新运行策略程序，由于程序拥有同样的输入和运算逻辑，一定可以得到同样的输出，因为此时并非实盘交易，你便可以修改策略程序，增加不影响输出的打印语句，帮助你更好的分析和理解策略运行状态；&/li&&/ol&&p&目前易筋经的缺点在于缺乏快速查询和分析工具，每次使用易筋经访问历史数据都必须进行顺序读取，并且没有高级查询语言来进行结构化的分析工作，在这方面我们已经有了很好的思路，并计划在未来不久推出易筋经专用的查询分析工具，也欢迎大家提供建议。&/p&&p&如果你还在使用 MySQL、MongoDB 等传统型数据存储交易数据，或是使用Protobuf、ZeroMQ 等“低速”的通信方式，希望你在看完本文后会对易筋经有那么一点点心动。我们希望易筋经可以成长为一个通用的，经过广泛生产环境考验的工业级产品，因此欢迎大家对它做各种脑洞出奇的实验和使用。&/p&&p&&br&&/p&&p&============&/p&&p&&br&&/p&&p&要进一步了解功夫的代码和相关文档，请关注我们在 Github 上的地址：&a href=&/?target=https%3A///taurusai/kungfu& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/taurusai/kun&/span&&span class=&invisible&&gfu&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&/p&&p&同时我们建立了 QQ 交流群（，入群问题答案：taurus.ai），欢迎尝鲜的朋友进来，有任何使用问题，可在群内找我们答疑。项目初创，我们暂时不会对入群进行审核，以后会根据需要定期清理，所以入群还需谨慎。&/p&
上线后，得到很多朋友的关注，其中不少人关心内存数据库易筋经的架构设计。的确，做为功夫架构中最核心的精华，易筋经的设计并不那么直观的容易理解，我就在本文对易筋经做一次初步的剖析。首先我需要回答这样一个问题：为什么你的交易程序需要…
最近和一个做机器学习的朋友在交流。也就和题主类似的疑问做了些探讨。这里分享一下。&br&&br&机器学习是运用一定的样本集作为输入对模型进行训练后，达到可以对新的输入做较为准确的判断的效果。&br&&br&诚如题主所说，很多时候为了学习的准确度和简易读，会做个分类，比如按收益率的大小划分为1（涨：&3%），0（震荡-3%~3%），-1（跌&-3%）。经过实证我们发现划分的更为细致是不利于机器学习的准确性的，因为中间的模糊地带0是不太好判断出来。&br&&br&下一个问题是学习之后的模型对于新的输入判断准确率大概70%，但大部分都是0，属于无法给出交易型号的这种。这也是我们所最为头疼待解决的一个问题。&br&&br&&br&&b&&u&所以讲到这，先回答第一个问题，预测目标是什么？&/u&&/b&&br&通过准确率（胜率）来判断预测效果。至少是50%的胜率，能说明运用预测模型比简单猜测涨跌的准确概率要大。&br&&br&&u&&b&分类后如何做成策略？&/b&&/u&&br&预测涨就买和预测跌就卖出，这种简单策略没有问题。交易频繁本身也没有问题，不影响策略的好坏。至于预测的周期时间跨度长短不一样，比较长时间时期间如何执行交易，一般都是滚动做预测，所以即使周期长的策略也不会出现交易的空档期。&br&&br&&u&&b&多个分类如何选出元模式，相似性怎么度量，序列长短选取？&/b&&/u&&br&之前做过一段时间HMM，隐马尔科夫状态转换模型。元模式和序列长短的选取大致也对应了HMM模型的一些先定参数，混合正态的维度以及市场状态（不同市场模式）的个数。序列长短也是一个可控可变的参数会影响模型效果。所以一个封闭模型先定的参数如何选取能达到最佳的模型效果，这个是不能一概而论，没有标答的，甚至如果不在乎经济含义的话，去fitting参数得出最优的解也未必不可。过拟合的风险在于模型运用一段时间可能会失效，但哪里有HF真的只用一个模型而且一用十年的。短时间内或者IS一段时间能盈利，我觉得模型和参数就是ok的。&br&&br&========================================================================&br&&br&其实遇到问题更好的方式是自己去探索，哈哈码农就要统治世界了，我之前也说过学点代码是自带工具，随想随用。&br&&br&下面贴一下朋友写的机器学习的研究，包含一些源代码的分享。可以在此基础上按照自己的思路去做些探索性的研究。&br&&a href=&///?target=https%3A///post/660& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&【机器学习方法研究】——思路整理、支持向量机&i class=&icon-external&&&/i&&/a&&br&&br&以上。
最近和一个做机器学习的朋友在交流。也就和题主类似的疑问做了些探讨。这里分享一下。机器学习是运用一定的样本集作为输入对模型进行训练后，达到可以对新的输入做较为准确的判断的效果。诚如题主所说，很多时候为了学习的准确度和简易读，会做个分类，比…
&p&其实经常听见有人吐槽公司这点不好那点不好，比如有BAT想转量化的，也有其他一些私募想走的。&/p&&p&如果是BAT想转量化的，特别是BAT里面做机器学习相关想转量化的，比如我本科的一些师弟师妹，我都劝他们不要转，或许之间产生了一些误会，让他们觉得我不帮他们。但说实话，以BAT今日逆天的待遇和基本上超级稳定的工作，加上人工智能如日中天的境地，还有国家几十年长期规划的支持，我实在看不出哪家量化私募能与这样的时代大势作对去挖人。。。不是说不愿意帮忙，而是确实没必要。&/p&&p&当然，也可能现在处于人工智能泡沫阶段，突然间哪个自动驾驶的车翻落悬崖引发多米诺效应人工智能光环不再等等，就好像某斯坦福美女学生一滴血体检的公司涉嫌造假引发的生物医药危机一样。。。。不过这些东西都很难说的。。。。总之我觉得如果一个人在腾讯阿里做人工智能机器学习都不大愉快，去到任何一家私募只会更加不愉快。。。&/p&&p&比如私募过了10月份就快年底了，有些pnl还是负数的就紧张了，当然如果负数太厉害也就放弃治疗了。私募招聘广告说“基本工资20-40万，跟奖金比起来，只是零花钱”，于是很多人猜测年终奖到底是多少呢？套用互联网喜欢说多少个月奖金的，很多人想着私募是4个月还是40个月还是400个月呢？我知道哪怕广州这种量化私募低洼地区在某些特殊的年份在某些特别的基金也确实有人拿到过数千万的年终奖，但不代表他每年都有这么多，很可能今年拿了明年就被裁了。&/p&&p&对绝大多数量化私募从业人员来说，考虑的并不是年底的奖金是多少个月，而是自己能不能撑到年底不被裁，或者公司能不能撑到年底不倒闭。。。因此那些BAT养尊处优惯的人未必见过这种大场面。&/p&&p&当然，在量化领域很多对公司不满的基本还是有点能力的，但不满不代表他会走。比如北上深一些牛逼一些的量化私募一般工作3年都有足够的钱买房给首付，然后就要贷款，进入漫长的房奴阶段。这个时候当然是稳定压倒一切，一个机会每年稳定就这么大几十万但不会失业，好过另外一个有可能赚几百万但也有可能失业的工作机会。很多人虽然一方面对自己公司骂的狗血淋头，但另一方面心理明白自己离开了很可能就没法获得这么高的收入了。&/p&&p&最近读了一篇文章《人到中年，职场半坡》，讲的就是很多35-45岁的人，处于公司中层管理职位，然后随着公司的兼并重组，部门划到另外一个部门，新的部门缺人干活但不缺领导，于是自己就被裁了。如果是基础的岗位各个公司都有很多，特别是量化交易类的，如果策略真的不错，很多公司都没有岗位数目限制，都愿意招这种人，但一般公司会缺量化投资经理，但不会缺量化投资总监。所以很多时候，人无远虑必有近忧，哪怕你赖着不走，说不定公司也会让你走。&/p&&p&其实现在也越来越明白为啥北大清华的奥赛牛人（不到IMO那种，但也有省一等）会喜欢去WorldQuant这类公司。一来大是美国的大对冲基金，100亿美金，虽然比不上Two Sigma，但Two Sigma也没在国内招人啊；二来它给的工资也挺高，刚毕业就有大几十万，堪比顶级的码农，很多私募虽然鄙视WorldQuant，但却给不了WorldQuant的待遇；三来说实话他家技能太单一，给的工资又高，换作其他任何公司都不可能给这种工作这么高工资的，自己自然也无法跳槽，久而久之，也就这么着了。&/p&&p&其实说实话，越是没啥名气的私募，想招人就越要花大钱。但现实往往反过来，越是大的公司越有实力给高的工资。其实如果有私募愿意直接给150万、200万的工资去美国Two Sigma挖人或许可以对私募行业的薪酬有大的提升。但大家都只给2、30万的年薪，来来去去都是这些人搞来搞去，啥也搞不出来，只会被人鄙视，于是整个行业就萎缩了，我认识很多原来做量化的又回去当码农了。&/p&&p&所以说，治乱需用重典，大佬们还是多加一些工资，促进行业良性循环吧。&/p&&p&&/p&&p&&/p&&p&&/p&&p&&/p&
其实经常听见有人吐槽公司这点不好那点不好，比如有BAT想转量化的，也有其他一些私募想走的。如果是BAT想转量化的，特别是BAT里面做机器学习相关想转量化的，比如我本科的一些师弟师妹，我都劝他们不要转，或许之间产生了一些误会，让他们觉得我不帮他们。…
&figure&&img src=&/v2-b57ab3f3c561b568ea4ff_b.jpg& data-rawwidth=&553& data-rawheight=&267& class=&origin_image zh-lightbox-thumb& width=&553& data-original=&/v2-b57ab3f3c561b568ea4ff_r.jpg&&&/figure&&p&本文作者： chengye &/p&&p&原文链接：&a href=&/?target=http%3A//.cn/forum.php%3Fmod%3Dviewthread%26tid%3D38%26extra%3D& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&研讨室 | DigQuant 专业量化研究社区&i class=&icon-external&&&/i&&/a&&/p&&br&&b&1.
趋势型网格交易法则&/b&&br&本文提出的此种趋势型网格交易法则是一种集成了出场规则的资金管理手段，可以配合各种入场条件，如：双均线入场、通道突破入场等等。&br&趋势型网格交易法则的规则：&br&（1）将资金分为10份&br&（2）达到入场条件（做多或做空），使用一份资金入场&br&（3）以做多为例：设置中线（等于入场价），按着一定规则（如：止损线=0.9*入场价）浮动止盈线和止损线，一般来说，（浮动止盈线-中线）=1.1*（中线-止损线）&br&（4）当后续的股价触发止损线，所有资金平仓出局&br&（5）当后续股价触到浮动止盈线，将中线上移到浮动止盈线，同时根据此时的中线计算新的止损线和浮动止盈线，与此同时，加码一份资金&br&（6）重复（5），直到达到条件（4），平所有仓位&br&&br&&figure&&img src=&/v2-b57ab3f3c561b568ea4ff_b.jpg& data-rawwidth=&553& data-rawheight=&267& class=&origin_image zh-lightbox-thumb& width=&553& data-original=&/v2-b57ab3f3c561b568ea4ff_r.jpg&&&/figure&&br&&br&一图胜千言！途中红色箭头表示买入，绿色箭头表示卖出，白色线是中线，红色线是浮动止盈线，绿色线是止损线。中线、浮动止盈线和止损线随着股价的波动动态地调整。&br&&br&这种资金管理方式、或者说出场规则，在震荡市的时候损失很少，一般只有10%~20%的仓位，但在牛市的时候（有趋势），仓位会慢慢放大，跟随趋势获得更高的收益！&br&&br&&b&2.
在IF 股指期货上的测试&/b&&br&回测标的：IF888 5 min 数据&br&策略规则：&br&共10份资金&br&入场：以前一日收盘价上下0.5*ATR为上下轨，突破上轨做多一份资金，突破下轨做空一份资金&br&加码与出场规则：采用趋势型网格交易法则（具体规则如第1部分所示）&br&&br&回测效果：震荡市基本不亏钱，趋势市（不论多空）资金曲线都快速上涨&br&&br&由 Auto-Trader 提供回测报告：&br&&figure&&img src=&/v2-57cb94dde6c37f78fade72_b.jpg& data-rawwidth=&787& data-rawheight=&406& class=&origin_image zh-lightbox-thumb& width=&787& data-original=&/v2-57cb94dde6c37f78fade72_r.jpg&&&/figure&&br&&br&&br&&b&3.
总结&/b&&br&本文提出了一种趋势型的网格交易法则，着眼于资金管理和出场规则，可以配合不同的入场规则。此种交易法则输入趋势型交易策略，在趋势市可以抓住趋势，加大仓位获得高收益，在震荡市减小仓位，控制亏损。
本文作者： chengye 原文链接： 1. 趋势型网格交易法则本文提出的此种趋势型网格交易法则是一种集成了出场规则的资金管理手段，可以配合各种入场条件，如：双均线入场、通道突破入场等等。趋势型网格交易法则的规则： …
&figure&&img src=&/v2-b36d8cf2bb_b.jpg& data-rawwidth=&940& data-rawheight=&449& class=&origin_image zh-lightbox-thumb& width=&940& data-original=&/v2-b36d8cf2bb_r.jpg&&&/figure&研报看多了，换个野路子。本文分享一个摘帽预期下的ST投资策略，立个flag，已入其中几只，欢迎大家抬一手。&h3&摘要&/h3&&ul&&li&首先介绍在近期市场上看到的与ST相关的怪相，比如ST戴帽后跌停，摘帽后涨停&/li&&li&随后，由怪相展开思考，希望通过已有的公告信息来预测未来上市公司被摘帽的概率，从而指导投资&/li&&li&最后，由于上市公司在年后前4个月内必须发布上一年年报，因此&b&本策略的最佳适用日期是每年的3~4月&/b&&/li&&/ul&&h3&1、近期与ST相关的怪相— 戴帽跌停&/h3&&ul&&li&日，河池化工正式被*ST，然后如下图看到的是当日跌停&/li&&li&但是值得思考的是，河池化工被*ST并不是到3月2日才知道的事，在1月24日公司就发布了业绩预告，预示着16年全年亏损1.2~1.8亿&/li&&li&此外，根据河池化工在16年3季度的财务数据也可以很简单分析出其16年净利润为正是件很艰难的是，具体可以参见社区的另一篇帖子：&a href=&/?target=https%3A//uqer.io/community/share/587c984e23a7d& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&ST股票排雷&i class=&icon-external&&&/i&&/a&&/li&&li&那么&strong&为什么非得到输入000953发现名字变为*ST河化才开始跌停呢&/strong&。。想不到其他解释，非有效市场吧&/li&&/ul&&figure&&img src=&/v2-03aafb92089d3fdebfcae27_b.jpg& data-rawwidth=&1074& data-rawheight=&1050& class=&origin_image zh-lightbox-thumb& width=&1074& data-original=&/v2-03aafb92089d3fdebfcae27_r.jpg&&&/figure&&h3&2、近期与ST相关的怪相二摘帽涨停潮&/h3&&ul&&li&日，亚星化学发布了2016年年报，报告显示其营业收入、归母净利润和年末净资产均符合摘帽的条件，而且其在更早的1月14号发布了业绩盈余的预告&/li&&li&随后，公司向上交所申请摘帽，上交所同意了，公司于2月24日停牌一天，并于2月27日复牌后改名为亚星化学（注意，在2月18日至2月24日期间股票正常交易）&/li&&li&然后就是大家看到的，2月27~3月1日股票三连板，算是今年ST摘帽概念第一枪&/li&&li&那么&strong&为什么非得到输入600319发现名字变为前面没了*ST才开始大涨呢&/strong&。。想不到其他解释，非有效市场吧&/li&&li&类似的股票还有*ST舜船，摘牌已经是明面上的事了，这几天三连板，有兴趣可以持续关注&/li&&/ul&&figure&&img src=&/v2-846d2aad6b865ba67bbfa36_b.jpg& data-rawwidth=&1011& data-rawheight=&1122& class=&origin_image zh-lightbox-thumb& width=&1011& data-original=&/v2-846d2aad6b865ba67bbfa36_r.jpg&&&/figure&&h3&3、对怪相的思考与投资启发——确定选项&/h3&&ul&&li&倘若市场真的是这么无效的，又或者说存在ST摘帽这个炒作热点，那么根据已有的公告来大致推断*ST股票被摘帽的概率应该是个不错的策略&/li&&li&假设以今天为建仓日期，那么首选要看的是现在还存在哪些股票还是*ST，但是其已经发布了16年的年报，并且营收、净利润等均满足摘帽条件的，那么这些将会是狙击的最佳选择，如下所示（截止日）&/li&&/ul&&figure&&img src=&/v2-5e35427cdb9a981a14e80b4c1c0f3b80_b.jpg& data-rawwidth=&747& data-rawheight=&249& class=&origin_image zh-lightbox-thumb& width=&747& data-original=&/v2-5e35427cdb9a981a14e80b4c1c0f3b80_r.jpg&&&/figure&&h4&说明几点&/h4&&ul&&li&要满足上一年净利润为正、净资产为正、营收不低于1000万才算基本满足摘帽条件&/li&&li&并不是这里的每一个都值得选择，还要看公司扭亏为盈的原因，有的可能是处置掉了资产、或者接受捐助之类的，选择的时候需要慎重考虑下&/li&&li&比如上面看到的河池化工在发布年报后就已经被*ST了，其余的读者自行研究吧，指得一提的是由于信息明确，这里面的大多都已经涨过一波了&/li&&/ul&&h3&4、对怪相的思考与投资启发——概率选项&/h3&&ul&&li&上面是已经发布了16年年报的，在现在这个时点（3月3日），大多数公司都是没有发布16年年报的，但是我们可以根据其发布的业绩快报和业绩预告来估算&/li&&li&说明一下，&b&业绩预告是先于业绩快报的，预告大多在1月份，但是其不确定性高，后续可能会有更改；而快报在年报发布的前几天，一般来说和最终的版本基本一致&/b&&/li&&li&那么，我们就可以分为两个层次，一个是看已经发布了业绩快报的，同时为了分析方便也列示了去}

淘宝游戏网