风险模型是个什么鬼
如果你做股票alpha策略,想必是离不开风险模型了。 那到底什么是风险模型(risk model)呢?我们慢慢道来。
话说,有一天,我们的alpha模型跑出来一个组合,比如是下面这样的:
所谓组合偶得之,风险谁来估。这个时候风险模型就上场了。
随之而来,一个问题,什么叫做风险?这个问题,不同的视角有不同的答案。一个一般的投资(机)者,学名散户,会告诉你,风险就是股票会往下跌啊!基本面投资者说风险就是公司的本质发生了变化;趋势投资者说,哪有什么风险,只有止损而已。那么,在我们alpha策略眼里,所谓的风险,就是你的组合预期收益率的波动率。
风险,其实就是不确定性,用统计的语言来说,不确定性就是标准差,也就是波动率。
预期收益率我们知道,就是每一个股票的预期收益率乘上股票的权重,也就是
E(R)= sum(E(S_i) * weight_i)
多说了这是预期收益率,既然是预期收益率,说白了就是一个均值。太多的时候,只知道均值是远远不够的,比较我和马云、马化腾的平均财富不要太高啊!相亲的时候我这么跟别人说,怕是会被认为是个傻子把。当然,如果对方会点统计,他肯定不会觉得我傻,反而会问我,“那么,你们的方差是多少?”。然后,我想我应该在车底,不应该在车里。
同样的,一个组合的收益率也一样,不可以只估计收益率而不去估计方差。所谓的risk model其实就是解决这个问题;而alpha model则是解决预期收益率的问题。
现在的问题就变成了,怎么去估计一个组合预期收益率的标准差。
那么,我们先来假设一下。假设组合中股票收益率的协方差矩阵我们已经知道了,记为E,那么,组合的收益率就是XEX。(建议看barra手册,公式不好打)
问题就来了,这个协方差矩阵怎么算? 显然使用每一个股票的每天的历史收益率来计算的。问题又来了,基本的统计知识告诉我们,如果这样计算协方差矩阵,有一个假设前提,就是每天的历史收益率都是一个独立同分布的抽样,然而,显然并不是。股票收益率自身存在较强的相关性,而且市场在变化:及不同分布,也不独立。
所以,这就需要引入一些数学手段了,比如new west调整,只使用近期一段时间的数据等等。
现在我们调整好了,可以开始算了,问题又来了。假设你的组合有100个股票,那么协方差矩阵就是100*100,也就是10000个参数。那么,我们如果使用一年的数据来估计协方差矩阵,结果就是100*252 = 25200,平均我们使用2.25个历史数据来估计一个参数。
显然,我们要估计的参数太多,而样本数太少。如果加大样本,那么又会有市场结构性改变导致的抽样不是同一个分布的问题。
正应为如此,风险模型才显得不那么简单。如果大家学过一点点机器学习的知识,知道碰到上面的问题的时候,有一个很当然的方法----降维度。
到这一个问题为止,就出现了三种解决方式,分别是fundmental risk model; macro risk model; statistics risk model。
fundmental risk model的典型代表就是msci barra。
这不,每个股票每天都有一个收益率么,那么我们对每个股票进行降维。每个股票都有十个风 格属性,自身的行业属性,加起来也就40+吧。那么,100个股票,最后就被降维到40+了,而且股票数目再多,也是这么点维度。具体操作,大家可以查看barra相关的文档。
macro risk model呢个人认为是fundmental model的一个超集合。你可以把很多宏观变量放到这个模型当中,譬如cpi, gdp等等,然后通过回归的方式获得一个exposure。
statistics model似乎学术界用的比较多。使用的数学工具就是PCA。这就有一个问题,维度是降下来了,但是究竟维度是什么含义并不知道。
数学公式不好打,不过相关公式什么的无所谓,收一下论文都有。
个人blog: lyx的专栏 - 第 1 页 - CSDN博客
公众号:
http://weixin.qq.com/r/CUyosK-E-PKDrevT9xkb (二维码自动识别)