读懂这一篇,才算看懂了“估值百分位”
友情提醒,这篇文章有点硬核,可能会让你看不下去。但了解这些知识,能让你看清数据。
最近几年指数基金投资兴起了一股热潮,用指数估值百分位来判断指数高估或者低估,并以此判断应该买,还是应该卖。但是,你知道估值百分位怎样计算吗?你知道有哪些因素会影响计算结果吗?
什么是百分位?
百分位是一个统计学术语,研究百分位的意义在于了解一组数据的频率分布。研究百分位时有两个特别容易混淆的概念:
第一个概念 percentile(百分位)。通常是已知一组数据,求第 p 百分位的数值是多少。比如已知一个班100个学生的考试成绩,求第 50 百分位(50th percentile)的成绩是多少。计算百分位的意义是了解某一个样本集合的值的频率分布。
第二个概念 percentile rank(百分比排名)。通常是已知一组数据,求一个数据在这组数据中的百分比排名。比如已知一个班100个学生的考试成绩,求83分在该班成绩中的百分比排名(percentile rank)。计算百分比排名的意义是了解一个样本在整个样本集合中所处的位置。
了解了这两个概念,套用在估值百分位上,我们通常会有两个需求。
- 已知一个指数历史上每天的估值,求这个指数的估值中枢(或者叫估值中位数)是多少,也就是求这个指数估值的第 50 百分位是多少。知道了估值中枢,我们就可以用现在的估值和估值中枢进行比较,看看现在的估值是比较贵还是比较便宜。
- 已知一个指数历史上每天的估值,求指数最新估值在历史估值中的百分比排名(percentile rank)。知道了最新估值的百分比排名,就知道最新估值比历史上百分之多少的时间都便宜。
由此可见,我们通常看到的各个平台计算的“估值百分位”准确的说应该是“估值百分比排名”。
百分比排名的计算方法
百分比排名计算并没有统一的定义和计算公式。看到这里也许你会感觉很奇怪,看上面的例子很简单,把数据比一下大小数一下个数,再除一下不就算出来了?事实真的没有那么简单。
我们再来看一下维基百科上百分比排名的定义:
The percentile rank of a score is the percentage of scores in its frequency distribution that are equal to or lower than it.
维基百科的定义中是小于或等于该数值,但在有些地方的定义是小于该数值,另外在频率分布的算法上也没有统一定义,所以各个地方的百分比排名计算结果可能差别巨大。
举一个简单的例子来说明:已知一组数据为 [1, 2, 2, 4],请问2这个数值在这组数据中的百分比排名是多少?我看到的结果,可能是75%,可能是50%,可能是62.5%,也可能是66.7%。每一个结果都有自己的理由,关键看你需要的是哪一种含义。
百分比排名通常用的公式如下:
其中 M 为该数值在一组数据中排名,Y 为总排名个数。排名的常用算法有5种,以 [1, 2, 2, 4] 为例,5种排名算法和排名结果如下:
- 标准比赛排名(Standard competition ranking):1224
- 修改后的比赛排名(Modified competition ranking):1334
- 密集排名(Dense ranking):1223
- 顺序排名(Ordinal ranking):1234
- 分数排名(Fractional ranking):1 2.5 2.5 4
从排名结果一眼就能看出每种排名算法的差别,就不用我再详细解释了。知道排名之后,再除以总排名个数就得到了百分比排名。现在你应该清楚75%,50%,62.5%,66.7%是怎样计算出来的。
根据“修改后的比赛排名”算法,得到的百分比排名,就说明历史上有百分之多少的时间才会这么便宜,而“1-百分比排名”就说明最新估值比历史上百分之多少的时间都便宜。
影响百分比排名的其它因素
同样的估值百分比排名,代表意义并不相同。在参考各个平台计算的估值百分比排名时,有些因素必须考虑。
- 根据长时间估值计算出来的百分比排名才有意义。有些平台给只有两三年时间的指数计算估值百分位,完全是不负责任!可以说,没有经历过一轮牛熊的指数估值百分比排名,没有任何参考意义。
- 有些指数的估值数据比较集中,它们百分比排名变动非常大。因为百分比排名只反应数值大小的概率分布,不代表数值大小的波动程度。因此可能出现估值变动一点点,百分比排名变化就很大的情况。
- 使用 PE_TTM 估值的指数,可能因为净利润(E)的大幅波动,引起百分比排名的大幅波动。随着4月底A股上市公司的年报陆续公布,各个公司的净利润都会更新,各个指数的 PE_TTM 也会迅速更新,相应的百分比排名也会改变。
- 固定区间长度的百分比排名,可能会被动变化。比如采用固定的最近10年、5年区间来计算百分比排名,可能会因为10年前、5年的高点或低点数据被移除统计数据范围而被动更新。
数据不会说谎,但说谎的人会生产数据。希望今天的你看懂了上面的知识,能够有一双火眼金睛。
2 - 实盘业绩
截止2020-04-03,指数量化投资实盘收益率如下:
PS: 年化收益率根据交易记录使用 XIRR 公式计算,不考虑现金部分收益。
3 - 估值计划
本周A股小幅下跌。本周一估值计划将中证红利和创业板的已退出收益重新买入。其中创业板2.2965赎回,1.8997买入,这半份资金成本降低了17%;中证红利是将分红的资金重新买入,比直接红利再投的成本降低4%。估值计划的买卖主要是长期持有,在此基础上参考目标市值策略加入一点小的波段。这两次操作的成本也不高,卖出的创业板份额已经持有超过两年,因此赎回费为0,分红的成本也是0,只有一点申购费。
估值计划收益率走势图如下:
4 - 长赢计划
本周E大的长赢计划没有操作。
我的长赢计划150份收益率走势图如下:
本文首发于微信公众号「无问木东」。