数据集在估计其平均值时是如何产生偏差的？

股票入门知识 | 发布于2021-11-30

现在我们来说明诸如罗素1000这样的数据集在估计其平均值时是如何产生偏差的。注意这并不是批评罗素1000数据集，任何其他的基于在固定日期选择最大的或最小的公司方式构成的数据集都会存在相似的偏差。特别地，我们将说明利用实证平均或通过最小二乘法——当今大多数模型所采用的两个基本方法——计算期望收益，将导致期望收益的高估。在计量经济学实践中，模型是在移动的窗口上估计的。例如，估计一个多因素模型，首先要做的是在给定长度的移动窗口中估计其期望收益和协方差矩阵。预期收益可以用移动平均收益来估计。我们选择一个100期的移动窗口，如果一期代表一周，那么100期大约就是2年。

继续我们的例子，我们来选取两个移动窗口，分别在第500期和501期终止，即刚好在501期进行股票选择之前和之后。对于每个移动窗口，我们都画出所有10000个价格过程的平均值以及对应时期上AR1000的价格过程的平均值。因此，对于在500期结束的时间窗口，我们平均的是在第451期时所选择的1000个过程。而对于在501期结束的时间窗口，我们平均的是在第501期时所选择的1000个价格过程。如图4.2和图4.3所示。

正如我们在图4.2所见到的那样，所选取的1000个过程的平均值在前50期呈上升趋势，之后就与整体均值一样趋势较为平坦。然而在图4.3中我们看到，在501期选择的过程在整个时期上都呈现上升趋势。

这些走向并不反映任何真实的增长路径。实际上,由于使用上述设计方法,我们人工1创造出的随机游走路径不具有任何本质的增长态势。在图4.2和图4.3 中所呈现的增长完全是由于所选择的过程在之前的时间窗口是增长的。但这个增长是一个假的偏差。选择时点之后的平均收益为0。

为了检验这个结果,我们计算每一时刻所选的移动窗口内价格过程的平均收益以及该时刻刚结束的时期上的平均收益。因为我们考虑的是人工创造出的随机游走过程，如果样本无偏差,那么任意移动窗口的实际平均收益都应该能估计接下来时期上的预期收益。因此,移动窗口内的平均收益与移动窗口后面时期上的平均收益应该相等。然而我们所得到的结果如下:

移动窗口内的实际平均收益=0.00038698%

移动窗口后的实际平均收益=0.0030430%

图4.4给出了两种实际平均收益的图形。

点线代表了移动窗口估计的预期收益。当实施了选择规则后,收益率马上上升然后又减少,就像图4.2和图4.3中所示那样。连续线代表移动窗口后的收益。由图4.4 可以看出,由于我们仅考虑一期，移动窗口后的收益波动十分剧烈。但很明显的是,平均来讲,移动窗口后的收益比移动窗口内的收益要小。

这个差异是不容忽略的。移动窗口后的实际平均收益接近于零:相关的年化收益约为0.02%。但移动窗口内的年化收益要大于2%。这意味着,在像罗素1000这样的数据集里,将预期收益估计为过去实际收益的平均值,会高估2% ,这仅仅是由于样本偏差。

飞鲸投研从多维度分析，整理了一份《成长50》的名单，可以关注同名公众号："飞鲸投研"：feijingtouyan，进行领取（点击复制）

Tags： 003043

该文观点仅代表作者本人，飞鲸投研系信息发布平台

/阅读下一篇/

从大型数据集中进行抽样的错误有哪些？

24小时热榜

脱水研报

过期的桃李面包，都卖给了养殖场？

重要的是桃李面包的存货从来不计提减值，近10年公司一直都是这样操作的。前几天的文章我们分析过泸州老窖、洋河股份和五粮液等酒企很少计提存货跌价准备，毕竟酒越老越香
市场虽波动加剧，但锂盐价格仍处于快速上行期！

碳酸锂价格自去年10月以来快速上行带动上游锂资源的新一轮资本开支，而受矿山盐湖建设周期影响，今年率先投产项目多为上轮停滞的棕地资源。据天风证券研报分析，据中国汽
如果你想多方位了解口子窖，看这里就够了

口子酒历史悠久，底蕴深厚，是当之无愧的历史名酒。在北纬33度，黄淮腹地的濉溪县口子镇，此地水肥土沃，气候宜人，孕育了适合酿酒的五谷杂粮和微生物群。因此，口子人两
说到会省钱，终于找到了这4家上市公司！

卖菜的人说：给你多放点满2斤。数学老师说：我有两毛的零钱我买一斤半。于是，我眼看着数学老师又拿出两毛的零钱给了卖菜的人，可是那人从秤上拿下来的超重的菜只有一丁点
桌面电话市占率全球第一，牵手微软，亿联网络构筑竞争优势！

亿联网络成立于2001年，公司主要从事统一通信终端产品的研发、销售及服务。主要产品包括桌面通信终端（SIP话机）、会议产品（VCS）、云办公终端。在2020年，

名家观点

龙头大师兄|暴跌，跑不跑？

一隐秀路大佬就是这波主多南天的主力，今天下午又再度拉回，从同花顺超级盘口看它从水下一路点火，要不是大盘太弱了大概率能走出地天，上次也是在一片绝望中隐秀路大佬引导
老丁说股|下周反弹有预期，但关键的底在哪？

这一周的弱势，始于外资的大幅出逃，不过，周五的弱势，却怪不了人家，参考下北上资金，尽管深港通有一定流出，但也谈不上很大，沪港通更是流入的，所以，周五的弱，纯属于
龙头大师兄|茅台何时止跌？

以岭药业：这个票近期是一路小快步上行，到了今天终于是走了加速，明天溢价问题不大，但周四涨停也说明短线资金进来了，短期估计短线资金还会关注这里，明天预计冲高问题不
老丁说股|短期多方不怂，歇一歇再反弹

10月份已到了最后几天，三季报也进入到了最后的集中披露，而这个时候，就要注意下不及预期的雷股了。怎么规避不及预期的可能雷股？如果对个股基本面不是很了解，还真没什
老丁说股丨二次止跌临近，只需注意一前提

第二段，就是11点之后，不管是中午前的强反击，还是午后的回落，以及随后的僵持，跟北上资金的节奏几乎完全同步了，这意味着，多空双方都选择了观望，然后，才有了北上资

热点题材

需求旺盛供给极度紧张、四氯乙烯价格暴涨，四氯乙烯概念股可关注

点评：四氯乙烯价格的暴涨，主要因为供给极度紧张。国内四氯乙烯的进口依赖在40%-50%左右，受海外飓风影响，7月份四氯乙烯进口量迅速萎缩。受8月初国内公共卫生事
OPPO发布折叠机望引爆新机上市小高峰、折叠手机概念股可关注

近期折叠屏手机市场产业动向不断，除OPPO外，华为等手机大厂新款折叠屏手机也将接踵而至，新机将再迎上市小高峰。据数码博主微博爆料，小米MIX FOLD2、华为M
军队装备订购规定正式施行、产业链景气度持续提升，军队装备概念股可关注

招商证券王超认为，军工行业景气度从2020年以来加速改善，今年业绩提升明显，得到了自上而下的全面验证。中航沈飞、航发动力两大主机厂确认百亿级预收款项，同时部分中
磷化工污染被环保督察组通报、行业集中度将提高，磷化工概念股可关注

磷化工行业是国家重点环保监控行业，环保督察将推进政府和企业加大治理力度。加之磷化工行业具备较高的资金和技术壁垒，下游磷酸铁锂需求快速增长，行业有望维持高景气度。
工信部发放首张工业互联网标识服务许可证，工业互联网概念股可关注

近日发布的《中国互联网络发展状况统计报告》显示，我国工业互联网“综合性+专业性+特色性”的生态正在逐渐成型，具备一定影响力的平台已经超过100家，连接设备数超过

数据集在估计其平均值时是如何产生偏差的？

24小时热榜

最新资讯