民营企业与幸存者偏差

本贴最后更新于 2386 天前,其中的信息可能已经斗转星移

一次统计数据背离背后的逻辑和讨论

​假期里《流浪》一文流传甚广,可惜刷屏时我在跟朋友喝酒,知道这篇文章的时候,网上已被删干净。昨晚有朋友询问,我特意找出这篇文章,看了几遍,发现一个很有意思的话题,结合之前读过的几篇报告,随便写了点儿东西。

文章最核心的两张图表是**“规模以上国企和民企营收/利润增速对比”​**,分别如下:

​每张图的红框里,都有两栏数据,分别是政府公布的同比增速,和自己计算的同比数据。两张图表,反映的都是一回事:规模以上工业企业收入/利润增速的”背离“。

在这里简单解释一下什么叫背离:每年国家统计局会统计”规模以上工业企业“的经营数据。这里的”规模以上“,是指营收和利润的某种门槛,比如当前的标准是"主营业务收入在 2000 万元以上的工业企业。”

OK,标准有了,我们现在做一个假设:在 2016 年,全国只有两家企业满足”规模以上“的标准,A 收入 8000 万/年,B 收入 2000 万/年,国家统计局对 A 和 B 进行了统计,给出了两个数据:

2016 年. 主营业务收入:累计值 8000+2000=10000 万

2016 年. 主营业务收入:累计同比 10000 万 ÷2015 年 A 和 B 公司的收入之和-1

到了 2017 年,假设由于某种原因,A 收入变成了 9000 万/年,B 收入变成了 500 万/年,那么按照标准,B 不够门槛了,统计局只会统计 A,给出了两个数据:

2017 年 主营业务收入:累计值 9000 万

2017 年 主营业务收入:累计同比 9000 万 ÷8000 万-1 =12.5%

在上述计算中,统计局认为 B 公司不再满足“规模以上”的标准,因此在算累计同比时,将 2016 年的数据也做了调整,调整到只剩下 A 公司。这种调整,从逻辑严密性上来讲,并没有什么问题。

但问题在于,如果简单地用 2017 年的累计值 9000 万,除以没有调整过的 2016 年累计值 10000 万,就会得出同比增速=9000/10000-1 = 负 10% 的结论,跟调整过的同比数据 12.5%,形成了一个明显的“背离”。

事实上,这种背离现象,并不经常发生。因为在实际情况中,每年统计局要统计几万家企业,不可能突然有大量的 B 企业一夜之间就低于了“规模以上工业”的标准。但从 2017 年四季度开始,这种情况真真实实地发生了。

这个背离,就是《流浪》一文两张图要讲的东西,不过,这里面的原因和逻辑,文章并没有展开讲清楚,挺可惜的。

如此明显的“背离”,自然逃不过宏观研究者的视线。2018 年以来,几乎所有的卖方宏观研究团队都发布对“背离”现象的研究报告,比如华泰证券李超(20180627)和海通证券姜超(20180703)。其中姜超老师的研报比较全面,标题为《马太效应和幸存者偏差:工业利润增速“背离”的背后》,这里简单介绍一下研究逻辑和结论:

_1. 统计局主动”人为调高数据“的可能性较小,用大白话说就是造假的可能性很小。_这里姜超老师回顾了历史上的 4 次统计”背离“,其中 98 年、00 年、11 年的背离均为”规模以上“的标准提高导致。

98 年的调整导致企业数量从 97 年的 53.4 万家大幅缩减至 98 年的 16.5 万家(引发了 98 年和 00 年的背离),11 年的调整导致企业数量从 10 年的 45.3 万家缩减至 11 年的 32.6 万家(引发了 11 年的背离)。

_2. 2017 年这次”背离“,主要原因是”马太效应“和”幸存偏差“。_2017 年的这次背离主要原因也是:纳入统计的规模以上企业数量减少多导致。只不过,跟 98 年和 11 年不同的是,这次是由于去产能导致的亏损企业出清,大企业强者恒强,小企业每况愈下,就像我们假设的那样:A 企业从 8000 万增长到 9000 万,B 企业从 2000 万下降到 500 万。

_3. 马太效应并非唯一原因,统计数据主动去水分,也占了一定原因。_这里姜超提了两个问题:1. 去产能开始于 2016 年,但”背离“开始于 2017 年四季度;2. 无论是财政部发布的国企利润总额增速,还是 A 股非金融上市公司增速,都在 20% 以上。

2017 年四季度发生了什么,就是”从去年 4 季度开始,统计局加强了数据质量管理,剔除跨地区、跨行业重复统计数据。“ 这不仅导致了工业领域出现了”背离“,商品零售行业同样出现了背离,说明这其实是一个普遍现象。

综上所述,姜超老师的结论是:统计数据出现的”背离“,并非统计局”人为调整“,而是去产能导致的中小企业退场,出现马太效应和幸存者偏差而造成。另外,统计局的主动去水分,是导致”背离“从 2017 年四季度开始集中爆发的重要原因。

所谓幸存者偏差,就如同我们的假设中那样:A 企业从 8000 万增长到 9000 万,B 企业从 2000 万下降到 500 万,A 是幸存者,在 2017 年统计的时候,只统计了 A,而 B 的数据却隐藏在水面之下,这会给经济决策带来偏差,这就是幸存者偏差(Survivorship Bias)。

​这里面还有一个著名的二战美国空军的故事,有兴趣的同学可以去搜一搜,这里就不贴了。

读到这里,可能就会有人隐约意识到:**这类”消失“的 B 企业,是不是大多是民营企业?**对此,招商银行的丁安华老师进行了深一步的研究,并在 2018 年 9 月 6 号发布了报告《落花无言:私营经济的衰退》,在报告中,他分别统计了国有企业和民营企业的“幸存者偏差”,得出以下结论:

1. 进行供给侧改革的行业,企业数量有较大幅度的缩减。

​上述结论与我们的直觉相符,丁老师进行了量化统计,其将 11 个进行了供给侧改革的行业的企业数量全部统计出来,这种数据的严谨性值得赞叹。

**2. 国有企业的幸存者偏差比较小,私营企业的幸存者偏差比较大。**说明国有企业退出“规模以上”标准的企业很少,而私营企业退出“规模以上”标准的企业非常多。

​3. 前两个结论相结合,得出:在“规模以上统计”样本中消失的企业,主要是受供给侧改革冲击的私营企业,也就是说_2017 年四季度以来出现的背离,主要原因是供给侧改革行业中的民营企业退场。_

在报告的后面,丁老师同样列出了 ① 私营企业负债率提升 ② 私营企业利息开支上涨的数据。并进一步指出:2017 年 6 月,国有企业工业增加值当月同比增速开始超过私营企业。对于这次“超越”,丁老师起了一个名字,叫做“死亡交叉”。

​​

名字有点儿那啥。丁老师的报告的论据完整,最后的结论也呼应了题目:落花无言,私营经济的衰退。这篇报告的公众号版本,目前基本上都已经 404。​

从年初出现“背离”现象以来,到 7 月份姜超老师的报告,到 9 月份丁安华老师的报告,基本上结论已经完整而清晰:“规模以上工业”数据产生的背离,并不是“人为调(zao)整(jia)”的结果,反而真实地反映了中国经济版图的事实—在供给侧改革的领域,马太效应和强者恒强现象非常严重,中小民营企业正在退场。

​需要感谢姜超老师和丁安华老师等人扎实的研究,将这块谜题的拼图拼全。另外,统计数据背离,在微博上也有过讨论,大家可以关注魏姐 @pkuwd 的文章,《经济中的统计总量和同比》,讲的也很清楚。

但问题有两个:①11 个进行了供给侧改革的领域里民企的遭遇,是主动的“国进民退”,还是集中度提升的行业规律使然?② 这 11 个行业的民营企业,是不是能够代表全部的民营经济?

对于第一个问题,这里引用琦总 @ 股事琦谈 转发的某研究员的观点,相对比较认同,这里就不赘述了:

_​对于第二个问题,_答案也很简单:11 个行业的民营企业,是民营企业的一部分,但不是全部。

事实上,2018 年的中国,正处在第四次民营企业创业潮的果实收获阶段。这四次分别是,1984 年(代表海尔联想万科等),1992 年(代表复星碧桂园),1999 年(代表网易阿里腾讯),2011 年(代表美团小米头条)。

2018 年,第四次创业潮的企业前仆后继上市,动辄几百亿美金市值,它们无一例外都是民营企业。
你不能把美团小米们的辉煌,当成 2018 年民营企业的缩影;同样,你也不能用 11 个受供给侧改革冲击的行业里的民营企业,代表全国几十万家民企。这都不合适。

统计数据的背离,是一种“幸存者偏差”;用供给侧改革冲击的中小企业代表全体民营企业,是不是也是一种“偏差”呢?

想起了这样一个笑话:

三个人坐电梯从一楼到十楼。一个原地跑步,一个做俯卧撑,一个用头撞墙,他们都到了十楼。有人问他们是如何到十楼的?一个说是跑上来的。一个说是俯卧撑上来的。一个说是用头撞墙上来的。这个电梯,就是高速增长的中国经济,而那三个人,则是吹嘘各种成功学的企业家。

成功的时候,大家都会认为是自己的牛逼;不顺的时候,大多数人都会归咎于环境。这是人性的弱点。

拿民营企业杠杆率上升这件事来说:国有企业的杠杆率从 2013 年一季度的 85.5%,降低到 2018 年二季度的 84.2%,降低了一个多百分点;民营企业的杠杆率从 48%,增加到 51%,增加了 3 个百分点。很多文章简单得出结论:“只是为了活下去,中国民企选择流血加杠杆。”

但这个结论其实是有问题的。国企杠杆率降低,可能主要原因是煤钢行业的供给侧改革,但民企加杠杆的原因,就相对比较复杂,比如过去五年杠杆率飙升的地产三剑客恒大、融创和碧桂园,都是民营企业,他们加杠杆的动机显然并不是“活下去”。

反过来想,如果倒过来:过去五年国企的杠杆在增加,民企的杠杆在下降,恐怕值得喷的点更多:比如国企是坏孩子,违背去杠杆精神疯狂借钱,民企是好孩子,相应去杠杆号召反而被国企挤压。

没有人能否认,民营企业家,现在的情绪处于悲观的低谷,造成这方面的原因很多,比如融资、社保、环保、那啥等因素,不过作为投资者,应该理智的认清楚,哪些问题暂时无解(如融资难),哪些问题有可能解决(如社保),哪些问题需要正反两方来看(如环保),哪些问题是操心也没用的。

我之前跟朋友说过,群众对国家的情绪,也是由周期的。过去的三十年,中国人对家国民族的认同感,出现过 5 次高峰和 4 次低谷,我们现在处于第 5 次低谷当中。身处周期里的人,往往不自知,狂热会传染,悲观也会传染。

如何识别出这种周期,并跳出窠臼,为之所用,才是顶级投资人应该做的事情。巴菲特每在群众情绪周期底部,都是坚决看多美国,中国怎么样,大家还是得有自己的判断。

最后,再次推荐大家广泛阅读卖方宏观研究团队的报告,真心是宝库。我最喜欢姜超老师,可惜没机会给他在新财富上投票了。

顺祝中秋快乐,文章懒得发公号了。

​​​​

  • 经济
    33 引用 • 155 回帖 • 2 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • SpaceVim

    SpaceVim 是一个社区驱动的模块化 vim/neovim 配置集合,以模块的方式组织管理插件以
    及相关配置,为不同的语言开发量身定制了相关的开发模块,该模块提供代码自动补全,
    语法检查、格式化、调试、REPL 等特性。用户仅需载入相关语言的模块即可得到一个开箱
    即用的 Vim-IDE。

    3 引用 • 31 回帖 • 117 关注
  • 外包

    有空闲时间是接外包好呢还是学习好呢?

    26 引用 • 233 回帖 • 5 关注
  • React

    React 是 Facebook 开源的一个用于构建 UI 的 JavaScript 库。

    192 引用 • 291 回帖 • 385 关注
  • Sphinx

    Sphinx 是一个基于 SQL 的全文检索引擎,可以结合 MySQL、PostgreSQL 做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。

    1 引用 • 217 关注
  • Hibernate

    Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。

    39 引用 • 103 回帖 • 719 关注
  • 一些有用的避坑指南。

    69 引用 • 93 回帖
  • GAE

    Google App Engine(GAE)是 Google 管理的数据中心中用于 WEB 应用程序的开发和托管的平台。2008 年 4 月 发布第一个测试版本。目前支持 Python、Java 和 Go 开发部署。全球已有数十万的开发者在其上开发了众多的应用。

    14 引用 • 42 回帖 • 808 关注
  • GitHub

    GitHub 于 2008 年上线,目前,除了 Git 代码仓库托管及基本的 Web 管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑器、协作图谱(报表)、代码片段分享(Gist)等功能。正因为这些功能所提供的便利,又经过长期的积累,GitHub 的用户活跃度很高,在开源世界里享有深远的声望,并形成了社交化编程文化(Social Coding)。

    210 引用 • 2040 回帖
  • SQLite

    SQLite 是一个进程内的库,实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。SQLite 是全世界使用最为广泛的数据库引擎。

    5 引用 • 7 回帖 • 1 关注
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 345 关注
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    108 引用 • 295 回帖 • 4 关注
  • HHKB

    HHKB 是富士通的 Happy Hacking 系列电容键盘。电容键盘即无接点静电电容式键盘(Capacitive Keyboard)。

    5 引用 • 74 回帖 • 494 关注
  • TGIF

    Thank God It's Friday! 感谢老天,总算到星期五啦!

    289 引用 • 4492 回帖 • 651 关注
  • Flume

    Flume 是一套分布式的、可靠的,可用于有效地收集、聚合和搬运大量日志数据的服务架构。

    9 引用 • 6 回帖 • 651 关注
  • 链滴

    链滴是一个记录生活的地方。

    记录生活,连接点滴

    171 引用 • 3845 回帖 • 1 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖 • 2 关注
  • 以太坊

    以太坊(Ethereum)并不是一个机构,而是一款能够在区块链上实现智能合约、开源的底层系统。以太坊是一个平台和一种编程语言 Solidity,使开发人员能够建立和发布下一代去中心化应用。 以太坊可以用来编程、分散、担保和交易任何事物:投票、域名、金融交易所、众筹、公司管理、合同和知识产权等等。

    34 引用 • 367 回帖
  • PostgreSQL

    PostgreSQL 是一款功能强大的企业级数据库系统,在 BSD 开源许可证下发布。

    22 引用 • 22 回帖
  • GitLab

    GitLab 是利用 Ruby 一个开源的版本管理系统,实现一个自托管的 Git 项目仓库,可通过 Web 界面操作公开或私有项目。

    46 引用 • 72 回帖 • 2 关注
  • Google

    Google(Google Inc.,NASDAQ:GOOG)是一家美国上市公司(公有股份公司),于 1998 年 9 月 7 日以私有股份公司的形式创立,设计并管理一个互联网搜索引擎。Google 公司的总部称作“Googleplex”,它位于加利福尼亚山景城。Google 目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务。不作恶(Don't be evil)是谷歌公司的一项非正式的公司口号。

    49 引用 • 192 回帖 • 4 关注
  • C++

    C++ 是在 C 语言的基础上开发的一种通用编程语言,应用广泛。C++ 支持多种编程范式,面向对象编程、泛型编程和过程化编程。

    107 引用 • 153 回帖
  • Excel
    31 引用 • 28 回帖
  • JRebel

    JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。

    26 引用 • 78 回帖 • 677 关注
  • Unity

    Unity 是由 Unity Technologies 开发的一个让开发者可以轻松创建诸如 2D、3D 多平台的综合型游戏开发工具,是一个全面整合的专业游戏引擎。

    25 引用 • 7 回帖 • 134 关注
  • Webswing

    Webswing 是一个能将任何 Swing 应用通过纯 HTML5 运行在浏览器中的 Web 服务器,详细介绍请看 将 Java Swing 应用变成 Web 应用

    1 引用 • 15 回帖 • 643 关注
  • 锤子科技

    锤子科技(Smartisan)成立于 2012 年 5 月,是一家制造移动互联网终端设备的公司,公司的使命是用完美主义的工匠精神,打造用户体验一流的数码消费类产品(智能手机为主),改善人们的生活质量。

    4 引用 • 31 回帖 • 2 关注
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 643 关注