苍蝇不打不会自己死掉

by , at 14 October 2014, tags : 死亡率 漏报 非正常 死亡 点击纠错 点击删除
使用CN2/CN2GIA顶级线路,支持Shadowsocks/V2ray科学上网,支持支付宝付款,每月仅需 5 美元
## 加入品葱精选 Telegram Channel ##

两年前,我在知乎写下了中国在1959年至1961年,真的经历了大饥荒并且因此饿死几千万人吗?这个答案,目的是让知乎上对大饥荒非正常死亡人数的争议「到此为止」。很高兴,这两年间知乎在这个问题上没有再掀起风浪。

去年9月,我看到了江苏师范大学数学学院孙经先教授发布的文章《三年困难时期:“饿死三千万”的谣言》,声称三千万的数字是被杨继绳等人恶意传播的谣言,大饥荒时期「中国营养性死亡人数应为250万人」。

当时只觉得,这只不过是诸多垃圾中较长的一篇。但今天才发现他的质疑登上了红旗文稿以及中国社会科学报。不仅如此,杨松林(邋遢道人)根据孙经先的文章写成的翻案书《总要有人说出真相 》甚至已经由南海出版公司出版。网上搜索一下,更是惊觉这些质疑已经成了很多网民攻击“大饥荒死亡人数约为3000万”的学术依据。

这不禁让人感慨:垃圾不扫不会自己跑掉,苍蝇不打不会自己死掉。

孙经先的观点可以在《关于我国20世纪60年代人口变动问题的研究》这篇文章里找到。大致总结一下:

  1. 孙经先认为,以往研究者一般使用户籍人口数(下表第二列)来计算大饥荒死亡人数。但他发现,第二列的数字与其他数字会产生矛盾。

    简单说,一个国家在某年年底的人口,应当等于上一年年底的人口乘以(1+自然增长率)。因此,在理想状态下,我们只需要1949年的年底总人口与最后一列所有年份的人口自然增长率,就能得到所有年份的人口值。
    但是,稍加计算我们就能发现用人口自然增长率计算出来的人口和第一列的户籍人口是不相等的。在这个基础上,孙经先认为,用年底总人口来计算大饥荒死亡人数,会出现严重偏误。

  2. 到底是什么样的偏误呢?孙列出了这一张表格:

    这张表格的C列(人口自然增长数)是用人口自然增长率(B列)与户籍人口数(A列)计算出来的,D列(户籍人口增长数)是用A列,即孙经先声称有矛盾的数字逐年相减算出来的。而两者的差别放在E列,被孙定义为「人口非正常变化数」。不难发现,这个「人口非正常变化数」在55-59年非常大,累计达到1144万人,但在60-64年为负值,而后到70年代又变成了连续的正值。先正,再负,再变正,这其中难道有什么端倪?孙经先将「人口非正常变化数」逐年相加后,得到F列,即「人口非正常变化累计数」。巧合的是,该累计数在1979年时下降到了24万。也就是说,如果将「人口非正常变化数」画成面积图,那么下图的红色和蓝色部分的面积是几乎相等的。

  1. 于是,孙经先恍然大悟:所谓「人口非正常变化」,其实都是「户籍人口登记错误」。**在1960至1965年,就是有这么一大批户籍人口因种种原因漏报了,但他们在1965年至1979年又逐渐补报了回来。**为此他给出如下四个推断:

    推断1 1956-1959年期间我国出现了户籍人口大迁移活动,在大迁移中有1144万人(即表2后一列与1959年对应的数字)重报、虚报了户籍。

    推断2 1960-1964年期间上述1144万重报、虚报的户籍被注销。
    推断3 1960-1964年期间我国再次出现户籍人口大迁移活动,在这次大迁移中有1510万人(即表2最后一列与1964年对应的数字)漏报了户籍。推断2和推断3所叙述的情况导致了这一期间我国户籍统计人口非正常减少2654万人。这是这一期间我国户籍人口非正常减少的真正原因,这一原因与人口死亡无关。
    推断4 1965-1979年(主要在1970-1979年)期间,推断3中漏报户籍的1510万人又重新申报了户籍。一个漏报,一个补报,就可以把所有的「人口非正常变化」给解释干净。所以,根本没有任何「人口非正常死亡」!

  2. 户籍人口的非正常变动被漏报补报解释干净了,孙经先将目光转向每年的人口死亡率——不把59-61年的高死亡率用某种方式抹平,他仍然回避不了人口非正常死亡的计算。孙经先继续使用老办法:既然前文已经「证明」了户籍可以虚报和注销,死亡怎么就不能漏报和补报呢?这真是一个天才的想法,54-58年的人口死亡率为千分之11至千分之13,其中可能有一些漏报了;而在59、60年上升至千分之14和千分之25,虽然看起来很高,但这其中可能包括许多死亡补报。也就是说,看起来发生在60年的死亡,实际上可能发生在54-58年间。使用这种方法,孙经先轻松地将60年的高死亡率给搬运到54-58年,死亡率的高峰被抹平了。

    具体方式可见下图,下图的横轴为年份,纵轴为每年的死亡率大小:由于60年的死亡率非常高,而54-58年的死亡率没有那么高,孙经先便声称60年的高死亡人口实际上是54-58年死亡人口的补报,因此可以将60年的波峰给搬运到54-58年的波谷中,如此修改之后,各年份死亡率相等,大饥荒期间的超额死亡率也就不存在了。

好了,就凭着上面的计算,孙经先虽然贵为数学系教授,却也成功地把自己绕了进去,声称自己完全破除了「大饥荒死亡3000万」的恶毒谣言,不仅发表了论文若干,还伙同邋遢道人一起出了一本书,苦口婆心地要把「真相」告诉大家。

那么,孙经先的问题出在哪里呢?

  1. 根本没有研究使用原始的户籍人口数来计算大饥荒的死亡人数,这是因为任何一个初中毕业的人都能看出该户籍人口和其他数据存在矛盾,孙只是树立了一个不存在的靶子执着地打着。另外,孙声称自己找到了其他研究的种种问题,并要再写两篇文章反驳蒋正华和金辉的研究:

    我也不得不遗憾地指出,孙经先一篇论文都没看懂。

  2. 那么,抛开孙对其他研究的错误指责,他自己的问题出在哪里?户籍人口的漏报补报,乍一看似乎还煞有介事呢。我们一条条来看:首先,孙经先发现「人口非正常变化」在1955-1979年加总接近零,因此仅仅计算1959-1961年的「人口非正常变化」会出现错误,因为他们会在70年代之后逐渐补回来。那么「人口非正常变化」又是如何定义的?

    孙经先认为:人口非正常变化=当年年底户籍人口数-上一年年底户籍人口数*(1+当年人口自然增长率)

    因此,如果户籍人口变动(D列)和自然增长率下的人口变动(C列)不一致,孙经先便认为其中的差额属于「人口非正常变化」。也就是说,只有自然增长率之外的变化,才属于「非正常」;反过来,所有的自然增长率造成的人口变化,不管大小,都属于「人口正常变化」。

    这下大家都明白了,孙经先的计算,暗含的是这么一个假定:不管自然增长率是正的千分之20,还是突然降低到了负的千分之5,都属于「人口正常变化」,此举事实上将3000万人口的非正常死亡,全部提前「正常**」化了。**

    而讽刺的是,其他研究,包括孙经先主力攻击对象,《墓碑》的作者杨继绳,在计算大饥荒非正常死亡人数,得到3000万这个结论时,其计算对象都是「人口自然增长率的非正常变化」。

    换句话说,孙经先的计算,实际上是在从侧面检验其他研究的正确性。在长篇累牍的计算后,孙经先的结论表明,计算人口非正常死亡,只需要考虑自然增长率的变化即可,因为在1955到1979的区间内,户籍人口数字和自然增长率是没有矛盾的。

    用一个比喻来理解一下孙经先做了什么:

    要计算非正常死亡人数,就像是要趟过一条河。河上有许多桥,在这边的岸上,有一座桥的桥头叫做人口自然增长率,大部分文献从这个桥头,走到了对岸,算出了3000万这个数字。

    孙经先则另辟蹊径,他不从这座桥的桥头开始,他从十八公里外无人问津的「岁末户籍人口数」开始,进行了一大堆调整之后走到了「人口自然增长率」这个桥头。他得出结论:户籍人口数字和自然增长率是等价的。
    我真应该恭喜孙先生花了一整篇文章从一个奇怪的出发点走到了其他文献的正常出发点,但请你不要这么快就宣布胜利,拜托从你现在所在的位置继续走下去好吗?

  3. 孙经先的第二个尝试,是抹平死亡率,这更是让人瞠目结舌。重新看这幅图:

    将60年的死亡率波峰给削平,填到54-58年,看似简单,但却需要三个条件。
    **条件A,红色箭头是否成立?**我们能够将某一年的死亡率搬运到其他年份吗?或者说,**确实存在死亡漏报和死亡补报吗?**死亡漏报和死亡补报会影响统计局的死亡率数字吗?没有任何证据。如果说前面孙经先还画了一幅图,通过「人口非正常变化累计数」来证明存在户口虚报和户口注销,那么在这里,他连这一步也跳过去了,所谓的死亡漏报、补报,纯粹是孙的想象。退一步说,即便存在漏报和补报,也没有证据说明它会影响当年的死亡率数据。
    **条件B,应该从哪一年开始搬运死亡率?**在孙经先的文章里,选择了60年作为分界点:之前的年份,全部漏报,而60年则一次性补报回来。而选择60年作为分界线的原因,据孙经先自己说:「随着1958 年《中华人民共和国户口登记条例》的发布和真正落实(这一条例的真正落实是在1960 年前后),这些漏报死亡人口的户籍在1960 年前后被注销,就是一件自然的事情。」明明在58年颁布的户口登记条例,孙经先却为什么一定要认为他在60年才生效呢?他的理由很有趣:58年不生效,是因为当年颁布不会当年生效,而59年不生效,是因为要准备大跃进。按照这种随意的推论,户口登记条例当真是哪年生效都可以了。可孙经先非要它在60年落实的真正原因是什么?答案很简单,如果在59年生效,那削平的是59年的死亡率,却无法削平死亡率最高的60年(见下图),此时能削平的死亡率太少了。

    而如果61年生效,那60年的死亡率还有漏报,需要补回,反而会增高60年死亡率波峰。虽然孙经先的证据完全不能确定应该在哪一年开始所谓的「死亡率补报」,但很显然,他选择了能削平最多死亡率的一种方案。
    **条件C,54-58年漏报了多少死亡?**这是一个最为关键的内容,他决定了死亡率波谷需要填上多少死亡,以及死亡率波峰能被削平多少。孙经先如是说:「上面我们把1954-1958 年期间死亡漏报率暂定为12%,这是保守的估计。如果我们把这一期间死亡漏报率由12%继续向上调整(我们倾向于这样做),则1959-1961 年期间的死亡率就要继续下调。」也就是说,完全没有根据,非要12%不可。改变这个数字,会发生什么?见下面两幅图:

    在第一幅图中,54-58年漏报死亡率较少,平均每年2%,5年内共漏报10%,在60年只能一次性削平10%的死亡率,还不够多——60年死亡率实在太高了,得再多削一点儿!而第二幅图中,假设平均每年死亡率漏报为22%,5年共漏报110%的死亡率,此时在60年一次性补回的话,60年大部分死亡都是补报死亡了。而这好像也不太现实。所以,调试来调试去,还是固定在12%好。这恰好是一个让60年死亡率不多不少刚刚好的数字,孙经先满意地选择了它。

    来总结一下孙经先对死亡率所做的处理:为了削平60年的死亡率高峰,孙先生创造了一个没根据的概念——死亡漏报、补报;创造了两个不存在的参数——54-58年每年漏报12%,在60年一次性补回。但事实上,这三个条件既没有根据,又对结论有极大的影响,他们的组合可以创造出任何结论。孙经先只是在经过大量调试之后,选择了最适合自己结论的一组数据。
    按照孙的「模型」,别说削平60年死亡率了,再狠心点,孙甚至可以声称59-61年的死亡全部来自解放前的死亡漏报(把59-61的死亡率波峰给填到解放前去),因此三年里一个人都没死。

花了几个小时来「打苍蝇」,我已尽力,因日报和知乎不太会转发这样的文章,所以拜托各位多多人肉转发,让这样的「苍蝇」以后越来越少。

最后的最后,再重复一次,**非正常死亡三千万,这是一个客观事实,不是筹码,也不是可以让某些人搬弄是非的玩意,**到此为止吧。

编辑于 2014-10-15

最简单好用的 VPS,没有之一,注册立得 100 美金
comments powered by Disqus

See Also