两亿零两年的恐龙

by , at 14 August 2020, tags : 围棋 误差 美国人 贴子 点击纠错 点击删除
使用CN2/CN2GIA顶级线路,支持Shadowsocks/V2ray科学上网,支持支付宝付款,每月仅需 5 美元
## 加入品葱精选 Telegram Channel ##

2019年序:今天看到一个微信,说是长城全长21196.18千米,上次看到这个数据是7年以前的事,我当时把我以前的文章发到了微博上。这次再看见,干脆把它转到我的公众号上,希望能给更多人普及数据误差的概念。

-—————————–

2012年序:盖茨身价500亿美元,张三身价10万美元,所以盖茨与张三身价合计500.001亿美元。听起来是不是哪里不对?盖茨的身价其实只是个大约估计,每天浮动都在百万美元以上。这个.001就是一个笑话,没有任何意义。读者或许会说没有人会这么计算。实际上这样算的人很多。昨天,国家文物局公布我国历代长城总长度。“历代”“总长度”这些概念比较模糊。古时候的长度没法量,只能估计。事实上发布会上说:“北京一带古长城大约40公里左右”。这个“大约40公里左右”误差两公里以上不算多。别的部分误差可能更大。但这次公布的总长度为21196.18千米。那个.18就是一个笑话,没有任何意义。关于误差我5年前写过一个趣文,眼见不断有人犯这种错误,决定再把它拿出来晒一晒。

======================================

两亿零两年的恐龙

--万精油--

晚上随意翻换电视频道时看到一个节目叫[十的幂方](POWER OF TEN)。 这节目是让参加者回答一些问题,问题的答案都是百分数的形式。比如,有多少比例的美国人认为电视里放的职业摔跤是真的?或者,有多少比例的美国人认为应该允许摩门教徒实行他们的多妻制?等等。参加节目的一般是两人,每人给一个答案,谁的答案更接近真实答案谁赢,然后是下一个问题。所谓真实答案就是节目主持者用同样的问题事先问随机抽样的一百个美国人,得出一个百分比。我这个人对数字方面的信息特别感兴趣,这个节目一下就抓住了我,于是停止了换台,继续看下去。

有一个问题问:美国人中有多少比例的人与美国总统握过手?如果让我来答,我肯定答小于1%。让我惊讶的是两个参赛者一个答8%,一个答9%,我觉得很不可思议。更让我惊呀的是节目公布的真实答案竟然是11%。让我们来粗略地估算一下。美国现有人口3亿。3亿的11%等于3千3百万。如果总统每天与一千人握手,那他要花90年的时间才能握完这些手。总统竞选期间他或许有可能每天与一千个人握手,当上总统后如果每天与一千人握手,那他就不要干别的事了。就算把前任总统们加上,也就是说可以同时有四五个总统,每个总统平均每天也要与几百个人握手,仍然是不现实的事。从另一个角度看,11%相当于每十个人中就至少有一个与美国总统握过手。我认识的美国人不下一千人,从来没听说谁与美国总统握过手。如果用我的样品做假设检验,不要说11%,就是1%也过不了。我把这个问题告诉我的朋友,朋友说,这有什么稀奇的,美国大众对数字从来都是稀里糊涂。

我在美国生活了二十多年,对这美国大众的数字或算术水平真是不敢恭维。商店门口如果没有收银机,我想绝大多数收钱的人是算不清楚账的。有时利用排队时间,我用心算把账(包括税)算到精确到分,然后把精确到分的零钱一起给收钱的人。他们算出账后发现我给得正好,都以看外星人的眼光看我。相比之下,中国的菜农就不得了。葡萄一块四一斤,我捡出两大枝给他,他边秤边说:“两斤八两,三块九毛二,给你加几颗,四块钱就不用找了”,说话间连顿都不打一个。

不单是美国大众,有些大学生也缺乏基本算术能力。我从前教微积分的时候,一个学生在把答案从2.4小时换算成分钟的时候算错了,我扣了他一分。他来与我吵,说是这道题微积部分他是做对了的(2.4小时是对的),只不过换算成分钟的时候算错了。还说他算错的原因是因为我不让他们考试的时候用计算器。更有甚者,有个学生居然不转换,直接就把两个答案加在一起,2.4小时加18分钟等于20.4。我在他卷子上写了个"20.4 what?",扣了他五分。他跑到我办公室来大吵,说是主要答案都对,只不过加错,没有理由扣五分(总共十分)。我让他看我办公室墙上的一张照片。照片是立在美国加州一个小镇入口的牌子,上面写着,

 NEW CUYAMA

 人口------562

 海拔-----2150

 建镇于----1951

 -----------

 总和-----4663

他看后说,我不是那么笨,我知道不同的东西不能加,相同的东西要把单位统一以后才能加(看来,来找我以前做了点家庭作业)。我本来想告诉他,统一单位以后也不一定就可以加,但看他一脸的迷惑,我没有继续说下去,本来想给他讲的一个与此有关的笑话也硬给压了回去。

相同的东西统一了单位以后就总是可以相加吗?我压在肚子里的笑话讲的就是这么一个问题。说是有一个博物馆的工作人员在给一群参观者解说一个恐龙骨架。她说:“这个恐龙的年龄是两亿零两年”。有个人问她怎么能知道得如此精确。她说:“我刚到这里工作的时候,别人告诉我说这个恐龙的年龄是两亿年,我已经在此工作了两年,所以我知道它的年龄是两亿零两年”。

你或许要说,这只是一个笑话,稍微有点常识的人不会犯这种明显的错误。那我现在就来告诉你一个真实例子。

三年前在互联网的围棋新闻组里有人贴了一个关于世界围棋人口的贴子。在看这个贴子前我先介绍一下这个新闻组。互联网的围棋新闻组是一些围棋爱好者(主要是美国和欧洲)讨论围棋的地方。西方的围棋爱好者组成与中国不一样。在中国,比如成都这种围棋爱好者众多的城市,下围棋的什么样的人都有。茶馆里,公园里到处都可以看到人下围棋。在西方,围棋没有那么普及,下围棋的主要以受过高等教育的人为主。几乎所有我认识的会下围棋的美国人都是在读大学或研究生时才知道围棋的。所以,在这围棋新闻组上贴或读贴的人应该说都是受过高等教育的。这个关于世界围棋人口的贴子就是在这样一群人中贴出的。贴子说,通过仔细和努力,他在网上收集到各国围棋人口的数据。然后做了一个表格列出各国围棋人口。大至如下:

中国---10 百万

韩国---9 百万

日本---7 百万

古巴---110

智利---30

美国---15000

最后他把这些数加起来得到世界围棋总人口--26902200。

因为每个数据都是各国官方网站上的准确数据,所以大家都认为其最后的结果很可靠。而且还有不少跟贴讨论,没有人觉得有什么不对。所以我前面说这种现象并不只出现在笑话中。

我实在忍不住,在他们的讨论贴后面跟了一个贴子泼冷水。我说:“中国,韩国以及日本的数据都是以百万为单位,也就是说小于0.5个百万的数据就被忽略了。在这些数据后面去加上别的国家的110,30之类的东西没有任何意义。如果我们只是要统计世界围棋人口的话,只需要把中国,日本,韩国这三个国家的数据加在一起就行了,最多再加上一百万用来包括世界其它所有地方的围棋人口。这样得出的结果的意义不会比上面精心统计出来的结果差”。为了不激起众怒,我在后面又加了一句,“当然,这并不是说别的国家的数据就不重要。恰恰相反,数字小的国家反到更重要。因为对中国,日本和韩国来说,围棋人口已经饱和,没有太多的发展空间。而那些数字很小的国家,对围棋在世界的普及上却有很大的潜力”。

象这种把不同数量级的数加在一起的现象在别的地方也经常出现。比如对越战,韩战死亡人数的报导,有些国家精确到个位数,有的国家却以万为单位。而我们却总可以看到各种报导把这些数据加在一起。从统计意义上来说,如果一个数小于另一个数的误差范围,那么这两个数相加就没有意义,小于误差范围的差别也没有统计上的意义。因为其中任何一项的误差就可以抵消这样的差别。遗憾的是,许多人还是用这种没有意义的小差别来做重大问题的决定。最著名的例子就是2000年的总统选举。布什和戈尔在佛罗里达的的选票相差只有一千多票,有一次重新数票后甚至说相差不到500票。这500票在六百万张选票中只占不到万分之一,而事后证明各地数票(机器数票与人工数票)的误差都大于千分之一,有的地方甚至大于1%。也就是说这500票的差别远远小于数票误差。然而,就是这远远小于数票误差的差别决定了谁当美国总统。过去这七八年美国人民(或者全世界人民)都为这个结果付出了沉重代价。眼看这就要扯到政治问题,还是就此打住。

仔细观察,你会注意到这种数字问题无处不在,无时不有。如果你们家的财政总管要把年度预算精确到元,你可以告诉他(她)小心两亿零两年的恐龙从博物院跳出来找他(她)算账。

--万精油–,2007年9月

最简单好用的 VPS,没有之一,注册立得 100 美金
comments powered by Disqus

See Also

我们应该为国家陪葬

一、共产党于我有恩 有很多人活在这个国家,天天发表恨国的言论,表达各种对共产党的不满。可他们就不明白,如果没有共产党,他们连说坏话的机会都没有。 好比有一些人,天天发表对父母不满的言论。可他们就是忘了,如果没有父母,连生命都没有,恨父母的机 …

如何看待华为启动「南泥湾」项目?

知乎用户 竟无语凝噎 发表 那些说鸦片的说内卷的,一点也不幽默,而且不是坏就是蠢。 任正非是革命时代成长起来的人,熟读毛选的人,说南泥湾,是要表达发扬自力更生的精神。放着南泥湾正面的主要的历史意义不看,非要揪着瑕疵无限放大。这不是 ETC …

观察者网为什么较多发布不利于西方的内容?

知乎用户 猫之初性本熊 发表 比起 RT,观察者网那点黑简直是喷水枪, 论舆论战,还是得学毛子, 不过话说回来,别人天天高炮干你, 有个观察者网这种喷水枪也不错了, 至于发布对西方不利的内容,不然呢? 发布对西方有利的内容不就成了 NGO …