真实的谎言——我们是如何被事实和数字欺骗的?

使用CN2/CN2GIA顶级线路,支持Shadowsocks/V2ray科学上网,支持支付宝付款,每月仅需 5 美元
## 加入品葱精选 Telegram Channel ##

在新冠疫情爆发的当下,我们每天看到海量的资讯,在这些纷繁复杂的信息中,如何做出准确的判断,如何避免被误导,如何保持独立的思考,这些能力都显得无比重要,因此卫夕觉得有必要把之前的一篇关于“真实的谎言”的旧文重新推送一遍,一个有价值的公众号的特征之一就是它的文章能常读常新,欢迎关注“卫夕指北”!以下为全文——

谎言能欺骗人,但你知道不说谎也能欺骗人么?

今天我就来聊一类“真实的谎言“,这类谎言它说的每一个事实都是真的,每一个数字都是正确的,但它却能成功地欺骗我们。

如今,赤裸裸的谎言媒体和企业都已经不敢再明目张胆地使用,但今天所说的这类狡猾的“真实谎言”却大量地充斥着每个人的生活,先来几个例子大家感受一下——

  1. 我的公众号**“卫夕指北”曾经有一篇文章让我的粉丝数增长了两倍**,你会不会觉得这篇文章的确不错?

    事实上那是我第一篇文章,发文章之前我的粉丝数是60,发文章之后我转到朋友圈粉丝增长到了180,而那篇文章是如此的平庸以至于我后来都把它删掉了!

  2. 假如一个球探并不认识丁俊晖,这时候我剪辑一个视频——里边30%的片段是丁俊晖表现好的镜头,另剩下70%是丁俊晖失误的镜头,那么,这个球探一定会对丁俊晖球技评价非常一般。

  3. 一位员工向老板汇报:“因为贸易战,我们的鞋子的销量下降了两成”,另一位员工向老板汇报:“尽管有贸易战,我们鞋子的销量依然保住了八成”,神马是真相?

  4. 一位自媒体作者的简介里写道:**2006《时代周刊》年度人物、2008感动中国组委会特别大奖,**你会不会觉得他已经到了自媒体金字塔的顶端?事实上2006时代周刊年度人物是“You”,即所有网民;而2008感动中国组委会特别大奖是——“全体中国人”

  5. “美国每100个人就有89支枪,看到这个数据,你会不会觉得美国枪支泛滥极其严重,简直是人间地狱,没救了;但你看另一个数据可能就没那么担心了——美国只有31%的家庭有枪。

  6. 新医学统计证明,一个人的寿命和这个人成人后手掌大小关系密切,具体表现为——手掌大通常寿命短,而手掌小寿命则长;太奇怪了!事实是,**男性寿命通常比女性短,**而男性的手掌则通常比女性大;

  7. 如果我给你一个组数据——市一中的升学率为46.4%,市二中的升学率为40%,你会把你的孩子送到哪个学校读书?

    当然是市一中!**对不起,你选错了!****看一看下面一张表,**不管是文科升学率还是理科升学率,市一中都没有市二中高,但它的总体升学率却高于二中,你没看错,数据就是这么神奇!

  8. 在美国全部市长的平均工资为6.2万美元,而副市长却高达8.3万美元,这个数很奇怪对不对?而事实上是在美国很多小的市并没有设置副市长,只有一个薪水并不高的市长,而设置副市长的市都是较大、较富裕的市。

  9. 这个图,你是否觉着这个指标有涨有跌,总体表现较为平稳?

    但事实上,真实的表现是2020年比2019年增长了一倍!

以上案例就是卫夕总结的“真实的谎言”的九种类型——

1.公众号2倍增长——“小样本谎言”

2.丁俊晖视频——“选择性展示谎言”

3.贸易战汇报——“描述倾向谎言”

4.时代周刊自媒体——“偷换概念谎言”

5.美国枪支数——“平均数谎言”

6.手掌大小与寿命——“相关当因果谎言”

7.升学率选择——“辛普森悖论谎言”;

8.正副市长工资——“不恰当对比谎言”;

9.指标走势——“视觉误导性谎言”

下面魔术师卫夕就带你一起来揭开这些狡猾谎言背后的真面目——

一、小样本谎言

“我在过去9年里只收到过2张交通罚单”,你会不会认为我是一个极其遵守交通规则的司机?

然而事实是我上周三才拿到驾照开始开车。

小样本谎言是指用并不能代表整体的极小样本试图描述整体状况,这是一种基于真实数据说谎的典型方式,常见于多种实际场合——

  • **公司财报:**我们经常会看到某互联网公司财报公关稿里会说自己某项创新业务上季度收入增长300%,**但它不会告诉你具体数,**因为这个具体的数字可能是收入从1万增长到4万;

  • 求职简历:我收到很多简历上写“负责XX项目期间,成功让某个功能使用人数翻番”的描述,我通常会继续问“那么这个功能具体的使用人数是多少呢?****”,很多求职者往往会有一个标准的回答:“抱歉,公司有保密要求,具体数据不方便透露”,呵呵!

  • **政府宣传:**摩纳哥政府日前宣称他们是世界上第一个完成5G100%覆盖的国家,你会不会这个国家真的走在通讯科技的最前沿?而事实上,摩纳哥坐落在法国的中间,面积只有1.98平方公里 。

注意:小样本谎言并不局限于用小样本来夸张倍数,也存在用小样本扩大整体范围,下面三句话大家感受一下——

1.自2002年韩日世界杯失利后,中国队在世界杯赛场上不败纪录已经延续17年

2.纵观漫长的世界杯史,中国队总共也仅输过三次

3.即使是巴西队这样的世界强队在世界杯比赛中也仅战胜过中国队一次

二、选择性展示谎言

选择性展示是最为常见的用事实欺骗人的方法,甚至没有之一,因为它实在是太常见了,英文中有一个词叫“Half-truth”,即给你看的部分是真的,但它只是事实的一部分,下面这张图很好地阐释了选择性展示——

我通常不看图书扉页上来自类似《纽约时报》的书评,为什么呢?

因为我知道书商的一个常见操作是——把《纽约时报》书评中好的部分挑出来,即便整个书评对这本书持否定态度:

比如书评写的是_“这是一本在情节上引人入胜的小说,但它恶俗的价值观和对女性的蔑视只能让其成为三流作品……”,书商只会在封面上印上“这是一本在情节上引人入胜的小说”——《纽约时报》,_所以大家要警惕来自外媒的书评,尤其是那些只有一句话的书评。

2007年,高露洁被英国广告标准管理局(ASA)下令禁止使用“超过80%的牙医推荐高露洁”这句宣传语,原因是因为它存在明显的误导,这个数据本身是独立而准确的,但它给消费者的感觉是——“剩下20%的牙医推荐其他品牌”,而事实上可能是——“90%的牙医推荐田七”(我随便说的,那份报告的确是牙医不止推荐一个品牌)

再看另一个例子,一些制药厂商在宣传时可能会说_“我们这款胃药和其他同类型的胃药相比,长期服用也不会对胃造成副作用”_,它宣称确实属实,但它没有告诉你的是——对胃是没有负作用,但是对肝有。

为什么很多人说:百度的财报新闻要去腾讯看,而腾讯的财报要去百度看,就是因为发在自家网站的新闻通常只会选择性展示财报中的利好。

现在,我终于理解我那经常看《参X消息》的高中地理老师为什么天天那么激动了!

三、描述倾向谎言

语言天然有着神奇的魔力,当我们的叙述方式发生微妙变化的时候,意思也就完全不同了,而这一点经常被很多语言大师所运用——

曾国藩率领湘军与太平天国作战,曾多次吃败仗,于是曾国藩上书朝廷,奏折提到“屡战屡败”,但被他的幕僚李元度看到之后将“屡战屡败”改为“屡败屡战”,**这次改动被传为佳话,因为它显示其奋勇无畏的作战精神,**然而现实中却被大量的人和企业用于刻意地欺骗。

胡适先生说“历史是任人打扮的小姑娘”,而事实又何尝不是呢,比如:

“三陪女白天去大学上课”,“女大学生晚上去当三陪女”这其实描述的是同一件事,但从不同的角度叙述则含义完全不一致了。

有一次我家LD和闺蜜聚会去了,我准备给她发一条消息——“亲爱的,你不在,家里好冷清!”,结果手一抖发成了——_“亲爱的,你不在,家里好清静!”__……._不说了,我现在那跪键盘的膝盖还隐隐作痛;

当年罗永浩之所以要和做测评的王自如约战优酷,就是因为老罗认为王自如在测评T1的时候用了大量不易察觉的倾向性的表述将锤子T1描述成一款不合格的产品。

“我能在祈祷的时候抽烟吗?”、“不能!”;

“那我能在抽烟的时候祈祷吗?”、“可以”。

四、偷换概念谎言

偷换概念谎言其实源于我们对于书面表达的迷信,不同于我们日常使用的口头表达,书面表达体系长期用于严肃场合因而形成了一种天然的可信度,于是它就常被用来编织真实的谎言——

公众号“吓脑湿”举过一个例子——有人这样描述自己的互联网运营工作:

他开始打造自己的私域流量,建立了一个庞大的私域流量池,并转化成社群,在着重提升社群活跃度的同时,用心做好社群运营。” 

而实际上是——

“他用微信加好友,加了很多好友之后把他们拉进一个微信群,平时没事就在群里发些段子和沙雕图,偶尔发发广告”

如果我这么说——“我一个表妹是一个极其优秀和突出的女生,她大学毕业就成功进入一家世界五百强工作,而作为新人的她在第一年就成功化解了该公司的一个分支机构两次公关危机”

你会不会想了解一下这个优秀的年轻女生到底是如何做到的?甚至想让她给你即将毕业的弟弟传授一下经验……

而事实是,我表妹毕业后只是在麦当劳找到了一份收银的工作,而她的确成功调解过两次就餐顾客的投诉和纠纷。

下次碰到类似的谎言,你只需要对他说——“说人话!”

五、平均数谎言

马克吐温说过一句名言——“有三种谎言:谎言,该死的谎言和统计数据”,平均数也是统计数据中极具迷惑性的常用术语。

平均数谎言常见于各类不专业的媒体,比如腾讯2019年Q1发财报,**显示员工人数5.46万,而腾讯的薪酬支出为116亿,**由此媒体计算并制造出“腾讯员工平均月薪7万”的新闻,不仅大众炸锅,很多腾讯员工也直呼自己被平均了。

平均数只是描述一个总体的一个指标,当这个总体分布相对均匀的时候,平均数是有意义的,而当其分布及其不均匀时,用平均数试图描述每个人状况就不适合了,这时候中位数和众数在某种意义上更能体现分布,中位数指整体有一半比这个数高,另一半比这个数低,众数是指整体中分布最多的数。

我们看一个实际例子,假如你们宿舍5个人,毕业十年后,一个人失业,月工资0;

一个人当老板,一个月100万;

另外三人一人月入6万;

所有人月薪为0、8、8、8、100万,这时候平均数为24.8万、中位数为8万,众数也是8万,显然,中位数8万和众数8万这两个数更能描述你们宿舍的实际情况。

嗯,马云可真有钱,我和王健林加起来还没有他多。

六、把相关当因果的谎言

在很多媒体在报道数据的时候经常一个误导读者的方式就是把相关关系错当成因果关系,的确这两个关系在现实中特别容易混淆。

观察到经常看电视的孩子最暴力,就直接下结论说电视使孩子们变得更加暴力,而可能存在的另一个原因是暴力的孩子更喜欢看电视。

中世纪欧洲一直认为虱子能预防风伤感冒,因为观察到感冒的人身上通常没有虱子,而事实上是虱子对体温特别敏感,如果人发烧了,虱子就离开了。

在医学界一个典型的案例——**医学观察发现使用激素替代疗法的治疗冠心病的女性复发率率明显低于平均水平,**于是很多医生认为这个疗法肯定比其他疗法更好,但之后的随机医学试验证实恰恰相反,这个疗法效果甚至还不如普通疗法,那么这是为什呢?

原来是因为该疗法前沿且价格高昂,而接受这一疗法的女性通常社会地位和财富地位相对较高,而她们的饮食习惯的健康程度和运动量也高于普通人,因而复发率低于普通人。

为了讲清楚因果和相关这个问题,我举一个栗子——比如某个地方车祸次数和黑熊袭击从数据表现上极其相关,大家可能第一时间想到的是黑熊袭击导致了车祸的发生,但事实上他们可能有四种关系:

  • 黑熊袭击导致车祸发生

  • 车祸发生到底黑熊袭击

  • 车祸和黑熊袭击都由第三方因素(如火山爆发)引起

  • 车祸发生和黑熊袭击完全没有关系

所以之后不要看到相关的数据就认为他们之间一定是因果关系,我们要认真分析背后可能的具体原因和逻辑关系,国外有一个神奇的网站(https://tylervigen.com/)专门收集那种不可能有联系的虚假相关关系,比如这个:

“世界非商用太空发射次数和美国社会学博士授予量呈高度关系”

不要看到**“刘姥姥一进荣国府,贾宝玉初试云雨情“**,就瞎想贾宝玉的口味可真重!

七、辛普森悖论谎言

回到开头的升学率的例子,一中在文科理科升学率都低于二中的情况下,总升学率却高于二中,很多人不理解,这其实是统计学上一个经典的悖论——辛普森悖论,它是英国统计学家E.H.辛普森于1951年提出的一个经典统计学现象,即总体结论和部分结论恰好相反。

那么这是为什么呢?是因为总体和部分在结构上呈现了大的差异,而这个差异有时候也会被人来制造谎言,1991年,科罗拉多大学的统计学家 Michael L. Radelet统计了1976-1987年美国佛罗里达州的谋杀案的数据,总体结果如下:

从结果上看,白人的死刑率为11%,黑人的死刑率为7.9%,看起来在审判上并没有种族歧视,然而真相并没有这么简单。

我们如果按凶手和被害人的种族进行细分,结论就完全不一样了,具体如下:

不管被害人是白人还是黑人,只要凶手是黑人,死刑率就明显高于凶手是白人的情况;

更让人发指的是,当被害者为黑人而凶手为白人的死刑率居然为0,即这种情况一个都没有判。

那么如何避免陷入辛普森悖论呢?

答案是警惕总体结论,通过科学合理的分组来查看具体细致的数据。

八、不恰当的对比

不恰当的对比也是用事实和数据说谎的一个常见方式,即把两个看起来差不多而事实上有重要差异的数据进行比较从而得出它想要的结果——

统计学家经常举的例子——在美国对西班牙的美西战争中,美国海军的死亡率为0.9%,而同期纽约市民的死亡率为1.6%,因此这个数据被美国海军引用作为征兵广告,以此证明去当美国海军甚至比坐在家里还安全。

聪明的读者一定猜到了这个对比极具误导性的,能入伍的都是身体健康的成年男性,而纽约市的全体居民则包含老幼病残。

华为在宣传它的手机P30 Pro的时候,把手机的ISO和佳能的两款单反进行了对比,于是网友在知乎上发布**“自行车在拥堵时候的速度是兰博基尼的N倍”**进行反讽。

三星也好不到哪里去,当华为的P30 Pro的主摄像头在专业影像网站DXOMark上的评分超越三星S10+时,三星无耻地发了一张下面的图,把后置摄像头和前置摄像头的评分加起来,以显示依然超过华为——

再看一个例子——2019年7月20日,周杰伦在一众粉丝的努力下登上了微博超级话题榜首,但微博CEO来总却发了一条帖子来说明这个事件对微博的流量并没有提升,而且来总有证据——

事实上来总说的降低的0.2%的这个对比其实就并不恰当,因为来总说的下降对比的是周六和周五的数据,**而微博的流量特征是周末本来比平时低,**因此更科学的对比方式是对比这周六和上周六的流量,来总可能无意说谎,但直接对比是不恰当的。

所以,如果哪天的你上司跟你说:“我昨天连续赢了柯洁三局!”,你不要惊叹于他的棋艺,他或许是和柯洁打了三盘王者荣耀。

九、视觉误导谎言

视觉误导是指把数据变成图表过程中玩的猫腻,图表严格意义上都没有错,但它呈现给你的方式会误导你得出错误的结论,我们来看几种典型的视觉欺骗——

1.并不从0开始的Y轴

这是图片欺骗最低级最容易识别的手段,但现实中却被使用的最为广泛,目的是为了让图片走势更突出——

  • 为显示履约费用率持续走低,京东2019年Q2财报的宣传图里的Y轴是从5%而不是从0开始的:


履约费用率下降很明显有木有,其实只有1%

  • 小米在小米9的发布会上的这张图,乍一看小米9跑分遥遥领先,但仔细一看,Y轴还是被截断了:

    看起来小米9跑分是Mate20跑分的两倍多

2.刻意伸缩的Y轴

刻意拉长缩短,为的是突出或者缩小数据变化,我们来看一个典型的案例,一些反对气候变化的人士绘制了一张一百年来全球平均温度的图——

乍一看全球气温貌似一直是一条直线,并没有神马明显的变化,但一些环保人士则绘制了另一个条平均气温的图表,在下面这个图表中我们可以明显看到平均气温的上升,哪一个是真相?

3.意味深长的饼图

饼图原本是让我们清楚地看到各个部分的比例,但如果把饼图放倒,就会发生意想不到的效果,下面这张图来自爱奇艺的官方微博,直观看爱奇艺占据了市场份额的半壁江山:

如果我们把图片还原,爱奇艺的领先效果就没那么明显了——

这个技巧是如此普遍,以至于乔帮主曾经也在发布会上也使用过——

有没有发现苹果的份额19.5%比“其他”21.2%还要大

4.并不恰当的示意图

这张图片来自微软Edge浏览器官网,它把它的速度和Chrome和Firefox进行了对比,Edge的浏览速度的确领先,但在图上的领先比例被明显夸大了。

好了,以上就是卫夕总结的基于事实和数据的九种“真实的谎言”,这些谎言是如此狡猾以至于不仔细分辨普通人甚至难以察觉,而在组织这篇文章过程中卫夕其实还积累了很多十分骚气的案例,由于篇幅原因没能逐一呈现。

卫夕在这里立一个Flag——如果本篇文章分享和“好看”双双超过1000,我就把这篇文章扩充成一本书,书名就叫《真实的谎言》

一个有价值的公众号的特征之一就是它的文章能常读常新;

朋友,都看到这里了,加个关注吧!

——End——

————————————————

    关注卫夕指北,一个值得置顶的科技公众号!

卫夕

让卫夕看到你的头像!

长按二维码向我转账

让卫夕看到你的头像!

受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭,可通过二维码转账支持公众号。

最简单好用的 VPS,没有之一,注册立得 100 美金
comments powered by Disqus

See Also

前两月我国失业人数推算——从500万到两亿

关于我国的实际就业人数,一直以来其实相当缺乏公开数据。官方的城镇失业率或者调查失业率,都是瞎扯淡的数据,完全不能看。在我国几乎没有公开数据背景下,昨天晚上美国发布了最新失业数据,首次申请失业救济人数达到了330万人,乃是川普担任总统之后的最 …

【全球新冠追踪】为啥国外抄不了中国的作业?

本文分成两个部分,第一,是全球疫情情况。第二,是欧美各国为啥不能抄中国作业的原因。 一、全球疫情情况 在回答为什么国外抄不了中国的问题之前,先例行放上三张表。第一张表是我国的境外输入型病例追踪表。从3月3日以后,境外输入就成为了我国的主要确 …

中国患病率不平等:社会经济因素研究

但这种策略从未奏效,它将威胁民众生命,引发公愤,最终破坏政府信誉 1.引言 迄今为止,已有大量文献研究了社会经济地位和死亡率之间的关系。这些在美国[1,2]、加拿大[3,4]、欧洲[5,6]和中国[7,8]进行的研究,发现了社会经济弱势人群 …

很遗憾,各位看不成日本的笑话了

东鉴君 纵横日本 这些日子以来,不少中国国内的人劝在日华人「回国避难」,也的确有不少在日华人真的跑回中国去了。当然,更多的在日华人还是积极参与在日抢口罩、卫生纸的娱乐活动,战绩卓越自不必提。 由于中国人默认「不会抄作业」的日本已经陷入疫情爆 …

大数据在这次疫情防控中起了什么作用?

对政府来说,大数据支撑了疫情期间大大小小的决策。对公众来说,大数据的相关产品,提供了疫情警示。这些实效或许有希望推动大数据真正成为城市管理的主流技术手段 新冠疫情像是一场突如其来的大考,政府对大型突发公共卫生事件的应急能力摊开在大众面前,而 …