Science 发表《全球公民诚信》研究，中国为什么排名倒数第一？

by , at 03 August 2020, tags : 钱包诚信邮件失物招领 点击纠错 点击删除

使用CN2/CN2GIA顶级线路，支持Shadowsocks/V2ray科学上网，支持支付宝付款，每月仅需 5 美元

## 加入品葱精选 Telegram Channel ##

知乎用户 YanYan 发表

2019.7.4 更新

在提出了初始质疑之后，这篇文章已经引发了舆论的广泛讨论。我非常荣幸的被哈佛大学的博士生袁博同学和牛津大学的李易扬同学联系，并同横跨中美欧不同国家的 10 位学生和八位教授完成了一封联名公开信，公开信的主要执笔人是剑桥大学的郑杰予，也包括了清华大学的张学工教授等多名学者的意见。在初始阶段，我的知乎回答里仅指出了邮件使用率的影响，在进一步分析以后，我们归纳总结了更多的该实验的许多缺陷，并陈述在公开信中，发给 Science 杂志主编 Valda J. Vinson。公开信的中文翻译如下：

—————————————————————————————————————

6 月 20 日，美国科学促进会（AAAS）Science 杂志上发表了一篇以 “全球城市诚实度” （Civic honesty around the globe）为题的文章（Alain Cohn，Michel André Maréchal，David Tannenbaum 和 Christian Lukas Zünd 为此文作者）。作者声称根据他们“全球范围内” 的“大规模实地试验”，研究了公民在金钱刺激下的诚信表现。这项研究以通过电子邮件上报丢失钱包的比例作为衡量诚实的指标，并以此评判了 40 个国家和地区的公民诚信度。作者在文中用一张对这些国家的降序排名图表展示了实验的结果数据，并且声称“不同国家的城市公民诚信度有很大差异”。本文在 Science 杂志上的出版表明了美国科学促进会（AAAS）认可 Cohn 等人的实验结果 “（提供了用以评判）不同国家公民诚实度差异的一个客观的衡量标准。”

我们作为科研工作者和 Science 杂志的受众，对这项研究的结果和产生的影响深感关切。我们认为文章方法论和推证逻辑上存在根本的缺陷，使其不能成为一篇严谨的学术论文。文章通过量化使用电子邮件通知失主的比率来衡量 “诚实度” 是一个缺乏逻辑基础的草率假设。首先，单一的量化指标无法衡量诚信度这样复杂多面的行为特征，有很多关键的混淆因素没有在文章中得到充分地讨论，包括邮件使用率，文化差异和语言差别等。此外，文章使用的抽样方法对于不同地区并不平衡，并且因此不具代表性。第三，作者在实验过程中，根据预实验和预期实验结果的不相符，故意地排除了一些国家（如日本），使得研究产生了确认偏误（confirmation bias）的风险。综上，我们认为“全球城市诚实度” （Civic honesty around the globe）的文章既没有“提供一个诚实度的客观衡量”，也不符严谨的社会科学研究准则。

作为科研群体的一员，我们不仅对此类工作描述的科学结果产生质疑，也对公众的潜在误读表示担忧，而这种公众的误读已经产生并且正在持续蔓延。很遗憾，作者否认了他们（及他们所属的密西根大学和苏黎世大学）对公众的解读负有责任，但尽管如此，关于这篇逻辑有缺陷，论证不严谨的文章的已经激起了对各国诚实度差异和排序的讨论，客观上对公众产生了负面影响。我们质疑这篇讨论 “全球诚实诚信度” 的文章是否有违 AAAS“维护科学及其应用严谨公正”的使命，并且未能达到科学研究的标准。

基于 AAAS 作为 “全球最大的科学共同体” 的愿景，我们认为 Science 和 AAAS 应当知悉这一问题。为了尽快中止不断产生并蔓延的对数据的混淆和误读，我们联名请求对此次事件进行彻底的调研，并且重新评估刊发的可行性。具体来说， 1）学界应当对 “全球城市诚实度” （Civic honesty around the globe）文章的准确性，特别是方法学和结论数据的展示方式进行充分讨论。 2）如果作者不能更多地对这一系列问题作出解释，文章应对全部有关“诚实性” 的结论进行纠正，并在有限的时间内公开发表在 Science 杂志上。 3）如果认定文章存在若干不符合 COPE 标准的做法，应根据 COPE 的研究发表准则对此事进行彻底的调查。Science 杂志应当尽快就此事发表编辑意见。

我们充分理解，对于文章的重新评估需要一定的时间，因此 AAAS 和 Science 及时发布的编辑意见和进行调研，将会对尽快促进科研结果的规范使用产生积极的指导作用，并且纠正公众对此文章内容的误读。涉及跨国家和地区的研究作为社会科学的重要组成部分，承载着真实、可靠、公正的社会责任。我们衷心希望可以得到您们的及时答复，也对您们对科学严谨和科学公正付出的努力表示感谢。

—————————————————————————————————————

在公开信附件中，我们总结了一份批驳在以下几个方面（限于篇幅，我只总结一下大纲）：

[A]: 使用邮件报告比率量化诚实度有根本的逻辑谬误。

[B] 除却假设有误，文章中也没有对各种相关混淆变量进行充分的讨论。

[C] 实验样本量不具备代表性，在不同国家间不平衡

[D] 文章本身存在主观确认偏差

[E] 公众的潜在误读和相关的社会影响

截至目前，主编 Vinson 已经给予了我们非常正面的回复，他支持我们投稿 Science 杂志的 Technical Comments，这样可以扩大影响力，并会要求文章作者官方回复，甚至审稿人介入。

现在大家还在紧锣密鼓地撰稿中…

感谢大家的 collaborative efforts，我很荣幸作为其中一员。

—————————————————————————————————————

以下为 6.22 原回答：

我从新闻刚出的时候就关注了这个问题。办公室的美国小伙伴一脸坏笑的把这个新闻给我看的时候，我还以为是个小道消息恶作剧，但是当我意识到这是个 science 的文章以后我的笑容就凝固了…

——————————————————————————————————————

当我第一眼看到这项研究结果，我就报以非常怀疑的态度。因为我也在成都丢过钱包，但是被完好无损的还给了前台，而且工作人员非常负责的态度让我觉得他们根本不可能是文章中描述的那样私吞财物的人。同时，成都也是这项调查的试点城市之一，所以我觉得作者的实验数据根本说不通。

在简单的浏览了这项调查以后，我一下子就注意到了一个非常大的逻辑漏洞。作者为了方便统计，只在遗失钱包里放了唯一的联系方式，就是一个电子邮箱。根据常识，不同国家使用电邮的频率完全不一样，这位作者为了方便统计，使用了西方人熟悉，但是东方人不习惯的联系方式，直接导致了观测结果的错误。因此，我昨天给文章的第一作者 Alain Cohn 取得联系，并询问关于 Email 使用度对实验结果的影响。

Cohn 教授今日很有礼貌的回答了我的疑惑，并且告诉我，他根据世界银行的跨国公司 businesses use email to interact with their customers and suppliers 当作控制变量作对比，还是发现中国的归还率最低，并且这项数据也包含在了补充资料中。随即，我指出，跨国公司使用电子邮箱的概率并不能代表正常市民和警察局，邮局。跨国公司使用电邮主要是为了和海外市场联系沟通。根据世界银行的数据，中国的跨国公司的电邮覆盖率根本不低，高达 85%，可是根据中国互联网信息中心 CNNIC 的数据，中国网民的电子邮箱使用率只有 35%。并且我向 Cohn 教授解释，中国人并不喜欢使用电子邮箱，甚至不会将电子邮箱视作一种日常联系方式，所以自然很难会给丢包的人发送邮件。Cohn 教授对我的最后一封回信中，他表示明白了数据中客观问题的存在，但是因为各个国家电子邮箱使用率的数据很难获得，所以也没有办法，然后对文章引起的歧视表示遗憾。

其实我对这样的结果还挺失望的，因为作者哪怕了解了数据的巨大问题，却并不打算为他的数据负责，哪怕是在一个非常具有影响力的期刊上，并获得了多家新闻媒体的报道。

我的印度同学也对这个数据表示不满。他认为，这样的数据对于发展中国家和人口稠密地区非常不公平。银行，警察局，邮局都非常忙，每天的人流量和欧洲一些城市完全没办法比较，所以自然不会给丢钱包的人发邮件联系。他认为该作者统计的数据没有任何学术意义。

我认为这项研究充满了欧洲人自满自大的心态（作者以及研究经费都来自瑞士，第一作者现在在密歇根安娜堡任教）并且对其他国家根本没有基本的尊重和理解，做出的实验结果更是相当荒唐，明显一种自卖自夸的宣传种族自豪的软文。Science 杂志作为最顶级的期刊，在重重的审阅之中竟然没有发现数据的问题，也体现审稿人的无知。

我真的希望有能力的人能尽快和 Science 杂志主编联系，尽早将这种 biased research 进行修改。

————————————————————————————————————————

我再贴一下 Cohn 教授发给我的最后一封回信：

Thanks a lot for the clarification, this is really helpful. I still think that email usage is a possibility for the low return rates in China, we just don’t have good international data to test this reliably.

I’m saddened to hear that some people are abusing our study to spread hatred. While this is beyond our control, I’d like to apologize for it. It was never our intention to hurt people with our study.

Best,

Alain

————————————————————————————————————————

我觉得有能力的人真的不能 remain silent，一定要向 science 杂志提出意见。这种充满偏见的研究，却拥有了非常大的影响力和话语权，真的很可怕。

知乎用户司马懿发表

如果作者换一个说法，不用「诚信」这样的道德判断，直接用数字来表述最终的结果，争议会少很多，但是可能也发不了 science。数学和统计分析本身并不能提供任何意义，我们只是利用数学和统计分析作为证据去证明论点和想法，说的太保守，就不容易发到好杂志，说的太激进，就像现在这样，所谓的「贡献」是有了，争议也来了。

因为事实上这个图并不能表明中国或者其他国家更「诚信」还是更「不诚信」。**只是说明在钱包里没有钱的情况下，中国人主动联系失主的行为频率比较低。**即便是按照作者的逻辑来说也是如此。但是这一个描述性统计图示的冲击感实在太强了。

作者提出，决定是否归还钱包由四个原因决定：

不还钱包所带来的收益
联系失主的成本
人的利他倾向
不还钱包所带来的道德成本「做贼感」，或者称之为廉耻感

这四个维度，平心而论，对于是不是归还钱包的影响因素的概括还是很全面的。这个问题下很多人的质疑「我们很忙我们哪有时间还钱包」和「中国人不习惯使用 email」都可以归结到 2 里面。

那原文的实验设计对于这四个维度的设计是什么样的呢？

1 最为简单，也是本次实验的主要干预手段「treatment」。通过随机的往钱包里面放一定数目钱所决定的。因为已经根据各个国家的发展状况对钱包里面的钱进行了调整，可以认为对于 1 的控制是令人信服的。但是要注意到一点就是作者遗漏了可能存在的「不响应」的情况，就是工作人员既不联系失主，也没有侵吞收益，而是交给一个地方比如失物招领处。

2 则是通过一系列的控制变量，比如交钱包的时候旁边是不是有电脑，以及只看旅馆数据来实现的。其实只看旅馆数据对于「中国人不习惯使用 email」这个潜在变量的控制是有效的。因为中国发达城市的酒店基本上使用 email 的频率还是很高的，很多旅馆的 invoice 本身就是用电子邮件的方式来发送。如果「中国人不习惯使用 email」真的会导致巨大差异的话，那么在只看旅馆数据之后，中国的排名应该会有显著变化。然而中国的排名并没有改变很多，只是超过了肯尼亚。如果想控制「我们很忙我们哪有时间还钱包」其实也很不算难，派另外一个 RA 在酒店呆一会，统计一下在交钱包前后的一个小时，大约客流量是多少就可以了，但是这一点作者似乎控制了不少，平心而论已经尽力的控制了，具体采用的变量像「繁忙程度」等等怎么度量的还不是很清楚。但是其实即便是控制了这一点，还有一个失物招领的问题，因为很多时候是失物招领处来选择联系的，所以单独控制大堂的忙碌程度未必非常相关。总之这个沟通成本，可能确实有遗漏变量，从而影响到左端黄点的位置。

评论区很多人说 email 习惯的问题，我在这里统一的回复一下。首先，一味的强调『中国人不用 email 』并不对本文构成根本挑战。因为如果这个偏好很强的时候，无论钱包里有没有钱，中国人应该都不用 email 联系失主才对。而事实上当钱包里有钱的时候，中国人用 email 联系失主的概率显著增加了几乎 10%。

所以中国人是会用 email 联系失主的，顶多说中国人用 email 不是习惯，所以成本比较高。而如果这是个习惯问题，那么这个习惯成本在钱包有钱无钱的时候就应该是一样的，所以钱包有钱时候归还的概率，减去钱包无钱时候归还的概率，就把中国人用 email 的习惯这个影响给减掉了。

其次，各个国家主流城市中 hotel 的邮件使用率的差异，小于各个国家非 hotel 的邮件使用率的差异，我想这个大家还是承认的吧。如果真的是 email 习惯的原因，那么只用 hotel 作为样本和用全体作为样本，中国人的数据左端应该会有很大的变化才对，然而事实是没有太多的变化，所以纠结 email 真的不是这篇文章的弱点所在。

第三，文中还用每个国家跨国公司和供应商和经销商用 Email 联系的频率作为控制变量调整了一下排名，调整之后中国的左值依然垫底，没有本质改变。所以就 Email 这个问题，作者的控制虽然说不是十全十美，但是作为这个水平的研究，是令人信服的。

3 是通过另外一个小实验，「放不放钥匙」先检验了一下，因为钥匙仅仅对失主有用，对拿到钱包的人来说毫无意义。实验结果也是正面的，放进去钥匙之后，归还钱包的概率显著提高了，说明人的利他倾向是显著的。

而 4 和 3 共同构成了实验中国民的两个维度。根据作者的框架，放钱和不放钱的归还率的差值反映了国民中不同类型人群的分布。如果人们的道德成本比较低，然而利他主义比较高（这个是可能的）那么放不放钱基本上没什么差别；然而如果人们道德成本比较高，但是不怎么利他，那么放不放钱的差别就会很大。

作者的这个实验，每个国家的起始点和金钱无关，表示的是「利他主义」。这个有参考价值的，但是受到很多看不见的因素的影响，比如失物招领处的联络习惯、「我很忙」和「这个东西不重要」的程度都没有得到很好的控制，可能会造成一定的误差。不过这也取决于「利他主义」怎么定义，是不是「不主动联系」就代表「利他主义」水平比较低？这是一个仁者见仁智者见智的问题。

左边端点和右边端点的差额，也就是「有钱的钱包」和「没钱的钱包」之间的差额也是有意义的。因为当两者相减的时候，这些看不见的因素很多就互相抵消了。而如果就比较这个差额的话，中国的排名不算高也不算低，基本上属于在中间的范围，低于北欧、高于意大利，其实和我们平常的观感还是相符的。

但是这个差额说明什么呢？这里可以看出来作者主观的实验设计了：除了钱数是确定的之外，其他两个变量：利他倾向和廉耻感都可能存在不同人之间的不同比例的变化。而干预变量只有一个，就是放钱不放钱，这个从计量经济学上来说，对利他和廉耻感是「无法识别」的，也就是不同变量的组合可以带来同一个结果。比如「我利他倾向一般，但是我廉耻感很低」所以我不联系失主；「我利他倾向很低，但是我廉耻感一般」的人也不会联系失主。

所以这个时候完全靠假设和框架的设定来决定干预到底说明了什么。其实如果把那个小实验推而广之，随机的放「钱、钥匙、钱和钥匙、无」到钱包里，这个实验会更加的圆满一些。因为钱代表廉耻感，钥匙代表利他，而无是控制组。这样的话两个因素就分的很开，甚至还可以知道他们的交叉影响。而现在的设计，我们只能把这个差异看做是廉耻感和利他共同作用的结果——其实这个参数反而更像是要度量的「公民诚信」。

说一千道一万，主要是「诚信」(Honesty) 这个帽子扣的有点冤，以及那个图示中国在最下方看的不太舒服。如果按照差值来看，中国虽然不算最突出的几个国家之一，但是中国还不错。像哈萨克斯坦，摩洛哥，加纳，肯尼亚，阿根廷，塞尔维亚，波兰这一干或者 GDP 较低或者不久前还在战乱的国家，可能迫于生活压力「廉耻感」相对比较低，然而较慢的生活节奏让他们潜在的联系成本也较低，所以体现出当钱包没钱的时候比中国有更高的归还率，但是有钱没钱变化不大。

知乎用户槿年发表

这东西到底哪里像个钱包？？？

在中国，如果有人使用廉价包装袋，里面放一点便宜的小东西，再加上联系方式，一般就是宣传赠品……

大家应该都见过教辅机构的宣传袋吧，里面有文具、本子、扇子，见人就发一袋。你要是感兴趣，就打袋子上的联系电话，不感兴趣就扔掉。

这 tm 不是一模一样吗……

况且这玩意儿只留了邮箱，邮箱是当下唯一可以不实名的通讯渠道，电话都不敢留一看就是个骗子，如果返还率高才见了鬼呢。

知乎用户 Mon1st 发表

感觉实验数据挺有意思的，特别是有现金的钱包更多人联系失主，有种意料之外，情理之中的感觉。

但是实验设计本身的逻辑经不起推敲。

假设我是酒店职员，一位**来自德语区学校的学生走进来交透明钱包给我，并用英语告诉我 TA 捡到钱包希望我处理 *。**结果失主没有收到我的邮件。作者以此作为判断我是否诚信的基础。这里的逻辑跨越有点大……

首先，我可能把钱包放在一边没有理会。那么这里测量的是某种热心程度。

其次，我可能把钱包交给本地的失物招领处而非主动联系失主。那么这里测量的是失物招领程序设计，或可理解为组织层级的热心程度。

再次，我可能对钱包表示怀疑（透明钱包里一张极简风的名片和不太可信的购物清单），认为这是恶作剧从而故意不理会。那么这里测量的是不同文化对相似情景的阐释差异。与此类似的，特别是在非英语国家，我可能没听懂 TA 说了什么，对整件事情表示不理解和怀疑。

最后，我可能不用邮箱，或者无法发送邮件至指定失主，这里测量的是邮件使用程度。其他答主已经指出作者对此项有所控制，但其使用的数据质量不佳。

诚信当然是一个方面，特别是钱包里有钱的时候，的确有可能我是自己收下了，可以反应我喜欢占小便宜。但这只是其中一种可能，在存在多种其他可以有跨国差异的相关变量时，难以根据国家排名就诚信程度本身作出有意义的推论。

来自原文补充材料：We used a total of 13 research assistants (all recruited from two German speaking universities)

知乎用户 Rune 发表

更新 3:

我不是在质疑结果，因为伟人说过 “没有调查就没有发言权”，我只是对方法很疑惑，既然是大佬做的，为什么会选择一个如此单一的判别标准（他们自己估计也注意到了，在 SI 里写了邮件使用率的影响），而且我个人很难把是否主动联系失主与是否诚信联系起来，因为他们选择的是机构，机构代为保管并不是侵占。有另一个方法进行：将钱包给柜台后，第二天另一个助手扮演失主来取回钱包，分为三种情况 - 完整取回；取回但少钱少东西；无法取回。这样至少直接和诚信联系起来了。

感谢

@小小郭

同学的补充。伟人在 1931 年进一步提出：“一，不做调查没有发言权。二，不做正确的调查同样没有发言权。”

另外我在更新 2 里举的例子是想说明至少试验应该要方法合理、控制变量、评判标准直接相关。

关于直接相关，我再举个例子：大家都知道刮大风，卖木桶的就会赚钱。但是刮风的大小和木桶的价格并不是直接关联的，你也不能通过木桶价格上涨来推测马上要刮大风。

更新 2:

让我想起我大二的时候作为被试者参加的一个关于诚信的试验（几年前的事了，细节可能会有记错）

试验的核心是模拟一种交易：甲方向乙方以 5 元的价格进货，乙方的成本是 4 元，如果进货成功就以 7 元卖出（也就是甲方赚 2 元，乙方赚 1 元）。但是乙方可以选择不发货把钱黑掉（甲方亏 5 元，乙方赚 5 元）（感谢

@财迷小 A

提醒，已修正）。甲方也可以在打钱前取消交易（忘了对乙方有没有惩罚了）。

试验一共 20 名被试者，分成两组扮演甲乙方，所有操作都在隔间的电脑上进行，你不知道对方是谁。一开始双方每人都被分配 50 元，进行十次交叉试验，最后的余额作为试验报酬给被试者。

这个试验最精明的地方在于，在双赢的情况下乙方赚的没有甲方多，会引诱乙方不诚信。而且所有条件都可以被控制，比如加入 “甲方可以把货黑掉不给乙方钱” 之类的。所有操作都在电脑上通过选项进行，可以避免语言障碍等问题。

在我看来这个试验比 “钱包试验” 要靠谱的多了

更新：

感谢评论区

@灰色幽灵

同学：（原文请移步评论区）

他们看来也在日本做了试验，发现日本不怎么主动联系失主，而是习惯交给警察。

同样是好好保管或者交给警察，在中国就是不诚信，在日本就是诚信。

“东方灯塔” 的地位算是保住了呢（手动狗头，猫头，长颈鹿头）

我对实验设计有一点不明白。

为什么选择交给各个柜台之类的地方，然后判断标准也是他们有没有发邮件

从名片的内容上看只有一个名字和邮箱，为什么没有地址和电话

他们观察的是 citizens，但是交给的是 institutions

补充材料里为什么只有 hotel ranking。

说好的五个机构呢。。

题外话：

居然没有在日本做，日本这个 “东亚文明标杆” 居然没被选作样本让我有点无法理解。如果是日本应该是在中位吧，日本不太倾向主动联系失主，只会原封不动的保存着，在自己的网站上贴个失物招领或者交给警察。（暗戳戳的想是不是在日本做的结果不好，就删掉了）

话说 science 也接受社科类的论文吗（不好意思隔行如隔山，工科狗不怎么看 science。。）

知乎用户 chenqin 发表

很多回答在这个问题上集中于讨论「中国人用不用邮件」，我觉得这没什么意义。

首先，你只知道中国人用邮件用得少，但你并不知道其他 39 个国家的邮件使用情况如何，他们使用邮件的密度如果比中国还少呢，怎么去解释？

其次，作者在他的补充材料里专门写到了对于邮件使用的讨论：

Differences in Email Usage Since our measure of civic honesty relied on recipients contacting the owner by email, one concern is that differences in exposure to email communication could be responsible for cross-country differences in reporting rates. Yet, we focused on drop-off locations in urban places and included institutions where email communication is common. In particular, hotel staff should be able to communicate via email in all parts of the world. Consequently, if email experience is a key driver of differences in reporting rates, we should see substantially less heterogeneity when we restrict our sample to hotels. However, Fig. S13 shows that this is not the case. We still observe large differences in reporting rates across countries when focusing on hotels only. As a further robustness check, we included the share of firms that use email to interact with their customers and suppliers in a country (from the World Bank Global Enterprise Survey) as an additional control variable to construct the regression-adjusted measure of civic honesty.25 Fig. S14 shows that the differences between countries remain large, and the regressionadjusted ranking is almost identical to the unconditional ranking (Spearman’s ρ = 0.950, P < 0.001 for the NoMoney condition, and ρ = 0.932, P < 0.001 for the Money condition). This suggests that experience with email communication was not a major driver of cross-country differences in reporting rates.

结合上下文，大致的意思是，作者一共选了五种上交钱包的地点，银行、剧院、酒店、警察局、邮局，这里面的银行、剧院、警察局和邮局的工作人员确实可能会因为邮件的使用而造成国别差异。

但酒店不是，作者选择的基本上都是每个国家最大的城市，这些地方的酒店工作人员是必定会使用邮件与全球旅客进行沟通的，因此作者只看了那些上交给酒店工作人员的钱包的报告率，这应该能很大程度上缩小因为邮件使用而造成的影响，结果是这样的：

看起来和原图没啥区别，次序变化也不太大。

然后作者又使用了另一个来源，来自 World Bank Global Enterprise Survey 的邮件使用率来控制报告率，去掉邮件影响后再排序，结果是这样的：

次序上还是没有什么差别。

因此，从邮件这点对论文发起质疑，不会有什么效果。

不仅仅是邮件，很多答案提到的「忙碌」，在作者的论文里也有控制。他控制了每一个收到钱包的工作人员的如下特征：

性别、年龄、忙碌程度、是否是本地人、是否会说英语、是否听明白了需要做什么、是否友善、桌上是否有电脑、在场是否有其他工作人员、在场是否有其他顾客、是否有监控、是否有保安。

所以，在发起质疑前，我建议还是先通读一遍整个论文的补充材料，毕竟是发表在 Science 上的论文，他把绝大多数漏洞还是堵上了的，

但这并不是说明这篇论文的解释就没有问题了。

真正的问题是——把钱包上交到工作人员处，然后工作人员去写邮件通知，这个过程，和诚信有多大关系？他到底和什么东西有关系？

假设我们去采访这些工作人员：什么时候你愿意去为了一个这样的「名片夹」给陌生人发送邮件？什么时候不愿意？

我脑补了一下这两个问题回答：

当我难得看见有人来上交钱包的时候，我会很重视这个事情，发送邮件。

当我对失物上交见怪不怪时，我可能不回去写这个邮件

换句话说，人们做任何事，背后的刺激都是要超过一个阈值才会去动手做，这个刺激的阈值可以理解为每天这些工作人员所经历的「背景噪声」。

那么如何来对这些工作人员每天的「背景噪声」做一个度量呢？我没有想到特别棒的指标，但是这个城市的「人口密度」应该是一个相关的变量。

人口密度越大的地区，人们之间的接触和交流越密集，这类事件的噪声阈值就越高，写邮件联系钱包失主的概率就越低。

举一个不太恰当的例子，独生子女政策刚刚实行时，总有人觉得独生子女比较脆弱敏感又「事儿逼」，理由就是没有和兄弟姐妹相处交流，总把人与人之间的小事儿当成大事情处理。那么在那些人烟稀疏的地区和人口密集的地区，可能也会存在类似的现象。

但现在这还只是一个猜测，为了验证是否正确，我从 https://science.sciencemag.org/highwire/filestream/727955/field_highwire_adjunct_files/0/aau8712_Cohn_SM.pdf 的 18 页开始，再去各个国家统计局逐个国家收集最大两个城市的人口密度，并与最后的分数交互（分数是按照图大致估算的）：

该图和我们的判断相吻合，这个关系是显著存在的，左上角的高联系率地区，人口密度相对来说都比较低，右下角的低联系城市都位于高人口密度地区。我以截距为 80 画了一条拟合线，他的拟合程度为 0.2946（图中 excel 对指定截距的拟合计算了错误的 r2）

那么，如果这个联系率确实因为「背景噪声」高度相关因而和人口密度相关的话，那些距离拟合线比较远的国家，才是真正需要关注的国家。

比如在线的左边，距离最远的依次是哈萨克斯坦、马来西亚、阿联酋、肯尼亚、加纳、南非，这些国家为什么在同样的人口密度下，联系率低了那么多？

比如在线的右边，印度为啥又以如此高的人口密度获得了那么高的联系率？

作者在补充材料里面使用邮件使用率和人均 GDP 做了两个调整，大意是使用这两个变量对排名进行调整后，和原始排名的相关程度分别高达 0.9 和 0.75，即作者想说明的这个「诚信程度」是和邮件使用和经济发达程度关系不大的。

但如果使用地区人口密度进行调整，则会出现另一番景象：

调整后的排名和调整前的相关程度立刻下降到 0.19 了，印度和中国排名变成了第一和第二名。

也就是说，这些设施所在地区的人口密度所导致的「背景噪声」，一定是一个需要考虑的 alternative explanation，在对失主联系率的影响上，他比邮件的使用和地区经济发展程度更为重要。

用与钱包失主的联系概率来衡量诚信程度，我觉得是一个挺好的主意，作者也控制了很多变量，堵上了很多漏洞。但是我认为还是可以有很多可以改进的地方，现在的结果，距离真正的「诚信」的度量还有一段距离，可能还有一些被遗漏的变量，希望作者有机会能够继续对其加以修改。

知乎用户支付宝发表

谢邀。

利益相关：相关

实名表示对这个结论不服

如最高票回复所言，

这个多国实验只能说明在钱包里没钱的情况下，

中国实验组主动联系失主的概率更低，

但不能说明中国比其他国家更不诚信。

就在今年的 6 月 6 日，

我们在郑州、上海、成都、东莞等地做了另一组实验，

设置了多个无人货柜，里面的东西可以按需借用，全凭自觉归还。

24 小时后的统计结果令人惊讶：

四个地方的按时归还率全部超过了 95％，其中郑州和东莞更是达到了 100％！

这虽然不是严谨的科学实验，但确实能反映一些问题。

视频：

[支付宝：4 年街头社会实验守信率从 62% 大幅攀升到 95%_新浪视频video.sina.cn

](https://link.zhihu.com/?target=https%3A//video.sina.cn/tech/2019-06-06/detail-ihvhiews7158597.d.html%3Fvt%3D4%26pos%3D91%26wm%3D2256_1231)

四年前，在第一届 66 信用日时，芝麻信用曾在杭州、北京进行过类似的实验，

开设无人超市，也是凭信用取货、自觉付款，结果两地的综合守信率为 62％。

这一场跨越 4 年的街头实验，过程很相似，但结果却不一致，守信率大幅提升。

在守信率达到 100％的郑州，无人信用借还柜放置在一家幼儿园门口，摆满了各种玩具，小朋友可在家长的帮助下登记姓名进行借用。

从早上 7 点开始，就有小朋友陆陆续续来借用。虽然很多孩子舍不得玩具，但最后还是全部按时归还。

有小朋友一本正经地和家长说 “借就是要还的”，还有小朋友分享了自己的玩具到柜子上。

在成都，试验当天恰好突降暴雨，许多人从春熙路附近的无人信用借还柜借了雨伞，而到了傍晚归还时间，虽然还在下雨，大家也都陆续冒雨前来归还。

甚至有一对外地情侣借了伞，下午赶火车回程时发现忘记归还，特地在网上下单，让跑腿小哥专门送回。

更有人因为不慎丢失了借用的熊猫玩具，在柜子里放了 40 块钱，并在记录本上特意注明前放在了纱巾下。

在东莞一家厂区的无人货柜里，摆满了各种按摩和美容的电子产品，深受女工欢迎，到了午饭时货柜里的 40 多件物品几乎被取空。

傍晚清点时，当天共借出 38 件产品，在约定时间内 34 件完成归还、3 件略微超时，还差一件未归还。

就在这时，预留在海报上的电话响起，一名借走卷发棒的皮具厂女工打来，称 “忙得走不开”，并承诺会半小时后归还，至此 100％的物品确认下落。

首先，自己和自己比，

我们这些年的进步有目共睹。

其次，Science 这个实验，

即便能得出「中国实验组联系失主的概率低」的结论，

也并不能由此得出中国人诚信排倒数第一，

因为中间有太多的和「诚信」无关的变量。

综上，大家不必妄自菲薄。

知乎用户山羊月发表

从社会学角度看，这个实验完全忽视了不同国家的公民由于文化习俗差异形成的和机构和工作人员不同的互动模式。

在中国，一个人丢钱包后合理地寻找逻辑是三步走：

1. 主动回到可能的丢失地点寻找。

2. 寻找无果后咨询所在地点的管理人员。

3. 再次寻找无果后咨询当地公安机构。

按照这个寻找逻辑，寻找的主体是丢失者个人，寻找的方式是从地点到人再到机构。由于这个寻找路径基本上可以被视为一个社会默认的普遍行为模式，因此相关的工作人员和机构大多也默认了这样一个逻辑：只要丢失者真心想要找回钱包，那么他或她一定会沿着这个路径和自己相遇，如此自己便不需要花费额外的精力去主动联系丢失者。

事实上，这也恰恰是这个实验设计中暴露出的问题：实验者在假装捡到钱包交还时没有要求这些机构和工作人员主动联系丢失者。

After walking into the building, one of our research assistants (from a pool of eleven male and two female assistants) approached an employee at the counter and said, “Hi, I found this [pointing to the wallet] on the street around the corner.” The wallet was then placed on the counter and pushed over to the employee. “Somebody must have lost it. I’m in a hurry and have to go. Can you please take care of it?” The research assistant then left the building without leaving contact details or asking for a receipt.

这里，我不确定在中国参与实验的研究人员是否是中国人，倘若是，那么实验人员假装捡到钱包交给机构和工作人员时应该说的是：“你能帮我处理它吗？” 之类的话。我想实验者可能故意不去暗示这些机构和工作人员要主动联系丢失者，但这种故意恰恰也在同时在中文语境下的构成一个默认的暗示，即请按照你们一般处理丢失钱包的方式处理这个钱包。而如前所述，在中国这些机构和工作人员我们社会默认的处理钱包的方式就是守株待兔，等待失主主动前来问询。

倘若实验人员是老外，那情况可能就更加复杂了，比如老外的措辞（无论中文还是英文）是否清楚？工作人员能否听懂和理解？他们看到这个只留有邮箱地址的充满违和感的透明钱包会不会觉得是老外的恶作剧？等等。甚至反过来看这个问题，会不会有一些工作人员和机构正因为是老外捡的钱包，所以就 “违背” 他们默认的行为模式，积极主动发邮件给失主？那这样一来，这种发邮件的行为就更加复杂化了，脱离了实验设计的初衷。这也是因为实验者没有考虑所在国家和地区的工作人员和机构在文化和习俗上和老外沟通和互动的差异性。这种差异性会不会形成一个影响人们行为的变量也是很难说清楚的。

退一步，我们大可以诟病说这样的守株待兔是有些不积极为人民服务，但文化和习俗铸就的互动模式的确就是这样根深蒂固。一个简单的证据是，倘若我们自己丢失钱包，我们中会有任何人去期待这些机构和工作人员主动发邮件联系我们吗？恐怕绝大多数国人下意识地反应都是遵循上文中三步走的模式去主动寻找。

但这里需要特别指出的是，不积极和不诚实绝非一个概念，且严格意义上讲这些机构和工作人员对钱包的保管本身和实验人员所要求的 “处理” 并不冲突，只不过双方对于处理这个词的理解存在文化习俗上的偏差。然而这样的偏差在实验中就会形成一个具有误导性的结论，这就是做跨国社会行为比较实验时最容易出现的问题——对于变量严格控制的需求和对所在国家和地区文化习俗的适应往往是冲突的，忽视了文化习俗的变量控制也往往会得出一个似是而非的，充满争议性的结论。

知乎用户知我罪我发表

We originally planned to include Japan but after some initial pilot testing we realized that the country was unsuitable for methodological reasons. Japan has a lot of small “police booths” where people can return lost objects. During our pilot tests, we found that Japanese citizens would not contact the owner but instead drop them off at a nearby police booth. This feature made it virtually impossible for us to assign individual wallets to particular drop-off locations.

这段话真的笑死我了

日本就要考虑风土人情，中国就不用啦

知乎用户陆仁贾发表

要是这也能上 Science，那我统计一下 SAT 考试成绩与应试者种族的关系，得出东亚人智商更高、黑人智商更低的结论，是不是该给个封面呢？

知乎用户玉米菌发表

先不说这篇论文怎么样，不少回答能看出很多人在答题之前就没怎么认真阅读原文。真要想反驳，各位得把论文基本的实验过程搞明白吧？

比如说这位：

若在中国，等价人民币与美元的购买力是否一致？如果不一致，请问如何保证这两个实验刺激的效应一致？

然而人家论文里写了啊？

We used local currencies, and to ensure comparability across countries, we adjusted the amount according to each country’s purchasing power.

大意就是：“**我们用的是本地的货币。**为了保证各个国家的可比性，我们用对应国家的购买力（purchasing power）调整货币大小。” 更别提在 Supplementary Materials 里的图表，清清楚楚的写明了他们用的是 49 元 RMB。

再比如说这位：

实验方法大致是通过遗留如上图所示的钱包，内含名片钥匙等物品，并设立有无金钱的对照。通过投放数和各渠道收到的联系数（电子邮件、当地旅店、警察局等）的对照，来进行诚信度的判断。
讲真我在路边发现这么个 “钱包”，以右图形态展示，即一个塑料膜包着一张名片。我大概会把它当成是以前路边常发的那些小广告之类的垃圾，连碰都不会碰就离开。这显然会降低统计数值。

然而人家实际的实验做法是：

Wallets were returned to one of five societal institutions: (i) banks, (ii) theaters, museums, or other cultural establishments, (iii) post offices, (iv) hotels, and (v) police stations, courts of law, or other public offices.
After walking into the building, one of our research assistants (from a pool of eleven male and two female assistants) approached an employee at the counter and said, “Hi, I found this [pointing to the wallet] on the street around the corner.” The wallet was then placed on the counter and pushed over to the employee. “Somebody must have lost it. I’m in a hurry and have to go. Can you please take care of it?” The research assistant then left the building without leaving contact details or asking for a receipt.

大致意思差不多是研究人员带着钱包走进银行 / 影院 / 博物馆 / 邮局 / 旅馆 / 警局等等地方，告诉工作人员他捡到了这个钱包。他有急事儿要做没法联系失主，请工作人员代为保管。归还的百分比以多少人给对应联系邮箱发邮件为准。

好了，怼完几位答主开始怼这个论文。

个人认为（以我的生物背景来看）各个国家样本的投放量不合理。以下人口数量来自 CIA，样本数量来自论文的 Supplementary Materials

阿联酋：人口 970 万，样本 400。
英国：人口 6510 万，样本 1132
美国：人口 3 亿 2925 万，样本 1000
中国：人口 13 亿 8468 万，样本 400 （其实是 400，不是 300。我当时貌似眼瞎看串行了。）

上述四个国家的人口和样本，我是忍着笑打出来的。人口 970 万的阿联酋能用 400 个样本作为代表，那么人口是阿联酋 100 + 倍的我国，怎么也得几万个样本吧？我不要求样本 / 国家人口数完全一样，但大致一致怎么也是要的。

2. 完全同意

@Vinceleeee

的看法，不同国家 / 文明的服务人员，对于电子邮件的接受度有可能不一样。其实这个很好验证，如果国内某个大学感兴趣的话，可以照搬 Science 这篇文章的方法，仅仅改变不同版本的联系方式，比如只有邮箱，邮箱 + 电话，邮箱 + 微信，邮箱 + QQ 号等等等等，只要能证明不同版本联系方式之间有显著差异，就能轻松驳斥 Science 论文的结论，即电子邮箱的联系数代表民众的诚实程度。

3. 对于地域广购买力差异巨大的国家（比如我国），用国家级别的购买力调整货币大小，并且测试最大几个城市的做法有些欠妥。

首先，我找了好久都没找到文章中所谓的 “adjusted the amount according to each country’s purchasing power” 究竟用的是什么数字作为购买力的体现，又是通过什么公式换算出来的最终金额。
其次，49 元在二三线城市的购买力和北京上海这种大城市是不同的。既然文章的其中一个结果为钱越少，联系失主的几率越低，那么我们是不是可以把中国人联系失主几率低解释为作者们你们算错金额了。49 元在一线大城市的购买力远远低于作者的设计，因此返还率才低？

4. 有没有一种可能，服务人员就是把丢失钱包直接扔到失物招领处，而不主动联系失主？

个人认为他们的实验其实有三种结果而不是两种。即 1）服务人员联系失主。2）服务人员认为此事和自己无关，直接把钱包扔到失物招领处。3）服务人员直接把钱包没下。第三种才是不诚信的行为，而第二种只能说是工作不认真或者没有联系失主的意识 / 规章 / 传统。如果实验是第二天失主带着自己的身份证明找上门来，服务人员矢口否认，那么评估诚信还算客观，但单单看电子邮件的收到情况，很难界定服务人员究竟是不诚实把钱拿了，还是工作不专业不上心。

更新 1：

由于

@许临风

先生和某匿名用户都关闭了评论区，我就在这里唠叨几句。

您们说的没错，文章的主旨并不在给各个国家人民的诚信排名，而是分析利己与诚信行为之间的关系。

文章摘要里就说:

Civic honesty is essential to social capital and economic development, but is often in conflict with material self-interest.

即 “公民诚信对社会和经济发展很重要，但它经常和物质上的利己相冲突”

其实倒数第二自然段中的第一句能非常好的总结他们的想法和发现：

We conducted field experiments in 40 countries to examine whether people act more dishonestly when they have a greater economic incentive to do so, and found the opposite to be true.

即 “我们在 40 个国家进行了现场试验，以检测人们是否会为了更好的经济奖励变得更不诚实（dishonestly），而事实恰恰相反”

那么问题就来了：

经济奖励（economic incentive）= 将钱据为己有 = 不诚实

诚实 = 不将钱据为己有

这时候应该测什么呢？

第二天失主带着身份证明上门询问，看看钱包（钱）还能不能完整无缺的找回来。

他们测得又是什么呢？

工作人员通过邮件主动联系失主的比例，而非工作人员不将钱据为己有（诚实）的比例。

所以您们口中的他们的结论 “人们都会倾向于交还钱多的钱包” 并不合理！

他们真正的结论是 “银行 / 影院 / 博物馆 / 邮局 / 旅馆 / 警局的工作人员倾向于主动通过邮件联系钱多钱包的主人”

至于不诚实（将金钱据为己有）的行为，谁知道呢。至少这个试验说明不了什么。没准儿实际模型是这样的呢：

知乎用户游泳健将廖昌永发表

看了那么多回答，稍微补充点大家没提到的东西，正文不长，很多东西没说，他正文边上还付了一个 supplementary materials，讲了一些正文里没的东西

连接如下：

https://science.sciencemag.org/content/sci/suppl/2019/06/19/science.aau8712.DC1/aau8712_Cohn_SM.pdf

这里面对统计进行控制变量讨论，并由分析结果得出一些结论, 讨论诚信和一些东西的关联，从 60 页开始总结陈词，我把他得出的结论翻译下，供大家笑笑：

-—————————————————————-

首先说，钱包召回率和高纬度，低气温，低海拔成正相关。所以呢，作者由此进一步提出假设，环境对社会组成和经济造成影响，从而不直接影响该地区的诚信水平。

然后呢，对温度进行分析，发现有四季变化的对诚信有正相关。

接下来对历史上的传染病史进行分析，说如果居住在历史上有过传染病史的地区，人和人之间信任会降低，会更不诚信。

再继续，对调查国家语言进行分析，因为作者认为道德水平和语言有关系，说如果该国语言里面对 “我” 这个词一般在说的时候不省略，那他们的道德水平就高，因为作者觉得不把 “我” 省略说明，该文化会鼓励从个人角度划分个人的社会背景，从而加强个人对社会的责任感。

再下来又讲了宗教，说新教会使人更容易和陌生人建立信任，与之相反的是，如果该地区家庭关系比较紧密，他们的道德就会差。

后面，讲了皿煮大法好，皿煮长就更诚信。

最后是教育史，当然基础教育越普及诚信越好

-——————————————————–

再结合看作者里面全是瑞士的，钱又是一个瑞士的研究机构出的 (Gottlieb Duttweiler Institute)，调查做成这样，我觉得大家也别怪这个作者了，估计下了指标，得给金主背书，给西方文化优越性提供论据呢，当然得发 science，不然怎么拿得出手啊

知乎用户立党发表

看了一千多个回答，这事儿从始至终最让我感到悲哀的是：

为什么基础科学和工程领域中出现严重的方法论错误，可能被直接拒稿，可能只能发二流期刊和会议，可能发到 CNS 上，但是几个月或者几年后被发现数据造假，可能会被撤稿，从此身败名裂；

而这种公然歧视和设计完全错误方法论的 paper，可以通过同行评议，可以发在 Science 这种顶级期刊上，然后同行们还没觉得有什么不对，还不会被撤稿，而且也完全没有一个人讨论这个一作（Alain Cohn）是谁，他为什么要设计这种试验出来，还大大方方地把 paper 放在了自己主页上（https://sites.google.com/site/alaincohn/home?overridemobile=true），仿佛觉得发这么一篇方法论错误又充满偏见和歧视的论文是一件非常光荣的事情。

再多说一句，中国人针对中国人的论文，最喜欢把匿名八卦扯到人身上搞点大事情，怎么面对这种标准欧美学者，就全在 “就事论事” 了呢……

知乎用户豆子彩虹爸发表

请各位大咖不要只在知乎热烈评论，Science 杂志也是有 peer review 和读者来信的。来自有影响院校、企业的同行同业提出不同意见，会降低这篇文章的可信度，让其他人在引用的时候有所考虑，最终大大减少此文章的影响力。

请知乎上各位在读或已经毕业的 PhD，各位教授副教授，各位科学家，各位学科带头人，各位知名企业大小负责人，不要客气，不要爱惜羽毛，不管你是什么学科专业，只要你对于这篇文章的采样方法，数据，论证过程等存在疑问，请去 Science 积极给这篇文章留下评论并签下自己的单位姓名。只要有理有据，言之有物，我相信大家的努力最终会取得一些效果。

我只是一个毕业多年的经济学硕士，学校在业内还算有点名气，一般我不会搬出学校字号，这次我就不要脸借用一下了，我先来。

知乎用户 Albus 发表

更新下对 Science 的认识：

今天的 Bloomberg 刊登了 Noah Smith 的一篇评论，虽然没有指出本次文章惹出的争议，但却提到了 Science 在 2008 年刊出的一个将 Ideology 和 Biology 结合起来的研究。这项研究试图表明意识形态有生理学基础 (保守派对突如其来的噪声或吓人的图片反应更大)，所以意识形态的纷争是生理上的不同导致…

最近一项的研究试图重复该实验，却并没有发现显著的结果 (08 年的研究有误)。而投稿 Science 却被 Desk Rej。理由是主编觉得研究没有足够价值…

看来是这届主编不行 [手动狗头]

……………………………………………………………

原答案：

文章的问题就不分析了，高赞答案都说的很好。我比较好奇这些作者是谁，所以去八卦了一下：

一作，Alain Cohn，瑞士的博士，手里面 AER， RES，EJ 还有 MS 还是十分惊艳的，顺着他的 CV 往下看，发现他的推荐人之一居然是 Richard Thaler…

二作，Michel Andre Mar´echal，也是瑞士的博士，但他的导师之一居然是 John List….

三作，David R. Tannenbaum，是个读社会心理学的，不好评价

四作，Christian Lukas Zünd，博士生，显然是负责打杂

尽管自己不是做行为经济的，但有这样的关系网（Thaler 和 List），找不到自己中意的 reviewer 是完全无法想象的。这种大佬随便一个 correlation 就是一个 top5（并不是说这种文章一无是处）… 在这个小圈子日渐盛行的今天，我们这些小鱼小虾就静静的看他们灌（装）水（X）好了，说不定还能曾个热度，给大佬们的研究成果做个补充，混个 field journal 的 pub 呢。

唯一值得担心的是这类研究被顶尖期刊发多了就像 Eugenics 被纳粹利用一样，会给美国国内排华制造更多弹药…

要杀住这股歪风，个人觉得给主编留言和联系作者一点用没有。借用三体的一句话：然而，神不在乎… 真正有用的是某些人有没有骨气把国家资助的项目不投 Science…

知乎用户 HY 李发表

25 日订正: 首先研究人员去过日本, 然而因为 initial pilot testing（先期测试?）中发现日本人倾向于将钱包交到小派出所所以数据没有采用。这个理由禁不禁得住推敲大家自己判断。我个人感觉完全不合适，如果这样起码应该把测试结果加到补充材料中，或者最少应该提一句，这样直接去掉对我来说有操作数据的嫌疑 (在论坛中也有来自波兰等国的网友也提出了疑问)。

@孙大湿

提到作者的 CV 中提到经费一共用了 25 万刀。原谅我实在没时间去翻作者的 CV，毕竟我也不是搞社会科学的，可能他们回收了钱包的钱。还有他也提到的因为作者是大牛的博后所以容易拿经费。单就我个人在物理领域的经验，25 万刀做一个实验也是相当大一笔钱 (而且物理领域买的设备还能重复用)，花了这么多钱实验过程和结果还这么糙的确是说不过去, 社会科学成果也很难直接转化，金主未免有点太大方了。但是可能这也解释了为什么文章能上 Science。所以我对作者和资助机构有无倾向性还是存疑。

还有最后一点，我看见在很多回答下面有人说中国人真是玻璃心，中国人都是被害妄想。这简直是莫名奇妙。这些人未免也是太大方了，连这么明显的滥用统计工具以科学为名做道德评价都可以帮人洗地。虽然打比方是个很差的论证方法，这里我还是想打几个比方直观一些 (比方里的例子结论都是假设)。

假设我写了一篇文章题目是全球公民智力研究，其实里面的 idea 是论证在有一定背景噪音干扰下人的专注度更高，表现出智能更高。采用方法是到各人种找样本在噪音条件下做 100 以内乘法，比较不同条件下速度，我预计中国人因为乘法表和幼时训练速度肯定遥遥领先，黑色人种因为普遍贫困问题速度可能最差。在文章中我也不提排名，就把计算时间有短到长搞个图，把黑人列到最后。不说文章能发到什么杂志上，我估计我的职业生涯就就此结束了。

再比如我想研究全球公民体质，然后研究方法是打乒乓球。选定国家里面中国列第一美国列在图表最后。然后有人问我为什么没有加拿大，我说经过前期调查加拿大人不怎么打乒乓球，你会不会觉得不值一哂。那为什么到了诚信这么明显一个道德评价的课题。中国因为莫名其妙的研究方法列到最后一位就成了中国人玻璃心了。不管事实上中国人的诚信情况怎么样，这篇文章的研究方法和由此方法的出这么一个结果肯定是需要驳斥的。尤其是黄祸论沉渣泛起的今天 (美国的政府官员甚至露骨的说出了这是首次文明间的冲突这种话)，这种滥用科学工具的文章上了 Science 怎么不值得警惕。

原文

统计上面高赞答主说的很好。这个实验还有一个比较可疑的地方，为什么会有人资助这么一个看起来没有经济效益又花费甚大的社会学实验。

本次实验中使用 17000 个钱包。鉴于钱包内钱数不定而且并没有说明有多少钱包内有钱，很难得到准确的资金数。但是我们可以估计一个大概，我们假设一半的钱包有钱。并假设其中钱数平均是 49 元人民币 (考虑到文中的样本很有可能平均值比这个高)。这样仅仅在钱包中塞钱就要花费 416500 元，也就是奖金 42 万元。

实际上文中还提到了在三个国家做了 Big money 实验使用了 90 多美元每个钱包。所以事实上光这部分钱就花了估计不止 50 万元。钱包和卡片成本估计至少还要几千。

但是这部分只是小钱，实验在四十个国家进行，每个国家选取 5 到 8 个城市，也就是说在全球接近 300 个城市进行了调查。实验有 13 名职员者加上作者等至少有 15 人参加。这十五人的差旅费加上志愿者的劳务费肯定高的惊人。我们可以做一个粗略估算，以京沪高铁 500 元票价来作为基准 (在发达国家这个火车票钱已经很便宜了)，单程去 300 个城市每个人在交通上可能就要花 150000，也就是十五万。就算他们不是所有人去所有城市交通费可能也要花几十万。加上住宿签证等等费用光差旅费这一个项目就要花掉上百万人民币。事实上我觉得这里我都是在低估，这种情况下都可能要花掉至少 50 万美金，可能实际更多。

根据文章，本次实验的项目来源是 Gottlieb Duttweiler Institute ，这是苏黎世的一个私人独立智库。我很好奇为什么一个私人机构会花费至少几十万美金去资助一个没有什么实际经济效益而且方法和结果都这么粗糙的社会学项目呢。据我所知社会科学从来都不是那么好拉资金的。

而且更令人好奇的是光北欧他们就逛了个遍，东南亚也去了三个国家。为什么东亚却仅仅选择了中国一个国家。我们一衣带水的邻邦韩国和日本也不是在欧美文化中可以忽视的地方啊，都来了中国也没道理不去

基于上述，我非常怀疑这个研究本身就是带有倾向性的。看似是全球研究，可能目的也不是那么全球。

知乎用户利流发表

电子邮件这个问题嘛，作为前柜员我还是要说一下，我们基层人员并没有公司提供的邮箱，所有必须的邮件联系都是私人邮箱，但是有公用的电话，我们失物招领基本上靠电话。在日常工作中，邮箱的使用很少，除了接保险公司的邮件，没有任何作用了，一切都由 qq 微信代替，和国外依旧流行邮件联系完全不一样。

另外这个包里有一张名片写着邮箱，这个作为线索也很不靠谱，一般自己的名片不会只带一张，我很可能觉得这是你客户的信息_(:з」∠)_我觉得如果这个信息打印在包上会好很多。（评论里有人告诉我是三张不是一张，我去看了下，确实是三张，这是我的疏忽，所以应该不存在认为这是客户名片的情况）

说一下我们捡到东西怎么处理吧，我工作中曾经捡到手机，钥匙，钱包和一卷钱（一百多）几样东西。手机我翻了一下通讯录，找了最高频率通话的那个号码打过去，果然是机主家人，告知对方我们的地址，让对方通知机主来取。钥匙找不到个人信息，留在失物柜子里等主人自己来找。钱包里面有身份证，我看主人可能是我们客户，我们通过身份证在客户信息数据库里面找到了对方电话，打电话通知对方来取。一卷钱找不到信息，留在失物招领柜。

大概就是这样，所以我觉得至少应该回访一下，那笔钱很可能不是被黑了，只是工作人员没找到（他们认为的）信息，或者单纯觉得打开别人的钱包不好，留着等他人来取。

顺便说一下，我这里不是什么城市，是非常贫困的乡下，有时候我们工作出问题，多给了客户一两万_(:з」∠)_，通知客户修改，客户都一定会来的。有些人还得从县城赶回来，干柜员其实很容易体会到这些的。

知乎用户竹青发表

这真是…… 令人叹为观止的操作和惊为天人的逻辑啊！

请问这实验方事后有没有假扮失主去前台询问过，以确定自己的 “失物” 被“侵吞”啊？

没有吧？没有你就说中国人诚信低？你的失物大概率还在哪个抽屉里保存的好好着呢！

所以我作为一个前台工作人员，就因为有人给我一个来历不明内容可疑的 “钱包”，我没有按照钱包内容物的指示发邮件联系 “失主”，就变成我缺乏诚信，甚至是中国人缺乏诚信了？

且不说在一线大城市繁忙的公共场所，一个装了 49 元人民币和几张英文纸片的塑料袋是否能引起前台工作人员的好奇心去尝试联系失主，这明显也和中国人接受的教育和社会习惯不符。

中国人处理此类问题的方式一般来说都是 “等待失主认领，然后当面核对内容物”或者 “交公统一管理”（警察、失物招领处等），而不是为了在一线城市看来微不足道的少量现金和无关紧要的内容物，做出与中国人日常联系方式不符的“写邮件” 这么个操作。

你可以说中国人的文化或者习惯偏向保守被动，不倾向主动挑战和解决问题，但是你因此得出中国人诚信低的结论，请问你实验方去确认失物的下落了么？

你实验方工作做一半就下结论是什么意思啊？

另外，如果我没记错的话，美国的邮件服务商有可能会把来自中国的中文邮件当成垃圾邮件给过滤掉。

所以这前台工作人员还得用英文写邮件和实验方联系才有可能让实验方获取他们想要的反馈。

这简直是漏洞百出的实验逻辑，他们到底是怎么说服自己接受这套一厢情愿的设计，又说服 Science 发表这种玩意儿出来羞辱中国人的？

已经不择手段到这等地步了么？

知乎用户陳亮言发表

好像纳粹的丑化犹太画报

将来这种东西会越来越多

直到他们说 chinese pig 好像理所当然不涉及污辱和歧视一样

在这边解释是没有用的

这种东西目的就是写新闻达到大众传播之效

例如:

学者研究 “中国人诚信世界最差”

专业认证 “中国人诚信世界最差”

主要也不是写来给中国人看的

知乎用户 Po Wong 发表

去西方国家多转转，就知道，这类故意贬低中国人的事多了去了。

我在国内去过上百个城市，就没有一次被偷过。

我也去了几十个不同国家和城市，自己或同行同伴在马德里，巴黎各被抢劫了几百欧，两周前在米兰还被偷了几百欧，警察连案都不立，直接打发走。下个月可能要去南非，同事警告，那里警察都会直接抢劫外国人。

现在出国我都要带两个钱包，一个放酒店保险箱，一个装个几十美元左右打发一下高贵的西方小偷和劫匪。随身带两张信卡，全部不放到钱包里，护照也是不放包里，万一卡和护照丢了，就很麻烦。

今年初到现在，我部门的同事在纽约被偷行李，以及在纽约地铁上直接被抢劫，在巴黎多次被抢劫，在罗马被抢劫。

现在来看只有日本，韩国，新加坡以及俄罗斯和主要的伊斯兰国家出差的同事没有被偷过或者抢劫过。而这些国家和区域大都不是西方阵营，或者是儒家文明的。

西方的媒体们在指责我们脸上不干净的时候，能不能自己先看看自己脸上有屎？

其实这也怪我们政府，不肯鼓励我们媒体去黑西方，如果肯，先做一个全球城市千人小偷排名，保证纽约巴黎罗马能进前十。

知乎用户 lcy19712018 发表

更新一下，主要是找到这样的 Science 论文太不容易，得珍惜。另外就是又看了一眼论文，吐槽能量要溢出了。下面的图片来自论文的 google 翻译。

作者似乎发现了了不得的东西

这个发现与文献相反

作者毫不怀疑这个与常识相悖，也与文献相反的结果，真是迷之自信。审稿人居然也相信，真让我觉得自己碾压了 N 多大牛。有人在自己的实验结果与现有理论、逻辑、常识都不符，自己也解释不了的时候拿去投 Science 吗？

要说利他主义，那些物品必须对失主很重要才行。可是，那几样东西价值何在？透明塑料 “钱包”，小学生都不好意思用；三张同样的名片（可以说明是失主本人的，排除了收的别人名片，这个细节还是挺用心的），谁丢了自己的名片到处找的？再说，有人在名片上只印个邮箱吗？没有 QQ、微信，连电话都没有？还有那个 shopping list，缺了它不知道吃什么吗？唯一也许有用的是钥匙，或许能打开一个宝盒，换锁会爆炸那种。所以，没有那 49 块钱，就是垃圾。

找个德国大学生，优雅地送给宾馆前台，“嗨，我发现这个 [指着钱包] 在拐角处的街道上“然后把钱包放在柜台上，推到了员工面前。“有人肯定已经失去了它。我赶时间，不得不离开。你可以请好好照顾吗？”（原文 google 翻译）

前台怎么想？是帅哥搭讪？假装拾金不昧？还是恶作剧？不是精神有问题吧？要不要报警？

能有几十个人发邮件已经很多了，我想其中有不少人发邮件时在后悔，不该没事找事跟上司汇报的。上司肯定说，“外国人送来的？还是联系一下吧，别让人说我们不诚信”

话说公民诚信不是应该考察个人行为吗，这文章考察的是机关和企业处理拾物的流程是否友善，员工是否热心，跟公民诚信没多大关系。谁丢了东西不是到处去找，哪有人在家刷邮箱的。

其实即使联系失主，也未必表明是利他主义，也可能只是制度要求。害怕不去联系可能被领导批评，客人投诉之类，而不是拿了 49 块钱有做贼的感觉。

以下原文 —————————————————————————-

显然这个实验设计不合理。

想必多数人对于这个实验中 “不诚信” 的理解是贪图钱财而不交还失主，而实验结果中钱包中是否有钱的结果与此完全相反。如果贪图钱财的话，应该是有钱的钱包联系失主的少。但是图中所有国家都是有钱的联系比例更高。这说明实验设计的错误，得到的不是 “诚信排名” 而是 “对实验道具重视程度” 排名。大家认为有钱的 “钱包” 更重要，所以联系失主的更多。

钱包之所以加引号，是因为它太简陋了：

如果没有钱，大多数人会认为是乱丢的垃圾。

另外，大城市的宾馆、银行等前台忙的飞起，谁有闲工夫为了几十块钱发邮件。公司对拾物会有规定，基本上应该是放在某处待领。所以统计结果是较为悠闲的欧洲国家排名靠前。

要想得到有效结论，必须提高物品的重要性。比如加一些文件、证件之类的。

这么明显的设计漏洞，还能发 Science。。。

知乎用户大树君发表

说中国人诚信世界倒数第一？

来看看我们关于 “诚信” 的社会实验吧！

如果一个外国小哥付款时不小心多付了钱，商家们会不会提醒他并把钱归还呢？

当外国小伙买东西多付了钱……

知乎用户王阿蛮发表

简单看了一下论文，作者采用电子邮箱作为联系方式。。。

那么按照这个实验方法，我在美国做同样的实验，然后把联系方式改成微信，是不是也可以说美帝人民 “不诚信” 呢？

作为一名科研工作者，没有考虑环境因素就堂而皇之的放结论，S 家的编辑还把这篇文章放出来了，一个敢发一个还真就敢放，一对山炮。

我没看到对于科学的敬畏，看到的只有愚蠢和傲慢。

知乎用户赵灵均发表

作为一个身经百 “丢” 的人，我作证，除身份证之外，从来没人主动联系我归还失物。

可是，每次我主动联系酒店 / 银行 / 电影院 / 警察局 / 甚至游戏厅，我的东西总是被完整地保存在前台 / 储物间 / 保安室等等。

印象最深的一次，我的挎包丢在游戏厅，联系工作人员调录像，来了一腼腆小哥儿:“别找了，在我们办公室呢。” 小哥儿笑呵呵地拿出来，还特得意地跟我说:“我们谁都没动，连打开看都没看，你检查吧，应该什么都不少。”

所以，私以为，这类场合工作人员的习惯就是这样——捡到东西就保存起来，有人来找就归还，没人来找就放着。根本没人在乎你里边装的是什么，只要能保证你来找的时候东西都在，不会招惹麻烦，就是了。

你可以说他们不爱管闲事，但说人家不诚信，你这是强行加戏呀……

抛开学术实验，一个现实生活中的真人，遇到这种事的逻辑难道不是这样的吗:

我的东西丢了。

如果这东西很重要——我会回想一下最有可能丢在哪个地方——去该地点联系工作人员询问。

如果这东西不重要，我可能根本懒得去找了。

可是，可是，你自己东西丢在公共场合，自己不主动去找，一旦没人主动联系你，就是人家不诚信？

这是啥逻辑？巨婴逻辑？道德绑架？

知乎用户耗子领袖发表

就这样一个粗糙的实验设计，关键信息缺失，实验控制稀烂的研究，除了有样本量够大和跨文化比较两个优点，如果不是符合他们的心理预期，怎么可能发 Science?

如果最后结果是美国最低，哪怕是客观事实，这篇文章连 6 分杂志都上不了。

在文章的 Supporting information 中，作者写道自己统计了这样一组指标：

Measuring Recipient Characteristics and Situational Factors（接待员的特质和情境因素），作者煞有介事地说自己为了控制额外因素，统计了以下指标：

（接待员的）性别，年龄，忙碌程度，是否是本地人，会不会英语（七点计分，从 0 的英语为母语到 6 的完全不懂英语），能不能理解目前的情境（也就是能不能理解研究者想让接待员干什么，从理解到完全不理解，7 点计分），友好程度，桌面上是否有电脑，有没有同事，有没有监控，以及有没有保安。

是不是看着还挺正规的？你以为作者会把上述数据纳入回归分析然后调整结果？

并没有。

作者在 Fig.S12 把接待员的性别、年龄、是否有电脑，有没有同事和其他侍者等因素纳入了回归分析，没有发现差异。

但是！会不会英语、能不能理解当前情境、忙碌程度，这明眼人都能看出来非常重要的几项，根本没有结合 main data 进行分析。

所以你之前可能会想，人家毕竟发在 Science 上，肯定至少表面上能够自圆其说。没想到还真没有！人家的吃相就是那么难看，额外变量控制得连本科生都不如。

这就是控制额外因素？控制在哪？

你看，有几个高赞回答就被骗了，以为人家列出来了就真的控制了这几个关键因素。

这就意味着：

1）作者团队可能是全程使用英语进行试验的（在 main text 中作者提到实验由作者团队的人进行的，而不是招本地人进行的。这样解释了为什么所有非拉丁语系国家都在图标的下半截），可以想象中国的非英语指数会非常高；

2）作者团队并没有确保接待者是否完全理解作者的意图，而是简单地列了个表说 “啊有的人没理解我也没办法，你看我还列了个表嘞！谁理解谁没理解我都记在本子上了！”

试想你是一个英语水平不高的服务员，突然一个外国人窜进来说了一堆英文，然后塞给你一个奇怪的透明盒子，里面有的有钱（也才几十块而已），有的没钱，你能猜到他想让你干嘛吗？

约 P？推销？还是碟中谍？

此外，只有我注意到了这个研究在东亚只纳入了中国吗，韩国和日本这两个国家居然没纳入进去？这非常不合常理，哪怕韩国被忽略，一般的国际化测试都不会忽略日本。

新加坡同理，连马拉西亚、印尼和泰国都进去了，虽然是最后几名（显然非拉丁语系国家都被这个文章证明 “不诚信”），新加坡怎么也没有数据？是不是发现新加坡作为民主文明的发达国家居然和周围几个国家数据一致，把结果推翻了所以不放？

所以我非常阴谋论地揣测，韩国、日本和新加坡其实做了调查，但因为跟周边国家的结果过于类似，尤其无法凸显中国人诚信差这一问题，反而暴露了实验设计的不合理，所以删去了。

最最可怕的一点是，这个研究成功把中国孤立了起来，除了中国以外，其他倒数几名都是国际社会上的臭鱼烂虾，上不了台面，他们对该研究的发声是没人在乎的。

而欧美国家对这个结果是乐见其成的，一个 “不诚信” 的中国符合大家的期待，也就是说，没谁会为了中国去质疑这个研究，除了中国自己的学者。

你看，关于这个回答的大量信息都是来自于文章的补充材料，除了中国人谁会去为了这篇文章翻补充材料？更别说大多数西方人看媒体一个标题就高潮了。

但中国的学者会去这么做吗？做了能被 Science 的 comment 采纳吗？就算做了类似的研究能发表在 Science 等级上的期刊上吗？

我没有阴谋论的意思，人家肯定也不会特意为了黑中国做这样一个研究，但如果没有中国信用最低这样一个噱头，任谁都能看出来这篇文章没资格上 Science。

这归根到底是出版社的问题，毕竟虽然科学是没有国界，但《科学》是有国界的。

宣泄完了，最后我想说，诚信肯定是和国民经济水平息息相关的，我相信如果严格做实验，中国的排名也不会很高，而北欧国家一样会很高。

但我拒绝承认这样的实验设计下中国必须背负 “最不诚信国家” 的骂名，以后在外面跟黑三、台毒和白人 loser 吵架，人家搬出这篇文章，你自动弱一头又难以辩驳，这感觉真是糟透了。

知乎用户 Jhon Smith 发表

谢邀。

人在床上，刚要睡觉。

说实话，刚戳进来我看到那个排名的时候我是懵逼的。心想中国人再不诚信总体上也不会比美国人不诚信吧，川建国同志已经给我们上课了。

那些近视的思想糊涂的自由主义或民主个人主义的中国人听着，川建国在给你们上课了，川建国是你们的好教员。你们所设想的美国的仁义道德，已被川建国一扫而空。

然后我注意到这个排名是 science 上的，不至于政治正确到胡编滥造，于是戳了进去，下载了文档，然后看到了这个。。。

根据各国 GDP 做出回归的排名，容我笑会，美利坚果然是德不配位。。。。（实际并不，这不能说明什么有意义的东西，不过想找回民族自尊心的朋友可以用它，而且它还比主题图更能反映出问题）

吐槽结束，说点正经的。

说实话这个实验的方法很有意思，适合写鸡汤。但至于适不适合论证它起的这个标题，即探寻各国人民的诚信程度，我是不赞同的。

实验方法大致是通过遗留如上图所示的钱包，内含名片钥匙等物品，并设立有无金钱的对照。通过投放数和各渠道收到的联系数（电子邮件、当地旅店、警察局等）的对照，来进行诚信度的判断。（此处有误）

说实话要不是其他内容，单凭这个实验设置我都不会相信这是 science 水平的，这个实验太想当然了。

讲真我在路边发现这么个 “钱包”，以右图形态展示，即一个塑料膜包着一张名片。我大概会把它当成是以前路边常发的那些小广告之类的垃圾，连碰都不会碰就离开。这显然会降低统计数值。

更何况大多时候出于各种原因我们很难注意到这个小东西。

我觉得大家只是太忙或是无心去注意他并为它找主人，而不是什么不诚实。因为在钱包里有钱的对照组中（即数据图红点显示的），我们的数值上升了不少，并超过了很多国家。

**这个实验想要证明各国人民诚信度的话，大概只能证明墨西哥人很不诚实，因为只有他们在发现钱包里有钱后，钱包的交还率下降了。**而包括中国在内的多数国家都是上升的，即发现钱包有钱后更倾向于为钱包找回主人。

额外说点感悟。

这个实验还能看出除了北欧那些有闲国家，传统意义上欠发达国家更愿意去为这个包括钥匙名片以及现金的钱包寻找主人。我想这大概是在他们眼里这个东西更重要的缘故。

我们小时候，在这个国家还不富裕的时候，在宣传 “捡到一分钱交警察”。而现在地上有一毛钱大概都不会弯腰去捡（一分我会去捡，因为已经很少见了），丢 50 以下的钞票，大家也就顶多惆怅一下，除非环境封闭（在家，在公司，在学校），一般也不会去找，这些损失没有多大意义。而相对的，捡到 10 块 20 块，多数人除非警察就在旁边，也不会去费心费力寻找失主。大家都默认这损失不大。而就算捡了这钱去花，大概也不会有负罪感和占便宜感。

相比之下那些我们认为重要的东西，比如身份证、银行卡、手机，一般捡到时都会去帮助寻找失主（就连有些小偷不也偷钱不偷身份证么）。

总的来说，这个透明塑料做成的钱包，显得太过廉价太过不重要了，不足以考验人的诚实。

感谢 @玉米菌还有评论区的一些朋友指出的错误，答题前看得太匆忙了居然没注意到。印象里当时理解得拧了过来。。。

知乎用户伍亦勤发表

英语水平越高，公民越诚信。作者想表达的恐怕是这个意思。

为什么呢？因为整个实验过程是用英文完成的。

After walking into the building, one of our research assistants (from a pool of eleven male and two female assistants) approached an employee at the counter and said, “Hi, I found this [pointing to the wallet] on the street around the corner.” The wallet was then placed on the counter and pushed over to the employee. “Somebody must have lost it. I’m in a hurry and have to go. Can you please take care of it?” The research assistant then left the building without leaving contact details or asking for a receipt. Our key outcome measure was whether recipients contacted the owner to return the wallet. We created unique email addresses for every wallet and recorded emails that were sent within 100 days of the initial drop-off. Complete methods and results, including additional robustness checks such as testing for experimenter effects, can be found in the supplementary materials.

以大部分国人的听力水平，根本听不懂对方在说什么，听懂了一些也记不住，能记住也只记得最后一句，“Can you please take care of it”，意思是，“你能帮我保管它吗？”

你都让我保管了，为什么我还要发邮件呢？而且我不会写英文邮件，也不想遇到诈骗。

这就是为什么实验结果中，英语不普及的国家，诚信水平都比较低。

另一方面，本单位自有《失物认领章程》，为什么我要回邮件呢？

因此，这篇论文并不能反映公民诚信，只能反映白人至上、英语至上带来的无知和傲慢，以及意识形态对社会科学的渗透与影响。

知乎用户渠梁发表

6 月 25 号更新

Conh 教授回了我一封邮件

具体内容就是：

有人把它作为政治攻击的手段是不合理和反对的

文章的重点是在钱包内的钱对于人们的重视程度，而不是进行国家与国家之间的对比，也就是说，他是想用经济学的角度来解释钱的总数对于诚实率的影响。

另外这篇文章主要针对的是外国人丢失钱包的这一个变量，所以对于论文来说造成的舆论影响是远远大于他本身的学术价值。

总的来说，论证方法和数据没有什么大问题，然而很明确的一点事作为经济学博士，他对于社会学的研究和学习还没有到家。

说白了无论 Cohn 的脑子里想的是什么东西，这东西已经被反华势力运用，成为破坏我国国际信誉的东西了。

匹夫无罪怀璧其罪嘛

另外根据样本和各个国家的人数对比来看。

这个实验数据很明显是有政治倾向的。

就这么说，要是我社会学或者社会心理学课程论文写成这样子老师要把我批成什么样子都不知道。

密歇根大学的助理教授发的这篇文章甚至比不上西南某大学大一新生的课程论文。

亲亲，这边推荐您去重修一下本科社会学和社会调查方法的课程。

“请不要生产学术垃圾。”

知乎用户 yang leonier 发表

我感觉，人口密度越大的城市，“诚信率”（回邮件率）越差的原因还是这个钱包本身太不值钱了，就像在日本随处可见的以纸巾形式发的广告传单一样。
据说他们整个实验只有 25 万美元经费，还要准备 17000 个这种钱包。如果经费加一个数量级，恐怕实验结果会大相径庭吧。

知乎用户山高县发表

有千日做贼无千日防贼，当然是打对攻了。

根据中西文化差异，设计一个实验黑西方，然后把结果投到 Science，看他们是发还是不发（滑稽）。

这样一来，Science 就是两难。发了的话，自己打自己脸。不发的话，不发这一行为本身，炒作价值可比一篇论文要大多了。

强调！这种事，辩护没有意义！你越辩护，新闻本身传播的就越广！你反而越吃亏！当年河南越辩越黑的教训，不可不查！

真正应该被注意到的是，破坏 Science 公信力的一个重大战机出现了。

知乎用户 IntoTheRain 发表

数据很扯淡，人文学科调查的变量因素太多了。用自己的思维方式去做调查，从而得出错误结论的典型。

曾经有欧洲某个小镇的人跟我说，中国没有宗教信仰自由。理由是中国人周末居然不去教堂做礼拜，肯定是被迫害不能去。

我很无语，无意与他继续交流。双方的生活背景思维方式文化差异实在是太大了，夏虫不可语冰。

敢情他以为中国跟欧洲一样，每个小镇都有一个教堂？

知乎用户 Mr Poopybutthole 发表

《钟形曲线》是一部研究种族和智力关系的著作。出版之初，就被绝大多数学术界同行打为种族歧视文稿，而视为瘟疫避之不及。很多人甚至放弃了学术的严谨，不去考察研究的内容，仅仅从课题的出发点就加以大力的抨击。

其中的一项批评，我认为是有道理的，也是学术委员会的终极大杀器：“你这项研究有意义么？” 不管科学事实如何，假如这项研究，除了助长歧视之外，不能产生任何价值，试问你为什么要做这个研究？

但是从反面来看，《钟形曲线》研究不管怎么说，还有可能有理论上的价值，比如识别确认影响人类智力的基因，从而造福人类。

Science 发表这项研究呢？真的除了给歧视加燃料，我根本看不出有任何潜在的价值。所以，我要调整一下眼镜框，问作者一句：“What’s the point of your research? Other then fueling discrimination? Or, that’s your end game all along? Is that what you and your institute spend tax payer’s money doing for all this years?”

再一次说明，西方人口中的爱与包容，平等，反对歧视，都是表面文章、自我感动、口惠而实不至。一有机会，他们就露出獠牙。

知乎用户 Viooola 发表

简单看了一眼，结果对于很多国家必然是有偏的。

实验方法是实验人员假装捡到钱包交给银行、邮局、宾馆、电影院、公检法等场所的职员，看人们会不会联系失主。

主要问题在于，钱包里的联系方式是电子邮箱…. 中国的一线服务人员中，真正会用电子邮件和人联系的应该不多吧？

研究者确实考虑到了这点，但他们认为宾馆职员肯定会用邮箱，所以单把宾馆条件的结果拎出来看，说差别不大。中国普通宾馆的前台真的用电邮吗？

研究者还把世界银行的一个调查数据 (使用电子邮件的公司比例，中国有 85.7%) 丢进回归里跑了一下，还是差别不大。但这个数据是公司比例呀，也不能代表一线服务人员。

所以对于中国而言，感觉这个结果意义不是很大。而且这个实验是否就反映了 civic honesty，我也有点疑问。随便看看就好。

知乎用户但丁发表

就这个实验设计，我是不信研究组自己不知道有多傻逼，有两种可能：

一、为了发文章，就先弄个实验出来求个结果

但是怎么就中国，没韩国日本？

那只能是下面的可能性：

二，精准打击，新型黄祸论罢了

知乎用户李妙文 - 赵可心发表

什么时候做社会学研究这么简单？

连基本的社会环境都不顾？

留个电子邮件？这些人咋不留个推特？

连中国的大众通信方式都没搞清楚，

就敢做实验？

我突然有个 IDEA

用犯罪率来判断一个国家的野蛮程度，

啊哈！我也可以上 science 了～哦列！

知乎用户空一格发表

同志们讨论的挺热烈啊，真把洋大人菊花喷点气当回事。

我只有几点：

1，文科实验都是扯。文科的所谓社会实验，变量根本就不可控。这个地球上各地区的人差异，远比象鼻子与象腿的差异大多了。试图以一个实验或以一个标准来衡量全世界人（某一指标），简直是天方夜谭。根本不能说明任何问题。

2，不妨公开地讲，个人捡到钱包，如果没有证件之类私人属性的东西，只有钱包和小额现金的话，一律自己拿着。如果有身份证等有用信息，联系失主或交公。小额现金，你花我花都是花，又不是救命钱，多大点事？至于钱包，更无所谓。再说，现在带钱包的人也不多了吧？现金更少了吧？花老功夫寻失主，又是等又是送，费那劲干啥？

为了减少麻烦，我现在见了钱包之类的东西都躲着走。捡它干啥？现金没多少，证件捡来有什么用？卡没有密码有毛用？或者还要联系失主，万一对方是个声音娇滴滴的还忍不住要给人送过去。见了不理智的失主万一说里面有啥东西不见了，惹来一身骚，图个啥啊？多一事不如少一事。

3，我是头回听说 Science 还登此类文科论文。看看人家英国 Nature，子刊一大堆，一个赛过一个。你美的 Science 呢？影响因子还不如 NM，都被挤压成这德性了，还在搞这些哗众取宠的东西。且不说实验是真是假，找个机会把中国排在最低感觉确实很爽，是吧？我早说过国外找机会黑中国是不遗余力的。就连高铁和移动支付的排名都要把中国排后面去，表扬个植树造林还要强行带上毫无作为的印度。(2018 世界支付报告：无现金支付美国第一中国第三) 这心态，是病，要吃药的！

[如何看待 NASA 研究：中国新增绿化面积达到四分之一个亚马逊雨林？www.zhihu.com

](https://www.zhihu.com/question/312025129/answer/602194364)

4、说一千道一万，不用电子邮件联系失主关于钱包这件事本身，能和人的诚信联系起来吗？

知乎用户狼宝宝发表

谢邀！

千万不要被排序所迷惑，这篇研究的重点并不是排序对比各个国家的诚信水平！

先说明：我反对任何形式的阴谋论解释，还有不看材料，不讲证据地批评。这与我们倡导的科学严谨，求真务实的治学态度都是相悖的。

任何一个研究都不是完美的，我们可以对研究提评，但是必须基于对原文的了解和对证据的评断，而不是信口开河，将情绪凌驾于理性之上。很多知友的质疑其实早就在作者的意料之内，除了正文的 9 页纸，还有 93 页的补充材料呢！

好了，我想先介绍一下 “利他行为”——这个本研究涉及到的最重要的心理学概念，另外再说说我自己的看法。

利他行为。

利他行为和亲社会行为，助人行为基本类似。非常好理解，就是在社会生活中，我们表现出的帮助他人的行为。有一些区别的点在于，亲社会行为可能带有一些可见的报酬，而利他行为是没有的，纯为人民服务。我这里不作区分。

为什么我们会做出利他行为？

迄今为止，社会心理学家已经研究了许多因素可以让我们做出利他行为。

情绪。

积极情绪会让我们利他——所谓的助人为乐。除了快乐这个最典型的积极情绪，还有诸如感恩，敬畏等更加复杂的情绪也会让我们利他。

一些消极情绪也有这样的作用——最典型的就是内疚了。当我们产生内疚情绪的时候，总希望做一些好人好事可以弥补以缓解内疚。

动机。

作为回报的外部动机。我们每个人都不是孤零零地活在这个世界上，总会与世界上其他人建立某种联系。根据社会交换理论，今天我对你付出，也是为了给明天你对我付出进行一个铺垫。所以，未来可能发生的回报形成了一个外部动机。

担心自我形象贬损的内部动机。除了与外界交换，我们对自己是有一个自我形象认知的，希望自己保持一个积极正面良好的形象，给自己看，也给别人看。做好事也是我们维持良好的自我形象的重要手段。大家都会夸赞那些好人好事，而对假丑恶的事件进行抨击。

共情

共情可能是最主要的引发利他行为的因素了。当我们对别人的境遇产生共情，我们就希望帮助对放度过难关，这是高级动物拥有的互惠机制。

外部环境。

研究发现，当你身边有人伸出援手的时候，你也更愿意帮助他人。可要是谁都按兵不动，那大概率你也不会动了。

自身状况

达则兼济天下。中国研究者发现，下行的社会比较（与不如自己的人比较）会带来亲社会行为。

时间压力。另外有研究则指出，当被试者没有紧急事务的时候，更有可能伸出援手。当一个人要赶去做某个紧急事务的时候，ta 就可能不太愿意帮忙了——比如 ta 可能着急着去看一场名为《帮助他人就是天使》的话剧。

另外，进化心理学家也对利他行为作出了一些解释，最著名的可能就是亲缘关系理论了。

研究发现，我们往往对那些和你具有相同属性的人更容易产生利他行为，而对其他外人则没有这种利他行为。也就是说，我们的利他可能是带有某种选择倾向性的。亲缘关系理论认为这是因为内群体和我们具有更高的亲缘关系——咱们一家亲，自然要多多帮助了。

总的来说，利他行为作为社会心理学研究的重要组成部分，真挺令人着迷的。更多有关利他行为的研究，大家可以参考任何一本《社会心理学》教科书。

下面来看这个研究

1 关于研究目的

这篇研究的重点其实并非对各个国家的公民诚信水平进行排序比较。作者在摘要当中介绍的很清楚。进行这样一个大规模的现场实验实际上是为了检验一个基本的模型——面对财富诱惑，我们到底是会抵制诱惑，诚实归还，还是据为己有。这其实也就是实验设计中的两个组，money vs. no money。根据古典经济学的假设，物质诱惑会让我们做出自私的行为；但是因为我们要维持自我概念，以及利他主义倾向等原因，面对物质诱惑，我们也会帮助别人。

以往的研究大多是在实验室进行的，而且被试者往往是 WEIRD 也就是所谓的 Western, educated, industrialized, rich and democratic societies。

因此，作者进行了这样一个大规模，跨地区，跨文化的现场实验。

实验的结果如图所示，当钱包里有钱的时候（对比没钱），大家都倾向于联系失主。这与物质诱惑导致自私行为的假设是相悖的。

因此，对各个国家进行排序并非作者的研究目的，同样，从结果也不能说明中国人不诚信。千万千万不能被带跑偏了，过度解读结果不是傻就是坏。

下面我会谈到关于排序的问题。

2 关于排序

尽管研究的主要目的不是排序对比，但让大家感到扎眼的是，中国居然倒数第一，所以难道中国人如此之不诚信？

2.1 关于邮件

这个可能是争议比较大的地方。

以我们自身的感觉，中国内地居民使用邮件的频率非常低。根据 @Yan Yan 提供数据（不知道为什么 at 不到 ta），中国网民的电子邮箱使用率只有 35%。那么是不是由于邮件的使用习惯导致的呢？

研究者在文章的补充材料中对这一问题其实已经做了分析。他们认为在五组选择地方种，酒店组应该是可以通过邮件去联系其他人的。因此，单独分析了酒店组发现结果如下：

中国排名上升了一位。

当然，正如 @ Yan Yan 所指出的，原文作者也认为邮件的使用可能是一个影响因素。

那么这里就有一个问题，如果是因为不习惯发邮件导致得分偏低，那么两组都应该偏低才对。总不能说没钱的时候大家不习惯发，有钱的时候就习惯发了……

如果要更加严谨地说明这个问题，我认为可以在中国深圳和香港两个地方做一个对比研究。两地距离较近，经济发展水平相当，但是邮件的使用习惯却非常不同。这个对比可能会比较有说服力。

还有知友说到，电话号码会更加符合国人习惯。这是自然。实际上，不难理解，发邮件肯定会比打电话麻烦一些，这个无论在世界的哪里基本都是如此。所以如果换成电话号码，可能大家的诚信指数都提升了。

2.2 关于钱包不逼真

要知道，钱包是否逼真这个条件是恒定的，在每个组都是一样的东西。恒定法也是心理学研究常用的控制额外变量的方法之一。

至于有知友提出，为了使钱包逼真，应当在里面放一张身份证。

还是一样的，要放必须每个地区都放，难道会出现中国人看到身份证更容易归还，而歪果仁看到身份证更不容易归还的局面吗？

2.3 关于诚信和多管闲事

有知友质疑这个研究本身是否能代表诚信行为。

这是一个很好的问题，这也是评价一个研究好坏的基本标准之一。这就好比，我本意是要测量被试者的身高，却用体重计测出一堆关于体重的数据，完全是答非所问，跑偏了。

如果你认为研究其实只测量了多管闲事，那么说明，中国人在没钱的时候就不会多管，而在有钱的时候才会愿意伸出援手。

这就引出了一个我个人觉得很有意思的问题——我们为什么要去做利他行为？

从数据结果来看，我觉得可以提出一个大胆的假设，我们的利他是以 “有用” 为目的的。也就是说，我们一定要看到联系归还这个动作是有用的——对方能拿到钱。同理，当钱包里什么都没有的时候，我们会认为这钱包是无用的，归还不归还，联系不联系都无所谓，反正无用。

当然，这只是我个人的一个假设，是否属实，需要研究。

看到

@支付宝

也来答题并且给了另外的研究证据（非常有意思的研究），我突然想到，移动支付的使用或许让我们淡化了对实体钱币的感知。这个说的有点远了，不过是挺有趣的。

最后，还是要再次强调，本研究的目的是对比有钱没钱组的行为差异，令人可喜的是，我们没有为了钱包里的钱就据为己有，而是选择了想办法归还。

知乎用户治水者 FPR 发表

与其掉书袋地从方法论上去质疑，不如想想这个问题：

当他们开始动用研究资源企图在学术意义上，以科学之名，抹黑整个国家和几乎整个种族时。

他们下一步会做什么？

别忘了，知乎的讨论，对于国际舆论而言影响力等于零。而 Science 可就太不一样了。

知乎用户知识分子发表

2015 年，一名瑞士学者在离开苏黎世机场时被工作人员拦住，因为他的箱子里装满了空钱包、现金和 400 个备用钥匙。他解释说，这些都是科学实验的道具。

他是一个行为研究小组的成员，正在研究两个重要问题：世界各地的人们是否会归还丢失的钱包？钱包里现金数量的差异是否会影响结果？

如今，美国密歇根大学、犹他大学和瑞士苏黎世大学的这几位研究者将得到的结果发表在 6 月 20 日的《科学》（Science）杂志上，题为 Civic honesty around the globe。该研究结果表明：无论在哪个国家，人们都会想办法归还钱包，钱包里数额越大，归还的可能性也越大 [1]。

有人敏锐地察觉到，在这项实验中，中国通知失主的概率处于最低位。

美国政府指控中国偷窃其高科技知识产权的背景下，这一发现迅速在中国社交媒体引发激烈讨论和争议。一些评论认为，这一研究可能会被 “别有用心” 的人用来攻击中国。

“听到有些人用我们的数据结果来传播仇恨，我们对此很难过。我们坚决抵制这种行为。” 论文通讯作者之一、密歇根大学助理教授 Alain Cohn 告诉《知识分子》。

他指出，跨国比较从未成为该研究项目的重点。“从一开始，我们的兴趣就是数额大小如何影响归还率。我们在《科学》发表的论文，几乎只用来讨论实验条件下钱包内容的差异，而不是跨国的比较。此外，我们没有在论文中单独列出中国（或任何其他国家）。”Cohn 说。

研究是如何做的？

让很多国人 “义愤填膺” 的研究是怎么做的呢？

根据论文，该团队成员一共前往了 40 个国家的 355 个城市，这些地方的银行、博物馆、剧院、邮局、警察局等文化和法律场所的工作人员，不知不觉中都成为了这项实验的一部分。

在实验中，一位实验助理假扮的欧洲旅客走进上述场所，将一个钱包递给前台工作人员，并通过翻译软件说道：“我在街角发现了这个（钱包），但我在赶时间，请问您能帮忙保管吗？” 钱包里包含一些钱（当地通用货币）、一张购物清单（当地语言所写）、三张附有电子邮箱的商务名片（当地语言所写）、一把钥匙。钱数分为没有钱、少量钱和很多钱三个等级，数额大小根据当地的人均收入而调整。比如在诸如美国等比较富裕的国家，钱数分别为 0 美元、13.45 美元、94.15 美元。该实验共花费了大约 600000 美元。

该研究的衡量标准是，拿到钱包的人是否联系了所有者以归还钱包。研究人员为每个钱包创建了一个电子邮箱，在线下实验发生后的 100 天内，统计是否会收到有关归还钱包的电子邮件。

另外，研究者还邀请 299 个普通人和 279 位经济学家对拿到钱包的人的行为进行预测，问题包括，钱包里没钱时、有一点钱时和有一大笔钱时，人们别有多大的可能性会归还钱包。

论文的发现有哪些？

总体结果表明，拿到空钱包的人，有 40% 会设法归还；拿到少量钱的人，有 51％会归还；当钱包里有大笔钱时，归还率为达到 72％。

然而，各国结果差异很大。丹麦、瑞典和新西兰的归还率最高，尤其是当钱包里有更多钱的时候。而在中国、秘鲁、哈萨克斯坦和肯尼亚，平均只有 8-20％的钱包被归还给其所有者。

而在预测行为方面，299 位普通人认为，当钱包里没有钱的时候，平均会有 73% 的可能归还钱包；65% 的可能归还有一点钱的钱包；55% 的可能归还有大笔钱的钱包。这一预测结果显然与真实情况并不一致。

然而，即使是经济学家，他们也预测错了这一结果。他们预测的结果也认为，钱数增多时，归还的概率会降低。

也就是说，人们所猜想的自己的行为，与真实所作的并不一样

那么，人们为何会拾金不昧呢？

研究人员认为，人们拾金不昧的主要原因，是厌恶将自己视为小偷。大家希望自己是一个诚实的人，私吞别人的钱包意味着必须要接受这种负面的自我形象，会带来心理成本，而这种心理力量可能会比金钱的力量更强大。如果这个钱包中没有钱，那么即使没有通知失主，被试也不会觉得这是偷窃，而金额越大，被试就越会觉得这是偷窃。

这种保持 “好人” 形象、避免不诚实行为的倾向被称为自我形象维护（self-concept maintenance）[2]。这也是为什么，在这个实验中人们会竭尽所能，维持自己的公众形象，以至于会放弃一笔“横财”。

在传统的经济模型中，人是理性的主体，为了增加个人利益，会追求更多的物质。但是行为经济学强调非物质对人心理产生的作用，因而会产生新的经济模型 [3]。

Cohen 等人的研究还表明，利他主义也能影响人们的行为。在美国、英国和波兰，作者增加了一项实验处理方法——有些钱包有钱但没有钥匙。结果显示，有钥匙的确增加了归还钱包的可能性，虽然它的影响没有钱那么大。

学者如何看待这一研究

法国国家科学研究中心的经济学家 Marie Claire Villeval（未参与本研究）肯定了该研究的意义：

“这一类有关道德困境的实验很难在实验室外展开，简单地询问被访者会带来主观的偏差，而这项研究用简单的实验证实了自我形象维护。更重要的是，经济学家可以引入自我利益、个人形象、利他性等因素，并通过它们之间的互动，从而创造新的人类行为模式。”

他指出，当设计行为分析实验时，既要保证实验设计捕捉所有的影响因素，又要保证实验设计足够简洁，才能用尽可能小的偏差来测量行为。

“很多因素都会影响地区差异，但是该研究的目的并不是解释各国之间的差异，而是根据钱包中金额大小来确定归还率的差异。从这个角度来看，无论国家如何，我们都看到归还率随钱数增加而增加。”Villeval 评论说。

各国通知失主的概率图源：文献 [1]

阿姆斯特丹大学的行为经济学家 Shaul Shalvi（未参与本研究）同样表示：“本文的主要结论，在于维护自我形象是一个强大的整体效应，主要表现在有钱多的钱包更易被归还。作者并未提出跨文化的比较，我认为本文的数据也不适合针对某一国家作出结论。”

正如前文所说，在这项实验中，中国通知失主的概率处于最低位，这也是这篇文章在国内各大网络平台上刷屏的原因。许多内容带上 “各国诚信排名”“中国最低” 等字眼，不过，包括《华盛顿邮报》[4]、《卫报》[5]、《科学美国人》[6]等外媒的报道中，并没有强调国别差异，有的甚至没有提到中国。

浙江大学教授王立铭在阅读论文后也直言，主观地将论文解读为中国人诚信倒数第一，是不是有点迫害妄想症。他在新浪微博评论说，这一研究并非意在研究国家之间的诚信程度的区别，而是验证个人的诚信行为是否收到经济诱惑的干扰。“这个研究的结论是相反的——在世界范围内，人们拿到一个装了钱的钱包以后，联系失主的概率都要高于拿到空钱包的时候。也就是说，人们在遇到经济诱惑的时候反而普遍表现出了更高的道德水准。中国也不例外。”

根据知乎网友公布的信息，Cohn 曾回复，“听到有些人滥用我们的研究来传播仇恨，我感到很难过。虽然这是我们无法控制的，但我想为此道歉。我们的研究从来没有打算伤害过他们。” Cohn 向《知识分子》确认了这一信息的真实性。

实验设计是否有缺陷？

国内社交媒体流传的一些评论指出，研究的实验设计存在问题，因为钱包里的联系方式为邮箱，而中国人普遍不习惯用电子邮件，如果名片上是手机号或微信二维码，归还率肯定更高。

Cohen 也表示，论文发表后，他们已经收到很多建议，最常提到的是，在研究设计中，丢失钱包的收件人只能通过电子邮件联系所有者。

“许多中国公民主要使用微信等移动聊天平台进行交流，因此收件人可能想要联系所有者，但对电子邮件不太熟悉。我们认为这是一个合理的解释，这一因素肯定会降低中国的报告率。但是，当我们进一步调查数据时，这个问题无法完全解释我们的结果。”

“首先，当我们将数据限制在酒店时——许多酒店员工通过电子邮件与外国客人联系——总体结果并没有显著改变。此外，正如我们论文的补充材料（图 S14）中所讨论的，当我们调整企业电子邮件使用的跨国差异时（使用来自世界银行的数据），我们发现了类似的结果模式。最后，我们对钱包报告率的衡量也与国家层面诚实差异的现有数据一致，例如对公共腐败的看法或向其合法所有者返还错误处理的信件（Chong et al 2014）[7]。” 在给《知识分子》的一份声明中，Cohen 解释道。

普林斯顿大学教授、社会学家谢宇评论说：“社会科学的方法都可能有缺陷。但是作者用同样的方法在这么多国家做了实验，结果还是有一定价值的。研究发现中国人的诚信最低是让我们值得考虑的。研究者不是专门研究中国的，对这一发现也没有特别好的解释。

他同时指出，“如果我们认为这篇方法上有问题，对中国的结论不正确。那就需要找出为什么这个方法对不同的国家特别对中国偏差有那么大。因为他们在不同的国家用了同样的方法。方式法本身的不足不能解释对中国的发现，因为方法不足对不同的国家应该有同样的偏差。”

中国人的诚信度如何？

那么，回到最初触到人们神经的问题：中国人的诚信表现如何？

Cohen 告诉《知识分子》，《科学》杂志刊登的研究显示，在几乎所有国家和地区，当数额更大时，公民都更有可能报告丢失的钱包。在中国同样如此——当钱包包含更多钱时，归还率大致增加了两倍。“对于我们的数据的一个解释是，中国公民在遇到更多钱时更加诚实。”

浙江大学管理学院教授周欣悦跟《知识分子》分享了一个未发表的类似研究，称中国受试者的不诚实率只有 5%。

“我们在中国几所大学做了类似的研究：丢一个透明卡包，里面装有一张校园卡和 20 元人民币。打电话或者交到失物招领处即为诚实行为。结果显示，不诚实率只有 5%。本文这项研究的指标是不正确的，这个指标顶多是测量帮助行为并非不诚实行为，在社会心理学的文献中这两者是分开的。”

谢宇则表示，即使有研究得出中国人的诚信水平低，自己也不会很惊讶。“诚信的基础是社会成员对社会行为规范有共同的认识，而中国社会目前没有大家都认可的有关社会规范的价值观，不同的个人，不同的团体，他们有自己的价值观。没有统一社会的价值观，这就是诚信度低的一个原因。什么都是以利益为基础，诚信怎么可能高呢？”

参考文献：

[1] A. Cohn, M. Marécha, D. Tannenbaum, C. Zünd, Civic honesty around the globe. Science Rep (2019). doi: 10.1126/science.aau8712

[2] N. Mazar, O. Amir, D. Ariely, The dishonesty of honest people: A theory of self-concept maintenance. J. Mark. Res. 45, 633–644 (2008). doi:10.1509/jmkr.45.6.633

[3] S. Shalvi. Financial temptation increases civic honesty. J. Sec. Per (2019). doi:10.1126/science.aax5034.

[4] https://www.washingtonpost.com/science/2019/06/20/people-are-surprisingly-honest-about-returning-lost-money/

[5] https://www.theguardian.com/science/2019/jun/20/honesty-is-majority-policy-in-lost-wallet-experiment

[6] https://www.scientificamerican.com/article/people-more-likely-to-return-missing-wallet-as-cash-contained-grows/

[7] Chong, Alberto, et al. “Letter grading government efficiency.” Journal of the European Economic Association 12.2 (2014): 277-298. https://doi.org/10.1111/jeea.12076

知乎用户谢箫发表

以下转自观察者网，作者柠檬木聚糖，感谢。

基本说了我想说的话。

侵删

———————————————原文分割线

中国诚信排名垫底？不严谨也能登《科学》？

观察者网

06-22 22:39

► 文风闻社区入驻作者柠檬木聚糖

不久之前，国际顶级期刊《Science》发表了一篇文章《Civic honesty around the globe》，主旨在于讨论世界各地公民的诚信问题。

在这篇报告中，研究人员在全球 40 个国家的 355 个城市进行实地研究，他们在公立和私人机构交付了 17,303 个 “捡到的” 钱包，并且统计有多少人通过预留的联系方式反馈给研究人员的邮箱。

在实验中所选定的交付机构有五类：1、银行；2、剧院，博物馆或其他文化场所；3、邮局；4、酒店；5、警察局，法院或其他公职单位。

在实验中所选用的钱包有三种：1、三张相同的名片，一份购物清单和一把钥匙。名片信息包括虚构的普通男性姓名和预留的电子邮件地址（以上信息均为当地语言）；2、在前一种的基础上附加与 13.45 美元等购买力的当地货币（我国是 49 块钱）；3、在英、美、波兰三国额外提供一种 94.15 美元等购买力的大额钱包。

实验统计结果依据的是 100 天内预留信箱是否收到反馈。当文章发布之后，很快就有人发现，在这个实验中我国的评价最低。而根据实验设计，这就是明示着在这个研究中，我国公民的诚信评价最低。然而，事实真的是这样吗？

我觉得未必，咱们从整个实验流程着手，分析一下。

1、选取的诚信检测方式是失物招领。作为在中美两国的失物招领处都打杂过的人表示，我国失物招领和某些国家不一样。

我以前在平山县附近某纪念馆打杂，那边的失物招领流程是收到失物之后存储起来，整个失物招领处就是一个大仓库。除非是特别贵重的东西，否则就是存在那里直到有人来认领。而且我也说实话，49 块钱、1 把钥匙，连张身份证都没有，失物招领处也懒得找失主，找到人家没准儿都懒得回来拿，特别是像我们那种地方来回车费都要几十块，况且上班时间玩电脑或者玩手机被领导发现要扣工资。

要是酒店前台那就更不得了了，我在酒店丢了那么多次东西，大部分都能在酒店前台找到，但要是说主动联系我，那是一次都没有（可能因为我不是 VIP）。

而且需要注意的是，留的是电子邮件地址，我国很多场所的工作人员不一定会发，也不一定愿意发邮件。哪怕留个电话都比电子邮箱效率高。

但是美国这边就轻松多了，我以前在某艺术中心打杂，一天能来几样东西就不错了，一整天就解决这么几个问题，我能解决出花样来。不要讲发邮件，我每封邮件还能附上一首小诗。比这个更忙的地方肯定也有，但总的来说，大体上我国的工作人员要忙上不少。

2、交付 “失物” 的对象是工作人员。依照他们的处理方式来判断公民诚信，这个选取对象就有问题。

这是统计学上非常忌讳的问题，选取对象和研究对象有偏差。研究公民的诚信，却只选取以上五类机构的工作人员作为研究对象，得出的结果并不是所谓公民诚信，而是服务人员的业务水平。

3、从实验数据上，这个结果实际上已经与所谓诚信研究课题不符。

首先，它的统计方式实际上是主动联系失主，不讲是怎么联系。其次，根据他们的实验结果，有钱的钱包比没钱的钱包的联系更多，大额的钱包比小额的钱包联系更多。那么，这个数据反映的就不是诚信，而是这个价值的钱包是否值得联系失主的博弈问题。（这个问题在文章中有部分提及）

综上所述，我认为这篇《Science》在研究方法上的瑕疵比较大，对于我国的基础情况并不适用，至于研究结果中的中国公民诚信水平问题，我认为缺乏可靠的研究基础。对于这种从实验设计角度就不算严谨的报告能够登上国际顶级期刊，我表示很失望。审稿的估计没有正常中国人，不然这种论文得打回去重做。

这篇报告是一个典型的例子，连它都能发在顶级期刊上，那么整个学术领域又有多少这种偏颇的 “科学” 研究大行其道？又会被多少别有用心的人拿来攻击我们呢？

责编 | 于杨

审核 | 邱荔

知乎用户郑庄公发表

题目说得很清楚，他们测试的是银行、警局、博物馆、剧院等社会机构，不是普通公民。可是，题目为什么要说成公民诚信排行呢？偷换概念。

而中国这些机构的诚信如何，中国公民对它们的印象如何，咱们中国公民都应该很清楚。

有一个笑话，说一个人掉河里去了，大家都要救。有一个说，这人是十字会的。众人走了一多半。又一个人说，可能是城管的。众人都往里扔石头……

从下往上数不排第一才真有问题呢。

知乎用户小边观点发表

这种研究报告就和美国大选的民调一样不可靠。

首先，我们要搞清楚一件事，其调查选取的诚信检测方式是失物招领，也就是调查人员假装拾取钱包来到柜台，通过失物招领的方式测试柜台人员是否会联系失主。

这样一来，所谓的 “诚信测试” 其实就无形中变成了“服务人员素质测试”，这样选取的对象群体就很有问题，容易造成研究结果的极大偏差。

第二点，归还程序问题。

虽然报告号称所选定的交付机构有五类：1、银行；2、剧院，博物馆或其他文化场所；3、邮局；4、酒店；5、警察局，法院或其他公职单位，然而在文中放出来的具体事例似乎只有酒店一项。

也行，我们就说说酒店的归还程序。

众所周知，中国的失物招领习惯一向是拣着了，交给柜台，然后柜台等丢东西的上门认领，而这回的测试程序则是包里放个电子邮箱的地址，等你发邮件去~

你觉得有几个看柜台的服务人员会给你发？

通行了几十年的默认等待认领程序在那，他大概率是不会找你的，更别说发邮件这种低效联系方式——哪怕留个电话也行么~

所以，到头来讨论的诚信问题变成了 “各国服务人员素质以及招领模式优劣” 的议题，这样一个漏洞百出毫无逻辑的人文社科类文章也能出现在以严谨闻名的《Science》上，我只能扼腕叹息一声：

科学还是有国界的。

知乎用户吴善发表

在 Hacker News 看到其中一名作者。有人说这个实验怎么没日本，要是日本也在里面那肯定得排第一吧。作者回复：我们刚开始是准备包含日本的，但是在做实验的刚开始发现，日本有很多小的「警察亭」(注：应该是指交番)，日本人捡到东西会丢到这个「警察亭」里，而不是去联系失主，所以我们没办法在日本做这个实验。

那么，如果中国人也把钱包丢到所属单位的失物招领处了呢？我也觉得中国人的平均诚信度还不如欧美日，但我不太相信，中国一线和强二线 (文中称选取八个中国最大城市) 的银行、博物馆、酒店等的工作人员会在柜台试图私吞一个没有钱或者含四十几块人民币的塑料钱包。

所以，排除邮箱等因素，这个实验能得出的结论应该是中国人不够热心 (懒得因为这点小钱主动联系失主) 或者中国的失物招领制度不完善 (失物招领处很可能守株待兔而不是主动联系失主)，跟不诚信不搭噶。但这两点也确实是问题。

知乎用户迟飞发表

看了下，榜单上居然没有韩国和日本！这是很成问题的。

大概是害怕出现对比导致穿帮吧，这次是对付中国的。为突出重点，把日韩屏蔽掉才是王道。

这叫舆论战，宣传战目标就是妖魔化，丑化中国人，这种丑化还会通过精外得到发扬。敌我分明。

知乎用户瑭佛发表

这两年参加过一些国际研讨会，不免会碰上一些土生土长的二代华裔，还有一些至少在中学受教育时期就跟着父母来到欧洲扎下根儿的 1.5 代华裔，他们中不少人的研究领域依然是和我们中国本土分不开的。严格意义上来讲，英文德文才是他们的母语，因为用中文交流很快就能发现，他们的思维方式早已和我们主流的中国人大相径庭。尽管如此，依仗着良好的语言优势，如果他们愿意选择科研，就会更具备一些优势在大学或其它研究机构占有一席之地。这样一来，他们所做的有关中国本土的研究，就难免会出现脱离实际的偏差，类似前几日知乎平台讨论火热的那个 Science 发表的 “中国人不回邮件，不还钱包，结论是诚信低下” 的啼笑皆非的研究论文。我也读过不少 100% 外国血统的所谓汉学家的论文，闹得笑话太多了，对不同社会文化因素的忽视，研究方法不免变成了洋泾浜，会产生极大地倾向性，得出来的研究结果则很大程度上失去了有效性和可靠性。

去年一个研讨会上, 在一个 panel 有几个金发碧眼的外国研究员做了一个关于中国本土的课题, 我也就进去听一听。在提问环节, 我稍微阐述了自己的小小不同的声音, 场面就有些尴尬。在我这个土生土长的中国人面前, 语言不是我的优势, 但是社会文化背景我是熟知的。本应属于我的主场, 有时候却会莫名其妙地变成一个 “闯入者”。后来我也明白了, 其实不少学术小圈子也都是自 high, 听不进去意见的。渐渐地, 我就学乖了, 能不发表意见就尽量少说话。

同时也会出现另一个现象，我自己做研究，德国导师还有其它外国教授学者的一些指指点点，会说不到点儿上，很尴尬。遗憾地是，全球研究界主体的研究框架大多都是沿袭着西方的传统，他们具有绝对的话语权。我承认自己的英文德文水平，即便成年以后再怎么努力，这一辈子在语言上是不会具备任何优势的，没有可能逾越这些连珠炮般的母语者，和这些被西方思维灌输满满的华裔们。有很多方面，我们无法彼此说服，然而这是西方世界，我也只有不断做出调整和妥协，并因此时不时会产生一些困扰，修改论文是痛苦的事情。

我也很想问一问，很多很多研究做出来，偏差不免会不断加大，那么学术界的论文究竟有多少是经得起推敲的真材实料、真金白银，而不是那些简单粗暴得出来 “中国人不发邮件，不归还钱包，诚信低下” 的想当然的荒谬结论呢！

知乎用户 Maybe 发表

非社科专业，但我有个疑问：诚信（人性）是可以用来做实验的么？

其他不说了，高赞回答对于实验的严谨性说很详细了。

人性中存在诸多的弱点，比如贪婪，自私，猜疑，嫉妒等等。人性的弱点不用讲出来，所有人都心知肚明。任何个人心理都想过不好的想法，或者偷偷做过什么，或者犯过或大或小的错，超凡脱俗的圣人少之又少。但这个实验是把人性中黑暗的一面拿到阳光下晒，无所顾忌的晒。

中国是倒数第一，那么其他倒数的国家呢？可能有些国家的老百姓生活就是个问题，无瑕顾己，何以顾他，不要轻易考验人性。道德是以法律和经济为基础的，法律是刚性约束，经济更多的是柔性约束。法律健全，经济繁荣，人民生活水平高，谁都想当个高尚的人。

看了这个实验，让我深深感受到了歧视，傲慢，偏见，无端指责。这就好比我家是地主，过得好，身价千万，出门看到 100 元都不捡。有天突发奇想，满大街扔了几百块，看看穷人会不会捡，这是何等的傲慢！！

这个实验出自于如此顶级的期刊，而且利用人性做实验。说的过一点，这跟日本 731 部队母爱实验有何区别？

知乎用户颢卿发表

许多人没有真正读过文章凭借几张图片和问题本身主观臆断作者的想法，这种做法是抱有偏见的。抱着这样的心情写答案就好像王劲松说的演员不背台词就上热搜一样。

首先归还钱包是有一定的时间成本的，文章当中也提到，这种 “义务偿还” 的利他动机，很大程度上取决于“白拿所带来的内疚感“（也就是自己把自己看成是小偷）。所以文章的主要目的是想看，公民的诚信程度是不是随着金钱激励的上升而提高。

要知道这样的研究其实是很有意义的，因为我们甚至很难说出一个定论，一方面来说归还钱包本身是有时间成本的，比如说联系失主，比如说保存钱包本身。另一方面来说归还也意味着 “失去”。所以说钱包内金钱的上升很显然有着双向的作用，一方面是金钱所带来的 “诱惑”，另一方面是白拿所带来的 “内疚感”。不通过实证研究很难证明那一方面因素会在人的最终决定中起到主要的作用。

所以这不是一个在比较哪个国家的人更诚信的研究。大家也没必要因为中国的归还率低而感到任何不爽。

研究的主要结果是无论是什么国家，在钱包里面包含钱的时候，大家的归还率都会显著提高。这意味着道德约束战胜了金钱本身的诱惑。这样的结果本身就应该被更积极地看待，而中国的加总除了在第一张表中出现过以外，后面的结果和中国人是否诚信更是完全没有任何关联。

至于中国人为什么会在所有国家中归还率较低，作者本身也有解释，比如说归还钱包的时间成本，归还钱包本身是需要花费时间的。可能时间对于中国人来说本身就比其他人来得更重要，如果钱包里面涉及的金额不够高（13.45 美金也就是 100 块钱人民币不到），并且抽样的城市是上海这样的城市，或许很多人都懒得去联系失主并且归还。

其他的一些文中没有原因也可能是许多机构有规定，只负责寄存不负责主动联系归还，比如说如果丢失的人真的觉得这个钱包很重要可能会主动去跟相关机构联系获取钱包。如果丢失的人自己都不愿意主动联系那可能说明丢失者本身也不在意，甚至不愿意花时间去取回，这样对于这些机构而言自然也没有太强的动力去主动归还。

另外

@chenqin

说到的人口密度本身也是一种很好的说法，人口密度和流动性较高也会导致 “寻人归还“本身的成本升高，这些因素都会对最终的“归还” 的绝对值的统计结果产生重要的影响，而这些影响又恰好在观察 “金钱激励” 效果的时候被完美消除，因为无论钱包里面有钱还是没钱还是有多少钱，归还钱包的成本这类“搜索时间“成本是不随着钱包内金钱所改变的。

总得来说这是一篇 “求仁得仁” 的文章，文章的结果甚至对于中国是一种称赞（在发现钱包里有钱的时候，中国人甚至比许多其他国家的人更愿意交还钱包）。作为读者而言，更加不应该因为中国仅仅只是出现在了全文图表中的一处就“特殊看待”。

以上

知乎用户回声箭发表

我认真看了一下论文，学术垃圾而已，充斥着各类傲慢的想当然和偏见。而且，有许多无法解释的奇怪现象，比如说日本、韩国、新加坡这三个和中国最像的国家居然没有进入调查范围。

这篇文章搞了四十个国家的数据，泰国、马来西亚、印度尼西亚这种国家都榜上有名，俄罗斯这样很不方便的敌对国家都拿到数据，甚至还有哈萨克斯坦这样的闭塞国家，偏偏就没有日韩新的数据，真是见了鬼了。

其实，要不是这篇文章为了搞大新闻，把中国排到了倒数第一，也显不出这篇文章的滑稽性。我相信中国人的道德水平和诚信水平不是很高，但你要说倒数第一那就真的滑稽了，搞过头就显得尬了。如果中国只是倒数第五倒数第十，绝不会有这么大的争议。不过这样，以这个稀烂的学术水平，也不会上 science。

这件事真是让人觉得悲剧，不是中国悲剧，而是 science 悲剧。

写这篇文章，明显就是个投机活动，以夸张性地搞大新闻碰瓷混口饭吃，这种人国内搞社科的也有不少，这么粗糙的做法，在一百年前的学术界都是落伍的行为。

一般情况这种玩意儿都是在一些垃圾杂志上吸吸眼球，完成一下论文指标而已。但他居然敢投 science，而且还被 science 收了，这说明了两个问题。

第一这个投机分子觉得他这种投机有可能在 science 上投机成功，他一定是嗅到了某种信息，这种人最会见风使舵，如果真的没机会他不会投的。第二 science 让他上了，不是说明 science 的审稿人都是傻逼，而是 science 的审稿人确实认同了他搞的大新闻，而且 get 到了他投机的点，他不是认同了学术素养，而是认同了这个大新闻。

这就是礼崩乐坏啊，真有一种且容小弟伸伸脚的感觉。

PS. 原来不是没有日本数据，只是初试测试数据和自己想的不一样就找了个借口不测而已，也知道文化制度不一样啊，这么个做学术真有笔削春秋的风范了。

知乎用户三千万世界发表

听说过爱心冰箱么？

有俩小伙看到牌子上的说明后，自觉往冰箱里放了零钱

一位老大爷路过放了个苹果进去，想了一会，换了个更大的放进去

说好的台湾最美的风景是人呢？滑稽. jpg

一个小学生路过，放了一封信进去，

额。。。。。。。。。

“科学” 统计这地方的人诚信倒数第一？？？？

知乎用户 Eidosper 发表

你要是把联系方式改成 facebook id，那中国人铁定垫底。

表单没有用 email 当短信的日本人，恐怕是为了数据好看故意的吧？日韩新越都没有，这实验作者是来搞笑的吧？

你说西方政府吃相不好，莫须有的打压华为也就算了，学术圈也这么玩？

知乎用户小伏笔 i 发表

开始了，最近这几天都泡在外网，外网黑中国就是政治正确，但是有随着网络的发展，很多人的素质也慢慢觉醒，分辨能力得到了提高，看一些很容易就能分辨的黑中国的素材更加理性了，包括 NED，CIA 都是反对的排头兵，他们不仅口头上支持，还出钱培养一些 “自由斗士”，至于是为什么，这里就不展开来讲了。这时候只要有越多的官方，科学的调查，就可以增加抹黑的基础，不至于一些人的理论太过于缥缈，以至于让人一眼就能看出来。不知道为什么，很多外国人都特别喜欢看国人出丑，就像国人特别喜欢被外国人赞美一样。

知乎用户离离图总裂夫发表

卧槽。这破玩意也能发 Science？真是侮辱了科学两个字。难道黑中国成了政治正确？

其实我国社会学者可以依据这个文章展开。研究一下是否贴合当地风俗习惯能得到的不同响应。

比如电话号码、推特脸书账号、微信号等等联系方式产生的不同效果。

根据我的经验的话，在中国希望得到陌生人的联系的话。电话号码要靠谱得多。服务人员顺手打个电话给你是很常见的。我就接到过电影院和酒店人员的电话告知有物品遗忘。

微信就差点，添加陌生人麻烦。

邮箱是什么鬼？这么落后的联系方式，在我国只有商务信函等特殊领域在用。

你怎么不留平邮地址？我敢断言回复率基本降到零。

知乎用户失去梦想的咸鱼发表

人家知乎大 V 至少有理有据有分析。你这 “中国人诚信低的事实” 又从何而来的结论呢？真是张口就来。

如果是从这篇滑稽的论文得来的，人家大 V 至少质疑有理由，你这就直接无脑反驳了理由都不说一下。如果是从论文得来的结论，你凭什么觉得它就是真实可信的呢？那些质疑你又如何回应？如果你是从别处得出的结论，麻烦说理由。这论文报告再滑稽还有个实验和数据，你这真是随口一说。好大一顶帽子。

知乎用户白羽子发表

不是，还个钱包和诚信不诚信有关系吗。

我觉得我国人最可能做的并不是 “捡起钱包——自己收好”，而是 “无视钱包”，捡起来自己收好算不诚信心里有愧，还嘛又麻烦，不如不捡，你要说我国人勤奋指数倒数第一还更可信一些。

至于没钱的钱包就真的和诚信没半毛钱关系了，完全是情分问题。

说个真实的，如果我有幸看到了钱包（真的是有幸，我走路不看路的），捡起来翻一下发现里面没钱只有证件，我有极大可能上交，但也有可能做这件事情：

扔回原地

不过还有一个可能，就是我国的工作人员不给力，那也算在诚信的一部分。

总的来说这个实验变量太多，有参考价值，但没必要。

知乎用户逛逛发表

这种论文一直以来都是最愚蠢的，因为可以设置考核方式。

我举一个例子。

钱包放置的地点，是很讲究的。在美国，把钱包放置在华尔街银行家公司的大门口，几乎不可能丢。一帮年入百万美金的银行家，不会为了几百美金，干出不讲信誉的事。

而放在黑人社区，那就不一样了。

在黑人社区，普遍穷的状态下，钱包几乎不可能拿回来。

在中国也是一样，中国也有穷的地区。在那个地方实验，肯定没有好结果。

外国的这种测试，从一开始就没有好心，里面可以操作的门道太多了。

已我微弱的智慧，我就可以用很多方式影响结果。

第一个，联系方式上做手脚。

中国人普遍用微信，很少用邮件。留下唯一的联系方式，就可以大幅度提高结果。如果想让中国高，就留下微信。

美国人几乎不用微信，不诚信几率 100%。

第二个，地点上做手脚。

如果是我测试，我在美国那边，一定把钱包放在吸毒，黑帮，抢劫遍地的社区。

中国这边我就放在中南海，那种出门随时碰见正省级别的地方。我就不信大庭广众之下，一帮省级，国级干部，会这么干。

这种测试，是最无聊的测试，因为测试的结果，完全是可以设计的。

简单的说，测试人想要什么结果，就可以导向什么结果。

只要让我设计规矩，任何匪夷所思的事情都可以发生。

比如，搞一个《国家软件发展应用排行》

在其中，就已微信普及率为标准，微信普及率越低，代表该国软件发展越低。

我相信，美国肯定是落后的。

这种小微量的，小样本的调查，太容易被操控。

只有真正的大数据，才有一点公信力。

对比一下犯罪率。犯罪率可是真正的全国大数据，做不了假呢。

鉴于，国外类似调查一直以来的公信力，我相信这个调查的结果，完全是对方设计出来的。这完全是为了黑中国，发动的舆论战，学术战争。

在电影届，只有中国是穷的，落后的，野蛮的，代表所谓 “人性” 的影片，才是可以拿奖的。这类影片，一般都是外国人给予的资金，让中国人自己拍的。

这种《全球公民诚信排名》结果已经 “被设置” 了，还有什么公信力？

用两个字评价他，就是：恶心

明天我搞一个排行榜，《全球种族进化排行》。

哪一个种族，毛发多就代表这个种族，进化不完全，是低等的，落后的，野蛮的民族。

我还可以搞一个，《科技高铁指数》。

这个指数里，高铁越多的国家，就代表该国科技越先进。没有高铁的，就是野蛮的，落后的第三世界国家。

我还可以设置《人均核武器反人类指数》。

人均核武器越多的国家，就是越反人类的。

知乎用户 Mlily 梦百合发表

看了看知乎，我就放心了。

如果是几年前，我能想到类似的新闻一出来，就是一边倒的批判所谓的 “国民性”，好像批判者就有某种特殊的本事，完全能不受到这种“国民性” 的支配和影响。

其实我觉得这个实验还是有一定的意义的，但它考察的似乎不是诚信的问题，尤其是它选取的对象并非随机的，而是一些公共服务设施的管理人员。而且，没有任何证据表示，他们没有联系失主，就意味着他们把失物 “私吞” 了，更可能的情况是他们把它扔到一旁，等着失主来主动联系（中国人毕竟有 “多一事不如少一事” 的习语）。所以，这恐怕只能反应出这些人工作态度和工作效率的问题，或者说这些单位管理上的问题，而不是诚信的问题，直接推导出 “诚信度”，未免太不严谨了吧？

而且，这个问题完全是可以通过建立一套科学、规范的流程，来加以检讨和解决的。而不像 “不诚信” 这顶道德大帽子，实在是有点不由分说的感觉。

答主对此可以说是深有体会，因为答主是个十分丢三落四的人，不久之前，我在上海地铁弄丢了一份重要的文件，地铁值班办公室打电话给我的时候，我还是懵圈的，在他的提示下我才发现文件不见了（其中有我的身份信息和联系方式）。但这时我已经离开了一段时间，而且有别的急事，于是问能不能另外约时间去取，电话那边答复说可以，但是不要超过一周。

一周后我来到了该地铁站的站长室，这边的操作十分规范、严谨。虽然我不是主动报失，是站务人员捡到并通知我的，但还是要发起一个寻单流程，站长在检查并记录了我的身份证、手机号之后，才把文件交还给了我，这是防止别人冒领吧。随后，我就收到了这样一条通知短信，看来这一切都是流程化、系统化的。

如果我们的公共服务设施都能建立起这样一套完善的机制，可以实现数字化、信息化的管理，那么工作人员付出的努力和效率就有据可循，他们也有足够的动力去做好这项工作吧。希望这样的经验在国内可以推而广之，不要再给人留下 “不诚信” 的口实。

知乎用户 [已重置] 发表

实验方式存在巨大问题。如果换作是微信群里掉红包我想 report（给自己朋友圈）的数字会达到空前的 100%

知乎用户 Jurand 发表

他妈的，八个城市三百多次考察，没有一个反恐意识达标的，我很烦啊！我国的公务人员和各行业前台人员反恐意识真是堪忧啊！

拜托，你可是酒店前台，面对着熙熙攘攘的人群，突然冲进来一个人，手里拿个钱包，

“这个是我在街边找到的，一定是什么人丢的。但是我现在很忙，我立马就得走，我不能留下我的姓名，不能留下我的电话，不能给你看我的身份证，这玩意就交给你啦么么哒。”

然后丢下钱包就消失在茫茫人海。

这时候一脸懵逼的你该怎么做？是打开看看这个钱包是谁的吗？不是。是把它收进招领处等人来拿吗？也不是。

你应该，大叫一声，按响警铃，疏散人群，封锁大堂，叫来特警，抓到那个傻逼，然后让他付全责。

连警局都这么不小心，我真是绝望了。

知乎用户 BLACK 枪骑兵发表

预言家宣布今年是（高大上人设）破产之年。

从山巅之城到自由贸易的灯塔，从 IEEE 到 Science，一个个绚烂的光环随着拥有者的肆意妄为而不断破产。

知乎用户特兰克斯的剑发表

抖个机灵，在中国钱包不就是手机嘛。

关于中国人特别是城市居民的诚信问题，还是

@支付宝

比较有资格来回答吧

知乎用户 Minamoto 发表

难道这样的文章也可以上 Science 吗？

我不觉得 “捡到钱包联系失主的品质” 可以被称为 “诚信”，因为没有“许诺” 谈何 “诚信”？，我也不觉得这种“捡到钱包联系失主” 的品质有任何意义，失主如果真的觉得钱包重要，肯定会主动去找，而且失主主动找钱包几乎肯定会比捡到钱包后去找失主快。

一个对社会几乎毫无影响的鸡毛蒜皮的 “道德品质” 也可以上 Science，而如此多的兢兢业业的回归猿这辈子能上个 econometrica 就已经谢天谢地了，只能说我们受到了严重不公平的对待。

知乎用户李明苏发表

除却电子邮件、忙碌程度两个因素未能处理好外，私以为这个实验还缺乏对文化背景的考量。如果能加上日韩，甚至于说越南的数据，想必更能使人信服一些。（按照日本在国际上的存在感，选 40 个国家都选不到日本，也是一件怪事。）

拾得遗失物之后，主动联络失主与等待失主联络，都是可以采取的措施，不能说等待失主联络就视同不诚信。尤其在该实验的主要设计场景，都是可以轻易找到管理人员的固定场所的情况下。

东亚社会有着浓厚的责任本位意识，是谁的过失，就应当谁来主动采取措施弥补，他人仅有协助的义务。东西丢了，自己回忆在哪里丢的，自己沿路找回去，在国人乃至于整个儒家文化圈看来，再理所当然不过。

还有一点在于，该实验的设计者恐怕没有考虑到一件事，以中国公共场合的监控覆盖率，工作人员对遗失物的侵占意愿几乎为零——什么事情录像里都一清二楚，失主调监控一路找过来就行，根本不存在侵吞的可能性。失主知道东西能查出去向，保管人员知道失主能找过来，于是双方达成一个默契：东西丢了我可以帮你保管，但这件事责任在你，你也有能力（通过监控）自己找过来，那这东西还要不要自然是你自己的事；别说你只是个透明塑料袋，你把名片贴在外边我也懒得看一眼。

这个实验与其说衡量的是诚信，不如说在考量公共场合工作人员的主观意愿强度。不同文化背景（可以加入日韩数据）、失主是否有能力找回来（控制实验场所有无监控），都会对工作人员的主观意愿产生影响。以此定论诚信能力，未免缺乏说服力。

而且不管怎么想，失主能否完整取得遗失物，都是比工作人员是否主动联系失主，更为有效的衡量诚信的指标吧，也只需要在该实验里加个失主隔天回到报告遗失物的场合询问的步骤。九十九拜都过来了，差这最后一哆嗦，这点实在是让人心生疑窦。

知乎用户 fei feifei 发表

这样的过家家一样的文章能发 Science。不能忍。建议大家去这篇文章下面发 eLetter 留言，超过 100 封必然要引起编辑的关注。顺便还可以把你们的反驳发给作者：

一作： Alain Cohn， adcohn@umich.edu

通讯：Michel André Maréchal， michel.marechal@econ.uzh.ch

Dear Editors,

You must be curious as to why I used the plural form of editor here. Because I believe a fierce debate had been conducted between (among) you regarding the publishability of this paper due to the premature and unsubstantiated conclusion on the global civic honesty ranking.

I, myself, am very surprised by how such weakly organized experimental results passed their own internal peer-review, the finicky Science reviewers’vetting, and, most importantly, the editors’ quality control (QC).

As a PhD holder myself, I fully understand that for a research project with a far-reaching conclusion to be published in Science (or any other journals), well-rounded and carefully executed experiments, conclusions strongly supported by the results, and high reproduciblilities are the pre-requisites. However, I see none in this paper.

This research used the reporting rate of a lost ‘wallet’ with/without money among the 400 samples to measure the civic honesty of 40 nations. The general direction was not problematic, but there are quite a few critical questions the authors need to ask themselves before writing the manuscript, or, even before they performed the experiments.

Are ~400 samples per country big enough to draw a conclusion on a global scale?
America has more than 300 million people, can 400 represent them? How about China with a population of 1.4 billion?
Why was not Japan included? Because Japan has a lot of police stations that people return lost items to as part of their culture? Isn’t the police station one of the target locations?
Why does not the ‘business card’ have phone number, address, and company name? I don’t think any one has ever seen one single business card like this. People with common senses will know this is not a real business card and assume it’s a prank. Don’t you think a phone call will be faster???????
Have the authors ever used a wallet themselves in the real life? A wallet isn’t a plastic bag with no money nor a single ID card in it. A wallet is an enclosed leather container with bank cards and IDs. You can’t do a social experiment without mimicking a realistic scenario.
Has the research team ever gone back and checked if the ‘wallets’ were still there? Maybe they are still with the institutions (put away in a drawer waiting for the owner to come looking for it). If the wallets are still there, they can’t claim the institutions are dishonest.
For this, I’d say this was an incomplete experiment as the authors didn’t collect all the outcomes.
How can the authors extrapolate the behavioral tendency from institutions like banks, and hotels to normal civilians? The counter staff has their own responsibilities that they might have less freedom to use their work email for things irrelevant to their job.
In the text, citizens and institutions are used interchangeably, which is incorrect.
“Can you please take care of it”? No more explanation on how? What if the receptionists assumed that you already emailed the owner and they just needed to store the wallet? Sending an email with your phone about the wallet takes less than a minute. How hurry were you???
How would the authors expect the ranking to change if they enlarge the sample volume to 4000 cases? 40,000 cases?
The foci of this paper is evidently the counter-intuitive observation that more money in the ‘wallet’ results in a higher return rate. And, to be honest, if the authors can change the title and remove the texts related to the global civic honesty, this paper still can be published in another journal.
Did they also already know that everyone in China uses Wechat to communicate instead of using emails? They took into account Japan’s cultural impact, yet, failed to do the same for China? Their rationale for ruling out the bias email would impose on the study is hotels always use email. This might stand, but what about the other 4 institutions? Hotel only made up 22% of the total’wallet’ number distributed.
How do the authors understand the word ‘honest’?? It’s far-fetching to link’not actively contacting the owner’to’being dishonesty’. People are too busy to care more about a money-free’wallet’.

I’d recommend the authors retract the paper from Science, change the title, and publish it somewhere else.

You are welcome.

欢迎补充

咱们定个小目标，召集 500 位知友发 500 封邮件给他们。邮箱后缀最好五花八门，这样他们想 block 都没办法。一作是个 AP，我就不信他有这个心理承受能力，这能让他疯一段时间。

但是写的信一定不要带有情绪或者民族情绪，我们要以科学的辩论打到不科学的结论。

而且我们不需要直接挑刺，问与漏洞直接相关的问题即可，8 成问题他们都解决不了。

https://science.sciencemag.org/content/early/2019/06/19/science.aau8712/tab-e-letters

这文章里的实验方法和结果无论如何都得不出 civic honesty 这样的结论。最多也最合适的结论就是钱包有钱造成更高的归还率。

从 Science 撤稿以后改个标题，可以发表在 5 流杂志上。标题我也想好了，就叫：

Global Altruism (Stupidity) Is Higher Than Expected

知乎用户 Emil Zhang 发表

我看到的第一感觉就是：

现在做科研的这么闲，这么有钱了吗？

几十个国家的跑，居然设计了这么不严谨的科目，不联系失主就是不诚信？

不诚信的唯一证明方式就是我知道你捡到了钱包但是我问你捡没捡到的时候你否认。而不是你不联系失主！（而且还是 email，老天国外日常交流还这么原始的吗？）

想到这里我们几乎可以肯定就是给这个实验投资的要求就是做一组中国诚信最差的报告，不然真的很难理解这资金是咋来的。

知乎用户孙尉翔发表

都废除中医了，怎么还不废除社会学？这么伪科学的东西都能发 Science 的原因就是整个学科都接受甚至欢迎这种范式。

知乎用户 Marshall488 发表

我觉得大家讨论的点跑偏了。讨论这个结果如何其实并没有意义。我相信作为一个大牛，还不至于到编造数据的地步，这个结果确实是通过实验得出来的。

个人觉得，关注的点应该在实验设计数据筛选和 science 上

作为一个算是只发过几篇文章的学渣，我也知道实验设计这个问题是一篇文章的根。如此粗糙的设计，如此莫名其妙的实验结果与结论的关联，还用了让各国人民都很敏感的诚信这样的标签，这篇文章从根上来讲就是虚的。

其他的答主也说了作者获得了日本的数据，但是以文化的借口剔除了。这就很有意思了。数据这个东西真的是个很好的武器。

最后，这个水平的实验设计，这个水平的数据处理标准，居然上了 science。这篇文章真是刷新了我对 science 的水平的认知，也让我多了一个疑问，社会科学到底科不科学？

知乎用户沉默的马大爷发表

这篇论文可以作为《心理测量学》第一讲《信度与效度》的典型反面案例。

理论上想测的变量是 “公民诚信”，实际上测的指标是 “联系失物失主的比例”，那么自然可以问两个问题：

（1）这个指标真能反映背后的理论变量吗？

（2）指标和理论变量的对应关系，在各国之间相等吗？

只有指标和理论变量存在清晰的对应关系，而且这种关系在不同国家基本相同，搞出这么一个 “civic honesty around globe” 的跨国比较才有意义。然而作者并没有在这两个问题上说服我。测量效度不高，则结果无意义。

有人可能会说，这论文的重点并不是比较哪国诚信水平高，而是研究诚信与物质诱惑的机制问题。没错，看完全文，真正的学术贡献确实是在这一点。然而论文从标题到行文再到图表的展示，都在有意无意地突出跨国比较的结果。

搞社会科学的人，平时写东西都知道要小心翼翼，敏感的话题尽量委婉地表述，尽量减少不必要的误解和争议。然而这论文却用这种噱头的方式来写，要说在主观上没有 “就是要搞个大新闻” 的想法，我是不大相信的。不过看看发表的杂志，也就不奇怪了。。。

知乎用户崔丁发表

遗失的钱包是否送回，不能当作评判一个国家人民 “诚信” 的主要标准！

这就好比我们判断一个人的实力，不能以这个人是否努力为主要标准一样！

一个国家的主要力量、支柱力量是商业，我到觉得用企业之间合同违约数据来判断，是较为公正的标准。

黑我种花之心不死啊！

知乎用户王伟麟发表

研究方法有问题。如果失主的信息不是 email，而是微信二维码，我估计中国可能冲到榜首。

各个国家的文化、社会环境不同，使用的电子通讯工具也很不一样。电子邮件是相对老式的交流方式，都 9102 年了，中国人没有那么高的 email 使用率，很多人就一个 QQ 邮箱，还常年不登录一次的那种。微信却可以不离手，扫二维码更是举手之劳。像我，平时工作沟通也都是使用微信。

青蛙在井底，使用错误的研究方法，自然就能得出 “天空只有井口大” 这种可笑的结论。它并不知道，井外面的人绝对不会使用 “从井底向上观察” 这种研究方法去估算天空的大小。

知乎用户 zstcode 发表

刚刚刷了一圈，槽点好像都被吐的差不多了….. 直到看到这个

emmmmmmm……

这删数据的水平像极了学习统计时长两年半的本科生…….

这论文能发 Science…. 抓一个班的学生能把 Science 灌水到吐

知乎用户松鼠山老农发表

作为科技工作者，我们都知道，如果我们想获得一个结论，我们可以昧着良心设定各种利于自己结论的假设，采集到足够支撑我们理论的数据。然后通过各种数学方法进行数据处理，保准能得到自己想要的结论。与其批判作者，我更想批判的是审稿人。十几亿人，就采集几百个数据点，中国的地图炮都比你们杂志严谨。

知乎用户孺子牛发表

根据这个测试流程，这个准确来讲，应该不叫诚信测试，而是人情味测试。排行前列的都是北欧国家，也就是说那些国家的人，闲的发慌，不是坐等失主自己找上来，而是想尽办法主动联系上当事人，把东西还给他们。

而中国就欠缺这么些人情味了，工作那么忙，生活压力那么大，谁 TM 有空会主动去还钱包。

两个社会氛围孰高孰低一见高下。

列表中没有日本，但是日本理论上也应该和北欧差不多。因为有 N 多去旅游的人，丢了东西之后，很容易就找回来的。但是在国内几乎无可能。比如日本乘地铁丢了一张地铁卡，几乎可以保证能找回。问路也不是随便指指，而是给你带到目的地。

本人觉得应该要补充一下，本人去日本旅游过几次。

1 次在机场松屋吃饭落下了手机，店员从 2 楼（松屋在二楼）追到 1 楼（去乘飞机要走一楼），问我有没有丢手机。当时我都没反应过了，我甚至还没发现自己少了个手机，说没有，店员都一脸懵 B 的回去了。过了数秒钟，我终于反应过来手机不见了，于是回去店铺找回了手机。

另外 1 次乘地铁老婆丢了东京地铁三日券，要出站刷卡的时候才发现，然后就出不了站，于是我们和站务员联系，想问是不是要补票还是怎么样，主要目的是让我老婆出来就行。结果站务员吧啦吧啦打了个电话，过一会儿，就有回电告诉我们地铁三日券找到了，让我们去某个站拿就行了，还给我老婆开了一张证明单，可以乘地铁过去取，当时我都惊呆了。然后就体验了一把日本地铁的失物招领处。后来特别观察了一下，日本地铁的失物招领处的确是无处不在。

知乎用户千岩发表

我觉得这个实验生动的说明了一个问题：为什么会有反智主义。

首先，你用了一个场景实验，做了一个不算特别严谨的数学分析，得出了一个跟一般人观念相反的结论。然后，你得意洋洋的以为颠覆了人们的常识？

你错了，一般情况下，稍微冷静一点的人会认为作者是一个友善度，当然，如果真是这样，其实还好。

更可怕的情况是，大众会拿出这个事例说明你使用的方法有多么的不靠谱。举个例子：一个大妈会听说这个例子然后告诉所有人，你看看，所谓的科学家，和刊登这个论文的杂志是多么不靠谱了吧。然后用她丰富的幻想嘲讽所有试图解释这个问题的人。并且洋洋得意的宣称反智主义的成功…

我现在就在努力的向别人说明，并不是所有做数学建模的都是友善度，数学建模是个靠谱的工具而不是骗人的玩意儿。甚至于为了更好的解释这一点，我告诉他们，刊载这个论文的，是一本野鸡杂志。ヾ (●´∇｀●)ﾉ哇～

我这么说，你们该知道做科普的人有多么讨厌这个友善度论文了吧。

知乎用户徐辰发表

邮箱…… 我只能说要么你完全不了解中国人的习惯，要么你就是存心找茬。

信不信你在瑞士做实验的时候钱包里塞个 QQ 号瑞士立马变倒数第一？

知乎用户夏桀发表

看了这么多回答，我只想说

你我晚生了 600 年，600 年前，吾国吾族被白人说成世界上最先进最文明最高尚的民族，事实如何，看书去

今日，吾国吾族被说成了这也不行那也不行的民族，是世界毒瘤，事实如何，看人间去

别人说啥，你就这般在意？

吾族自有吾族的荣光，何须他人说

三百年前，白人艰辛度日，靠武力掠夺，杀戮毁灭，方有今日。竟自诩文明缔造者，怕不是记不得今日之世界，如何而来。若论劣根性，看看往昔，白人当是贪婪、破坏成性，谈何文明

可笑可叹可悲

往日，色目人如此说，然后揍服就完了

今日，色目人如此说，不少人就趴下了

有些人自以为秉持科学理性之精神，其实行自卑菲薄之奴隶精神

有些人名为中国人，其实不是。

生活在这个时代既是我辈的不幸，也是我辈的幸事

广阔天地，大有作为。

知乎用户千年放浪发表

我觉得论据有点问题，但结论没有问题。下面我决定重新论证一次：

要证明诚信，最好的证据当然是我们官方的征信报告了。

选取对象就选主要地区和主要城市人群，比较具备代表性。

假如你是浙江的

[个人频繁跳槽信用将成问题浙江拟用征信约束频繁跳槽www.dyhjw.com

](https://link.zhihu.com/?target=http%3A//www.dyhjw.com/gold/20190403-90244.html)

假如你是北京的

[北京地铁禁食规定：在地铁吃东西将被记入个人征信报告_手机搜狐网m.sohu.com

](https://link.zhihu.com/?target=http%3A//m.sohu.com/a/314132287_100218548/)

假如你是上海的

你看，我的论证充分又严密，相信随着征信系统一步步放开，不久的未来大家都有机会当上不诚信的中国人了

知乎用户谭派文发表

文章的缺陷已经被高票回答们挖掘得很清晰了，说到底，这就是一个 “愿者上钩” 的问题，至于文章的最后结论究竟是事实还是观点反倒无关紧要。

愿意相信它的人自然会选择性无视它所有低级错误，最不济也可以捏着 “国人是不是综合素质总体较低” 之类的观点作文章。至于什么叫做 “综合素质”，什么样的样本可以反映“总体”，“较低” 是用什么标准衡量较低等诸如此类的重要问题，这类人当然是会故意忽视回答的。抛开讨论事实的假象，他们想要做的其实是讨论各自的立场。

可以推测这也是为什么文章的缺陷如此明显：只有主动联系失主才被视为 “诚信” 而联系方式只有电子邮件、实验所用 “钱包” 和日常所见钱包差别迥异、样本量极端不均衡、未确保非英语国家实验者是否理解了作者的意图、东亚三国中的日本和韩国怪异地未被纳入实验等等等等。毕竟，如果实验做得太过严谨，则结果未免太过接近事实。而事实不会有倾向性，也几乎总是没有观点或立场那般极端，那文章又何以博人眼球呢？

我们更可以推测，即使这篇文章撤稿，也可以被描绘成 “这篇文章的结论令中国 lost face, 再一次掀起中国国内 patriotism 的浪潮，中国再次拿出 communist country 压迫舆论的蛮横，《science》被迫撤稿，国际学术自由受到中国打压”，文章的作者则自然占据“因勇于说出真相而被极权国家压迫” 的道德制高点。

有反击之道吗？恐怕没有。文章本身用学术讨论的精致外壳完美包裹住了其所有不当，在这个范围里，所有不恰当都属于学术不严谨。你不可以指责文章自带偏见，在没有明确马脚的情况下指责作者歧视则更显得你情绪激动（而这个情绪则显然会被理解为 patriotism）、行为可笑、动机可疑。因此，所有情绪流露明显的抨击都会落入圈套，成为上述段落里所描绘情景的一环。至于言辞冷静的学术分析，则会自动被文章的狂信者们所忽略——如前所言，他们想要讨论的并非事实或者学术，而仅仅是各自的观点或者立场。

至于将来，说真的，大众总是善忘的，更何况是学术圈里的东西，即使被偶然知晓，被普罗百姓遗忘起来速度只会更快。除此以外，这类缺陷明显的文章也只有第一次发表还可以在博人眼球的同时还带有学术自由的光环，短时间内倘如有后续效仿者（诸如 “研究显示中国对动物同理心水平最低”、“研究显示中国学生创新能力最低”、“研究显示中国反抗权威心理趋势水平最低”），媒体大众也只会觉得愈显腻味。套路玩得太多，情绪也便没那么容易撩拨了。至于更长远的将来，只能说“发展才是硬道理” 了，想来的人多了，想走的人少了，管它什么圈念得什么经也不碍，正如各类枪击案各类文章不影响人摩肩擦踵抽美国绿卡一样。当然，如果发展崩了，那自然什么屎盆子扣下来也得挨着。

知乎用户秋秋秋子发表

我不服！

印度这个钱包都时常被偷的国家为什么不是倒数第一！

啊？！

知乎用户烈日烤鱼发表

敢不敢把钱包里的唯一联系方式改成微信再到各国统计一遍？

知乎用户 Zorn 飏发表

这篇论文给我的感觉就像这样……

做一个《全球公民饮食调查》

调查方式：通过观察刀叉的使用情况

调查结果：中国人很少使用刀叉

实验结论：中国人几乎不吃饭。

（日本因为使用筷子而被剔除）

纯属为黑而黑。

知乎用户 laike9m 发表

这个实验是不是故意抹黑中国暂且不论，实验设计是真的很扯淡。

不同国家的人习惯的通讯方式不同，中国人不喜欢用邮件的（甚至我怀疑很多人都没有 email）。你换成微信号试试，说不定瑞士倒数第一呢。

与之对应，不习惯用邮件也是中文互联网极少有人用实名账号的重要原因：

[为什么英文互联网世界里实名比例如此之高？ - laike9m’s bloglaike9m.com

](https://link.zhihu.com/?target=https%3A//laike9m.com/blog/wei-shi-yao-ying-wen-hu-lian-wang-shi-jie-li-shi-ming-bi-li-ru-ci-zhi-gao%2C107/)

希望能看到反驳这个调查的论文。

知乎用户周明发表

这论文他妈净扯淡，论文本身怎么样其实大佬们完全没必要像这么认真，这人明显不懂中国。

外国人自行车丢了中国警察都给找回来，别说钱包里有信息，没信息发现是外国人的钱包也会千方百计联系上。

前提是看起来要像个钱包。

知乎用户匿名用户发表

看到是经济学家们发表的文章，所以我觉得有必要给大家看看经济学圈子里是怎么看待这个事情的。我这里贴一个 EconJobMarketRumor 的帖子，有兴趣的同学可以专门去看看：

“Civic honesty around the globe” (paper in Science)www.econjobrumors.com

这个论坛，如它的名字，是一个经济学家们找工作的论坛，但也经常有各类圈子里的讨论，甚至是对某一篇论文的看法。在很多圈子里的人来看这个论坛是一个败坏风气的论坛，因为经常能在里面看到 “侮辱女性” 的词汇（有兴趣的可以搜索哈佛大学的博士生 Alice Wu 和 EJMR）；也有人揭发过论文的抄袭，以及该抄袭论文的作者和期刊杂志 editor 正在合写别的文章的腐败事件。总的来说，这个论坛上面对各种事情的讨论都比较极端，不会去打太极，原因可能是因为匿名。另一个想说的是大家不要很意外这类研究，因为经济学很多实证研究都是标题 / 内容很震惊的那种，张口就是诚信，腐败，洗脑，这类研究才能称得上是 interesting 的 topic，不搞大新闻想发好期刊是很不容易的。

这里我翻译几个我觉得这个帖子下比较有趣的评论，括号里是我自己的感想。

``If Japan was in the study they would be top 3.’’

如果日本也在这个研究里的话，他们肯定是前三。

（偏见不一定是往坏的方向）

``A: The most honest country was Switzerland or Denmark. Least honest was - what do you expect.

B: Let’s say I guessed correctly on the first try

C: I think we all did.’’

A：最诚实的国家是瑞士和丹麦。最不诚实的是，你们猜？

B：我第一次猜就猜中了！

C：我想我们都是一下就猜中了！

（这里是三个人 A，B，C 的回复，可以看出来，对中国的偏见确实是普遍存在的，研究的结果可以说坐实了 B，C 两位的猜想。我这里无从揣摩这个 A 的心态，但他能问出这个问题确实钓起了 B，C 两条鱼，并且我没有看到其他人回复 A 的帖子里提到了其他国家或者说自己猜错了。不过这个问题倒是让我细思恐极，作为该研究里倒数第一的中国人，我如果没看过文章，第一眼看到 A 的问题，其实心里也是有个答案的，这个答案代表了我的偏见。我想任何一个人对着 A 的问题，可能下意识都会有一个答案，每个人内心都会有一些偏见。**最为恐怖的是这类研究的结果无论是怎么样的，它都会引起强大的口水战，或是加深人们内心的偏见，对种族 / 国家之间的歧视是有巨大负面作用的。**同时，说实话我也没觉得这类研究有任何的应用价值或者是普世意义。就算它的方法精确无误，从研究的话题而言，这种研究应该被枪毙，就像那些研究不同人种智商差异的文章一样。）

知乎用户周赛发表

我们至少还进入了测试国家名录呢！这说明我们国家的治安状况还不错，至少不至于直接把实验人员绑了抢钱！

知乎用户健步侠阿杜发表

看了看 https://news.ycombinator.com/item?id=20236444，发现国外的吃瓜群众也提出了很多不满，我可以理解一个社会科学研究存在很多争议，但是尼玛这可是个 science 文章啊……

我摘录一些吃瓜群众吐槽，简单翻译了下

A bit odd that they didn’t include Japan in their set of countries. My expectation is that it would have probably topped the list.‘

跟知乎一样，问为啥没有日本的结果

作者表示日本人倾向于归还到治安亭 = =

Hm.. wouldn’t it bias your results in some countries too? I used to live in Poland, now living in Switzerland (both topping the chart), and in both countries it’s pretty customary to drop found wallets/IDs at police stations.
Btw, in both countries there’s a rule (at least in Poland it’s in the civic law, probably more like a custom in Switzerland), that the person who found your wallet can receive some share (finder’s fee) of money, in Poland currently 10%.

波兰吃瓜群众说日本你觉得有 bias 就去掉，我们波兰有法规还钱可以领 10% 报酬，这种 bias 你不不考虑吗？= =

I think the contents of the wallet are too much like junk without the money. Some business cards, a grocery list and a key in a transparent wallet. To me that’s almost as junk as finding some fliers and I might think somebody has just thrown it away as litter and $13 is like lunch money. So it has to has $100 so I think"they might want this".
If it was a regular wallet full of useful cards, perhaps some sentimental things like photos etc. then I’d want to get it back to them regardless of whether it contained some cash. I think this experiment might work better with a backpack or a mobile phone.

这里也有人提出了这个钱包就很奇怪，生活中并不常见，更像是垃圾 = =

I don’t have any data to back this up, just knowledge about Chinese society. My view is the main driver for the low score for China is the society norm of minding your own business and not getting involved. So it might not be a measure of honesty but rather a measure of being passive. For example, I would assume if instead of having to contact the person, the person just walked over to retrieve the wallet, they’d likely get it back.

这里也有网友指出天朝分数低是因为大家一般都是事不关己少惹麻烦的态度，跟不诚实无关

To me, the biggest confounding variable is the race/culture of the researchers. From the supplementary material: “We recruited eleven male and two female research assistants to perform the drop-offs. All research assistants were recruited from two German speaking universities and born between 1985 and 1993.” Seems somewhat fortuitous that German/Nordic countries uniformly performed the best. In many countries, they would stick out like a sore thumb. To make this study more complete, they really should have someone who looks and speaks more native do this as well. Especially as race/culture seems to be so highly correlated with the result, it is only natural to see whether factors like distrust/xenophobia play a part. I mean, some random stranger (possibly using a language translator app!?) tells you to do something with a package they drop off and then leaves very quickly. How I react would certainly depend at least somewhat on my impression of the person and how that brief interaction went.

这里也有人提到了测试中使用德国人在不同国家来做实验，会很奇怪，所以也能解释为啥德国北欧得分相对较高，因为语言习俗会接近一些

Isn’t there a degree of"apathy"vs.“honesty"here? A person could be fully honest, but just not care enough to take the time to contact the owner of the wallet. It doesn’t seem they considered that in the study design?

这里也有人指出了这个实验叫做同情心可能更合适 = =

Very nice and unintuitive main finding. I wish there was a separate condition where they sent a second experimenter back to the location of the hand-in to ask for the wallet. Just waiting for a contact leaves some room for unpredictable effects: perhaps with no money, the person can’t even be bothered to deal with it. With money, there is an incentive to try to contact in the hope that if no response is received within a short period, the money can be kept.

这个大哥的建议也有点意思，应该再排第二个人去同一个地点装作失主去取回来，原作者表示在一些国家试了试 We find that over 98% of the money was returned, so doesn’t seem to be the case that people are contacting the owner but pocketing the cash. 说 98% 的钱都被 return 了，可问题是 figure 上最高的 return 率也不到 90% 啊大哥

还有印度网友有类似的吐槽，总之大家英文水平过关的可以慢慢欣赏 = = 这 science 真好发！