两个被中国人玩坏的AI研究方向:ELM和Metaheuris

使用CN2/CN2GIA顶级线路,支持Shadowsocks/V2ray科学上网,支持支付宝付款,每月仅需 5 美元
## 加入品葱精选 Telegram Channel ##

两个被中国人玩坏的AI研究方向:ELM和Metaheuris

作者:杜克林

几年前开始,中国发表的学术论文的数量就已经是世界第一,论文自引数量也世界第一。中国的论文就如同中国的商品在国际上的声誉一样,只有极少数的领域有前沿的成果。从本人的实践中,在AI领域有两个研究方向已经被中国人玩坏,不吐不快。

第一个是ELM(Extreme Learning Machine, 极限学习机)。ELM在2004年由新加坡国立大学的G.B. Huang提出来的时候,本人就觉得它就是RBF网络的特殊情况,只是把输入层的权重和RBF中心随机初始化,然后把输出层的权重解出来,实际上是解一个线性方程组,用一个伪逆操作即可完成。由于不需要输入层权重和RBF中心的调节,所以只要求出矩阵的伪逆,一步给出结果。作者发现用这种方法,比BP模型和SVM模型快1000倍。作者把这个trick 称为极限学习机。

实际上,这个方法的思想是把一个含有大量冗余的模型的大量模型参数随机化或固化的方法,然后用其中的很少的参数对数据进行拟合。这种想法在1980年代后在各种模型中都有采用,没有什么新意,仅仅是一个小技巧而已。

ELM的作者随即如获至宝,开始到中国大力推广ELM,并连续10多年在一些著名的国际会议上召集国际专题会,投稿人基本上都是中国大陆的作者,其中不乏清华大学,浙江大学,中国科学院的作者。据估计,应该有数千篇有关ELM的论文发表,不乏IEEE Transactions on Neural Networks and Learning Systems, Neural Networks等期刊上的论文。这些期刊的编委会成员主要也是华人。俨然ELM被国际学术界广泛接受的样子。

但是早在10年前,深度学习的奠基人 Y. LeCun就公开在社交媒体上批评这个模型,说它对机器学习领域没有贡献,早在1958年就被神经网络领域的奠基人就研究过,却有大量中国最优秀的研究生在从事这种东西的研究,觉得不可思议。后来,LeCun对媒体说,“ELM is officially a fraud.”(https://actorsfit.com/a?ID=e170d2e1-62f6-43e0-9b64-f6510be36803)

在2014年前后,我的邮箱中收到了G.B. Huang群发的email,说有个叫Wang的人对他的ELM进行抹黑,并进一步为他的ELM辩解。随后过了几天,我又收到一封匿名的群发邮件,标题是ELM丑闻。

在过去10多年中,我遇到很多中国研究生对ELM非常膜拜,这些中国研究生容不得任何人说ELM不好。我也看到无数中国学者发表无数的有关ELM的论文,也看到了西安一个非常高产的中科院院士,在IEEE Transactions on Neural Networks and Learning Systems 发表了两篇连载论文来分析ELM模型,得出一些无关痛痒的结论。我也看到了G.B. Huang 成为AI领域被引用排名前几的科学家。

我和国内的在AI领域有实力的朋友聊及此事,对方答曰:在中国没有真正的原创研究,大部分人都在跟风,不管是清华,浙大还是中科院。不管是不是原创,只要能够发表论文就可了。所以从这个角度来看,国内的考核制度,只能制造出越来越多的水货论文。

其实,早在2015年知乎上就有人讨论ELM,基本上都是一致认为这个东西没有什么贡献(https://www.zhihu.com/question/28810567),和Y. LeCun的观点基本一致,说明国内的很多学者还是清醒的。但是持有这些观点的个体只能匿名非主流,在数千篇相关论文的中国作者面前只能是边缘人。

最近有朋友要我帮一个在国内顶尖大学做研究的硕士生修改一篇ELM论文,在她的30多篇参考文献中,有关ELM的30多篇参考文献全是中国大陆学者发表在IEEE等高级别期刊上,而且无一例外都是中国大陆学者,所以这些研究都是在中国进行的。我只是对学生提出一些修改意见,学生基本上都不予理睬,答复说她的用法是目前的主流论文的用法。鉴于她的所有参考文献都是中国大陆作者的发表的ELM相关的论文,她说的主流论文毫无疑问就是中国大陆学者的论文。这种东西也都成了主流,不知道是学生对自己过于自信,还是被ELM的民族自豪感洗坏了脑子(全世界基本上只有中国人研究ELM,G.B. Huang也是从中国出去的,是中国人独创的)。所以,对学者的评价,不能光看发表的期刊的级别和引用数,也要看国际同行的评审意见。否则,你的自豪成为国际上的笑话。

另一个被中国人玩坏的研究领域是Metaheuristics(启发式优化)。作为Scientific Reports的编委,我负责机器学习和自然计算的论文的评审和协调。我经常收到来自中国的关于某种启发式优化的投稿,在选择审稿人时,我发现,在系统推荐的数百个审稿人中,这些推荐的审稿人都是过去发表过相关的期刊论文,80%以上都是的工作单位是中国大陆 ,另外的基本上都是台湾人,韩国人,和海外的大陆人,还有几位伊朗人和埃及人,我几乎没看到有发达国家的非华人从事这种研究。这些启发式优化方法,基本上根据某种动物的捕食或交配等策略现象,或某种自然或物理现象,或某种人类的思维方式等设计一种简单策略来解决优化问题。在早期,这种方法还有一定的新颖性,但是如今,世界上各种动物、各种植物、山川湖海、物理原理、基本粒子、各种宗教,等等等等,实在繁多,都有人受启发来发表论文。如果继续下去,加上这些策略的组合,可以发表的论文数量是无限的。这种可以开发无限种方法的Metaheuristics,如今实在是被玩坏了。

一个相似的例子是,蛋白质结构的解析,早前让中国人极为自豪的海归明星科学家施一公、颜宁等的实验室,每年解析一些蛋白质,发表一些CNS论文。但是自从2021年,Google子公司DeepMind开发的AlphaFold解析了这个星球上100多万种生物的2亿多个蛋白质结构,而且精度优于人工实验解释的结果,施一公和颜宁也只能够改行,都回国做学官。后来,Meta公司也推出了软件解析了6亿多种蛋白质。所以,AI让大量的这种原创性不强的科学家失业了。

目前正处于AI热潮中,机器学习模型的各种要素的各种组合,或者对某个数据进行计算的一道研究生作业题,也都大量被用来发表学术论文。总而言之,大量低水平的论文吞噬了中国学者的研究经费和年轻学者的劳动力。除了产生一些虚假的学术GDP以外,对提升中国在研究水平并无益处。

(XYS20231008)

◇◇新语丝(www.xys.org)(xinyusi.us)(groups.google.com/group/xinyusi)◇◇

最简单好用的 VPS,没有之一,注册立得 100 美金
comments powered by Disqus

See Also

土-叙地震真的会引发中国境内大地震吗?

土-叙地震真的会引发中国境内大地震吗? 作者:方玄昌 自唐山大地震以来,全世界每一次灾难性地震,几乎都会引出中国社会上与地震预测有关的各种神奇“学说”。目前已经造成数万死伤的土耳其-叙利亚群发地震自然不会例外。 所不同的是,过往更多“神人” …

为什么中国人会觉得美国治安比中国差多了?

为什么中国人会觉得美国治安比中国差多了? ·方舟子· 上次我对比了中国和美国的安全感,作为在这两个国家都曾经长期生活过的人,我觉得我在这个问题上还是很有发言权的。但还是有很多人不服,他们做出比我还了解美国治安状况的样子,要来教训我,说美国是 …

与蔡医生的一番话

与蔡医生的一番话 作者:李长青 蔡医生是ICU的主治医生,父母是香港移民,他出生在美国,普通话和粤语都不怎么会说。作为主治医生,他是我的老师,我也从他这里学到了很多东西。他的未婚妻是大陆出生的移民,俩人明年即将结婚。前几天一起值夜班他向我请 …

毛泽东同音乐工作者的谈话

毛泽东同音乐工作者的谈话 (一九五六年八月二十四日) 实现社会主义革命的基本原则,各个国家都是相同的。但是在小的原则和基本原则的表现形式方面是有不同的。比如打仗的原理是一样的,都是攻、守、进、退、胜、败,但是在打法上,怎么攻,怎么守,各有不 …

三年后再来到中国,我相信这里会继续繁荣

三年后再来到中国,我相信这里会继续繁荣 作者:STEVEN RATTNER 2023年5月31日纽约时报 这是我三年多来第一次来中国,一觉醒来,看到北京一反常态的蔚蓝天空。连翘和樱花开得正盛,整座城市熠熠生辉。 在我看来,这至少是对我今春为 …