如何看待复旦博士生使用 ocr 和正则表达式帮助学院几分钟核查完数百人核酸完成截图?

by , at 09 April 2022, tags : 技术 核酸 复旦 博士 点击纠错 点击删除
使用CN2/CN2GIA顶级线路,支持Shadowsocks/V2ray科学上网,支持支付宝付款,每月仅需 5 美元
## 加入品葱精选 Telegram Channel ##

知乎用户 留德华叫兽​​ 发表

抗疫也已经 2 年多了

相关的信息和智能化建设

根本无法想象是在人工智能如此发达的中国

计算机视觉 OCR 方案

还需要靠一个苦逼的在读博士

挤时间自己研发?

2022 年了

依旧频繁在朋友圈、互联网上看到

因为核酸检测而导致的 “悲惨遭遇”

全校 / 全小区在寒风中排队十几小时(甚至熬到凌晨)

只为做一个核酸检测

为何不联系一家运筹学公司

建立一套调度系统来统筹调度这项工作(调度问题)

包括志愿者和医护人员的轮岗排班(人员排班问题)

更魔幻的是还存在纯人工手写登记

检测完之后

再来一个闭环的信息系统

自动给出全校、全小区的核酸统计报告

这很难么?

知乎用户 AimiBritni​ 发表

这次上海疫情下来 ,让我深切感受到了所谓信息化转型还任重道远 。

除了这个核酸结果统计需要花费大量人力统计之外,之前通过健康云批量做老人的核酸 预约也是个相当费劲的事情。

因为健康云没法直接批量预约得一个一个弄,而又有很多独居老人并没有儿女帮他们预约,所以每次都需要大量的志愿者花费大量的时间来帮他们预约核酸 。

本来志愿者人力就不足,在这个时候还要他们做这种毫无意义的重复劳动就很离谱,关键是健康云仿佛从来不知道有这么个需求一样,做了这么多次大规模检测了仍然没有上这个 feature。

最后看到青浦有个选调生通过类似按键精灵的东西实现了通过 excel 表批量预约的功能。并且也上了当地的公众号新闻。

幸运的是,健康云这个辣鸡的约核酸产品终于被换成随申办了。

看到类似的这两个事件后,感觉其实我国对于广大互联网从业者的需求还有很多没有释放出来,可能需要等着领导们逐渐替换成从小在互联网中侵染的这一批才能进一步的释放出这些需求来更好的帮助我们解决这些生活中简单的小问题。

另外从互联网产品经理的视角上来看,这些问题从一开始产品设计上就需要被考虑到,即使当时忘记了,后续从用户反馈中也可以收集到并识别出这是一个重要且紧急的需求,并且很有可能一天就可以完成上线。

那为啥他们不会呢,因为互联网公司需要靠更好的用户体验来不断抢占市场,而他们作为垄断型产品自然不会有这种动力,也就不会有这种意识了,除非…………


刚刚看了部分其他答主的回答,发现很多答主认为这位博士用这么小儿科的调库去实现一个功能也配上人民日报,而且还要写几个小时,自己甚至十几分钟就可以搞定。

我只想说这些答主可能都搞错了重点

因为一个优秀的产品的定义就是它能切实的解决用户的需求和痛点,而不是它是通过多么牛逼的技术才实现的。

而这位博士他敏锐的观察到了这个用户痛点并通过力所能及的方式实现了他解决了大家的痛点,让统计的相关人员都节省了大量的时间,这就是一个优秀的产品。

而人民日报要推这篇文章 所宣传的也并不是他的技术有多牛逼,而是宣传了这种洞察需求并解决问题的能力和意识。科技改变我们的生活,从一件很小的事情就可以体现出来。就凭这我觉得是非常值得宣传的。

唯一可能不太 ok 的只是里面有些对技术实现描述的段落确实会让人觉得有点尬了罢了。

知乎用户 小泽马大哈​ 发表

能用 ocr 和正则表达式提取的信息,后台必然有准确的格式化的数据,提供个接口出来就能让几千几万人不必使用这类无法保证准确率的奇技淫巧。

当然,做这么一个系统最难的不是做出来,而是设计。比如核酸检测数据,哪些人应该有权限拿到哪些数据?所有人随便查所有人的记录显然是不合理的,但是一旦涉及到权限就一定是先制定规则再人工审核。规则怎么定,谁来审核,出了问题找谁追责,这些都是问题。要是对不同性质的单位做不同需求,开发量和其他工作量一定会比想象的更大。政府系统的软件,做出来没人用的例子还少吗?

信息时代也是不可避免地有摩擦和内耗的。你觉得这个 ocr + 正则表达式的方案效率太低,但很可能已经是现实情况下不差的方案了。如果这个代码可以开源出去,让大家都可以根据当地情况去改进,也不失为一件提高效率的好事。

知乎用户 第一大明白 发表

其实,挺难过的。

真挺难过的。

疫情突如其来至今,已经两年多了。

我们除了搞出一个健康码来,很多应该数据化的工具还没有做出来。

可能有些朋友看过网上流出的一些内部流调截图,不知你们看了是什么感觉,我看了是挺悲哀的,不只是为信息泄露而悲哀,更为流调没有专业化的信息数据工具而悲哀。

在我的理解中,流调应该有一个程序,该程序可以跟许多数据进行对接、自动核对,流调人员简单录入阳性病例之后,根据大数据筛查过的行成轨迹就会自动生成,流调人员再根据阳性人员自己的回忆补足大数据部分,之后提交,后台自动生成流调报告。

而现在是什么情况呢?

流调人员通过询问、查看截图、交叉验证等多种方式确认阳性病例行程轨迹没问题之后,再撰写一份流调报告,上传。

疾控中心收到流调报告之后,再进行编辑、汇总,按照时间和地点公布重点涉疫场所,或者是擦去隐私信息,直接按照病例编号发布流调报告中的轨迹信息。无论哪种发布方式,都挺浪费人力的。

在我的理解中,如果可以做到流调报告模块化、信息化,就能通过程序自动选取时间、地点等重要信息,再通过去重得方式迅速生成可向公众公布的以时间和地点为经纬的流调信息,如果公众不想看文字版,还可以直接生成地图版,公众直接查询即可。

现在的情况时,向公众展示的这些内容,我们都有。但把这些展示内容整理出来,却要耗费大量的人力。

复旦这个案例不也是吗?明明教给程序三两分钟就能完事的东西,人力上却需要半个小时。我跟你们讲,这还是因为截图少,倘若截图多,用程序跑的优势就更明显了。

如果我们拥有流调报告的数字化工具,我们流调速度会进一步加快,我们封控时间就会缩短。

知乎用户 秀川 发表

挺好的,那些角度刁钻冷嘲热讽的人,并不是很好的人。

我并不希望阴阳怪气的人越来越多,我希望像复旦博士这样能运用所学来解决实际问题的人越来越多。只有垒起来一块块砖,才会有高楼大厦,站在旁边起哄 BB 的人,在我看来没有比搬砖工人做出更大的贡献。

众所周知上海现在社区买菜很困难,微信群里开团接龙这种垃圾方式居然找不到好的替代,年纪大的人操作不来,甚至有的人连改群昵称都做不到。

作为一个菜鸡程序员,我本想写个小程序来优化下 “买菜难” 这个问题,因为这个问题并不复杂,写个页面也就一两个小时。

分享这个页面到群里,大家看到这个商品信息,想买的扫码付款给团长,统计完成后团长再自己跟菜场联系,送菜上门。

啊有人说为啥不用美团叮咚盒马?我会用,但老人们最多只有微信,你能驳倒这个理由再跟我说为啥要单独写个小程序。

然而,写完页面,跟某个所谓团长联系之后,我放弃了上线的打算,主要原因是,团长提到分成,我意思是我不需要她给我分成,她不信我,觉得我想掌握用户信息后自己当团长,所以不采用这个小程序,虽然她也说了会方便很多。

想做个好事,就是这么难成行。

复旦这位博士,用自己的知识,方便了大家的工作,人日来表扬了,居然还有人找到角度来骂几句,我真是服。

还是那句话,觉得人家不行的,你自己找到更好的方案,行百里者半九十,你能做成再开口说话。

or stfu.

顺便,看到有不少人提到 ocr 识别防不了 P 图造假。

没有任何系统是完美的,人家只是写个工具,并不是写一个大项目,需要考虑到所有的异常情况吗?这么重要的事情,那要不要上报联合国呢?

大家的包容心都越来越少了,为什么呢?

知乎用户 夜星辰 发表

我仔细思考了一下,个人的身份信息是否核酸,是否打了疫苗等都是属于个人隐私范畴,正常来讲是不能被一个接口随便调用的。但是各个基层单位又在上级单位的压力下有确认一个人是否核酸了的需求,这点又至关重要,因为很有可能有人没去做,这样就会存在一个矛盾,基层单位需要获取你的个人信息以证明你核酸了,但是这些个人信息属于你的隐私他们无权调用,所以就只能使用这种截图上报的方法确认你是否核酸过。如果我没猜错,这个程序最开始的用途就是给他们院导员用的。

以目前的技术手段有没有办法解决这个问题呢?其实是有的,但是现存的系统没有办法提供解决方案,还需要进行改进。

下面说一个我个人思考过的一个可行方案:

可以像企业微信一样,建立基层的单位的机构号,是你这个单位的可以通过邀请码等方式加入进去,你所需要做的就是手动授权(这样能确保隐私,只授权需要的核酸信息给单位)将你最近一次核酸的信息的权限放开给单位查看,这样单位那边就可以显示出你是否核酸了,检查个人是否核酸的工作可以轻松的解决。

知乎用户 CnDriver 发表

信息社会的漏网之鱼。

虽然疫情已经这么长时间了,核酸数据还是没有一个全国统一公开的 API 接口,竟然还需要手工截图上传?竟然还需要手工统计?这特娘的还是复旦大学?我小学时就学过的数据库被时代扔进狗肚子里了?

我越来越怀疑:我们对疫情的态度是不是只是在表面在乎。已经三年了,连一个全国统一的核酸数据库都没人做,一个全国一流的高等学府统计核酸数据还要用一千年前的 “古方”,当一个人使用比他自己年龄都大的某项技术时,竟然还能上国字机构的新闻。

长久以来,我们的行政管理方法都过于注重 “人”,而忽视 “物”。不管什么事,最重要的都是找人来做,找更多的人来做,而不是怎样把这件事做好。

因此我们便很容易陷入意图伦理的陷阱当中——我重视了,我开会了,我努利了,这就可以了,至于这件事有没有做好,做的是否漂亮,根本不重要。

尤其是所有人都在手填表格,都在人海战术,都在挑灯夜战时,最好的表现就是填更多的表格,抽调更多的人手,加更多的班…… 这才是踏实可见的政绩,而不是用了什么 “不靠谱的新方法”。

别人三天做完的事你十分钟就完成了,领导只会嫌你坐那没事干、嫌你下班准点走,嫌你开会不积极…… 而不是赞扬你效率高。

这才是机关单位做事的常态。

所以,官媒报道复旦博士的小创新是好事吗?是好事,但这件好事的背后是一个悲剧的、宏大的背景,宏大到可以将无数的好事淹没在时代的沧桑之下,按灭所有本该燎原的星星之火。我们本该高枕无忧,却被强制艰苦奋斗;我们本该轻松愉快,却被灌输忆苦思甜;我们本该大道坦途,却被扔向遍地荆棘。

知乎用户 由空​ 发表

1. 首先一些阴阳怪气的别酸了,创新很多时候就是对现有方案的组合应用,按很多酸黄瓜的理论,元素周期表不过就是把原子量排列了一下而已,孟德尔遗传实验不过就是个黑盒测试,居里夫人得两次诺贝尔奖是因为提纯搬砖技术熟练,沃森克里克发现双螺旋就是用 x 光扫了下,瓦特发明蒸汽机就是改造了下烧水壶,冯诺依曼不过就是给了个计算器控制器、存储器概念,图灵测试普通人用脑子想想也能提出,只不过他最早想象到了。

2. 官媒尤其是人报不是新闻机构,他们是宣传机构。宣传大多不是给别人看新鲜事的,常看官媒的人就会知道,一件事在张家做了可以发宣传稿,在李家做一模一样的事也可以发,具体的目的有刷绩效,刷存在,刷典型,刷方向,刷精神。比如你看个农村开展电商使农民增收的报道,你会评论这电子商务的技术我早就掌握了,我开店比他好多了吗?你看个见义勇为救落水儿童牺牲的,你会评论他游泳技术太差,救人经验不足吗?不存在的,如果有,说明你完全没 get 到稿件的意思。

3. 复旦官方给的标题很客观,学以致用,创新实践。意思就是鼓励大家多实践利用自己所学知识,创新的运用到不同方面。同个基础技术跨个学科应用很容易灌水发文成功,不是技术有多先进,是你组合的方式比较新颖。另外主要也是给学校师生提个劲,鼓励其他人为学校做出更多无偿贡献。

4. 复旦这么多 cs 讲师教授肯定早有人会想到 ocr,只不过活不是自己做,这东西又没钱拿,做这个自己的其他事情反而被耽搁,机会成本代价高昂。何必掺合。导师也说过自己给学校免费搬大砖吃力不讨好的惨痛经历。

知乎用户 原网名我没有马 发表

我一直觉得信息化还任重道远…

当年我在某 985 高校,看到研究生徒手计算 6 元方程组,工程问题,精确到小数点后 8 位数字…

我就知道信息化水平了…

最重要的是,他用 Excel 记录中间数值,电脑上也有 MATLAB…

但是他选择徒手计算…

要知道,他是在干活!

在我看来,这就是摸鱼,但是他真的是在很努力干活!

在计算机行业,有非常多非常多手段,让人们从繁重的重复工作中解脱出来,但是,一方面相关行业人员不知道不主动学习,另一方面计算机行业工作人员不普及 (为了垄断别人开源的技术挣钱,这跟开源社区精神又非常矛盾)…

知乎用户 nullptr​​ 发表

技术不是什么很难的技术,开源方案相当多,这位博士做的事情也很有意义,在当前这种大量重复性无意义的劳动中提供一点先进的生产力。

但是,宣传口的记者们和工作人员们,你们像发现新大陆一样沸腾的时候,难道不反思反思,只需要 100 多行代码,1 个小时就可以就可以初步完成的小功能,目前为止为什么没有哪个健康码系统来提供呢?也不要求你们提出类似于 “为什么不用 XXX 技术实现 XXX 功能” 的批评,我甚至都没有看到过如 “疫情 3 年,还没有一个统一的健康码数据库” 这一类的批评。这个还要技术背景才能批评吗?

从直接从后台 api 查询不比 OCR 更方便?

难道你健康码是没有后端的?每次信息更新是直接意念传送到每个人手机上?

信息化社会了,数据都上云了,还要每个人截图上传信息,P 图行不行?P 的好你能查出来?截图有啥意义,你直接后台锁定了数据异常的人不可以吗?有多难?

每天都在进行大量的重复、内耗的工作,把这时间去干什么不好?

知乎用户 王左政 发表

我觉得这个博士的做法没问题,宣传也没有问题,有问题的倒是部分觉得 “这东西这么简单,我做我也能行”“一天天整那个没有用的,谁不会啊,你狗屁才艺也能上公众号” 的人。

的确,**OCR 不是啥高精尖技术,Python 语言也不是什么高难度的语言。用 100 多行代码解决问题好像不如用 30 行代码解决问题更有资格被称为 “大牛”。**问题是,现在疫情统计的需求这么大,**这些 “如此简单” 的技术,怎么没见你主动去提供,去应用呢?**你做了什么?就嗯喷?


这倒是让我想起来一件往事——几十年前的时候,农村缺医少药,城市里的医疗资源倒是不短缺。这时候,主席建议农村搞 “赤脚医生” 制度,从生产队里选拔一些心灵手巧的农民,简单加以培训,就可以派回农村参与基层的初诊,急救,接生等工作。

后来,有人说了:“就这帮培训几个月的人,连高中文化水平都没有,又不是科班出身,怎么去给农民进行治疗?这不是拿制度开玩笑吗?”

没错,这些人确实没有科班出身,没有文化水平——但有他们,总比之前什么都没有强,总比让巫婆神汉占领乡村医疗阵地强吧?你确实厉害,你又做了什么?


所以,话说回来,我再次重申:**这个博士可能确实不太高明,用的手法也没有多么高难。但是人家用这种方法解决了问题,这就是难能可贵的。**他被报道出来之后,可能确实会因此得到这样或那样的 “先进” 和“优秀”,让你觉得愤愤不平,有一种想说点什么的冲动。

好,我承认,你很高明,那你又做了什么?

**


**

我就猜到,评论区里会有人说啦,什么 “我想干但我没有渠道” 云云。

我只想说,你看见学校里面整理这个东西很困难,你去说:“我有一个办法能够帮助咱们减少工作量,看看这边是不是能用得上。” 我不相信你们学校会直接拒绝。

疫情期间归根结底是个非常状态,你让所有人都保持一个清醒的状态,不可能。但是你看见了,你去做了,这就是做贡献。但如果你根本不做,又说什么 “怎么没请我啊,我上我也行”,这事儿我只能说您的吃相有点难看。

行文至此,学一段古文吧:

子曰:“…… 居则曰:‘不吾知也。’如或知尔,则何以哉?”

是啊,则何以哉?


嗯,评论区里又有人来 “积极回复” 我啦,那就挑一个典型言论上个截图吧。不涉及任何人,只谈相关言论问题。

当然,肯定会有人说,为什么学校之前的管理者一直在采用繁琐的旧程序?

这个问题也很好解决。答案就是:**不是每个懂管理的人都懂技术,疫情条件下大家都忙疯了,也不是每个人都能第一时间想起在这个时候能采用什么技术。所以这个时候要是没人提供新方法,那大家就只能靠人力等。**而这时候懂技术的人站出来了,就能造成这个博士所造成的局面。

譬如,我想很多人都有相关的经验——就连 Excel 的下拉表单自动填充数据,都不是每个人都会用。这时候就需要懂技术的人加以指导,节省每个人的时间。此处同理。

不过肯定有的人会这么想:“统计数据的人又不是我 ““如果我教会了大家,我就失去了技术垄断的地位”“他们又没给我钱和好处,我上去有什么用”“枪打出头鸟,我去了万一没有好果汁吃呢”……

可以,这些心态我都理解,毕竟现在个人主义甚嚣尘上嘛,不能要求人人都学雷锋,我向来反对道德绑架任何人。

但是,在有人愿意做好事的时候,也请你们别说风凉话,生气,别嫉妒,别眼红,实在忍不住就往后稍稍。

做个人吧,不好吗?

知乎用户 太空铁​​ 发表

充分体现了各地网信部门、防疫信息化主管部门的不作为。

充分暴露了上海还有多少地方在用手工的方法做这些统计,以及统计的准确性有能有多高。

知乎用户 呜莎花园 发表

非常漂亮的工作

但是,这不是一个很困难的工作,更不是只有复旦博士才有能力完成。

这让我想起我每天都日常:

1、截图自己的健康码和行程码,一大早上传钉钉系统,确保孩子所在学校的调查
2、把健康码和行程码传给单位小妹,由她统计制表上报
3、扫描单位门口的场所码,出示行程码,并在纸质文件上签字说明进入写字楼的理由
4、在微信群里参加接龙,提供自己做核酸的信息
5、向小区保安出示健康码,进小区,回家

以我前程序员的见识,以上事情没有一件事是值得做的。

这不是一个高度信息化数字化社会应该干的事儿。

但是,全国人民应该都在做。

在后疫情社会,大幅度提高防疫的信息化水平势在必行。

知乎用户 Bird​ 发表

不愧是复旦,这宣传真是有力量。

我去年为我校防疫工作写了一整套工具,

包括导入导出、数据汇总、自动统计,

还要考虑各种坑爹的非标表格解析。

结果,别说没有宣传稿了,

防控办的同志甚至都没有跟我说谢谢,

而且还吐槽我协助工作 “不够努力”。


没办法,自家夫人,总不能说啥吧。

疫情防控实在是辛苦,还请大家多多理解。

最后,“科技解放人力” 是我们的应有之义。

虽然这个工作不复杂,但是能帮忙就好了。

知乎用户 轻健身 发表

我们搞无人值守的全自助健身房,会员入场前都要在我们 app 上传自己的实时健康码。系统不通过就不能入场,部分地区门店还会检查是否有 24/48 小时核酸阴性报告。

这都已经去年广州疫情爆发时,三天搞定的事情。IT 部几条蛋散吃着泡面随随便便就弄完了啊。

原来是很高级的技术啊?那我们错怪他们了!不应该扣他们鸡腿啊!

知乎用户 Super X 发表

对媒体来说,复旦和博士是爆点,而 OCR,正则表达式不是。你们这些死码农自己往往都内卷得要死,动不动把常识挂在嘴边上,殊不知隔行如隔山,你自己以为的常识往往是别人难以逾越的高山!

话说回来:
人民日报难道就没有码农么?哦,码农那么低级,审稿子轮得到他们!
机关里没有码农么?哦,有产品经理隔着呢!

算了,我忘了我也是个码农,不说了,去解一个 BUG,很严重的那种!

知乎用户 12345​ 发表

复旦居然要靠手动截图来看核酸结果?而且这种极其简单的 ocr 到现在才有人想起来去做?

知乎用户 吴楚​ 发表

这个博士太不懂规矩了。

你一个人几天做出一个程序。

让那些发疫情财,拿几千万投资,做出一堆 Bug 百出程序的资本家怎么办?

知乎用户 旅行者 发表

只能说所谓社会工作绝大部分都是沉浸在极端低效的无穷无尽的重复人力劳动里不可自拔,人家随便用几个小时,用一些很成熟的技术就能让这些人惊讶

知乎用户 Arthur Wang 发表

我们嘲笑过英国 Excel

英国漏报将近 16000 个新冠病例,因 Excel 超出最大值未更新,如何看待这件事情?

我们嘲笑过日本手绘

我们嘲笑过美国的 yes no

现在轮到我们自己了!

我一直以为是要学习西方发达国家先进的抗疫理念,现在看来还是一直和本土落后思维相结合了的。

知乎用户 尤莎​ 发表

我不知道这个问题下的一些回答在阴阳怪气什么?很多真是一副高高在上的傲慢嘴脸,让人极度不适。十分恶心。

我看了一下新闻原文,人复旦博士自己也说了:

说起程序原理,李小康认为并不复杂。

人家博士也没引以为傲啊,你们觉得这玩意有手就行,自己去做一个啊,咋知乎全是把这玩意拿捏,信手拈来的,也没见你们谁去毛遂自荐解决这个问题的啊。

个个嘲讽有多简单,是个本科生就能做。

还有嘲讽以前人工核查有多麻烦,效率低下。就这么简单一个问题,有几个人想得到这么做啊。人家做出来你们个个马后炮,事后诸葛亮。

就拿疫情健康码,要在做核酸时候提前亮出来,能提高效率这件事,谁不知道啊?都认为这是有手就行的事,我做志愿者时候看到过多少下一个就要做了,半天一个健康码打不开,倒腾来倒腾去。就这点玩意,还要拿着个喇叭循环播放,还有人记不住。

现在人家自己做出来个玩意,个个变身 IT 程序员来嘲讽。

知乎用户 第一人称 发表

前两天在上计算机视觉课,老师在群里分享了这个消息,真巧今天就刷到了。

当时群里一位大佬同学提出了自己的一些想法与老师进行了学术交流,分享给大家看看,头像和昵称都已打码

知乎用户 远山 发表

挺可悲的,说明现代信息社会纯文科生堪称百无一用了。连基本的常识都没有才能写出这种贻笑大方的文章,ocr 又不是复旦博士发明的在这大书特书啥呢,这个程序学过点编程的人都能写,写的好像攻破什么技术难关了。只能说这帮传媒老爷在办公室端个茶杯指点天下太久了,在技术面前就是井底之蛙。

知乎用户 吴茗​ 发表

个人信息的保护都成筛子了,从来没人管。

正经要用的时候这个隐私那个隐私不让用。

简直就像是为了保护未成年人,15 岁能怀孕不能打工一样可笑。

知乎用户 寻步 发表

看到新闻动手复现了一下,不到六十行代码用了将近二十分钟。

因为都是用过的包所以做起来比较快,软件本身很简单。主要是遇到使用场景时要能想到使用它。

OCR 识别核酸报告

知乎用户 从天而降的胖胖​ 发表

事实 1. 基层工作人员没有基本的数据 / 软件知识,重复劳动占据大量工作时间和精力

事实 2. 各级政府对疫情相关数据的访问权限管理严格 / 限制多

推论 3. 公务员招录?

推论 4. 政府信息管理?

知乎用户 纸盒勇者​ 发表

1,有一个苏联笑话是 “苏联最大的成就是解决了在苏联以外根本不可能存在的问题”。

2,前几天有人问什么是现实存在的科幻武器,我回答行程码,因为没有在硬件上过多投入还能监视每个自然人的行动轨迹简直是一个奇迹,现在看来我对奇迹的理解还不够到位。

3,打个比方,这就相当于曼哈顿计划研究中,有个研究员发明了开罐头刀。

4,

人民日报公众号赞美复旦的博士重新发明轮子然后制造平板车。

知乎用户 马德依彪. Matthew 发表

勤快遇到问题的时候,想到是否有更好的办法解决。

如果正好这个人又受过高等教育,而且知道更好办法。

“勤于思考,勇于探索,敢于创新”

知乎用户 Tom Jackson 发表

充分说明了官媒的不学无术狗屁不懂 背个十以内的加法口诀都要惊呼天人

知乎用户 netero 发表

首先,技术上并不复杂,不用博士出马一个应届实习生就可以搞定,最简单的面向 API 的编程调调各大云的 API 就可以更高效和精准的实现, 关键问题是:使用 ocr 的方式,图片是非常容易被伪造的,我只要在图片中写上指定的关键字就可以骗过去。从安全角度上首先不信任所有用户的输入是正确的。应该反思的是:健康码为什么没有提供报表导出的功能?是什么导致了这么基础需求的,很耗费人力且解决起来非常低成本的事情三年了都没有做? 为什么三年了全国的健康码体系还是各自为战导致跨区域防疫成本巨高? 为什么很多本来可以用技术来解决的问题,却人肉填表? 每天学校,单位、社区各种重复劳动低效的查查查的时候没有想过怎么解决?信息化时代信息共享的优势体现在哪里?

知乎用户 邱昊晨 发表

ocr + 正则解决问题没有?解决了。对于非技术人而言,他们压根不了解 ocr 是什么,生活中也不一定直接接触过,这个博士生用合理的方案高效的解决了问题,宣传口再帮忙做做宣传引导下技术普惠、计算机技术对于老百姓生活的影响,多么好的一件事情?

绝大多数技术人员在那里对这种所谓「简单」技术嗤之以鼻的底气不知道是什么,真是纯憨批,这件事情和技术难不难没有半毛钱关系,搞 cv nlp 这帮二笔是不是卷魔怔了。技术是用来解决问题的,不是用来让你们秀花拳绣腿的

btw,一帮象牙塔出来的或者大厂的技术螺丝钉们压根对于各行各业的数字化工作复杂度没有半毛钱 B 数就在那里指点江山,这点视野实在是低级的令人发指

知乎用户 greatmatch​ 发表

人工查截图这么原始的办法我们孩子读书也在用,不光学生,家长和家里同住的所有人都要查健康码截图,很费精力。

而题目这个方法在现行制度下大幅度提高了效率,但远不是最省事的方法。

我提出一个建议:

学生和家长在钉钉里,授权腾讯后台读取健康码查验,输出结果到学校相关人员的钉钉里。这样大家不用截图也不用上传,后台全部搞定。

知乎用户 休息 发表

怎么每次都能有人用入门教材第一章的内容捡漏。我咋不行

知乎用户 import 潘多拉​ 发表

有发现问题的心,

有解决问题的愿,

有实现操作的能。

——这个博士已经做的很好了,你们还想怎么样?

当然,从另一方面就反映出来了更严重的问题:

这么简单的问题也能发生?信息化已经到今天这个程度了居然还在搞这些?

知乎用户 刘宾 发表

没啥技术难度,也就是布置一声,外包也能搞定的事,知道比做到更要紧的点。这体现了:

领导水平、编辑水平和正能量流量推手的技术上限,这一系列人里没一个觉得这种东西报道出来的违和感。

知乎用户 无为而智 发表

属实没想到复旦在上海,竟然还在用原始方法统计,可见复旦行政人员有多冗余,既然技术跟上了,建议疫情后精简机构吧。

这位同学行为很赞,也很有勇气的,ocr 甚至更好的技术方案,很多人想过,但并没有付诸行动,原因在于吃力未必讨好,要承受出错的代价,因此,大家都以不出错得过且过了。

知乎用户 默碌 发表

我相信博士本人看完应该尴尬到扣地板

知乎用户 中医大脑 - Water​ 发表

确实是入门级的技术,说明我们有意无意地把很多能解决问题的人挡在了门外。

知乎用户 angus 发表

不太想看,实话说,一线技术人员的基本操作,被国字头的公号还当成新大陆一样去宣传的时候,对不起,我只看到了技术人员的卑微,和 XX 的 “勤勉”

如果这就是现实,那我真的挺失望的

口口声声的科技兴国,兴在了哪里?

是不是只停留在一次次的会议上,一次次的拉扯中,一次次的盘算里

而真正应该关心的,技术,应用,只能卑微的落在角落的尘埃里

作为一个伪 coder,此刻,很迷惘…

知乎用户 骑蚩尤的熊猫 发表

这需要个博士来写的么?

还用图像识别,还拓码正则表达式,

咋不上天呢。

知乎用户 平凡​​ 发表

我昨晚回答了下面这个问题。

复旦博士开发小程序,2 分钟核对 800 幅核酸截图助力防控,疫情中你在哪个瞬间体会到了知识的力量?

说实话,我根本没有否认这位博士同行的工作,而是反感两个点:

1 抗击疫情的技术手段 3 年如一日,靠人海战术往上填

2 宣传媒体人员科学素养太差,只想着打感动牌震惊牌

这玩意本来就很简单,按理说多逛逛知乎就能知道个大概,但是还能拿出来吹,那只能反应了以前的手段有多离谱。

两年多了,还是只会加油,必胜,这里补个流汗黄豆。

知乎用户 alloc​ 发表

记得疫情刚开始的时候,我们嘲笑日本人力填写 excel 统计确诊病例…..

知乎用户 碎碎念的喵 发表

我觉得现在有一个很奇怪的逻辑

研究出来一种高新科技:这啥玩意儿啊有啥用啊又不能改变生活。

将 “简单” 的技术组合解决实际问题:就这?这也没啥高深技术啊,有啥值得吹的?

但是我一直觉得,技术好不好,最根本在于能不能解决实际问题,能不能给大家带来便捷。

如果确实有用,可以解决问题、可以方便大家的工作生活,那就是好的,值得宣传推广的。

然后我要吹一下 Excel

这真的是一个宝藏工具。

很久之前我玩怪物猎人世界,那时候有个 “观星”。

就是我先保存存档,然后疯狂炼金出珠子,然后恢复存档以后打任务,出珠子的结果是固定不变的。

也就是说,我可以预知到哪次可以出好东西,然后其他炼金用任务来跳过。

可是这有个问题,做任务是按照 112 的顺序来跳过的,每次都人工计数时间长了容易搞岔。

后来我就用 Excel 现学写了个 VBA 按钮,用一次记录一次任务,自动按照 112 的顺序跳过。

非常方便。

对于大佬们来说,这算啥呀,一个信手拈来写个脚本的事儿。

但是对我来说,就是我通过一定的技术,成功解决了遇到的问题。


OCR 难吗?网上有现成的。

正则表达式难吗?不难,网上一搜看一下就行。

而现在,结合这两项技术,成功解决了实际遇到的问题,不就是技术存在的意义么?

知乎用户 羊舌存旺 发表

感慨万千。两年多了,现在每天我们单位还要一个字一个字的把全国隔离名单打出来复印,而且不止一个人打一遍,不能互传。即使你有电子版也不行,格式不对,设置门槛,必须手打,每个科室专人负责。前几天好像有 600 多小区吧。

唯一值得庆幸的是,估计是怕字写的太难看,可以不用手抄。

认识了好多街道小区。

知乎用户 黑山羊不吃草​ 发表

所以为啥要核查截图,这个不应该内部数据一交换就解决了吗?从道理上来说完全没必要。

这位同学本人应该也很无语,因为这是个退而求其次的选择。

知乎用户 饼当 发表

笑死了,外宾嘛?

我到现在就没见过国内哪个单位(互联网大厂没接触过啊),用 word 或者 wps 写材料时候会用文档结构图的。

年轻人进单位第一次写材料,用多级列表把材料写好,领导还要叫你把多级列表删掉。

“一、” 不允许用编号,一定要手打。

然后两年后年轻人也不会用多级列表了,他会主动站出来批评新来的年轻人:

“搞那么花哨干啥呢,我们看不懂!”

知乎用户 毛彦伟​ 发表

大概就类似我刚工作那几年,给本组的数据统计员写了个 excel 的宏,让她每天从加班加点手动拉数据到 8、9 点钟一下子提前到下班后半小时就可以收工。这个外挂一直用到我司的业务系统做了重大升级。

所以,怎么评价呢?一句话,上峰无能。

知乎用户 吾心 发表

看到这个新闻,想到了我们公司之前手动核对发票录入信息,那会每个月上千张发票都是人工确认的。当时我就在想,人眼看费时费力还容易出错,如果可以图像识别发票信息跟后台数据库做对比,岂不是一秒钟完事?事实证明确实很简单,阿里百度都有很成熟的 OCR 场景解决方案,有点编程基础,会调用 API 接口就行,剩下的决策逻辑自己写,无非就是选择,判断,循环。所有代码编写 + 测试半天,还是因为我不熟悉语法,之后本来要干 3 天的活,在我这 2 小时搞定(扫描发票。。。)

回到这个新闻,明明很多可以用技术解决的问题为什么要人工去填呢?一直不太理解为什么需要出入场所就必须亮健康码?数据库关于健康码颜色存储无非就是三个数字(0,1,2),后台逻辑定时读取黄码,红码数据推送到公安,学校,当地居委有什么难度吗?直接联系健康码颜色异常人员,告知不要随意走动,后台监控轨迹,及时通报给相关场所,这样执行效率不是更高吗?

希望在疫情防控中技术人员能够提出相关的处理意见,负责人可以耐心听取技术人员的意见,提高工作效率,实现真正的精准防疫,不要用人海战术自我感动,这些苦本来是不必吃的。

知乎用户 羊肉汤真带劲 发表

可别再宣传了,丢人

知乎用户 绿豆糕​ 发表

我打赌识别完后,领导们肯定还会安排原来登记的那个工作人员把识别结果一条一条对照过一遍

而且因为图片顺序可能和表格顺序不一致,工作人员在一遍一遍的 ctrl+f 查找图片中的名字

知乎用户 匿名用户 发表

层层加码看似认认真真、主动作为,实则是懒政怠政,是形式主义、官僚主义的新变种。究其内里,既有少数党员干部态度散漫的原因,也有其能力不足的因素。有的人不想担当作为,有的人不会因地制宜创新工作方式方法。这些缺乏担当和智慧的 “花式防疫” 充满了蛮横,只会把好事办坏。

知乎用户 匿名用户 发表

可以但没必要。

谁来改代码让他适配各种各样的情况? 出了事情谁负责?

知乎用户 xi ka​ 发表

赶紧想办法下了热搜榜吧,我非常担心这个博士过于羞愧导致无法承受,想不开万一跳楼或者自残 ,罪过就大了

知乎用户 科研日精进​ 发表

什么时候这种新闻不在热搜中出现了,什么时候我国的科技水平才上到一定台阶了。顺便安利一下,可以看看我们的文章,了解一些科研相关知识

[

聊聊机器学习

科研日精进的视频

 · 1018 播放

](https://www.zhihu.com/zvideo/1441010712659701760)

[

如何下载测序的结果数据

科研日精进的视频

 · 2133 播放

](https://www.zhihu.com/zvideo/1404539783385772032)

[

物种形状热图的绘制

科研日精进的视频

 · 529 播放

](https://www.zhihu.com/zvideo/1439977915409068032)

[

python 中用 math 模块进行简单运算

科研日精进的视频

 · 614 播放

](https://www.zhihu.com/zvideo/1445097024651300865)

[

常用质谱数据库及质谱数据处理软件的使用

科研日精进的视频

 · 3885 播放

](https://www.zhihu.com/zvideo/1385965925833818112)

一劳永逸搞定生信分析环境搭建:Singularity 虚拟化技术【鼠小弟 · 免费生信平台】已开发功能合集(持续更新)一不小心,我就学会了建系统发育树

知乎用户 NaN 发表

只能说 BAT 要知耻。你们互联网行业要知耻啊。

知乎用户 AlexKidman 发表

最初与学工同事分享这个想法的时候,同事还担心会不会太难了。而他却回复说:
有现成的库,import 一下就好了。
然后,1 个小时过去了……“我写好了”。
同事见状甚至感慨说 “这就是博士吗”。
根据复旦官方的介绍,这位博士生更具体的是用到了 Python 中的正则表达式。正则表达式可以把想要的信息从 OCR 识别的文本中筛选出来。

其实,我刚看完这个新闻,内心发出的感叹跟报道中的同事是一模一样的,“这就是博士吗?”

真的,这就是 XX 日报公众号眼中该上热搜的博士吗?

知乎用户 皈依凡尘​ 发表

上海快别秀了,上个月张文宏的精准防疫,都快把上海秀死了。这损失几百个亿是少说了吧!

就算一秒钟检查完数百人,也不影响每天 2 万的感染。笨法子,聪明法子,解决问题才是好法子。

什么复旦博士,OCR,正则表达式的,能用就普及普及,抓紧解决核心问题。

一大片上海人还没有粮食吃呢。

知乎用户 Aceeie 发表

看数字货币的时候感觉自己生活在科技前沿。

然而国家媒体报道这样一件事情,究竟是互联网技术不能下沉到普通生活,还是中国 gdp 第一的城市依然习惯于人海战术,亦或是现在已经太平到这等媒体来报道这样一件事来表现上海抗疫的 “优秀”。

也许真的是局中人困局吧。

知乎用户 delight 发表

当时阿里搞出健康码,然后某些集团出于内宣需要,硬是说健康码是个民警搞出来的。

呵呵,这时候再让那个民警搞试试看?

知乎用户 lwangls 发表

我一直认为,因为电商和网游的需求,中国的互联网技术发达,但整个社会的信息化技术和 IT 应用水平仍然很低。

这看起似乎矛盾,你去 zf 机关,企业,公安,税务办办事就知道了。

知乎用户 紺霜 TKL 发表

你全都给自动化了百万漕工吃什么?

知乎用户 谢克儿 发表

应该说我们积极防疫的能动性还是很高的。知乎之外,防疫是由很多细节组成的。

只有知乎上,才是专家,育苗,辉瑞,一战决输赢。

知乎用户 小小脚色零零八 发表

只看这个题目,我感觉这是多么简单的事情啊。多么简单啊。 常规字体下的 OCR 识别而已啊。

知乎用户 lixiansheng 发表

小细节的技术,有人干就好。但突出复旦博士生就有点过了,这显然不是博士生的研究方向。我不否认利用信息技术改善核对流程提高效率,但没有必要炒作。科研需要的是静心定力,不太需要网红搏流量。

知乎用户 剑圣 发表

讲个笑话,国际化大都市买不到东西吃,核对还要靠人工

知乎用户 摸鱼酱 发表

苏伊士运河一艘巨轮堵住了河道

他们找来了一家挖掘机公司,试图让轮船可以移动。

其中一个挖掘机司机这样说:“所以…… 我老板今早给我打了个电话,然后就这样了。真是给我上了一课!”

“说实话,我甚至都不太确定我到底在挖啥,纯粹就是图我老板高兴。他说每个人都从卫星上盯着我们,所以得显得我们有在做啥。”

在绝对的力量面前:

如果你看不懂我在说什么。

那我就真的啥也没说。

知乎用户 木子 发表

我会阿里云调库,请问我可以上复旦研究生吗?

知乎用户 pmoe 发表

截图收集和发送不要时间?

这种可靠性低的技术又无奈可笑的技术就不要拿出来说了。

都已经不期待大家统一用户端平台了,只希望国家能主导设计统一 API,建设状态同步平台。

知乎用户 一只小苯环 w 发表

等等海绵宝宝,我们不是原始人,你看,我们拥有高科技

知乎用户 北十东四车神 发表

说明大量劳动力都被浪费在一些低级体力劳动上面了。

疫情都三年了,还没有解决这种问题。

或者说有的地方解决了,其他地方却得不到经验。

知乎用户 北京路 发表

如果是两年前的新闻,得点个大大的赞。

知乎用户 平谈数字化 发表

这都是被逼的,逼的。根本上是数据共享的问题。

博士在拿不到接口的情况下,用图像识别核酸检测的结果,解决本单位检查工作的困难。看到这个新闻,一下想起来西安疫情时亮码系统崩溃的事情,那是同时在服务端把大量数据生成二维码图片给搞崩了。这次的场景是每个人在手机查看核酸结果,然后截图提交单位,单位再收集检查。浪费大量的人力和时间,全国有多少个单位啊。如果说开放调用程序接口有单位可能不会用,但做一个用户认证,然后批量导入身份证查询结果,开发马上就能搞定。

所以说数字化转型,不在于技术,在于用户思维。

知乎用户 不吃香菜 发表

知乎用户 麦克学麦基 发表

又让人想起了汉芯

知乎用户 大头大飞​ 发表

之前我早就说了,现在各行各业要数字化,都是跟风喊口号,实际想取得进步很难,

  1. 领导没动力数字化,数字化核心是对于数据结构、对于 api 借口、基础数据录入等等的基础建设,而领导要的是数据化的结果,是分析图表,是 ppt。数据化的建设,往往需要很高层的权利且前期成本高、见效慢,但一旦组建号,领导要的图表 ppt 手到擒来。但是高层领导除非是专门做技术的,不然各行各业高层没有动力做这个,建设基础数据和设施是需要领导批的,而现在的靠实习生人工堆 excel 的方式,领导是感觉不到的,所以领导没动力大力推。
  2. 数字化的本质之一,其实是对管理方式的改进。很多时候需要自下而上,但这在中国显然很难。

知乎用户 木有小基基 发表

就是觉得有点讽刺

知乎用户 serena 发表

太厉害了吧,建议申报诺贝尔科学奖

知乎用户 抬杠小程序 发表

作为非复旦非博士专科生码畜,我知道正则表达式对于一些特殊符号是无法判明的,而且经常由于软件的不同,导致存在不同的转义,包括对中英标点概率性判明失败,所以,不知道在医学领域使用正则会不会产生高错判率,从而导致几分钟内识别要么全是阳,要么阴阳颠倒呢……

知乎用户 疯清羊 发表

计算机的生命力确实不是传统学科能比的

另外,考公考编的试题内容是不是该改改了,感觉数理化人才解决问题的能力确实更强

知乎用户 谜之桑 发表

赞扬本不需要做的事情

知乎用户 极地探险家 发表

真的还在用这个核查吗?

一个人到底有没有做核酸这事交给学校去统计本身就是很操蛋了。

学校只需要上交一次学生名单,政府在数据库里筛一遍就完事了……

总不可能学校不去做这个工作,政府就不知道辖区范围内谁没做吧?

如果有人可以躲过去,那上海大规模开展核酸检测的意义到底在哪?

知乎用户 锕秀 2007 发表

分析数据:整理垃圾数据 90% 精力,画图 10%

有人帮你把 90% 的弄好了而已。

知乎用户 我想起我​ 发表

这个中学生估计也能做的吧。

知乎用户 尼好 发表

上下五千年四大发明后的第五大?

知乎用户 我是上帝 发表

书到用时方恨少

需求产生市场

要不是疫情,谁想到把技术这样用

中国烟花鬼子的枪

知乎用户 monkey 发表

技术真棒。

信任成本也越来越高。

知乎用户 SKTINnoVation 发表

上海防疫问题从来不是技术问题

难不成上海的技术储备比西安还差吗?

从来不是技术

知乎用户 天地正气 发表

到现在健康码和行程码还是没有集成到一个界面,我觉得纯属给查码的志门岗和出示码的群众添堵。

知乎用户 贝加尔湖冷空气 发表

怎么看待?

谁辣鸡谁知道。

知乎用户 髡山贼 发表

复旦计算机系真的就这水平,我还是挺失望的,

知乎用户 赵澈 发表

我觉得这个小伙子非常棒,这一波 AI 技术发展有点到头了,但其红利在基层政务 / 社会公益场景上兑现得还远远不够,技术与业务的桥梁还很弱。

厂子们除了搞 to C 黄赌毒以外,to B/G 天天想着搞大而全的、来钱多的解决方案,对于这种细碎的、小盘子的、持续性不强的需求看不上眼,当然很多时候因为没有介入到实际流程里,也根本意识不到有这些痛点,这无可厚非,但这并不代表这些边角没有价值。个人倒是觉得政府可以考虑招点技术顾问,但效率提高了是否有人会不高兴,又或者有人感觉被动了蛋糕,就不是技术范畴的问题了…

另一个答案也说得好,就这一个问题来说,从根本上看不需要 AI 出场就能解决的,这些信息在变成图片以前,只要有数据库那啥都好办

知乎用户 路过捞 发表

第一种未来:决策者不懂技术,但任何需求都公开发布,任何懂技术的人都能看到自己能够解决的需求,能够提出意见并被决策者听到。当然是否采纳取决于各种现实情况,但全部信息公开可信。

第二种未来:决策者懂技术,能够主动应用先进技术解决大部分需求,剩下的需求勉强可以用落后技术处理。

第三种未来:决策者不懂技术,只能碰运气,即 “一个懂技术的人恰好遇上了一个他能解决的需求”。稍微好一点的结果是 “这个事又凑巧被决策者看到了,于是决策者推广了这个解决特定需求的特定技术”。

第四种未来:决策者不懂技术,也不想懂技术,懂技术的人不允许说话,会危害决策者的权威。

事实证明,我们走在正确的道路上,第四种未来与我们完全无关。

有多正确?反正非常正确。

知乎用户 匿名用户 发表

西安一码通此前报道:用两天两夜,将 1M 图片优化到 100kb

知乎用户 书君哟 发表

给学校搬砖也没见有什么回报,啊,我是工具人,那没事了……

ocr 有开源的,不需要您自己实现

您只需要输入图片,直接跑出来就是文字

然后用把字符串过滤一下

不过…… 健康码为啥不直接开放数据库,直接看别人是不是绿码就完了吗…… 还要一个一个收截图干嘛……

知乎用户 酱爆 发表

我就这么说吧

即便是在校本科生想出了这个法子,也就只值得在校报上吹捧一下。

知乎用户 白东杰 发表

我今天看到了这个,说实话就看个乐呵。各学院的信息技术基本都是本校相关专业学生维护的。我相信这文章博士本人看了也尴尬。

反倒是人民日报记者怎么进清华、怎么仿佛发现新大陆、怎么得意地宣传,这个姿态和对象值得关注。

知乎用户 朱卫军​ 发表

首先非常肯定这位博士学以致用的精神,虽然技术不难,但是能帮助到疫情,还是值得学习。

看人民日报报道的细节,是用 Python 做的脚本,我来梳理下这个过程,以及实现的技术。

1、导入 Python 的 OCR 库来识别图片,生成文本字符串

细心观察便可发现,身边到处都是 OCR 的身影,文档扫描、车牌识别、证件识别、银行卡识别、票据识别等等。

OCR 本质是图像识别,其包含两大关键技术:文本检测和文字识别。

先将图像中的特征的提取并检测目标区域,之后对目标区域的的字符进行分割和分类。

Python 中 OCR 第三方库非常多,比如 PaddleOCR、cnocr、easyocr 等等。一般安装好后,可以直接 import 导入,传入图片路径参数,直接调用接口函数即可识别该图片。

比如书像 PaddleOCR 里的接口调用

from paddleocr import PaddleOCR, draw\_ocr

# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如\`ch\`, \`en\`, \`fr\`, \`german\`, \`korean\`, \`japan\`
ocr = PaddleOCR(use\_angle\_cls=True, lang="ch")  
img\_path = './imgs/test.jpg'
result = ocr.ocr(img\_path, cls=True)
for line in result:
    print(line)

你只需要传入核酸截图的路径地址,就可以直接输出文本信息

输出:

17:28
检测结果查询
检测结果【阴性】
姓名 朱卫军
采样时间 2022-04-08 12:28
试剂编码 48
检测项目 新冠抗原

通过 ocr 的图片文本识别,会出现上面的结果,可以看到时间、姓名、检测结果等各种各样的信息

2、通过正则表达式来识别文本信息,提取关键词

我们得到上面的文本信息,还需要进行整理提取,分别别类填到 excel 表里

这里就需要用到正则表达式来处理文本,把关键文本提取出来,这里要提取的是时间、姓名、检测结果、试剂编码、检测项目等.

说到正则表达式,正则表达式(Regular Expression)通常被用来检索、替换那些符合某个模式 (规则) 的文本。

此处的 Regular 即是规则、规律的意思,Regular Expression 即 “描述某种规则的表达式” 之意。

那我们来提取下上面的文本信息

\# 导入re模块
import re

strs = '''17:28
          检测结果查询
          检测结果【阴性】
          姓名 朱卫军
          采样时间 2022-04-08 12:28
          试剂编码 48
          检测项目 新冠抗原'''

name = re.findall('(?<=姓名 ).\*',strs)
time = re.findall('(?<=采样时间 ).\*',strs)
result = re.findall('(?<=【).\*(?=】)',strs)
print(name)
print(time)
print(result)

输出结果:

\['朱卫军'\]
\['2022-04-08 12:28'\]
\['阴性'\]

3、将结果输出到 excel 表格

当用正则表达式提取出关键信息后,再用 pandas 将数据输出到 excel 中,这里需要对数据进行适当调整即可

import pandas as pd
import numpy as np

info1 = name + time + result
info1 = np.array(info1).reshape(1,3)

df = pd.DataFrame(info1,columns=\['姓名','时间','检测结果'\])
df.to\_excel('核酸结果.xlsx', index=False)

大家也可以拿自己的核酸结果去试试

知乎用户 轻尘 发表

我试了一下,用百度的 ocr 接口,几行代码就行

但有个问题,不是 ocr 技术能解决的,就是对健康码进行人为修改,我只是把绿字修改成黄字,如果有人讲红码 ps 成绿码呢?或者修改其他信息然后进行上报,又或者是二次收集的时候出现丢失、错误怎么办?

所以数据的来源不应该是来自个人的截图然后上报

当然这位同学的做法是值得表扬和鼓励的

用自己的所学知识支持了抗疫

为相关人员节约了大量时间

让我们再次为这个同学点赞

但我们还要看到更高层次的问题

都 2022 年了,疫情也三年了

为什么我们还没有统一的防疫数据平台

为什么每个人的数据明明已经在某个地方了

还是要依靠这种原始的方式来进行二次采集

知乎用户 二哥 发表

这就是复旦. jpg

21 世纪 22 年的复旦还在用公元前的统计方法——靠人眼去看。

本程序员笑出了声。

当然不是笑这位博士,他的工作虽然没有太大难度,但对于复旦来说是具有开创性的工作,一举将复旦的统计工作从公元前带入 21 世纪。

知乎用户 匿名用户 发表

两年前的热搜还笑话隔壁日本用传真机。


并不是说用 Python 就简单,调库就 low。能改进方法就是好的,但整个过程多了很多不必要的环节,从根本上就存在完全可以提升的地方。

以下文字不仅限于提问所指

OCR 应该用于文件来源就是图片的场合,比如纸张照片。从本质上说,个人信息完全就是格式化的数据,为什么会需要正则表达式?

服务器 1 下发的 byte 级别的数据 (个人信息),用来生产 kb 级别的数据 (图片),上传至服务器 2,最后又转换成 byte 级别的数据 (表格),闹着玩呢?格式化的数据,转换成像素点的排列,最后又格式化,CPU:我在干啥?

想想商业网站登录验证的功能,是不是跟这个是一样的?安全快速两方面呢,哪个更好,哪个又需要更好?多处理的数据消耗的时间精力电力,难道是变出来的吗?

说到这又想起各种,将即时通讯工具用作__、__、__的…… 太多了我都不想说了。


技术一直在进步发展。有更好的信息技术不使用,却还用信息技术来加强原本的那一套;这 “图片”,是否也是一种“传真机” 呢?

知乎用户 牛顿的火焰激光剑 发表

有一台直升机,我们想让它飞起来。在中国,它飞起来的方式是一群人在下面用手搓螺旋桨。

这位博士生做的工作是啥呢?是找了根现成的绳子,缠在螺旋桨上,用力一抽,用抽陀螺的原理,节省了数人用手搓的功夫,于是 “火了”。这个时候你是什么表情?

我相信你除了这个没有别的。

各行各业都在搓螺旋桨,明明这个直升机有驾驶舱,装满了燃料,也有人会开,但就是要人去手搓,把燃料放空,说是要减轻直升机重量,方便飞起来;逼驾驶员一起来搓,美其名曰 “人多力量大”。

知乎用户 齐天大圣 发表

现在爱丁堡的宣传部门也顾首不顾尾了,前面宣传自己有宇宙飞船,现在说自己的拖拉机能打起火来了。

知乎用户 陈大宝 发表

66666 啊,这个同行生动地诠释了人工智能如何提高社会生产力。

其实仔细想想这种技术并不困难,但是很少人能够像他一样想到这个痛点,这就是人工智能难以商业化的地方:没有明显的需求。但这件事也说明人工智能很重要,它是一种可以解决未来问题的技术。

知乎用户 285538 发表

有些让人鄙视。

看了下需求,就这还需要一个小时?代码效率低下。我的话十几分钟给你搞定。

对了,我是学化学的,被导师评为不如本科生的沙币。

我还写了一个应付(学校门都不让出却天天让人打卡)插件,内容包括 opencv 的滑块识别 selenium 自动化,这些都是我半小时前没接触过的,是的,我半小时就搞定了。

学校居然没让我火起来?哦,原来是我没露出真名。python?我就学了三天基础。

博士,就这?装什么呢?用别人的轮子的人就别讲得好像是造出轮子来一样。

现在的媒体但凡有点常识,都不会给我整这么无语的话题,博士写个 import 就牛逼应该被捧上天际?我有一次抄别人的代码,那个人还是电子厂上班的员工呢。没点水准的媒体。

知乎用户 cursor hu 发表

呵呵

把计算机通信专业博士生用个 ocr,写个正则,当个大新闻报道

果然是新境界,新高度,既有水平,又有深度。

看来上海是实在没啥正能量可以报道了

知乎用户 肝病梁韬 发表

调库怎么了?调库就很 low。搞程序难道要从造芯片开始?调库怎么了?我用 python 就是调库。方便啊。搞程序,是用来解决问题的。支持这位小哥,生物医学工程的博士,别人是生物医学工程。人生苦短,我学 python。如果,你还没过 40,大家还是都学一学 python 吧。生活中可以有很多便捷之处。

博士,就该很高级的算法,和会系统架构?

我是医学硕士,我的能力范围就是 Python 调库,对于我来说是技术的 “天花板”,但是很实用啊。

顺便找了这串代码:

# 导入 easyocr
import easyocr
# 创建 reader 对象
reader = easyocr.Reader([‘ch_sim’,’en’])
# 读取图像
result = reader.readtext(’test.jpg’)
# 结果
result

知乎用户 小狐狸精綠寶石盒 发表

1、科学技术是第一生产力。

2、国家发展,任重道远。

3、码农公务员是时代的需求。

知乎用户 啊手动阀手 发表

一进知乎就看到了这个问题。

同院同学,不认识,听说过,一起开过会。小康本来就是辅导员,也是做图像方面的学生。当核查核酸完成截图需要辅导员必须一一核查的时候,小康用了 OCR + 正则表达式的方法筛选出截图里面的名字、当天日期和采样日期,用来帮助学工的辅导员完成这个核查和筛选工作。

看到这些本没什么,小哥确实强,想到将学到的应用到工作上来,这事儿我也干过,写爬虫爬公众号信息,然后提供给老板做数据支撑。

但看到知乎的这些回答真是乌烟瘴气、阴阳怪气,让人义愤填膺!

主要有这几个点的:

  1. 当前疫情工作信息化尚未完成,没有一个统一的 API 接口;
  2. 人力的重复劳动;
  3. 上海没什么宣传的,这种基础技术还被宣传。
  • 第一点:

我们可以细细数一下,疫情的信息化的数据有多少,要打通所有省市的所有数据的权限需要有多大。

北京大学梅宏院士团队研究成果荣获 2018 年国家技术发明一等奖

梅宏 - 黄罡团队 “云 - 端融合项目” 获国家技术发明奖一等奖 一项连通信息孤岛的变革

2018 年梅院士拿国家技术发明一等奖做的就是打破信息孤岛。打破这种全国级别的信息孤岛和实现张口就来的功能需要千万行代码和无数的工程实践,还需要中央级别的动员和权限。

  • 第二点:

小康是辅导员,需要完成这种核查需求,然后就使用自己的专业知识去完成这个工作,方便自己和同事们的工作。

其实是其他人不会呀,会的人不许要做这个呀…… 其他的学工老师不会技术(非本专业的或者并没有长期写代码),会的学生或者专业老师不需要做核酸筛查。

前程无忧数据显示,22-29 岁的程序员占比高达 55.7%,其次是 30-35 岁的从业者,占比为 32.1%,而 35 岁及以上的程序员占比刚刚超过一成。微信上 Python 办公的广告不也是这样的嘛?教授的都是很简单的使用 xlrd 和 xlwt 模块处理 excel 表格方法…… 还能指望人人都是计算机大佬嘛?

和文科生和其他专业的同学接触过,聊国际形势,马克思的思想演变,共产党宣言,资本论,红军的经济问题,政党,政权,海贼王,网飞…… 能讲一天的单口相声,却担心自己的计算机基础不行……

闻道有先后,术业有专攻而已。

  • 第三点:

据我听说,除了被这么多的国字号媒体报道外,包括百度、商飞等公司,美国的校友公司等等,都来找该同学合作了。即使是这些公司千金买马骨,也有巨大的品牌效应。

疫情当头,我们已经被关在学校近一个月。而今正是我们应该团结一切可以团结的力量的时候。难道新闻上一片哀鸿遍野,人心惶惶才是你想看到的嘛?

最后总结一下吧:

小哥用自己的专业知识方便了同事们的防疫工作,尽管是非常小一个事儿,却弘扬了非常大的正能量。尽管技术原理非常简单,但是他的行为让抗疫成为彰显人间正道、涵蕴家国情怀最鲜活的教材、最生动的课堂。就像复旦原推送里面写的那样:

“同心抗疫,共担风雨;学以致用,创新实践。”

知乎用户 匿名用户 发表

作为一名本硕软件工程的公务员,看到这个新闻时的感受到极其强烈的割裂感

如果说行业的割裂只是让一些入门的基础技术被外行奉为圭臬,而体制内外的割裂则让大量的人力堆在了本可轻松解决的机械性事务上,还不以为耻反以为荣!

数字政务还有很长的路要走……

知乎用户 我只敢感恩 发表

这就是博士吗,花五百块钱找个程序员也行。

我就是程序员,我可以免费

知乎用户 红尘破劫 发表

复旦博士的操作火了?

火的究竟是什么?诸位,细细思量……

知乎用户 每天摸鱼的打工人​ 发表

虚假的科技:建立统一核酸数据库,各单位从数据库拉取相关数据

“关于《‘全国核酸检测和数据统计服务’项目》的通知:

排期:两周

前端:一周(其中 3 天摸鱼),负责网页端数据的读取

客户端:一周,微信小程序端的数据采集和数据获取

业务层后端:一周(其中 2 天摸鱼),从数据库读取数据接口、统计工作

数据库:一周(其中 4 天摸鱼),确定一下存储方式

测试:两周(第一周等开发完成),测一下接口功能、压测

TO G:两周(其中 5 天等领导有空闲时间开会,5 天说服领导立项)

各组看下排期有没有问题,第一周结束各部门对齐一下进度”

政府支出总费用:0。每一家云厂商都免费给你抢着做

基层工作人员每天在统计工作上耗时:10 分钟(其中打开电脑 5 分钟,点鼠标一分钟)

真正的科技:要求每人上传截图信息再进行统计,优化统计流程

知乎用户 匿名用户 发表

哈,我高中毕业去邮局分拣,需要搬运一台大风扇到几十米外,我看旁边有一个推车就想着省下劲用推车,结果那个主管看见了告诉我说,这么轻的东西还用车?然后我一脸懵逼,到现在我都不明白为什么可以省力的方式不让使用呢

程序员里有句话,懒惰可以带动技术的进步,python 之父为了更简便发明了 python,但是发明 python 的初心也只不过是满足自己对技术追求,让编程更加便捷。

但是,当人们身处公司等集体当中,自己的想法就不能这么随行了。

你必须考虑到老板对你的想法的看法,考虑到市场需求的紧迫性,考虑到同事的看法。

现在我想明白了,当我想要使用工具提高效率的时候,在主管眼中,我只是一个偷懒不肯卖力的丑陋形象,对我感到愤怒自然就不足奇怪了。只是那时候单纯的我,本来还想着提高工作效率,然后挤出时间去帮助同事,被这么一呵责,完全失去了工作的积极性,甚至想了多年都不知道到底为什么我要被这么对待,直到今天写下这些文字。

技术的进步大概可以分为两种,一种是满足最低的需求,另一种是优化。对于后者,需要的不仅领导的肯定,还需要集思广益,以及一腔热忱,然而在大的集体中,你的付出更多时候不会被人理解,甚至会被误解,最终,好的想法,人们的积极主动性,会在误会和摩擦之中消磨殆尽。

(个人比较年轻,可能道理过于浅显,而且第一次回答,就匿名了)

知乎用户 Chen 发表

我从计算机转到汉语言文学,发现大量简单重复劳动在文科生主导的工作中普遍存在。

文学院教授主持一项国家社科项目,主要研究材料是一百多万竖排繁体字,只有图片形式的 ppt。为了把这一百万字写入 word,有三个方案:一是联系该专著主编提供文字底稿,电话打过去就被挂了:二是利用 OCR 识别图片转成文字;三是让学生对着图片敲。最后采用的办法是二加三,先利用 OCR 把繁体竖排文字输入文档,再组织一百多个学生校对、繁转简。

但最初的做法就是单纯让学生一个字一个字敲,我转到中文系之后建议教授说其实可以用 OCR 弄,这才改变方案。其实我并不知道怎么用 OCR,但是我知道有这么一个东西,有这个意识。

在文科生主导的很多工作中,主导者缺少以信息手段减少简单重复劳动的意识(年龄大者尤甚),如让学生手敲一百万字,如人工比对截图。为什么人民日报要报道这么一个简单应用,因为这确实反应了 “先进生产力”,无论“复旦” 还是 “博士生”,都只是代表“先进生产力” 的符号。

之前在知乎刷到一个万赞回答,妻子是公务员每天要处理各种表格,丈夫是程序员直接写了一个程序大大降低了工作量。事实上现在提倡的 “新文科” 专门有将数字技术融合文学研究的方向,光明日报 3 月 23 号 11 版整版都是,感兴趣者可以找来看看。

(新闻中文章出自复旦大学微信公众号,由人民日报公众号转发)

知乎用户 springboot 发表

这 TM 是谁写的文章,博士看了想砍死你!

这就像我夸你:哟!都会计算 1+1=2 了,值得夸奖呢!

知乎用户 不觉​ 发表

简评就是隔行如隔山

只能说这篇推文,从收集素材到采访到撰写到审核出稿没有任何一个人懂代码才能写出这种效果。但凡有一个人懂一点点现代技术也不至于写出这种贻笑大方的文稿。看来本科时候学校强制全校哪怕汉语言文学这种纯文科学生,专业课里也会有一门 c 语言或者 python,可以说是有点意义的…

至于其他回答里,211 计算机学院的课程群老师也在转发称赞,那更是当代高校教育体制的典中典了。教技术的人本身不懂技术不会写代码,只知道这个技术怎么讲,这现象也不是一天两天了。毕竟我导 985 的人机所教授曾经在我们实验室群里问学生怎么用 conda 装指定版本的 pytorch。不吹不黑,我导至少肯问,但是其他某些老师像某个回答里的老师,你要说他不懂技术,他还跟你臊了呢

知乎用户 列蒂齐亚 发表

说明祖国广阔天地,大有可为

知乎用户 复旦大学王勇 发表

终于有个我校的热搜不至于使人愤怒或想吐了….

但我仍然感到可笑,并为之悲哀。调几个包就能解决的事,竟然浪费了中国最顶尖大学管理人员大量的精力和时间更惊悚的是,辅导员们在对着核酸检验结果的时候难道就没有一点把工作自动化的意识吗?哪怕自己写不了,身边难道就没有几个懂技术的人吗?

更可怕的是,这只是上海魔幻现实的一个小侧面…..

说到复旦就不能不想到

知乎用户 直觉残片 发表

基本操作,生物信息方向写好脚本确实能事半功倍。

知乎用户 血狼 发表

原来吹了两年多基于大数据的精准防疫,连最基本的数据处理都没做。这就是精准防疫。

这和香港有得一拼啊。

沪是长三角的叉烧,港是珠三角的叉烧。幸好没有黄河三角洲,要不然,真的不敢想。

知乎用户 车路​ 发表

发挥更多人的力量。

知乎用户 Sam - 林 发表

这不就是之前那个地铁 flash 的 pro 版本吗?

知乎用户 陈江夏 发表

突然理解了为什么我们学校会让新闻传播学专业的学生修那个计算机二学位了。

知乎用户 艾利克练 发表

为啥就不能直接调库扫码然后请求健康码的统一认证接口。。。

总感觉没有验证总会被中间人。

知乎用户 反事实推断​ 发表

重点是大大提高核查效率和精度,而且虽然这些技术的基础知识我们都会,但还要在合适的时候无偿地提供帮助,并且将这些技术整合在一起,就只有很少人能做到了

但是直接 ocr 有个很大的问题是学生稍微改一下图就能造假了,治标不如治本,健康码数据库应该向学校等机构开放。

知乎用户 Jason LIU​ 发表

这个问题下面,把喷口对准复旦这个学生而不是媒体的,有一个算一个都是 XXX,没有例外

知乎用户 ghost 发表

应该改成 “如何看待复旦博士生知道 2+2=4?”

看似以博士生为中心的一系列文章难道是为了强调个体的能力突出?“复旦” 啊,他打的从来都不是代码,而是学校借用他打了各大厂的嘴脸罢了

知乎用户 单机侠 发表

我在统计局的时候,明明一个函数公式两分钟就能解决的表格,却要用计算机算半天手动输入。

为什么,不会啊!

偶尔看到有一个同事用的表里有公式运用,去问他。

他说他不知道,他接手工作时的表是这样的,就一直是这样,什么作用,意思也不知道。

直到我因为年轻心大跑路,交接的时候,把我优化好,带公式的各种月报、季报、年报表交代接手的人时。

对方那居然还有这种操作的表情我到现在都没有忘记。

各种表内计算公式就不说了,还有表格调用等等。

原本的工作量说减少七八十是夸张,三四十绝对有的。

现在想来,我那版本的表估计可以流传好几代了吧。

问题是我其实也不多懂 EXCEL。

但我知道 EXCEL 能做到什么事。

遇到问题的时候直接百度现学,而不是埋头在那瞎敲。

磨刀不误砍柴工嘛。

但负责具体工作的人没动力和权利推进程序优化,反正按部就班不出错就行。

有资格拍板的人不知道工作流程居然可以优化,或者怎么优化,反正有结果就行了。

偶尔有几个知道怎么优化的,也没办法跟领导推广。

再说了,人家也不干这活啊!

你往哪推?

能在办公室内推就不错了。

难道你还要教其他城区的统计局做事?

还讲不讲情面了?

这就导致了大家都是一个系统,但个个小系统却又打不通。

再打个比方:

一个门派只会基本刀法用来砍柴。

偶尔招来个自带艺的,用五虎断门刀砍,又快又好。

被夸奖。

那他会教给别人吗?

或者敢跟传功长老说我这有更好的刀法么?

反正柴火交了对吧。

真要变,那可能得这个自带学艺的小徒弟,成长到传功长老那天吧。

对了, 还得来个门派大比,比哪个传功长老教的徒弟劈柴给力。

知乎用户 Opaque​ 发表

本质上是我们国内(至少内地),公卫和临床数据质量和互联做得差。不是现在面对新冠差,是从来就差。

之前肿瘤、各种感染、心血管、卒中、重症的数据,质量和互联也都差。

看着美国的 SEER、MIMIC、NHANES 数据库,是真的羡慕。我们人口是美国 4 倍,互联网第二大国,世界第一大工业国,但临床数据方面非常拉胯。

什么是一个强大的公卫 / 临床数据库?

1. 严格的权限管理。患者的信息谁有权限查看?相应的权限能看到哪个程度?都需要严格管理,控制泄露风险。

2. 在线协同工作。同一时间,容许必要的用户流畅地访问、修改、处理自己有相应权限的数据。不能同一时间搞出好几个版本,我输我的,你输你的,最后谁也不知道谁的是最新版,一团乱麻。

3. 结构化。一个空里能输什么、怎么输,要高度统一,而不是由着性子来。规定吃饱了要写「吃饱了」,就只能写「吃饱了」,不能写「吃撑了」或者「吃得很饱」。这样能够在统计中用计算机快速解决,而不是只能用人力去处理。

4. 备份与还原。很好理解,如果有人对数据库进行了错误的操作导致数据库出现重大损失,要能一键还原到之前的版本。

5. 易用易上手,同时不能出奇怪的 BUG。

很难吗?其实如果只是一家三甲某个病种几百人的数据,腾讯文档结合好的使用习惯,就将将堪用。但参与人数多了、数据量大了、数据类型复杂了,就必然需要开发专门的系统。

希望以后能有。能用算力解决,就不要用人力。

知乎用户 全星 发表

没有问题,但同时别光夸,这个技术并非是一件多么需要天赋的事情,完全可以让在校的大学生多普及。

现在大学因为疫情原因,有的恐怕连上课都只能上网课,其实我不明白这种时候还上一些七七八八的课干嘛,比如什么乱七八糟的军事理论、心理之类的,不如让在校学生,像计算机专业的,提前开始感受一下实践操作。

有一说一,上海现在这样其实我一开始就好奇了,且不说政府问题,单单是人才,上海坐拥数个 985 和 211 院校,而来自中国各地的研究生、高材生也是大把大把的,我一开始就非常好奇了,难道他们所学习的专业毫无用武之地吗?为什么到现在为止很少看见有相关专业的人参与?

现在是科技时代又是互联网时代,信息传输非常便捷,这完全可以布置成为课题小组作业,最重要的学生本身与利益的关联其实不大,难道就不能互相配合吗?学生总不可能冒着退学风险倒卖物资吧?

落实交易信息,这对于一个部门来说很难,对于几个高校联合起来还是轻松的。

我记得上海的辟谣就是复旦的新闻专业人才弄的吧?难道上海只有辟谣的人才没有计算机人才?还是说学生不可以用网络帮助完成疫情工作,因为会耽误学习?难不成病毒还能顺着信号传播?

还是说我们发展了几百年,以前古代面对疫情传播靠封城,我们到现在就多了个疫苗?真就什么也多不出来了?

难怪说 21 世纪是生物的时代,这是哪个预言家说的?

知乎用户 work 发表

一方面体制内冗余人数过多,一方面工程师大量被裁

知乎用户 大愚 发表

我只想说,在象牙塔里待久了,出来透透气吧,这种新闻也拿出来报道,不知道的还以为多复杂

知乎用户 Attudy 发表

这些年,看到各种无人驾驶、AI、5G、元宇宙……

我以为我们就快进入一个新纪元了

开始幻想着以后解决能源危机和解放劳动力之后的世界

头脑热的发烫

一盆盆冷水泼上来都能给它蒸发了

但这一回是真的冷却了,冰凉冰凉的!

属实没想到啊!

我能理解农村人在土灶上烧柴做饭,但不能理解高铁餐车里烧柴做饭!

我对博士生的行为没有任何的恶意,甚至还要为他点赞,我只是想不明白为什么要在高铁餐车上烧柴做饭呢?

知乎用户 匿名用户 发表

这个东西虽说不难,但是搞出来没啥好处,反而要承担 OCR 结果出错的风险。

所以确实佩服这个复旦老哥,要是我,绝对不会去做这个费力不讨好的工作。

知乎用户 殇欣 发表

冷嘲热讽倒也没必要。

这里的场景是学校老师每日收集学生的核酸结果,然后由某位热心的学生写了个脚本自己判断。

学校并没有权限直接接到政府相关数据库去直接查询,只能采用原始的由学生提交自己核酸结果截图的方式来进行。

在此情形下,写个小脚本来减轻人工操作,是聪明的懒人最常见的做法,媒体大肆宣传倒是少见多怪了。

编程还得从娃娃抓起啊!

知乎用户 匿名用户 发表

看了不少评论,绷不住了 。确实 OCR 技术很老了,一堆在那何不食肉糜为什么不用 API 调用。这种核酸数据也好,医疗数据也好,是一个学校说调就能调的?数据都上云了,你在自己手机上都能看见啦怎么可能没有 API,只是这个东西涉及大量敏感信息需要权限,学校不具备当然只能用这种截图上传的方法统计罢了。

知乎用户 乔木 leon​ 发表

主要是操作这个事的这批人方式方法错了,

你弄一批被阿里腾讯优化后的人去机关做基层。这玩意可能几小时就给你倒腾出来了

知乎用户 匿名用户 发表

知乎用户 模式识别智能系统 发表

别骂了别骂了

我仔细想了想,大伙儿不应该喷这个事儿了。不是说信息化没做好,是他班级统计确实接入不了。国家或者城市层面的信息化做的还是很好的,没必要因为这个事喷国家,一堆人搁那儿 “挺可悲的、没资格嘲笑英国日本” 都出来了。

这个博士是以辅导员的身份做学院统计。学院这种统计应该是不能接入到健康码或者核酸检测系统的。

至于我们学院辅导员为啥能知道。是因为我们做核酸都要去体育馆,学校规定进去前要扫一个场所码,辅导员就是通过这个知道你做没做核酸。至于结果当然是全阴,有阳了也轮不到辅导员先知道。



以下原回答:

南航这方面看来属实是牛逼。你不做核酸辅导员立马就知道,直接私信轰炸。两天一抽检,三天一全员检。没听说过需要用截图统计的,属实离谱。

知乎用户 匿名用户 发表

所以人民日报一直是三流报纸

知乎用户 匿名用户 发表

你随便去个稍微靠谱点的学校再随便抓个计算机 / 软工 / 信息 / 通讯的本科生问问,就会知道这难度就 tm 是个课时作业的水平。

以文法治国器,殆害无穷。

知乎用户 龘飍飝 发表

有些人真是对现在程序能做到什么程度真是一无所知

知乎用户 Zhy54​ 发表

我觉得这一幕似曾相识,刚刚找到

知乎用户 肖忆寒 发表

我怀疑人有前世

前世的他们,迷信修建铁路会破坏风水,造了火车也得用马匹来拉,惧怕照相机会摄取人的灵魂

今世的他们,迷信繁琐而无意义的操作,造了计算机也得用手写文件,惧怕懂科技的高材生会动摇他们的权威

多的不说了

知乎用户 色胚 发表

有过相同经历,疫情期间封城,村里组织物资采购。

最开始是在微信群里发布可购买的套餐,每个村民私聊物资采购的志愿者。没两天志愿者就崩溃了,因为她得手动把这些物资采购信息复制黏贴到一个 excel 表里。

我觉得这个方法太愚蠢了,简单做了个金山表单发到群里,但是志愿者硬要让大家手动私聊发送,让大家别用我的表单。忘了后来是怎么回事,志愿者接受了我做的那个表单。

因为金山表单不支持某些单页信息的导出,我就顺手写了段 JavaScript,然后每天帮他们发布表单,统计采购信息啥的。把 1 / 人天 的工作量直接降到 10 / 人分钟。

讲道理,用金山表单,比自己写个项目快太多了(金山打钱!!!)。


后来不是还有到户核酸嘛,村里每天整个大喇叭喊。住高层点,在睡觉或者戴着耳机,根本就不知道。

所以我就想,他们已经统计了疫区所有人的联系方式。那申请个拨号 API,再整个语音模板,到点让服务器直接给每个人打电话就行了。

我就顺手提交了企业审核资料啦,购买了拨号服务啦,顺便写了个 Demo 啦。

然后就打了镇政府那边的座机,说明自己是一名开发者,做了这么个东西,问他们需不需要。

那边直接回了一句,不需要不需要,咔嚓就把电话挂了,搞得我像个小丑,怪尴尬的。

就这样,白白交了一个月拨号 API 的月租。

再后来疫情就结束了,我就没折腾这些玩意儿了。


反正不论什么地方发生疫情,刚开始感觉都是一阵慌乱,还有一堆不合理的规则。

之前被封就想在 Github 上整个库,整理一些防疫方面的业务,或者说是经验。让构建这类的系统的开发者有些参考。

后面想想,这事咱是真做不来,这应该是政府部门牵头去构建的内容。咱一个无名小卒,算了吧。但据我观察,并没看到有人牵头去汇总、传播防疫经验。

那就更别提技术支撑了,疫情封控也就几十天。

从封控开始交付需求,需求还没交付清楚就解封了。这要能开发出来,也是够敏捷的。

就算真够敏捷,开发出来了,迭代也不见得跟得上。哪哪不好用,等一线反馈到功能上线,估计封控也结束了。

因为软件开发的终极耗时因素是——沟通。

对领导们来说,一线累点就累点呗,整这些花活干啥。

所以,大家,忍着点就好了。

知乎用户 冬瓜 发表

我觉得那个国家反诈中心的统计也可以用这个

知乎用户 匿名用户 发表

在读学生,匿了

知友们大多忽略了一个问题:谁在统计核酸报告?谁需要统计核酸报告?是辅导员、学工的老师,他们是否统计 / 怎么统计跟计院的师生基本上没啥关系,从来没有正式向他们提过需求;更何况做学工的会自己干活、用用 excel 就不错了,你们还想让他们知道什么叫 OCR?

当然能有人把并不是很先进的技术在生活场景中应用好也是值得肯定的,这两天朋友圈都在发叮咚买菜抢单插件,以前大家也都找些健康打卡插件,倒也挺好。

知乎用户 纳德 发表

以知乎这逼格大概是很难认识到在中国懂程序的人只是极少一部分,而他们全部挤在互联网卷。本来互联网是为了提高效率,但是你们都去写买菜和抽奖程序了。但凡下来一部分人进到制造业,数字化也会迈进一大步。其实现在已经有企业在做这个事了,叫做 RPA(Repeated Process Auto),不过你们瞧不上。

知乎用户 匿名用户 发表

看了半天回答,没一个说到点子上

技术上,这个确实不难

报道里面讲的情况,我自己编程,解决我自己遇到的工作,没毛病。出了问题,要么上级怪你投机取巧,要么你怪自己学艺不精,责任都很好明确。

但是全面推开,识别里面有个 1% 的错误率(OCR 里面算非常低的了),谁来担这个责?要是系统突然出了问题,崩了,所有的业务都开展不了,谁来担这个责?

更何况疫情防空的最重要因素就是要压实一线。你拍板,业务用技术去做,出了问题是你负责,虽然给一线松绑了,但是也没人感激你;你拍板,业务靠人工,出了问题人工负责。

都是正常人,你选什么?

知乎用户 郑某晗 发表

中国软件工程的悲哀

技术简单,行政很难

知乎用户 穆翼悠​ 发表

但凡做过 zf 项目的都能明白,技术难点还是可以想办法解决的,信息汇总才是最难的,甚至根本解决不了,也就是所谓的信息孤岛。这个技术对于一个专业博士应该和吃早点一样简单。可是对于信息的获取,再加十个专业博士也搞不定。

知乎用户 三新青年​ 发表

这个博士太不聪明了。

他应该先成立一个公司,然后校方出面招标,这么大的工程,标底百把万,丝毫不过分吧。

然后大家都有钱赚。

博士赚钱了,学校相关负责人也赚钱了,领导政绩也有了 (信息化手段抗疫),工作人员也方便了,学生省事儿了,你好我好大家好。

而博士现在的做法,博士本人风头是出了,问题是这东西在方家眼里也没啥含金量反倒让人看轻了。连带着报道的人日,也要被方家们阴阳怪气一番。博士这样干,显的别的工作人员很无能,在同事中是败人缘。至于信息处,这就是在打信息处脸。领导嘛,风头都给你博士出了,领导可啥也没捞着。

故曰: 博士这是输麻了,明明可以多赢,闷声发大财,名利双收,搞成这个样子,实在是不智,纯属出了风头,啥实质性好处也捞不着。

很多事,坏在坏在这儿。

唉!

知乎用户 CRN 发表

你高考数学,打开卷子,先瞪着复数选择题看上五分钟,再错一个集合/逻辑用语选择题,我还有什么好说的?你不崩盘谁崩盘?

ctmd 卫健委,早早地建个全国统一的核酸检测数据库,开发一个全国统一的健康码不就完了,难道上海市政府的人还能抄家伙冲进数据中心,强行全员绿码?美团饿了么统筹算法现成的,上海全市的行政力量调配起来,连个菜都送不明白?送外卖的没见有多少偷吃的,你这怎么直接有人开始偷吃物资了?

最基本,最切实的工作不做好,做快,总有一天你会为此付出代价。

知乎用户 heita 发表

数据库一条语句就行了,只能说该做事的人不做事

知乎用户 我饱了阿尧​ 发表

人民日报需要建立相关理工科顾问部门。

知乎用户 李小狼也是 Geek​ 发表

#复旦博士用 130 行代码搞定核酸统计# “正能量” 新闻为何仍遭抨击?

复旦大学博士生李小康,用 130 行代码搞定核酸报告统计工作,这不是妥妥的 “正能量” 新闻吗?不是可以修饰上海的舆论形象吗?怎么还是会受到广泛的抨击和质疑呢?

屏幕前的你如果对此感到疑惑,那么,我可以分享一下我的理解,看看能不能帮到你。

事件的真实背景

为了客观地评价相关的新闻宣传,我们应该首先了解这个事件本身的情况。大家可以略读,后面还会仔细辨析这里的细节。

复旦大学官方微信公众号在 4 月 7 日发布了该事件的一篇报道,详细描述了该事件的背景和经过。

原来是这样的:

  1. 复旦大学自今年(2022 年)三月初以来,“启动常态化核酸筛查工作”,要求学生们提交 “健康云”APP 上的核酸完成截图,给班级辅导员核查,以敦促学生们检测核酸。
  2. 作为班级辅导员的李小康同学(在读博士),在 3 月 15 日,可能是在同别人交流此任务的情况时,受到启发,并且由于自己专业的知识积累和技能水平,就想到了用 Python 设计一份自动的核查程序。编码工作比较顺利,一个多小时就实现了基本功能,后期还为了改进代码的使用感受,而设计了一些额外的动态展示功能。
  3. 李同学设计的代码对于普通用户,如果他们真能用起来,确实是比较实用的。李同学还贴心地封装了 Python 程序,或许是使之可以在 Windows 平台上更好地使用。
  4. 普通读者最容易忽视的一点,但又是这里最重要的一点是:复旦大学信息办受到李同学启发,终于动起来了,希望设计出更系统性的(由专门人员设计的)程序。

我对李小康同学的编程行为的相关评价

李小康同学作为一名班级辅导员,在面对重复的、机械的人工任务时,不是照样地、机械地完成分配了的任务,而是运用自己在所学专业中经常用到的计算机技术,比如图像识别(OCR)、数据分析、正则表达式等,运用 Python 的一些库,可能是 opencv、pandas 等等,实现了相应需求。

他在自己有限的的工作职责范围内,能运用技术手段改进工作方式和效率,值得在相应程度上的积极评价。而且,他本人对这个程序的技术难度的评价,也十分客观、十分理性。

我对相应宣传的评价

### 对复旦大学的原初宣传的评价

复旦大学官方微信公众号的宣传,从学校对自己学生的宣传方面来说,总体说来没有明显的过分夸大之成分。而且也忠实地报道了李同学对自己编程工作的客观评价。

但这样的宣传,本身就隐藏着一些负面的东西。报道方本身由于缺乏了相应的技术能力和对技术方案的全盘考虑,而没有切实地感受到而已。

稍微有一些技术能力的人,稍微考察一下,就能想出来问题何在:

  • 原来你们复旦大学还在用那种最原始的手段,要求学生们提交图片材料,人工审核。
  • 懂技术的人都知道,如果我们所要求的信息只是确定身份的信息、是否检测核酸等等,那么一张截图的信息提供方式是十分低效的、过分复杂的。为了核对相关情况,明明只需要获取文本信息就可以了。一份学生的相关信息,用文本形式储存,可能连 1kb 都不需要。我将自己的姓名、身份证信息、是否已检测核酸等信息存到. txt 里,只需要 35b。但是,如果用图片反复传来传去,保存来保存去,十分麻烦,而且一张图片的大小,刚拍下来的时候可能有 2M 之大,是相应文本文件大小的至少 2000-60000 倍。无关数据太多。
  • 从更深的层面看,这种工作明明可以通过更系统的方式,比如信息办终于想到的小程序的方式,来进行汇总、分析,以减少繁琐的中间过程,比如,人与人之间的低效沟通,还有恶心人的传来传去等等。

不过,我还要为复旦声辨一下。从报道中可知,核酸检测结果是保存在 “健康云” 的数据库里,(对于终端用户来说)展现在 “健康云” 的界面上。这样的数据跟复旦那边恐怕(至少目前)无法互通。所以,复旦不得不从学生这里搜集相关数据。

对于复旦的信息办来说,如果我们稍微严格一点来讲,应该主动地、更早地想到一些更统一的、更系统的、更高效的信息搜集方案,帮那些不懂技术的人,减少甚至尽可能杜绝低效的、人为制造出来的工作量。后期的一些技术工作,还有待信息办的人积极推进。别人不懂信息技术,信息办不应该不懂信息技术。人家不会操作复杂的技术流程,你们可以想办法减少技术应用的复杂度。

但复旦本身的宣传还是理性的,在其相应的层面上还是合理的。但是,后面的一些宣传就开始片面地拔高了。

没错,我说的就是那家 “二流报纸”。

### 对 “二流报纸” 的夸大宣传的评价

首先讲来,热搜#复旦博士用 130 行代码搞定核酸统计#的几乎每个字或者是假的,或者有争议,或者容易导致争议。

突出 “复旦”,目的之一是满足宣传机构的特定宣传动机,即修补上海的舆论形象。其次,复旦是名校,这样宣传又能突出这一点。

再讲一讲 “博士”,李同学目前是在读的博士生,严格说来,他还不是博士。突出“博士” 是什么动机,还需要我解释吗?

“130 行代码”。这个只是初始代码的行数,是当时实现最基本的需求所形成的最初行数。后来李同学又增补了一些附加性的代码,优化了代码在终端用户那里的使用体验。所以,最终代码很可能不是 130 行。还有,更重要的是,评价程序好坏时,代码数量绝对不是一个刚性指标。重要是实现了多少功能,代码是否简单、可复用、低耦合等等。对 “二流报纸” 来说,要理解这些东西,太难了。

“核酸统计”。人家实现的是自己工作职能范围之内的统计工作,他统计的是他作为辅导员所收集的,复旦大学特定学院、特定专业的同学们所提交的,截图。抽象地讲什么 “核酸统计”,则李同学的工作量和代码的功能范围有无限扩大的危险。

相关报道人为制造的这个热搜,有 “四个突出”:突出上海,突出名校,突出学历,突出技术。样样都可以被它搞出争议。

舆论场上的争议何以产生

“正能量”报道的目标受众,主要是不懂技术的,并且容易被 “正能量” 感染情绪的,普通网民。让这样的网民感动,崇拜,赞叹,就是这篇报道的预期效果。

但是,也有一些不太懂技术的网民,虽然接受了 “核酸统计” 这种夸大了的暗示,但多想了想,发现“不对啊”:

国际化大都市上海(或者名校复旦),现在还需要最最原始的手工统计方式,还需要人家一个博士自己来优化你们的工作流程?

这种思路,是 “核酸统计” 相关暗示的一个必然结果。何况,“核酸统计”这个话,也不是这些网民自己说出来的。

而对于一些懂技术的人,还真就是 “外行看神话,内行看笑话”。这些人里面,有的是专业的计算机行业从业者,比如运维、一线程序员、架构师等等。他们平时做的工作,恐怕比夸大了的宣传中所提到的编程,复杂得多。他们这些人看到这样的“放卫星” 式的宣传,心里会怎么想?

他们不是没技术,相反,他们中大多数人的技术,完全可以实现这样的简单需求。他们中大多数人是没机会:不管是作为一个辅导员或相关部门里的工作人员,接触到这样的工作任务;还是作为编程行业从业者,争取到这样的订单

又遇到了不切实际的、片面夸大的宣传话语,他们给出一些必要的澄清和反驳,也是意料之中的事情。

支持相关报道的普通网民,由于平时不接触相关技术,不太能理解这篇报道到底在什么地方存在夸大和问题,也想不出这里的更深的技术问题,比如数据互通、运用数据库等等。所以这些网民对了解技术者的一些反对的话,就产生了误解,以为他们是在针对李同学。争论就这样产生了。

说起来,李同学本人,在既定的、愚蠢的、低效的工作流程中,能运用自己的技术,设计相关代码,在自己力所能及的职责范围内,优化自己的工作流程,并热心地分享出去,帮助他人。作为一个辅导员,他对工作是负责的,作为一个学生,他对其他老师同学是热心的,作为一个博士,他对自己的工作之实际难度、运用范围等等,始终有客观的、理性的、谦虚的认识。问题不在他这里。

总结

复旦大学相关的那个宣传,本身还大体处在合理的范围里。

但经过一些夸大的渲染和宣传之后,相关编程工作,从小范围内的工作量,扩大成了所谓 “核酸统计” 等等,反倒暴露出了许多问题,引起了大量的争议。某些 “正能量” 报道的“四个突出”,也造成了很多不满。

有理性的人,对那种夸大的、或带有暗示性的片面宣传,应该保持谨慎的态度。

如果一定要对从事新闻工作的人说点什么,那么他们就应该保持自己的职业操守,在不太懂的领域,应该积极寻求专业人士的意见,自己弄不来,也可以让专业人士发表一些评价。何况这次报道中的主人公自己,也明确定位了自己的编程工作。记者不应该随意拔高,否则容易引起专业人士的反感。

知乎用户 海棠花开 发表

任重道远

知乎用户 zhou ye 发表

任重道远啊,那怕是被黑出翔的澳洲,我们做核酸的时候只要扫个二维码,出来一个网页,自己排队的时候录入身份信息,然后轮到你的时候把手机生成的二维码给别人一扫,别人拿手机扫一下试管上的二维码,然后过几个小时,核酸的结果就发到手机上了,全程没有看到一支笔。第二次做核酸也不用重新输入信息,直接生成二维码。全程也没有使用任何特殊的设备,就是手机,我用的手机,测核酸的人用的也是手机。

知乎用户 Snowflyt 发表

只能说挺难过的,没想到这种事情都能被拿出来宣传,更没想到在这之前居然还是人工核对截图。

我没有要嘲讽这位博士生的意思,毕竟人家也没觉得这有多了不起。只是一个学了两天 Python 的本科生都能够花不到一个一小时做一个小脚本用来完成的任务,居然直到这位复旦博士生发现问题并完成了这样一个脚本才摆脱了人工核对的窘境,这基层工作该落后成什么样啊……

知乎用户 将子山​ 发表

也就只有在这么一个人力不值钱的地方,才会什么都人力核查,人多力量大嘛。要是核查人员 1000/h 的工资,这些自动化工具早就出来了。

知乎用户 翻滚吧猫小呆 发表

不敢看待,只知道不久之前我们好像才通过回滚系统的办法解决了美帝不更新 FLASH 控件卡脖子造成铁路系统故障的难题。

人民群众的解决办法聪明才智是无穷无尽的,但是本来不该成为问题的技术问题变成问题,我觉得是技术人员的耻辱;当然很多事情技术人员做不了主。

知乎用户 czj 发表

风险,打个比方,ocr 的产品有哪家敢写识别率 100% 的.. 比较重要的场景最后还是离不开人工

造假,造假可就太容易了

知乎用户 我就喜欢猫​ 发表

更新下想法,

在体制里,计算机和审计差不多,懂

得都不多。以我的了解,所谓的科技部门夸张点

说,一般就做做重启之类的活,修电脑也不行的。

审计也一样,就只会看章盖没盖。。。。说法夸张

了点,其实真差不多。。

……………………

系统的作用

一,写信息,写成效

二,拉关系,某介绍的

三,收 meney

系统的运行

一,永远卡

二,技术指导比开发更贵

三,某某,及时付款啊,财务催了,预算完成

系统的维护

一,科技部门,负责插拔网线,预约第三方修

二,保密检查保密检查保密检查!

以上

至于有用没有

不会看成效报告啊!!!

知乎用户 高登高 发表

这个题目没描述清楚吧?什么叫几分钟核查完数百人核酸完成截图?我以为有一种快速检测新技术,能对数百人第一步分组速检第二步对疑点组复检,这样快速迭代收敛出结果,并通过结构化数据生成数码身份,包括将截图回递参检者。我又狐疑,这个 OCR 不是我熟悉哪个吧,那个有啥能耐?又正则表达,都是图像识别人工智能等貌似高深数学问题。后看了些回答和原始资料,才知道是我想多了。

窃以为,复旦博士通过知识实践化协助了学校提高了相关检查效率挺好,网络宣传现在也不是一定要讲大事,都没问题。但这个事在这里说,大家扯开了聊反而觉得哪里不对,“勿以善小而不为”?也似乎缺乏宽容,包括题目阐述也不清楚,也只有包涵了。同样,我说得不妥当的,也请各位看官多包涵!

知乎用户 CodingPanzer 发表

别提了,我在乡镇防控办志愿,区里给我们纸质的核算检测点的记录表,让我们核查 200 + 名单是不是都做了,但是测核算时明明录入电子信息了,我就问领导能不能让他们找数据库管理方查。结果领导说这个数据只有市里有权调。区里不敢往市里要数据核查,就敢欺压下层。。。还有健康码转码系统,一个批量接口都没有,平时还行,一旦爆发疫情就是基层累死累活机械劳动。。。

关键基层又是一帮临时工顶着,有编制的都懒得学计算机之类知识,我这种帮忙的又不能左右决策,只能被迫干苦活,天天干着急。

知乎用户 匿名用户 发表

健康云能够直接导出的信息偏偏要花几十上百倍的人力物力截图再识别,实在是太魔幻了。到底是什么力量阻止着核酸统计信息给到基层负责人,值得思考。

知乎用户 Chestnut 发表

有什么技术呢,不就是调几个 API 的事吗

知乎用户 Dolja​ 发表

是,你们没想错,( ) 信息化程度极低,工作基本靠人。

普遍比企业落后十年到二十年不等。

有些确实是出于保密需要。

但大部分还是因为能拍板的领导不懂技术。

不懂技术自然也就不关心升级技术提高效率。

水多了可以加面,面多了可以加水。维持现状才是最稳妥的。

如果有哪个小伙子能力突出能够运用技术提高工作效率,那可以把相关的工作都给这个小伙子做。

知乎用户 Guan 发表

他聪明的背后,显得很多人不聪明了。后果很严重啊。。。

你审核什么?B 站审核人员的下场不够惊醒你么?

知乎用户 可不敢乱起名 发表

其实根本不需要考虑谁有权限访问谁没权限访问的问题,每个人做完生成一个 url,通过 url 访问既没法伪造也机器可读,如果考虑到服务器负载问题可以换成数字签名,不需要服务器来验证

知乎用户 匿名用户 发表

从整个防疫体系来说,确实不应该出现这样的情况,健康码和核酸结果等信息在不同范围和不同层级间的灵活共享应该早就设计好。这明显属于预案没有作好,媒体在报道的时候,更应该反思一下为什么出现这样的痛点,并督促从制度和技术层面补齐这个短板。但是实际往往比预案更复杂,不能因为预案没做好,就不能表扬临场中的改进。

以经历了 14 天封校,今天才解封的长沙某高校为例。在 14 天前刚封校时候,由于健康码会根据疾控中心大数据和流调信息随时变化。学校为了及时掌握本单位内全体学生的健康码情况,刚开始也是直接要求学生上报,并汇总给辅导员,尽管有微信小程序和在线表格,但依然比较原始。这一阶段说明疾控部门和学校还没有实现信息共享。

随着封控的进行,有一天早上打卡时候发现(具体时间不太记得了,貌似是不到封校一周时间),学校的打卡界面中可以直接自动获取健康码信息了。更新后的打卡界面如下图。而且整个封控期间,学校的打卡界面大概变化了有 2 到 3 个版本。由于有在酒店集中隔离的学生,所以如果选择是集中隔离的话,还能自动弹出集中隔离酒店列表供选择。说明信息可以在学校和疾控部门之间共享。

如果最初的应急响应机制不健全,但是当真的处于疫情中心时,能够发现不足,并及时改进,这未尝不是一种进步和创新。

知乎用户 hope​ 发表

博士做的肯定没有问题,用来解决问题嘛。

但是

什么核酸数据的统计竟然要用的上文字识别了?

别告诉我核酸检测点是拿张表,然后一个个填的姓名。

八百年前都是刷身份证或者扫码后台自动录入的了,这年头又倒退回去了?

知乎用户 曾几何 发表

复旦系日常低水平自吹

知乎用户 红茄 发表

写新闻的拥爱我党,用笔尖的故事描绘着欣欣画卷。

只是这画卷里,纸是擦屁股都不用的草纸,墨是五味杂陈的下水道沥水。

有人赞扬大好河山,美轮美奂。

有人痛骂不干人事,臭气熏天。

可是如果问,为什么是草纸而不是宣纸,为什么是沥水而不是徽墨?

就会有人笑着说,提议很好,马上就改。

张三,你家不是卖纸的吗?来两大车。

李四,墨水都是黑的对吧?就用你的!

于是,共同富裕,达成了。

新的画卷,更胜从前!

知乎用户 后知后觉 发表

4 月 7 日下午,记者与李小康取得联系时,他正在学校楼栋担任志愿者送饭。

他说过:“原理也很简单,只要是会写代码的人第一时间就会明白是怎么回事,但是不做相关工作的感受不到这件事情的费时费力,自然也不会想出办法。我只是用我学到的知识解决实际工作中的困难。”

这名博士生说的没有问题, 记者特地报道把这句话写进文章也没问题, 只看标题就喷的人都是 XX

重点是这背后映射的全国不统一健康码. 不推广认证采集平台, 而是各省市甚至各学校单独开发一套, 不好用甚至是难用的, 是利益还是懒政, 我不明白

这篇文章能够促进上面的问题吗? 我也不明白

知乎用户 xxyyzz 发表

也许不是很难的东西, 但它确实帮助了我们,减轻了相应的工作量,为什么就不值得上人民日报?为什么有这么多人要喷?

勿以善小而不为,勿以恶小而为之。 觉得简单就自己动手做出点真正对别人有帮助的事情。自己不动手却要批评别人,是满满的负能量。

知乎用户 远昼 发表

有没有人仔细想想,为啥学校一开始没有采用高效率做法。这很难吗?不难吧。

知乎用户 羊哥​ 发表

我越来越确定上海是从 2019 穿越来的事实

真的就拿金锄头锄地

为什么现在还用截图的方式呢

截图想造假随便 p 一下就好了

算了,上海都是自己人应该没有人会想造假吧

杭州所有核酸检测报告数据很早就能做到集成了 不论你在哪做的在健康码上都能查到

后台数据一清二楚

为什么还要多次一举截图出来重新复核一遍呢?

我不懂,真的魔幻

另外文理不分科真的很重要啊

知乎用户 哈哈哈​ 发表

昨天看到这个报道的时候,当然不是在人民日报,我就评论:正如这位博士所说技术是简单的,但明显效果是好的,简单的自动化操作就可以大大节省人力资源。

我们没必要非去讲这个东西很弱,没技术含量。

同时可以很简单的发现即使在人工智能喊的火热的现在,基层的很多机械重复性的工作还是依靠人来一一查看,一一手敲。

这个报道在大多数非计算机专业的人看来都很厉害,这也是一个事实。

我只能说,人民日报小编是文科生,我们不能苛责他懂计算机方面甚至还沾点机器学习的知识。

知乎用户 东四 发表

看了答案才知道,原来健康码统计数据是手动输入、截图上传的????不可能吧…… 那大厂动辄年薪几十万的程序员,不会搞不定这个啊??

知乎用户 东夕​ 发表

凭借 Vlookup 函数和数据透视表这两个 excel 小技术,我从村抽到镇,从区抽到市,从市抽到省,像大神一般的存在!其实就是搞统计的。

可见,大众普遍是缺乏技术的,特别是体制内。Excel 如此,编程也如此。

知乎用户 亚历山大 - 韭零后 发表

看到很多人说没什么技术含量的。 这些人是有多自卑才会说出这样的话。

举个例子,工地上数钢管,一直是人力,图像识别发展这么多年,数钢管这么简单的一个操作,这么多年一直没有人做,这是为什么?我觉的就是技术的傲慢,就是不能发 paper。

现在学美国这套科研评价体系学魔怔了,凡事都以 paper 为准,大学里出现了一大批,水 paper 的人。这些人搞一些天马行空的不切实际的东西,吹一吹,就是 paper。生化幻彩尤其严重,逐渐蔓延到了别的领域。这些人还慢慢的朝着学术明星的方向发展。但是我们真正需要公关的硬核技术因为漫长的周期,而没有人做。中国社会一直运行在一个极低技术含量的状态,农民,农民工,老人,政府机关,他们使用的技术手段,低到恐怖,效率极低。

我一直感觉这是美国给中国学术界挖的坑。 捧杀。

脱离群众,脱离生活的学术研究才是最大的问题。

知乎用户 匿名用户 发表

就在昨天,参加小镇某次惠民政策会议之后,几个小角色包括我和镇上分管领导泡茶,聊着具体实施细节,突然领导心血来潮,提议 “不如我们现在就找个对象家庭慰问一下。” 大家纷纷表示赞同,然后就有人赶紧跑去找宣传科叫人,领导带头昂首挺胸的踏出大门,后面大家赶紧手忙脚乱的收拾东西跟上。

到了对象家里,握手,问候,我们很自觉的拿起手机找角度拍照,然后赶紧传给各自单位的文宣人员,然后,收工。

小地方,路程短,从决定慰问到走出对象家门,前后也就十几二十分钟的事情。然后写文章配图发公众号发官网,花了一个下午,审阅了两三次。

这事吧,说有意义也有一定的意义,至少对被慰问的对象是很感动的事情,因为领导确实亲自跟人家当面宣传了这次惠民政策,还当场给对象指定了负责对接的街道人员,说有事情就找他们。

说没意义吧?我不敢说。

可耻的匿了。

知乎用户 乐在其中 发表

先把数据从联网库里导出来变成纸面的。在把纸面的转化成数据的,小伙子好样的,有些部门,不知道干啥吃的

知乎用户 Matsu 发表

用 python 加别人造好的轮子写这个很难吗?但凡是个科班出身的都能写出来吧。人家博士自己都得觉得这篇文章尴尬。

知乎用户 镖掌柜专招驾驶员 发表

首先

不要管人家是谁

也不要深究这个东西有没有很高的技术含量

小李用学到的知识解决实际工作中的困难

而且是助力防疫

而不是助力资本家盯着百姓的菜篮子

也没有用做杀熟

我们要为这个点赞

其次我们要反思

我们的互联网已经发展 20 多年了

互联网 + 也提了十来年

我们的某音推荐算法都已经走出国门了

为什么我们的基层治理数字化还停留在近乎原始的阶段

通讯基本靠微信群 / 钉钉群

数据汇总基本靠 Excel

数据采集基本靠纸笔登记

数据校验基本靠人力

我们的各种服务系统还是离开 IE 就不能运行

更别提办公电脑万年 win XP/win 7 了

这是为什么呢?

知乎用户 嘎嘎被乱杀 发表

这个事情太正常了。

疫情刚开始的时候我们公司开发了一个行程记录,要求所有员工每日必填。

每天都会检查各单位有没有没填的员工,一个不填就通报批评。还不给人事员开放查询权限。人事就只能让我们截图手动统计,保证所有人都没忘填写。

这事实在太麻烦了,我们车间好几百人。然后我就写了个爬虫,爬上报的数据。自己在自己公司网站爬自己提的数据,多离谱。

后边有一天数据结构改了,导致我的爬虫出了 bug,一下爬的太多了,给我 ip 给封了。

怕被找上门,爬虫不敢用了。

又想了个法子,给公司的网页套一层,员工上传的数据我这也存一份,需要查询的时候就查自己的数据库。

然后我们有一些同事在美国出差,每天公司统计行程的时候他们还在睡觉,所以他们的行程都是人事帮着提报。

我又写了自动提报。出差的同事就不用人事给填了。

功能写都写了,我就把我自己加上了,关系好的同事,也陆续都加上了,然后……

然后我们车间就再也没有人忘记填行程。

知乎用户 x2c2y4 发表

我觉得是好事,而且值得宣传。我昨天看过那篇文章,评论区还有好些人在要代码。

这说明信息壁垒确实存在。实现这个程序,对计算机专业的学生不是什么难事。学一下怎么调 ocr 的库,如果不会正则也学一下,应该也能几小时搞定。按照上海这情况,这个程序至少能用 2 周,肯定不会亏。但是呢?志愿者来自于各个专业,很多人不会甚至不知道可以使用程序来解决,这就导致了他们只能花费很多时间手工完成。

代码是可以共享的,但现状是哪怕一个人写了,同校的人也不一定知道,不会的人还是只能日复一日地做着重复劳动,导致大量时间的浪费。所以这件事我是认可人民日报宣传的,它的难度有限,但确实有价值。

顺带提一下,其实好多小事都能用计算机处理的。我使用过的有:普物实验,拍照的数据,直接 ocr 把数据搞出来,保留成 4 位小数;B 站抄的没换行歌单,程序换行;编程作业要求至少每 4 行 1 注释,用正则表达式在函数末和循环末添加;下载的图片名称乱七八糟,用程序把变成 1234 这样的编号。(而且,哪怕实际没省时间,这样子也很爽。)

我认为编程的一大意义就是让我们重复性劳动中解放出来,不是非得复杂的、需要大量数学推导的、有创新性的才是好的。很多时候,简洁的模型有更好的泛用性 (花里胡哨提升 1 个点的我都怀疑是不是编的)。实用性和创新型一样重要。

知乎用户 Pink 发表

可怕,这么简单的东西,浪费了大量的人力物力,甚至还能上公众号?

知乎用户 Fun10165 发表

假设你刚上小学二年级,背会了乘法口诀,知道 3×4=12。书上有乘法交换律,但你的数学老师不会,所以没有讲。

考试开始,请听题:4×3 等于几?

普通人:乘法口诀里没有〝四三得几〞。回归朴素的定义。4×3=4+4+4=12。

你:我的辅导老师教给我了乘法交换律。4×3=3×4=12

你的同桌:哇,我们班的老师私下里辅导我,教了我这招。4×3=(2+2)×3=(log(1)!+log(1)!)×[e]×[π]=……=12

考完之后,普通人得了 60 分,你的同桌得了 100 分,而你只得了 0 分。

你不服,课上站起来质疑老师。老师破口大骂:

〝抛开事实不谈,人家态度不比你端正多了?你这种做法是哪个境外老师给你的?他教这么快的方法,你让其他那些不好好学习的同学将来怎么毕业?〞

〝我用的是书上的方法!反观他用了超纲的知识,能一样吗!〞

〝狗班奸,滚出我们班,找你的辅导老师去吧!〞你哭了,但是家里穷,换不了班。

自那以后,你的同桌靠人脉,坐上了既清闲,又有钱的岗位,岁月静好。你和你班里的其他人正在为他负重前行。

你的同桌用微信转发给了你要做的任务:把大象从冰箱里拿出来,再放回去,以免它冻死。每完成一次奖励 100 块。

尽管你知道这只是为了让一些小时候没上好学的人不会饿死的钱,尽管你不能违命,你还是决定玩些花活。瞄准新形式,新局面,用衷心,热心…(下面省略 1000 字)… 为大象服务。别人 10 分钟能赚一次钱,你 1 分钟就能赚一次钱。

这件事被报道后,有人质疑:为什么要把大象从冰箱里拿出来?直接关电源不就行了?

为什么小时候有十万个为什么的孩子会长成麻木的尸体?为什么人才不能身居高位?

人们已经习惯、麻木了的事物,社会的创新,往往发生在其中。

知乎用户 王牌飞行员简柏丞 发表

体现了理工科人员在体制内的弱势地位

虽说我们号称工程师治国,当前的 top 的确也很多理工背景,然而嘛

文科在各方面越来越强势,理工科不把握真正的权力,将来即使创造再高的社会价值,没准将来大半辈子的努力也抵不过文科生的笔杆子一挥

我对文科生没有偏见,只是希望掌握宣传口的文科生在技术领域,没问过专业意见之前别乱说话。

知乎用户 匿名用户 发表

他能写这个代码不代表他只能写这个代码,而是因为他看到了问题,并且想要帮助他人解决问题,这才是他成为一名博士生的原因。

绝大多数时间里,博士的研究工作都是不完美的,采用的方法也往往不是最佳的,但这种发现问题并愿意去改进的态度,让他有机会找到越来越好的解决方案,推动科技的进步。

知乎用户 estu 发表

对,这就是我们国家的博士

知乎用户 匿名用户 发表

二流报纸绝对是高看他了,人民日报的水平大概介于楼下光膀子大爷和卖房中介之间。除了赢和沸腾没有其他报道,沸腾的也莫名其妙。除了名字,哪里还有人民二字?

知乎用户 匿名用户 发表

想起来我经历过的一件很像的事情,

有一个会议是在线开的,讲者就是照着 PPT 讲;(有几十个)

但由于视频资料不便于查询,当时我们的选择是,先录屏,然后用计算帧之间差值的方法来粗糙地确定哪帧翻页了,然后获得了不那么准确的 PPT;

就是不知道为什么会议为什么不公开 PPT。

知乎用户 liyun 发表

充分说明码农和农民工一样,是处于社会底层的,没有身处要职。码农必然受不了这种低效率、手工、重复性工作。

知乎用户 直角先生 发表

挺好挺不错。

政府不做这事也挺好理解,政府自己做,试错成本太高,甚至特别高。引入社会资源去开发,社会资本考虑的是钱等其他因素,受限很多所以做的也不一定能有多好。

同时某个事件所涉范围越广,牵扯越多,实际操作过程中一般使用的都是最简单最成熟的方案。学院很小可以这样,错了在改也不会有什么负面影响。但中国很大。

此外,好的技术会受到使用环境限制。在上海适用,在北京就不一定行的通。收割机效率很高,但我家种地还是用毛驴,因为碎片坡地,机器不如驴。

知乎用户 髕贇 发表

有时候只是不愿意改变。。

知乎用户 檀香小筑​ 发表

闭嘴,中国得新四大发明:高铁移动支付大数据共享单车可是洋人都羡慕的呢

知乎用户 胡海阳​ 发表

互联网大头们,你们天天喊的智能、AI、元宇宙如此震撼,搞钱搞得很震撼。

知乎用户 高级督察黄启法​ 发表

那就没法做实体台账了啊,厚厚的一本或者一堆放在那里多有成就感(狗头)

知乎用户 板子 发表

啊~
我旦上热搜为什么永远是被群嘲…

人家想这个办法来做这个事情我觉得合情合理。一个小时的话,考虑数据格式前期的数据准备,貌似也差不多…

用适合的技术解决存在的问题,这难道不是工程和产品的本质?

抖音一共就那么几个操作,加上一套推荐算法,但这并不妨碍人家是世界一流的 app 并撑起了字节上千亿的市值。

知乎用户 CodingCube 发表

这东西真的需求这么广吗?好几个人问我

这个其实很简单我做了个发给大家

代码里面有比较详细的注释说明

https://gitee.com/codingcube/nucleic-acidOCR

为了统一我用了微信小程序里的国家政务服务平台里的核酸和抗体检测的截图

截图的时候记得把右上角的小眼睛打开

下面是我用自己和舍友的截图做的测试

这个速度还是太慢,希望有相关机构能推进相关统计功能的完善吧

(有半年多不写 Python 了,程序可能会有点丑陋,可以直接在评论区提建议大家一起来改善)

知乎用户 Qs1020 发表

今天经历的广州筛查,我觉得很乱。

基层的信息互通也很成问题。我和朋友外出,全程行程相同,我黄码,他绿码。

我双卡,每一个卡有两个号,社区,大学和居委会分别给我打电话,而且其中两个单位两个号都打了,接了 5 个电话。其中还有一个我的个人信息一概不知,就知道个电话,还要手动统计一遍。最后一个电话接到我码都转绿了。。。这效率打到不早扩散了吗?

集中力量一个电话搞定不好吗?效率高,信息准。

发明各种腾讯文档统计信息。填了表格还填问卷。反复就几个问题。

对于黄码,有的短信说 7 天 3 检,有的说 3 天两检,有的说要隔离。不同机构自己没统一。

穗康码点进去提示的核酸机构严重不全,我们附近社区卫生服务中心做黄码核酸检测,其实没显示。

穗康码和粤康码变黄,但国家健康码一直是绿的。理论上我外出不是还是畅通无阻吗?

社区卫生中心做核酸,黄码在马路上大人流得人行道排队,要真有阳性。。。

知乎用户 一路感恩 发表

这个东西需要博士吗?需要负担的高材生吗?大才小用了。

知乎用户 隐身的魔法师​​ 发表

该博士生值得称赞,但我们是不是该反思有些人尸位素餐久了,该清理了

知乎用户 圣殿 发表

好吧,如果这也成了热搜话题,那还真的挺难过的,疫情两年多了,我们的防疫信息系统该有多烂

知乎用户 祝晨伟 发表

虽然和这个无关,不过看到这个也有一点感想。大学毕业工作快 4 年了,在一家家电企业做设计。除了本身的画图,大量的工作其实都是文书工作,各种填表。有时候经常会有查找填表的需求。很显然,这类需求只需要一个 vlookup,这也是我觉得学 excel 最应该学的一个。但是除了我以外,工作中就没见有人用过。

知乎用户 Zhong Mr 发表

这让人工智能、大数据为主的大厂情何以堪?哦,他们看不上这点,还是给客户做画像、做商品推荐来得的实在。本人最近在某鹅上看了看《特战荣耀》,好家伙,UC 上竟然主动推荐了。

知乎用户 亚当当 发表

知识就是力量

知乎用户 允许说活该 发表

说句 ZZ 不正确的话,文科认为高大上,工科就认为是小意思。

那句话怎么说来?

知乎用户 秦庐 发表

本来这是个几千万的项目

还能弄个星火 863 啥的

再报个国科 2 问题不大。

小伙路走窄了。。

知乎用户 匿名用户 发表

我是一名博士生也曾经工作过做过几年程序员,我老家有一个当村干部 (会计) 的哥哥。

  • 我的哥哥接手村会计之前,原本的村会计记账都是手写不会使用电脑,村部委员中甚至没有一个人会 ghost 来重装系统;
  • 教了一些他和另外一名村干部 (妇女主任) 做 Excel 表格的技巧大大地提高了他们的效率,他本来要做一天的表格现在一个小时就能弄完;
  • 过年期间我帮他维护好了遭受流氓软件危害的村部电脑。

这些东西在知乎都算足够入门的了,村书记唯一给我的报酬是发了一根烟,我因为不抽烟还没接。

看回答,很多人自己不愿意干的事别人干了还要嘲讽,原来是觉得没表扬到自己头上,万物商品化的今天,有人愿意免费地为基层解决问题,应当予以正面评价,很多人没有机会实际面对问题总觉得什么东西都应该很先进,实际上知识都是分散的,不是我生活在哪里,世界就都是什么样子的。

知乎用户 流水​ 发表

这种东西政府不牵头搞,靠个别医院是很难实现的

知乎用户 黄浩 发表

中国还需要更多更多的产品经理。

不是在互联网,而是在于方方面面的信息化建设。

知乎用户 那人 发表

呵,果然逼乎上又冒出来一堆牛鬼蛇神,啥也不是就知道玩冷言嘲讽事后诸葛,无碍乎还是这几类老面孔组成的,高华,香蕉,湾湾等。我想问问这些耗材们,疫情两年多了,你们为白皮猪们研发出来了哪些高大上的信息系统?有健康码么?有行程码吗?有核酸预约码吗?

“哦,我的上帝!不不不,这涉及到个人隐私,白皮爸爸们不会喜欢的!”

“哦,我的上帝!不不不,棱镜计划是另外一回事,这涉及到数十万人的生命安全,所以必须另当别论!”

“哦,我的上帝!已经死掉 100 多万了?不不不,他们个个都是黑鬼,死了正好,他们不配生活在这片自由香甜的空气内!”

知乎用户 Agony​ 发表

单论技术,cv 已经是有多套很成熟的技术栈了,不算难,至于正则表达式。。。自己手写有限自动机的那种么?如果只是调个 re 包,那好像也不咋难。。。

综上,一个 985cs 科班的本科学生用个一两天应该能就写出来这么一个批处理的脚本,宣传口的老哥和宣传口的受众至少有一方对科技还是有一种畏惧,没完成去魅。

归根结底啊,求求官媒别想着一天到晚造你内逼神了,没意思,就糊弄点傻子了

知乎用户 与亡者共战 发表

我的回答是: 不如沈逸

知乎用户 丫丫 发表

我们的淘宝、微信、各路 APP & 小程序,用的太顺手了,以至于以为全国 “数字化”、“信息化” 程度很高了呢,

这下,暴漏了我们还有很多地方需要填补空白,技术是不是最优不一定重要,能解决问题最重要。

话说,这些基础的 “数字化”、“信息化” 搞好了,才有可能更多,更快地进入 “元宇宙” 时代吧?

知乎用户 匿名用户 发表

很多东西不是技术问题,是政治问题。

知乎用户 跑得快 发表

比如登记房产的程序很难编吗?随便一个计算机系大学生都能做,但是却一直做不出来。

很多数据是不能让计算机记录的,因为会关系到要命的问题。

最简单好用的 VPS,没有之一,注册立得 100 美金
comments powered by Disqus

See Also

复旦药学院党委书记从学士到博士的飞跃

复旦药学院党委书记从学士到博士的飞跃 作者:张正义 尊敬的方博士, 作为复旦的教授(也作为一名海归), 深为您为建立中国的学术正义所作的努力钦佩不已! 今向您举报复旦药学院党委书记陆伟跃从学士到博士的一步登天, 请查实揭露这种在职挂名变相不 …