一小时爸爸|不要过度信任和依赖 AI 给出的答案

by , at 31 March 2025, tags : Deepseek 检索 错误 信息 点击纠错 点击删除
使用CN2/CN2GIA顶级线路,支持Shadowsocks/V2ray科学上网,支持支付宝付款,每月仅需 5 美元
## 加入品葱精选 Telegram Channel ##

我这两天有个问题想不通透,所以昨天干脆扔给 deepseek 去帮我分析。因为这只是我个人的疑问,所以也没打算加班写文章。但在和 deepseek 沟通的过程中,倒是发现了另外一件事,或许更需要跟大家聊聊。

不过 deepseek 一如既往的话痨,字数太多,我只能换到 PC 版截图了聊天记录。截图字小,如果看不清可以点开看大图。

1. 首先在 deepseek 回答我的问题后,我发现里面有一个重要信息和我以前所了解的不符,也就是下图红框的部分。

2. 所以我复制了一下之前的新闻内容,追问了一下。而 deepseek 则很快认识到了自己的错误,说明的确有这个要求。但是这次的回答中又有另外一个更明显的问题。

3. 我只好继续追问它为什么给出了这个新的错误信息。它重新检索之后,反省说自己其实没找到过今年发表的声明,还跟我道歉。

4. 我好奇它连续出错的原因,问它为什么会犯这种错误。它承认错误倒是很快,说明自己之前犯错的原因包括:规则理解偏差、信息更新延迟和过度推断流程。并且深刻致歉,表示自己以后会努力改正。

5. 最后我又重新问了一次最开始的疑问。这次 deepseek 给出的答案我就没有发现什么问题了。

需要这里特别提一句:deepseek 认为未来几天可能补发通告,或者是因为接近尾声所以之后会直接发布最终报告。我个人认为这两种可能性是存在的,我也很希望 deepseek 的判断会变成现实。

后续:但有趣的是,我今天另起一个新对话,再次复制粘贴问了最初的问题,而这次 deepseek 依旧犯了同样的错误。也不知道现在大家问它的话,是会得到怎样的答案。

开始就说了,今天的文章并不是关于我问 deepseek 的问题,我已经多等了两天,而且会继续等到有最终报告的那天。

但和 deepseek 的沟通中,让我想起最近感受越发感受明显的一件事:随着这两年 AI 的热度,尤其是 deepseek 出现之后,我身边越来越频繁的出现一种场景 —— 当你问别人 “你这么认定的证据和理由时”,对方信誓旦旦地回答你说 “deepseek 这么说的”。

只是 deepseek 也好,还是国内外其他 AI 也好,虽然它们检索汇总资料的能力很强,语言表达能力现在也不错。但依旧会犯很多比较初级的错误。

就比如前面我和 deepseek 沟通,deepseek 因为搜到了 2023 和 2024 年的资料,就很随意地推断认定 2025 年也有。

更重要的是,AI,尤其是针对公众免费使用的 AI,无论是哪个国家哪个公司开发的,其实都只能检索到限定范围内的部分资料,尤其是网络传播较多的信息。这就导致 AI 可能会被网上主要流传的信息所引导。如果 AI 检索范围内的网络信息,基本都是错的,或者有偏差的,那 AI 的答案就很难科学和真实。

就像 deepseek 分析自己出错的原因:规则理解出错、信息偏差延迟、过度 “自信” 推断,这些其实都是现阶段 AI 容易犯的错误。

之前的文章中写过,无论是下一代还是我们,未来的一个重要课题就是如何学习使用 AI,不只是说要搞明白如何使用,也包括如何去引导 AI 更为准确和有效地工作,以及如何判断 AI 给出的答案是否有 “坑”

最简单好用的 VPS,没有之一,注册立得 100 美金
comments powered by Disqus

See Also

百度副总裁之女开盒风波:不应道歉为止

赵宏 法律圆桌 近日,百度高管女儿被曝多次在饭圈开盒素人事件,引发公众广泛热议。网友根据多个账号发布的信息,发现这个多次在网络开盒者,疑是百度副总裁谢广军的女儿。而谢在3月17日发朋友圈称,“我13岁的女儿在网上与人争执,情绪失控下,把海外 …

真实与虚假(柯义的乌克兰战争日记)

信息战与真实认知:如何在复杂环境中保持清醒? 在这个信息爆炸的时代,最可怕的不是信息的缺失,而是错误信息的泛滥,尤其是那些自以为掌握真相的人,却不自知自己所知的一切可能只是幻象。他们不仅坚信这些错误的信息,还乐于向他人传播,以“为你好”的姿 …

13年网安从业者的无奈:「隐私就是一种幻想」

灰产圈 以下文章来源于镜相工作室 ,作者镜相作者 在网络安全领域从业13年,面对个人信息泄露,卢圣龙多次提到“无力感”。 他是一家网络安全公司安全实验室的负责人,工作之一是作为授权黑客,测试一些单位或公司的网络安全,他们经常轻易拿到很多企业 …

仿制药一致性评价数据仍有不少错误

原创 hotstone 夏志敏医生 春节前,《仿制药一致性评价大量数据雷同》一文,不到 24 小时被删。国家药品监督管理局药品审评中心随后就「编辑错误」致歉,下架了所有公开数据。2月10日,终于恢复下载,但似乎仍有不少错误。 上海医生提出「 …