梁文锋的 DeepSeek 的问世成功颠覆了什么?

使用CN2/CN2GIA顶级线路,支持Shadowsocks/V2ray科学上网,支持支付宝付款,每月仅需 5 美元
## 加入品葱精选 Telegram Channel ##

知乎用户 碾羊羊​ 发表

他妈的,老板疯了,居然问我们:人家能做出来地铺细克,你们为什么做不出来地铺细克?人家有个梁文峰,你们不是还有个张文峰吗?

我们那个同事真叫张文峰

知乎用户 柳絮 发表

颠覆了什么不清楚,但是看到一种说法,只要 DeepSeek 持续不断地升级,每次升级后都比大洋彼岸最牛逼的模型 “落后一点点”,那就是它的最佳状态。。。

知乎用户 Cloud​​ 发表

DeepSeek 问世之前,可以说全世界基本接受了美国的 AI 叙事,别说 40 万亿美元债了,再来 40 万亿,全世界也只能捏着鼻子认了。

DeepSeek V3 和 R1 横空出世带头冲锋,不少国家发现自己攒点硬件居然也能八九不离十,然后你看星际之门烂尾了,OpenAI 用户数也增长不前了……

美帝再次引领 AI 霸权受到重创,只能说幸好科技又掌握在文明手里了

知乎用户 你家凉皮哥哥 发表

据说有武警贴身保护还挺离奇的,但是结合 22 年到 24 年很多 ai 专家比如冯暘赫、汤晓鸥、周光远、刘东昊走的都很蹊跷倒显得合理了。

知乎用户 水陌轻寒 发表

梁文锋及其团队基本上中国本土培养的人才,颠覆了 “中国培养不出优秀人才” 的谎言;梁文锋及其团队没有拿美国绿卡,颠覆了 “中国留不住优秀人才” 的谎言;deepseek 性能不亚于 Openai,颠覆了 “中国 Ai 落后美国几十年” 的谎言;deepseek 率先开源,颠覆了 “一卡脖子就翻白眼,一开源就自研” 的谎言;梁文锋团队花很少的经费短期做出 deepseek,颠覆了 “星际之门需要 5000 亿美元” 的谎言;deepseek 不需要高性能显卡,颠覆了 “中国制裁不了黄仁勋” 的谎言……

知乎用户 光暗 发表

一个美国真的非常非常想搞死的大人物。

根据截至 2026 年 5 月 11 日的公开资料,‌梁文锋‌(DeepSeek 创始人)确实多次拒绝了来自外部的各类邀请,主要集中在以下两类:

一、拒绝国际学术 / 访问邀请

  • 连续三年拒绝美国方面共 23 次学术交流或访问邀请‌,渠道包括:

  • 美国官方机构

  • 顶尖高校

  • 头部科技企业

  • 甚至通过意大利、加拿大等第三方中间人转达‌‌

  • 拒绝原因‌:

  • 借鉴‌孟晚舟事件‌和‌**徐泽伟事件**‌的教训,认为赴美存在被扣留、调查或技术围猎的风险‌‌

  • 认为当前国际科技竞争已超越单纯技术交流,涉及‌地缘政治与人才争夺‌‌‌

  • 强调 “‌核心人物不能被随意消耗‌”,主张守住安全边界‌‌

  • 立场明确‌:
    “不去,不谈,不泄露核心细节。”“我的算法只服务于五星红旗。”‌‌

二、拒绝国内资本方的控制性条件

在 2026 年 4 月底至 5 月初的融资过程中,面对腾讯、阿里等大厂的投资邀约,梁文锋也明确拒绝了部分条件:

  • 腾讯‌提出认购最多 20% 股份,被‌**一口回绝。**‌‌‌

  • 阿里‌要求在董事会嵌入战略决策权,也被‌**拒绝。**‌‌‌

  • 原因‌:认为这些条件触及 “红线”,可能‌反客为主、损害 DeepSeek 作为创新组织的独立性

  • 应对方式‌:

  • 个人增资至‌34% 直接持股‌,合计控制约‌84.29% 股权

  • 拟以‌个人名义出资 200 亿元人民币‌,占本轮融资 40%‌‌

总结

梁文锋的 “拒绝” 并非简单的固执或低调,而是基于以下判断:

  • 技术自主‌:核心模型(如 DeepSeek V4)已实现国产算力适配,摆脱英伟达依赖‌‌
  • 安全优先‌:将个人与团队安全视为国家科技竞争力的关键‌‌
  • 战略定力‌:拒绝流量表演,专注产品与技术落地‌‌

正如权威媒体所评:“‌拒绝,是另一种更强的表态‌”‌‌

你说说看颠覆了什么?

中国要不是军事上美国无论如何都打不赢的国家,梁文锋和 DeepSeek 是值得派遣 B2 直接上钻地弹的存在。

知乎用户 Daemon 发表

一个明确知道自己力量的张一鸣。

之前很多人讨论到生育率或者文化传播的时候,一定绕不开短视频这个东西,现代的信息传播和娱乐方式是被张一鸣塑造的,可能这么说很怪异或者给他抬咖,但是字节跳动接近 2000 亿美金的营收很好的证明了这一点。

梁文锋的重要性在于,他在一个关键的节点交付出了最关键的产品,并在后续每个关键的节点上做出了更强更有用的事情。

1 打破美国 AI 垄断,领先地位的议价权和垄断地位的议价权是两码事。

2 打破 AI 大模型下的美国叙事,即美国算力 + 美国模型 + 美国投资 三位结合的美国最强叙事。美股几个龙头在这个叙事下起飞,然后被梁文锋打断了不止一次。全世界都意识到原来不是只有美国能干。

3 真正意义上的 “推动文明进步”,在美巨头选择以技术专利收割全世界资本的时候,梁文锋选择开源,让全人类站在 deepseek 的肩膀上进步。梁圣伟大。

4 国产叙事最好证明,用中国人的技术,中国人的芯片,做比美国人更牛逼的事情。不是工程领域的复刻或者替代,是从基础技术到落地,走自己的道路,也没有把自己卖给华尔街权贵,中国工程师,中国数据,中国服务器,中国企业,中国创始人。

如果说有点瑕疵的话,就是幻方的资金是靠量化割韭菜来的。但是这样很好,因为大 A 的钱也来自于股民,这何尝不是一种中国人民众筹资金助力民间科技发展的故事呢?大家赔钱了等于我交钱了,取之于民,用之于民。这反而回归到了股票应该干的事,用金融工具来哺育科技进步。而不是用科技进步来增强金融工具。这个叙事是无敌牛逼的,甚至影响到上层对金融工具的评判。

知乎用户 huang liu 发表

知道日本为什么失去三十年了吧?从来不是什么广场协议,不是什么内部官僚股市房地产泡沫,就是日本被美国一巴掌打趴了。

日本的梁文峰被美国抓了或者恐吓了,任正非的华为产品被强制不准上市,不准自己搞芯片体系,这种情况还搞个毛的经济竞争,日本二战战败就注定他经济无法超越美国的经济技术层次。

中国能保护好中国的产业,中国的创新人物,才是能挑战美国的底层基础。

ps:nec 富士通东芝当年丝毫不比美国因特尔德州仪器差,尤其是那个 tron 系统,完全开源,而且微内核,计算机汽车洗衣机手机都是可以用的,可以说是最优操作系统选择,结果美国一巴掌就拍死,不准 tron 系统装机,就跟今天不准鸿蒙在中国的手机平板电脑上用一样的, 你想那华为还发展个毛。

可以说盖茨 windows 的成功,本质就是美国霸权的延伸,是美国霸权造就了盖茨这个世界首富。

tron 系统设计者坂村健 2004 年就来华警告过中国企业,到了一定时候美国就会打压且不讲道理,所以任正非早就开始有准备了。

知乎用户 leave 发表

DeepSeek 再这么追赶下去,叠加低成本算力优势,干碎美国的巨型 AI 金融泡沫,让美国两三年内爆发金融危机都是大概率事件。

看一下 DeepSeek 的创始人信息:

知乎用户 不知道的事 发表

梁文峰简直是 AI 界的霍去病(长寿 108 岁版)

他都快在 AI 界封狼居胥了。

等他把华子硬件搭配对接好,

下一个正式版模型直接训练、推理一条龙用国产硬件。

再出一个 opus 和 gpt 不相伯仲的模型,

(事实上现在已经有 85%~90%,长上下文真 1M 比前者已经更强)

然后开源用牢中天顶星的电力和工业把价格保持,

你看牢美 AI 泡沫顶不顶得住。

牢美:8000 亿估值星际之门

老中:星际之门免费送!

在后面国产芯片、HBM 什么的产业链顶上来追到之后,再出个定制 D1 芯片,你看牢美麻不麻。

星际之门都给你拆喽。

其实国产 AI 阿里系功劳也是非常大,真的。

z-image 懂得应该明白什么含金量,8g 显存本地部署,随便无限制出图。还有各种 tts。出视频有 seeddance 和快乐马。不能忘记它们。

另外,有些企业做个模型忙着对标国外收费套餐,超售限速、排队 6000 多问一个问题、改老用户条款、投诉就封号… 大家也不要忘记唾弃这样的 Z/

知乎用户 车斤清女夭 发表

DeepSeek 连续打了美国 3 次脸。

第一次,DeepSeek 是打破了 AI 需要超高算力才能成功的宣传。DeepSeek 需要的算力远远小于 OpenAI

第二次,DeepSeek 开源让所有人都有了训练 AI 的权利,打破了美国的垄断。

第三次,DeepSeek-4 让人们摆脱了英伟达,可以在华为昇腾的芯片上直接运行,打破了没有英伟达做不了 AI 的神话

知乎用户 Tiny Rick​ 发表

这是鹰酱打不过,如果打的过,Deepseek 足够让它对兔子开战的。

AI 是现在美国唯一的经济叙事,没有二。

整个美股就靠这一根线吊着。

美国必须在这个领域内取得绝对垄断的地位,整个故事才能顺利的讲下去,画皮才能撑的住。

正当懂子宣布 5000 亿美元投资建设 “星际之门” 项目的时候,Deepseek 出现了。

用几十分之一的成本做出来 90% 以上的性能。而且更重要的是,它居然还开源。

这意味着美国下一个增长引擎的叙事已经崩掉了。

因为这种成本差距已经说明了一切。

美国的 AI 服务势必要更贵、研发成本也更高。客户更容易选择 Deepseek。更不用说希望自己部署 AI 的客户,Deepseek 几乎就是唯一的选择。

这会进一步加剧投资和回报差距。越到后期美国将会越吃力。

可以说,竞争还没开始就已经输了。

如果兔子的军力还是 20 年前的水平,美国几乎可以肯定要动手。

现在唯一的壁垒就是美国还掌握着芯片技术。

但就这个护城河也已经以肉眼可见的速度变窄了。

兔子的廉价能源可以用规模化缩小单一芯片的算力差距。做到相差不大,成本依然更低的效果。

而且,芯片技术被突破也基本上就是时间问题。这个没有疑义了。

现在美股的叙事更多的是靠沉没成本

大家的钱已经投入太多,接盘又找不到这么大的冤种,崩了损失太大,只能装鸵鸟看不见。

但是这毫无疑问是不可持续的。犹如 2008 年的大空头故事一定会再现。

实际上 2008 年的大空头之一已经开始做空美国 AI,后续只会越来越多。

左脚踩右脚飞上天没有不掉下来的。

掉下来并不可怕,可怕的是美国很有可能短期内再也找不到第二个叙事了。

这种情况下发生的衰退,1929 年比起来都会像一个普通回撤。

知乎用户 Sam Lee 发表

答案里玩梗很多,大家也看的很开心。但最为量化行业从业人员,还是要说一下,梁文峰能做出 deepseek,本质上是因为他是最纯粹的那一批量化从业人员,即自筹经费的科研人员。

何为最纯粹?就是理工科毕业,想做科研,但因为各种原因在学术界没找到合适的位置。转头一看发现自己那些数学模型稍微改改在金融市场能用。于是干脆开始在金融市场赚钱来便于自己做研究。

这方面国外最典型的例子就是 DE Shaw,靠量化赚了钱以后疯狂买算力,然后去计算化学领域刷论文,再也不用看人脸色申请经费,学术界还拿他没办法。

我做 fof 投资的,专门投量化。幻方是最早就对外宣传自己用了深度学习的那一批。效果就是收益贼猛,但由于模型黑箱化,回撤也大。后来由于算力过剩,幻方自己居然组了个超算集群,叫萤火一号(这应该也是深度求索的前身),搞天气预测什么的,还对外出租算力。如果是学术研究好像还可以低价使用什么的。最夸张的时候据说搞的全杭州买不到显卡。从外界看,这副业做的大的有点离谱了。虽然大部分量化私募肯定都有自己的集群,但能把集群单独作为一个项目独立公开出去,说明这老板是真的 “瘾大”。

其实量化行业像梁文峰一样想搞科研的的人很多,但他应该是在这条路上走的最疯狂的。幻方这么多年死磕深度学习的结果是在行业内留下了 “波动大” 的名声,这种黑箱化的模型偶尔会弄点意外的回撤,还不好解释,给投资者的公告都不好写。梁肯定也是有一定压力的。但这么多年他能顶下来,应该说他本来的兴趣点就在这。量化只是给了他一个买显卡的理由。

后来我才知道梁文峰是学计算机视觉的。回头看,他估计毕业后就是想搞深度学习研究的。做量化只是在帮他筹集经费而已。从这个角度看,他做出 deepseek 也不意外。

知乎用户 猎犹人 发表

直接把美国星际之门国运大基建给干废了,你说颠覆了没?

知乎用户 大明战神蓝玉 发表

在 it 领域,开源的都是圣人。

这哥们这下真的能名留青史了,至少在世界范围人工智能相关领域一定会反复提到 deepseek 和他的名字。

这哥们就像学操作系统经常提到的开源的 Linux 的 Linus Torvalds,和安卓的 Andy Rubin。

未来人工智能领域,一定会频繁引用 deepseek 的相关论文,并且作为教材参考。没准能根据他这个论文和训练方法新开十几个相关专业。就像计算机 / 软件工程等专业一样。没准以后考研专业就有和 deepseek 有关的相关专业。而且远不止于此,他还年轻,他最近又开源了相关的多模态模型,图像生成 ai,Janus-Pro,就这玩意就能开好几个硕士专业,图像识别,图像生成。而且除了 V2,V3,R1 之外,没准他后续还会继续开源。

对于普通人来说,开源就意味着免费就能用上强力的 ai 大模型。且各行各业都会引入他的 ai 大模型,就像定制 ui 一样定制自己的 ai 大模型。当然后续 ai 大模型会不会继续开源,那就看梁文锋后续想法。

对于学术界和企业来说,这哥们配享太庙。

没准以后还会在相关专业讲课时提到他的趣事,在出租屋里炒股,八万赚五亿。然后说说他的主业,幻方量化。做空英伟达,收割美股。

deepseek 对于 openai,就像 linux 之于 unix,Android 之于 ios。当然 openai 不开源也是合情合理,毕竟别人的智力成果。别人闭源拿来赚钱赚钱也没啥问题。毕竟你何同学都能拿别人开源的东西去赚钱,我山姆奥特曼也是需要生活的。本来开源协议就是防君子不防小人。所以说 deepseek 开源更是难能可贵,当然考虑到老板主业是量化炒股,别人早已经财富自由了。所以说 Linux 之父林纳斯 · 托瓦兹这种人是真的极其少见,他的成果至少值 100 亿美元。现在还在当平凡的程序员,不过有人愿意分股份给他感谢他的贡献也算好人有好报。

林纳斯 · 托瓦兹于 1969 年 12 月 28 日出生于芬兰赫尔辛基,是一名计算机科学家和开源软件运动的领袖。他在芬兰赫尔辛基大学学习期间,为了满足自己的需求,开始开发一个类 Unix 系统的内核。1991 年,托瓦兹首次发布了 Linux 内核,这是一个免费、开源的操作系统核心,允许用户自由使用和修改源代码。这一举措极大地促进了开源软件的发展,吸引了全球范围内的开发者参与其中,共同为 Linux 的发展贡献智慧和力量。

梁文锋就是 ai 领域的 Linus Torvalds。从程序员进化到计算机科学家,ai 科学家。大部分程序员都只是搬运工,极少能创造出新东西的。

当然,梁文锋的 deepseek 如果他也闭源收费,这玩意起码能值的价值

只会更多。开源就意味着所有人都不能拿他的东西去商用。免费就不会出现区别对待。不是富人的专利。梁文锋完全能靠这玩意和幻方量化冲击中国前十富人,没准就是下一个互联网巨头,但很明显在 AI 领域,这哥们不想赚钱。考虑到他做量化也能以 “一直平凡的小猪” 捐款,这哥们真的说是小说里的人物我都信。

反正,废话不多说,感谢梁圣开源!

知乎用户 绅士喵​ 发表

根本没有那么复杂。什么国际局势之类的,干翻美国之类的。

就说一个,ChatGPT o1。

DeepSeek 的 r1 问世以前,o1 怎么宣传自己的?

在发布的几个月之前,牢曼就开始饥饿营销了。这是他用了无数次的套路,但也是被打脸最狠的一次。

牢曼发了一张自家花园里草莓的照片:

暗示他们已经研发出了能解决 Strawberry 有几个 r 问题的模型。o1 发布前后那会儿,他又搞出一套 AGI 五个等级理论。表示 o1 上升了一个等级。它是 Reasoners(推理者) 而不再是 Chatbots(能对话的机器人)。离 AGI 又近了一步。

他们在宣称上说 o1 已经跨越了简单的 “概率预测下一个词” 阶段,正式进入了系统性思考时代。不仅如此,他们把 o1 宣传为一种极高的准入门槛。例如在物理、生物、化学等科目的测试中,表现已经达到了博士生(PhD)水平。在 AIME(美国数学邀请赛)中,GPT-4o 只能做对 13%,而 o1 预览版直接跳到了 83%。

一整个给一种 “成本极其昂贵、技术门槛极高、只有最顶级的领域巨头才能整出来的黑科技” 的感觉。再加上各种营销号也被忽悠了,传得神乎其技。

结果呢?DeepSeek R1 一出现,用 “极低成本 + 开源” 的方式 “拆穿” 了 o1 的所有神秘氛围。你所谓的先 “思考” 几十秒,那个 “Thinking” 小圆圈,整得好像真在孕育智能一般。

人家 r1 直接把思维链的生成过程,完整清晰的贴出来打脸。不需要任何解释,所有用户都明白了。哦,原来所谓的思考,就是先生成一段指导怎么推理的 prompt 啊。重点是 r1 还极为廉价。

但凡那时候体会过从 o1 到 r1 这之间的那种颠覆感的人,就能明白 DeepSeek 是有意义的。所以哪怕后续它落后那么多版本,被那么多人喷,我也从没喷过它。

DeepSeek 就像是目前大模型领域的一个特立独行的存在。别人都在炒作的时候,营造 AGI 近在咫尺的虚假共识的时候。它是那个冒出来打脸的。这个领域,你能看到大量的 OpenAI 韭菜、Anthropic 韭菜,甚至国内的文心一言韭菜、豆包韭菜、Kimi 韭菜。但你几乎看不到 DeepSeek 韭菜。

知乎用户 green​​ 发表

梁文锋颠覆了传统和现代的论调如下:

一、应试教育过时论。

二、阶层阶级固化论。

三、读书无用论。

四、崇洋迷外论。

五、美国高科技不可逾越论。

六、一代不如一代论。

七、本土大学不行论。

八、青年幼稚论。

九、资本至上论。

十、为富不仁论。

知乎用户 啊花 发表

牢梁给美股训的和狗一样,过几个月,随便掏出个啥玩意,就可以狂砍美利坚几十个亿。

牢梁不用干别的,就每天在微博指点江山说几句,硅谷都可以出地震。

只能说国内很多人对于牢梁的统治力是毫无概念的。

尤其是牢梁本身还是个乐子人的情况下,科技懂王知道吧。

还是真正有能力炸飞整个美股和硅谷乃至加州经济的天才版懂王。

更牛逼的是,这位还能自己赚钱,他本身就是个狗庄,在钱这个方向,你都对他毫无办法。

更更严重的是,硅谷那群大傻子幻想几十年的,一个科技天才,拿着超越时代的科技,吧全世界吊起啦打这种戏码,牢梁真的做到了。

可能有些人不炒股,我给大家伙说一下,量化是什么级别的玩意。

量化交易就相当于,在大家伙还在股市刀耕火种的情况下,你的牢梁捣鼓了联合收割机。

而且老梁还是在 a 股这个逆天市场,一个素人做到了行业前三。

什么概念啊?

我就这么说,你在美股,你就是个傻子,你眼光好,都可以拿麻袋装钱。

但是在 a 股,强如贝莱德,黑石,都得低头做人。

而你的牢梁,不只是可以在 a 股赚钱,他还是出了名的激进投资。

他是行业里第一批,搞全数字量化的,不看大盘,不看那些有的没的,纯考机器高频交易

这个算法水平含金量比 deepseek 只高不低。

而且,别看国内说,不给往外捣鼓。

算法模型只要建立了,你怎么知道,量化不去炒美股呢?

在国内你做到行业前三,每年也就赚几百亿,但是,你把这个算法拿到美股。

只要稍微炒一下,就那么一下,就比在国内做一年赚的还多。

我就敢这么说,牢梁就是就是在美股下面塞了个跳蛋,没钱就按一下按钮。

牢梁不给你整个大的,纯纯是因为心情好,而不是他整不出来。

而随着牢梁获得了他想要的算力,想要的数据,美股可能就真的让牢梁一个人出于娱乐目的给玩死了,而这个过程,甚至没有人能够阻止他,美股近 2000 亿美元,他的蛋相当于被牢梁一个人捏住了,有事没事就捏一捏。

只能说,硅谷那群大傻子幻想那么久,混了几十年,不如一个不知道哪里蹦出来的天才,给他整爆了,只能说幽默,nerd 就是 nred,神经病就是神经病,这个世界不会因为你是神经病你就是天然的天才,尤其是这群人现在已经混的依靠嗑药幻想了。

知乎用户 芝芝 发表

老美摆七星灯续命,DS 老师跑来一脚把灯踢翻了,老美想杀了他的心都有

知乎用户 真诚王 发表

我提醒一下,梁文峰坐在企业家第一排的

知乎用户 吾不知所云 发表

最大的好处之一就是证明了土鳖可以不比洋鬼子差,希望以后国人不再以洋文凭、海外经历来区分人才高级与否。

知乎用户 一凉海风 发表

不知道何时有人总喜欢把梁文锋的功劳弱化。

说什么他只是参与了一点。论文贡献者他没排第一。而是后面的清华等最重要起作用了。诸如此类。我只能说你们还是适合玩人情世故,你什么心态我懂,你们这类人你们是干不成什么实事,最多给你挂个名。这么恨梁文锋吗?

我就说句难听的,你信不信他领头换几个成员照样能做出来?孙凝晖院士手底下一大群清北硕博,怎么没见他们团队做出一个像样的 ai?孙凝晖很缺人吗?你信不信让后面几位成员单搞最后也做不出来?

当年纳粹德国 V2 火箭领头人绑去美国后照样能做出来。并作为 NASA 创始人之一推动了美国航天事业发展。但凡是干过工程的,都知道领头人要是懂技术并且亲自参与,那真的是事半功倍,别人整个逻辑的清楚,你等他好好安排工作就行了。自己专心干自己一部分。

别人 deepseek 团队包括你说的什么主要贡献者都承认梁文峰作为老大的重要性,你来否定他什么逻辑哈哈?

少点嫉妒,少点眼红,少点人情世故。你那种心态对中国发展没好处的,整天玩宫斗,耍心机,搞内斗。

乔布斯懂技术吗?他全盘负责了苹果的每一个部分吗?芯片他造的?操作系统他设计的?但是为什么别人提起 iPhone 第一个想到的就是乔布斯,乔布斯的重要性?怎么 deepseek 就把梁文锋给除名了?你这点心态啊,真不行。

知乎用户 fatal1tyv​ 发表

颠覆了我的家庭群

以前:爸妈隔三岔五转发 xx 中老年健康公众号,今天专家不让吃这个明天大夫不让吃那个,后天美国研究不让坐着大后天日本研究不让站着,但凡反驳一句其中有些离谱的说法 99% 概率招来 “专家懂还是你懂”“人家那是美国 / 英国 / 日本的研究”“翅膀硬了” 之类的丝滑小连招,想接着摆事实那自己慢慢 google 去吧

现在:链接直接扔去 DS,要求阅读全文,逐条分析,事实核查,最后总结观点,带参考链接,然后分享回去,魔法打败魔法,最多耗时 2 分钟并且免费

而且体感我爸妈已经学会这招了,现在分享的不靠谱文章已经很少了

就凭这件小事,我也得说一句 DeepSeek 就是普罗大众用着方便的好 AI

知乎用户 起兵烦我 发表

如果没有 BYD,特斯拉卖给你还能加个 0,信不

知乎用户 VladimirTepes 发表

很多人太低估 deepseek 的历史意义了,现在可能看不出来什么,但在未来的史书上会有重重的记上一笔,openai“发明” 了大模型,而 deepseek 改良了大模型,而他这次改良的意义,堪比瓦特改良蒸汽机,当年蒸汽机刚发明出来的时候,其实并没有多大影响力的,只能在矿井里抽水,而瓦特将其改良之后,才能使之成为工业革命的基础,而 deepseek 对大模型的改良和开源,能够使得大模型普及到全世界的每一个地方,样本多了,才能实行类似生命进化的优胜劣汰的自然选择过程,这样的 AI 才是真正具有生命力的,我们有兴见证了历史,站在了下一次工业革命的开头,

知乎用户 我不是 33 发表

颠覆了百度的文心一言。那时候国内 C 端用户基本上是百度一家独大,甚至智障一样的模型还要充会员。deepseek 出来以后百度被迫取消会员全免费了。国内的大模型智商迅速拔高,百度哭晕在厕所。

知乎用户 nelius 发表

如果基于华为的 DP4 生态护城河一旦形成,梁文峰大概率要封神了,能量不亚于当年的马化腾和马云。

知乎用户 曾是惊鸿照影来 发表

美国花了很多钱想达成在全球 AI 领域断崖式领先的成就

进度条看着无限接近 100%

结果每次看起来只差最后一步,DeepSeek 就会跳出来说,恭喜你仅差 0.01 代大模型就能达成成就,快邀请你的投资人再加一笔钱来投入研发吧。

知乎用户 踽踽独行 发表

梁文峰真的是国之栋梁啊。应该比当年梁启超还有名了。

作为跟梁文峰半个老乡,隔壁市。老家距离几公里,也算与有荣焉了。

知乎用户 佛泽 发表

奥特曼 2023 在印度一次活动中有个对话

当时有人问他:印度能不能花 1000 万美元自己搞个大模型?

他当时说了这句:和我们竞争训练基础模型是完全没希望的,你们不该试


然后今年 2 月,又一次在印度放话

印度不需要从头训练大模型,直接用 OpenAI API 做应用就好;印度是 OpenAI 全球第二大市场


你首先要明白 AI 对于美国来说是什么,说直白点,老美是在拿 AI 赌国运

2026 年 Q1:AI 投资贡献美国 75% 的 GDP 增长

2025–2026:AI 拉动美股约 80% 涨幅,成为唯一增长引擎

老美甚至说谁掌握了 AI,谁就掌握了 21 世纪


本来在老美的设想中,左手芯片,右手系统,这是 “垄断生意”,其他国家根本不能或者没有能力挑战老美的垄断地位,这是妥妥的赚垄断生意

老中:哥们儿,你这美国 AI 多少钱一小时?

老美:大几十块一小时。

老中:我去,你这 AI 模型是金子做的,还是算力是金子做的?

老美:你瞧瞧现在市面高端 AI,全是硅谷大厂的技术,你嫌贵我还嫌成本高呢。

老中:给我挑个普通版本。

老美:行,这个套餐怎么样?

老中:这 AI 保好用吗?

老美:我做 AI 服务的,还能给你割韭菜

老中:我就问你,这 AI 保好用吗?

老美:你是故意找茬是不是?你要不要吧!

老中:你这 AI 要是真好用,我肯定要。

老美:那要是不好用咋办?

老中:要是不好用,我自己认栽,满意了吧?

老中:算账,多少钱?

老美:算你优惠,两百八美刀。

老中:两百八?你这 AI 真是镶金了是吧。

老美:一分价不能少,高端模型就这行情。

老中:我看你这不是 AI,是收割韭菜来了。

老美:你买不起就别在这磨叽!

老中:我今天就把话放这,你这溢价离谱的 AI,压根不值这个价。

老美:你想干啥?

老中:两百八,是吧。

老美:对,就这价,少一分不卖。

老中:(拿起套餐页面翻看着)

你这 AI,参数虚标、算力注水,还敢卖这么贵?

老美:你别不懂瞎扯啊!硅谷大厂都这定价!

老中:我就问你一句,你这 AI,值不值这个钱?

老美:你故意找茬是不是!不买赶紧走!

老中:走?我今天不走了。你这不是卖 AI,是明着宰人。

老美:你想怎么着?还想闹事?

老中:我不想怎么着,就是让大伙都看看,美国这帮 AI,到底是做技术的,还是抢钱的。

老美:你他妈拆我台是吧!

老中:掏出 deepseek

老美:杀人啦!杀人啦!

AI 还是好用啊。。

只此一家,别无分号,你嫌贵,我还嫌卖便宜了,你嫌贵也没办法,劝你别研发,根本不是我们对手,浪费钱,老老实实用我们的系统就行


结果现在出来个 deepseek,虽然性能差点,但是开源啊,你让我老美的垄断生意还咋做啊

断人财路,如杀人父母啊

老中你坏事做尽啊

知乎用户 亡灵 发表

deepseek 是唯一一个让国人感觉自己在 AI 领域赢过一次,我们 ai 领域没有差对面太多的模型。

其他模型都没有给人这种感觉,都是技不如人,我们不行的感觉。

可能其他模型也很优秀,差的不多,虽然差的不多,但是也是一直差,一直在后面追赶。

deepseek 干了一件其他人都没做到的事,相当于告诉大家,我们也可以的,也可以在 AI 领域领先一次。

成功颠覆了中国人觉得自己在 AI 领域不行、觉得中国人 AI 不行的认知。

至少 deepseek 之前中国普遍认知中国 AI 落后十几年,未来永远都赶不上。

而现在有很多人认为我们 AI 在国际第一梯队没掉队太多,这是 deepseek 出现之后才有的事。

知乎用户 收集欢乐愉悦大家 发表

创造了 AI 圈的斩杀线,更贵的闭源模型都得死。

知乎用户 剑仁不败 发表

我对 deepseek 未来一年的预测毒圈正在合拢:DeepSeek 就是那条斩杀线——以芯片为界,以算力为刃

V4 悲歌:那个本可封神的模型,与它被推迟的 127 天

一支天才团队用技术登顶,一个创始人用股权和时间为国产生态开道。2026 年那个本该属于 DeepSeek 的春天,最终成了一场静默的牺牲。

2026 年 4 月 24 日,当 DeepSeek V4 带着输入缓存命中仅 1 元 / 百万 token 的 “价格屠夫” 姿态登场时,AI 圈为之震动。但鲜有人知,这声惊雷,本应在 127 天前就炸响,并让中国 AI 提前数月,在技术王座上刻下自己的名字。

更令人意外的是,仅仅 4 天后,4 月 28 日,DeepSeek 再次宣布限时优惠:V4-Pro 输入缓存命中价格直降至 0.025 元 / 百万 token,相当于首发价打骨折价,优惠延长至 5 月 31 日。

这是一场被推迟的发布,一次主动选择的牺牲,和一笔用股权与时间写下的悲壮赌注。


01 本可封神的冬天

2025 年 12 月,某地,深夜的 DeepSeek 办公室。

最后一批内部评测数据出炉。会议室里,是长久的沉默,然后是压抑不住的激动。

屏幕上,V4-Pro 在多项关键评测中展现出令人振奋的实力。在 Agentic Coding 任务中,其表现已全面超越当时公认的标杆 Claude Opus 4.5,甚至在部分复杂推理场景中,展现出挑战更高维度的潜力。

“我们做到了。” 一位核心架构师的声音有些颤抖。为了这一刻,这支平均年龄不到 30 岁的团队,已鏖战了四百多个日夜。他们赌上了对 MoE 架构的重新想象,赌上了对稀疏激活的极限压榨,赌上了中国团队也能做出世界最顶尖通用大模型的信念。

路标已经清晰:按计划在 2025 年底或 2026 年 1 月初发布,抢占全球技术心智,成为 “中国第一个在通用能力上全面超越 Opus 4.5 的模型”。资本市场将为之疯狂,订单将如雪片般飞来,团队将沐浴在聚光灯与橄榄枝中。

那是本可属于 DeepSeek 的,一个封神的冬天。

然而,庆功宴的香槟,最终没有打开。

02 梁文锋的抉择:掉转船头,驶向风暴

几乎在技术胜利的同时,现实的压力接踵而至。英伟达为中国市场 “特供” 的芯片,性能已被阉割,且供应随时可能中断。更关键的是,政企市场对 “国产化” 的要求越来越高

另一边,华为的战友带来了消息:昇腾 950 的最终流片验证顺利,但要让 V4 这样的巨兽完全在其上奔跑,需要一场从编译器、算子库到分布式框架的 “心脏移植” 手术。手术预计需要 3-4 个月

会议室再次陷入沉默,但这次是冰冷的。梁文锋面前只有两条路:

  1. 按原计划发布,赢在当下。用技术荣光凝聚团队,吸引资本,巩固行业地位。但代价是,模型将长期运行在 “别人的地基”(英伟达 CUDA 生态)上,命脉悬于他人之手。在可预见的未来,政企等对自主可控有硬性要求的庞大市场,将对其紧闭大门。

  2. 推迟发布,重写地基。全面转向昇腾,拥抱国产算力生态。代价同样惨烈:白白葬送来之不易的数月技术先发优势,浇灭团队的巅峰成就感,并必然在漫长、艰难的迁移过程中,面对军心涣散、竞品追赶的严峻局面。

没有人知道那几天梁文锋经历了怎样的挣扎。外界只看到结果:原定的发布计划被紧急叫停。全员转向,攻坚昇腾适配。从 2025 年 12 月到 2026 年 4 月,整整 127 天的黄金时间窗口,在内部被定义为 “战略静默期”。

决定宣布时,一位刚为 V4 通过最终测试而欢呼的年轻研究员,在工位上红了眼眶。那不是疲惫,是理想触手可及却被硬生生拉回现实的、巨大的失落。

03 大出走:理想主义在现实前的溃散

转向的决定,像一盆冰水,浇灭了技术登顶带来的灼热激情。

接下来的 127 天,是 DeepSeek 创业史上最晦暗的时期。技术挑战如山:40 万个算子需要重写或优化,精度对齐的微小误差就可能导致训练崩溃,全新的工具链让开发效率骤降。

但比技术挑战更致命的,是人心。

**“我们明明已经赢了,为什么还要回头去修路?”**​ 这种质疑在团队中无声蔓延。当 “做出世界第一” 的理想,被替换为 “适配国产芯片” 的琐碎工程时,一种深刻的无力感攫住了那些最顶尖的大脑。

离职潮开始了,且精准地发生在融资消息扩散、猎头闻风而动的时期。

  • 罗福莉,V2 架构的关键奠基者之一,被小米以高薪挖走,负责 MiMo 大模型

  • 郭达雅,R1 推理引擎的灵魂人物,被字节跳动的 Seed 团队以 “技术合伙人” 的愿景挖走。

  • 王炳宣,DeepSeek 第一代大语言模型核心作者,加入腾讯。

  • 阮翀,多模态技术核心研究员,离职加入自动驾驶公司元戎启行,出任首席科学家。

  • 魏浩然OCR 系列核心作者,去向未公开。

据《每日经济新闻》统计,2025 年下半年至今,DeepSeek 至少 5 名核心研发成员确认离职,覆盖了基座模型、推理、OCR、多模态四条核心技术主线。

梁文锋没有强留。他理解,对真正的天才而言,对技术极限的追逐,往往比股权和薪酬更有吸引力。他亲手推迟的,正是他们梦寐以求的巅峰时刻。他不能,也没有资格,再用理想绑架他们共赴一场前途未卜的豪赌。

团队在流血,估值在承压,时间在流逝。那四个月,梁文锋的办公室夜夜亮灯。他一面要稳住残存的骨干,用 “我们一起做中国自己的 AI 根技术” 的新故事重新凝聚共识;另一面,他必须启动一场绝地求生式的融资

04 股权换时间:一个人的战争

2026 年初,DeepSeek 启动了成立以来的首次大规模对外股权融资。这是一场与时间赛跑的输血。知情人士透露,DeepSeek 目标估值不低于 100 亿美元,计划募集不少于 3 亿美元

谈判异常艰难。投资人都问同一个问题:“V4 到底什么时候能上?你们的技术领先还能保持多久?”

更残酷的是外部竞争:2026 年 2 月 5 日,就在 DeepSeek 埋头攻坚昇腾适配时,Anthropic 正式发布了 Claude Opus 4.6,再次刷新了行业标杆。这意味着,即使 V4 最终发布,它要面对的已不是当初的 Opus 4.5,而是更强大的 4.6。

最终,协议达成。2026 年 4 月下旬的工商信息变更显示,DeepSeek 完成新一轮增资,梁文锋通过大幅增资,将其个人持股比例提升至超过三分之一,实现了对公司的绝对控制。通过直接与间接方式,梁文锋持有 DeepSeek 约 **84%**​ 的股权,继续保持对公司的高度控制力。

这惊险的一跃,背后是他破釜沉舟的决心:用尽一切筹码,确保自己对公司的绝对控制权,以推行这条无人看好的 “国产化” 路径。

这笔钱,首要任务不是扩张,而是止血和续命。一部分用于弥补研发超支,一部分用于安抚和激励留下的核心团队,还有一部分,必须支撑公司在零收入的情况下,完成漫长的迁移工程。

与此同时,华为的工程师团队进驻 DeepSeek,开始了 “联合攻坚战”。这不是简单的供应商支持,而是两个同样背负国家期待的团队,在未知海域的背水一战。

05 127 天后,带着伤痕归来

2026 年 4 月 24 日,V4 终于发布。

当外界为 V4-Pro 输入缓存命中 1 元 / 百万 token、V4-Flash 仅 0.2 元 / 百万 token 的定价震惊时,只有亲历者明白这个数字背后的苦涩。它已经足够激进,但还不够——DeepSeek 已经失去了用技术溢价从容打开市场的时间窗口

更残酷的是定价表上的小字:“受限于高端算力,目前 DeepSeek-V4-Pro 的服务吞吐十分有限,预计下半年昇腾 950 超节点批量上市后,Pro 的价格会大幅下调”。这行小字,道尽了所有无奈与期待。

但真正的震撼在 4 天后到来。4 月 28 日,DeepSeek 宣布限时优惠:V4-Pro 输入缓存命中价格直降至 0.025 元 / 百万 token,相当于首发价打骨折价,优惠延长至 5 月 31 日。这已不是 “价格屠夫”,而是近乎 “自杀式定价”。

发布会上,梁文锋没有过多渲染技术参数。他平静地宣布了价格,然后着重感谢了华为昇腾团队。只有细心人才能听出,那平静之下,竭力压制的波澜。

V4 依然强大,甚至因为昇腾的专用优化,在某些场景下表现更佳。但它的登场,不再是一个天才作品横空出世的炫目故事,而更像一个伤痕累累的战士,在错过最佳战机后,用更惨烈的打法强行杀入战场的悲壮叙事

那些离开的天才们,此刻或许正坐在竞争对手宽敞明亮的办公室里,看着这场发布会,心情复杂。他们亲手参与铸造的利器,因战略的考量,未能以最荣耀的方式出鞘。

06 这不是终局,而是更残酷的开端

从 1 元到 0.025 元,不是战争的结束,而是另一场更加宏大、也更加残酷的战争的开始。

梁文锋赌的,从来不是这一定价本身能否盈利。他赌的是:

  1. 用极限低价,在英伟达生态的铜墙铁壁上凿开一道裂缝,让百万开发者涌入,快速养成基于昇腾的开发习惯。

  2. 为华为昇腾 950 的大规模量产上市,赢得最后几个月的宝贵验证期和舆论准备期

  3. 将 DeepSeek 的命运,与国产 AI 算力基础设施的崛起,彻底绑定

他牺牲了一支 “梦之队” 的短期理想,换来了一张通往未来十年、中国 AI 自主博弈主战场的、唯一且沉重的船票。

华为方面宣布,昇腾超节点全系列产品已全面支持 DeepSeek V4 系列模型,通过双方芯模技术紧密协同,实现了 “零日适配”。在 8K 输入场景下,昇腾 950 超节点运行 DeepSeek-V4-Pro 可实现单卡 Decode 吞吐 4700TPS

这场豪赌没有赢家,只有幸存者。如果未来,中国的 AI 应用真的跑在深度融合的 “DeepSeek 算法 + 昇腾算力” 底座之上,那么历史也许会记下:

在 2025 年那个寒冷的冬天,一个叫梁文锋的人,和他那些最终选择离开或留下的天才们,共同为一个尚未到来的春天,按下了一次昂贵的、悲壮的、但或许必要的暂停键。

而那枚本应在 2025 年冬日绽放的、宣告技术登顶的烟花,最终在 127 天后的春天,化作了一颗价格屠夫的低价子弹,射向了更远的未来。

壮烈的从来不是胜利,而是在注定沉默的时光里,选择为何而战。


没想到这么多人看了,以下对一些喜欢的评论:

1、是不是 V4 写的?

答:有原文,但很干巴巴,也有主观臆想,所以 V4 润色了,链接在这里:为什么在性能相近的情况下,DeepSeek 模型的影响力比 Qwen 模型更大?

2、槐角不甘心:其他开源模型为啥也 0day 适配了国产芯片?

答:其他模型的适配,相当于在性能强大的 X86 电脑(英伟达) 上,用虚拟机软件模拟运行一个 ARM 手机应用(华为芯片架构)。

它能兼容运行,但因为指令集和硬件架构完全不同,中间隔着一层 “翻译”,性能损耗巨大,基本不可用于严肃的生产或训练。这只是解决了“从无到有” 的问题。

而 DeepSeek V4 的目标,则是要成为那个应用的原生 ARM 版本。

这意味着必须彻底重写所有底层代码,直接调用 ARM 芯片的原生指令和算力,以追求极致的原生性能。这解决了 “从有到优” 的问题,但工程量和技术难度完全不是一个级别。

核心差异就在于此:

前者是 “通过模拟兼容”,目标是能跑起来,性能是次要的。

后者是 “打造原生版本”,目标是发挥硬件 100% 的实力,这需要从最底层开始重构一切。

3、李凯:先发布,再适配华为,并不影响国产化进程啊?

答:我感觉说得对,时间红利是实打实的牺牲。先发布后适配,或等友商开路,无疑是更轻松、更 “精明” 的选择。

但在分秒必争的 AI 竞赛里,适配不是表面兼容,而是 “重构心脏”,这需要核心团队全身心投入。如果都想着 “明日复明日”,等别人铺路,那路就永远铺不起来。

有些选择,关乎担当。黄仁勋最怕的,并非中国有了好芯片,而是顶尖模型从此优先为非美国架构优化。一旦趋势形成,游戏规则就此改变。

DeepSeek 选的,去打最难的仗。在未来回头看,梁文锋可能是做错了,但希望不会后悔。

知乎用户 Liber8 发表

其实也没颠覆什么,无非是价格问题,性价比的问题。

Deep seek 又没有性能爆炸,也不知道啥时候出 deepseek R2

只不过给其他国家提出了一个问题。你是否愿意用百分之 3 的价格买一个 90% 到 95% 性能的产品?

中国的 AI 售价是美国 AI 成本的十分之一。

Deepseek 导致七姐妹的估值本身遭受质疑。

星际之门这玩意真的能赚钱么?按照中国这个 ai 价格,所有美国的 ai 永远别想赚钱。

知乎用户 精神女同异装癖 发表

老美怎么拖垮苏联的?

打压油价,让苏联财政吃紧。

老美指望 ai 吸血全世界呢,然后 ds 一下子吧老美的吸血管砍了。

现在最理想的状态就是让 ds 保持在比美帝 ai 稍微差点但是比美帝廉价的多的状态,就像是当初美国星球大战计划一样逼迫老美不断烧财政来保持自己神话。

只能说一个排的武警有点少了,应该让专门负责的人来。

知乎用户 guangbin 发表

只要 DeepSeek 不差到完全不能用的地步,老美的收回投资的希望就很渺茫,彻底断绝老美唯一翻盘的希望。这确实是国运级的产品,此仗若是能打赢,梁文峰可以比肩钱学森。

看到有回复说比肩不了钱学森,其实我觉得是钱学森的历史地位太高,让人形成了思维惯性。

这么说 DeepSeek 的意义可能更清楚一些:这是几次工业革命以来,唯一中国直接参与,而不是追赶的一次,而梁文峰让我们赢的可能性很大,至少也能让老美赢不太多。

知乎用户 小杠杆 发表

颠覆了新技术出现后先收割 (以回收成本为噱头) 再被打到平价逐步淘汰的传统

出厂直接打成平价… 新技术直接平权…

梁圣的恩情还不完…

知乎用户 qcc 发表

![](data:image/svg+xml;utf8,)

梁文峰是奥特曼最严厉的父亲!!

知乎用户 拾荒的艺术家 发表

5 月 8 号,DeepSeek 被曝启动首轮外部融资。

500 亿人民币。中国 AI 史上最大单轮。投后估值 3500 亿。数字砸过来的时候,群里的反应都是” 卧槽”。

但我盯着一行字看了很久。

梁文锋自己掏了 200 亿。占这轮总融资的 40%。折合 29 亿美元——差不多他身家的四分之一。

不是跟投。不是” 象征性出资”。

是在所有机构抢着进场的时候,他一个人押了最大的一份。

你知道吗,这个动作比任何 PR 稿都诚实。一个人对一件事信到什么程度——不是看他怎么说的。是看他把多少真金白银放在了桌面上。

我扪心自问了一下。过去三年我做出的每一个所谓” 选择”——没有一次下过这种注。


DeepSeek 从一开始走的路,跟所有人反着来。

2023 年、2024 年,中国 AI 圈的共识是什么?烧钱买卡、闭源收费、讲资本故事、追 OpenAI。没有一家公司敢不融资,不敢不开源路线之外的变现模式,也不敢说” 我不需要外部资本”。

梁文锋全反了。

开源。低成本推理。三年不碰外部融资。不接受任何一家美元基金的条款。硅谷说中国的 AI 公司只能做应用层——他直接杀进基础模型,连招呼都不打。

当时市场上怎么说的?

“太天真了。”“你扛不住算力成本的。”“不融钱你在 AI 赛道怎么玩。”

然后 2025 年 1 月,DeepSeek-R1 出来,全球炸了。

然后 2026 年 5 月,500 亿到账。梁文锋自己占最大份额,最终受益股份 84.29%,表决权 100%。

他把公司守住了。

你有没有发现一个规律。当所有人都往同一个方向跑的时候,那个反方向走的人——要么是傻子,要么看到了别人没看到的东西。

关键是你怎么知道自己是哪一个。


我这几年没少犯第一种。

去年跟风搭知识库。所有人都在说” 第二大脑”“数字资产”“终身学习系统”。我听进去了。剪藏了上百篇文章,文件夹改了一遍又一遍,SCHEMA 写了一版又一版,Skills 装了一堆。每天花两三个小时” 优化系统”。

你问我当时什么感觉?

很爽。搭建这个动作本身——太有成就感了。每加一条规则、每完善一个模板、每打通一个自动化,你都觉得自己在进步。

4 月底我在日记里写了一个词,叫工具幻觉

你花大量时间搭建工具。搭建的过程给你一种” 我在成长” 的错觉。但你打开它的频率——越来越低。我越来越不好意思点开那个越来越完美的文件夹。因为里面装的都是我” 将来会用到”、但今天用不到的东西。

跟着共识走最隐蔽的坑,不是走错了。

是你根本感觉不到自己在错。所有人都这么做,你怎么会怀疑?

但这个道理,我花了 3 周和一堆失眠的夜晚才想通。

但更痛的在后面。


5 月 6 号,我研究小红书英语外刊赛道。突然想通了一个方案——把 AI 完整嵌进英语学习全流程,做 6 个库、多张表、完整闭环。

我在日记里写的原话是” 茅塞顿开”。激动坏了。

5 月 7 号花了一整天搭系统。逻辑完美,技术上完全可行。每一个库跟每一个库之间怎么关联,用户从哪一步进、哪一步出,我全画出来了。

晚上打开 Codex,让它帮我完善方案。

它没完善。它反问了我几个问题。

目标用户是谁?他们现在用什么替代方案?用户为什么不用免费资源、来用你的系统?

我一个一个回答。答到第三个——我知道答案了。

他们不会来。

这群人不是我想象中” 想学英语的人”。他们的真实行为路径是:收藏→兴奋三天→放弃。小红书上的免费外刊多到看不过来。他们真正卡住的,是把输入变成稳定输出。而我搭的那个东西——6 个库、完整架构、逻辑闭环——解决啥了?

用户根本不想要一个库。

他们要的是:今天给我一段,告诉我学哪 3 个表达,让我写 2 句,帮我改,明天继续。

就这么简单。

我花了一整天搭出来的东西,跟用户真正的需求之间——差了一整条银河。


这不是能力问题。这是共识思维的问题。

当时 AI 圈的共识太强了。”AI 时代必须搭第二大脑”“每个人都需要知识管理系统”“不搭知识库会被淘汰”。当这种声音够大,你不会主动去想——

有没有人真的需要我搭的这个版本?

你默认” 需要” 是一个已经被验证的前提。但它不是。

梁文锋做 DeepSeek 的时候,没有人验证过” 不融资、做开源、搞低成本推理” 这条路能走通。一个都没有。市场上没有任何证据证明他是对的。

他面对的,不是”A 和 B 哪个好” 的选择题。

他面对的是:全世界都在说 A 是对的,你在没有任何证据证明 B 能赢的时候——选了 B。而且,一选就是三年。

三年。

一个人扛着反共识走三年。没人信你。市场怀疑你。你的员工被挖走——罗福莉去了小米、郭达雅去了字节。算力成本在飙升,对手在烧钱,而你账上没有外部资本。

换我,我不知道自己扛不扛得住。


但现在站在 2026 年往回看,所有人都说梁文锋的选择” 显然是对的”——开源赢了、低成本推理赢了、独立路线赢了。所以 500 亿到账,很合理。

对吧?

不对。

放在 2023 年,他做这些选择的时候——没有一个人会这么说。

他不融资的决定,在当时的逻辑里就是” 自我设限”。他开源的决策,在当时的叙事里就是” 放弃变现”。他做低成本推理、不讲 AGI 愿景,在当时的审美里就是” 不够性感”。

反共识最难的,从来不是你” 有什么不一样的想法”。

是你有了——没人信。是你下注了——不知道结果。是你如果输了——所有人都会说” 早就告诉你了”。

梁文锋这次融资,有一个细节我反复看:他是在所有机构都抢着进场的时候,把自己的钱放在第一位。

机构可以犯错。机构投错了只是 portfolio 里少赚一个 case。他投错了——是四分之一的命。

这个区别,数字算不出来。


我后来把那套失败教训刻进了 CLAUDE.md 里。第一条规则写的是:

默认假设这个方向是错的。

每次启动新项目之前,先写失败理由。最可能的 5 个死因是什么?用户为啥不用?为啥不买?为啥不持续?

写不出来——说明你没真正理解这个项目。

听起来很消极对吧。但它真正的作用不是让你不做事,是逼你直面一个你一直在躲的问题:

你选这个方向,是因为别人都在选——还是因为你看到了别人没看到的东西?

大部分时候,答案很让人不舒服。

我搭知识库,因为所有人都在搭。我做英语系统,因为”AI + 教育” 听起来正确。我收藏一堆文章,因为收藏这个动作让我觉得自己在进步。但这些都不是判断。是跟风。

我从来没有在动手之前问过自己:有人要吗?我自己想用吗?如果没人看、没人买、没人持续,我还会做吗?

这些问题太痛了。痛到你会下意识绕开。

但 DeepSeek 这 500 亿让我意识到一件事——真正有判断力的人,不靠共识做选择。他们靠的是自己对一件事的判断。然后,他们用最大的代价,去兑现那个判断。

梁文锋用 200 亿兑现了。

大多数人——连用 200 小时兑现都不愿意。


所以今天你可以做一件很小的动作。

把你手头正在忙的事拉出来。不管是在搭系统、做内容、换赛道、学新工具——问自己三个问题:

第一,我做这件事,是因为别人都在做,还是因为我自己判断它值得做?

如果答案是” 别人都在做”——停一下。这个理由不够。从来都不够。

第二,如果有人告诉我” 这个方向是错的”,我能拿出什么证据反驳他?

不是情绪。不是” 我觉得你不懂”。是证据。是用户说了什么、数据显示了什么、我测试了什么。

第三,我愿意在这个方向上,下多大的注?

最后一个最难。因为它不是在问” 我觉得这个方向怎么样”。它是在问——我信到什么程度。

梁文锋用 200 亿回答了。

你准备用什么回答?


好了,以上就是 DeepSeek 这笔天价融资让我想到的。

不是行业分析——那个有更专业的人在做。是我自己在做选择的时候反复踩过的坑,和这一次被梁文锋 200 亿炸出来的反思。

如果你也在做选择——选赛道、搭系统、学工具、换方向——希望这三个问题能帮你冷静一下。

不是什么都做。不是跟着走。

是找到你真正愿意下注的东西。然后把你的时间和注意力押上去。


以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~

谢谢你看我的文章,我们,下次再见。

/ 作者:Jacky

知乎用户 呜喵呜喵 发表

既然美国想效仿当年整死苏联那套搞新世纪星球大战,那就要有做好被中国反过来架在火上烤的觉悟。

巧了不是,梁文峰的 deepseek 和华为的昇腾卡就是这把火。

知乎用户 鼓面上的蚂蚁 发表

其实 DeepSeek 出圈的关键节点就两次,

一次是 V3 和 R1 的开源,主要是 R1,极低成本训练出推理大模型,虽然有幻觉有各种小瑕疵,但是方向对了,直接打破了美国闭源 AI 的垄断赚钱战略,AI 平权的时代到来;

第二次是 V4,如果说 R1 打消了美国的 AI 霸权梦,V4 适配华为昇腾就是动摇了美国 AI 的根基,给他们直接设立了一条斩杀线。以后只要水平低于 V4 的模型,基本没有闭源的必要了,甚至都没有存在的价值。硬件构建的 CUDA 生态已经开始有竞争者,以后训练模型,不再只有英伟达一家生态可以支持。基本上 AI 从一种金融产品和金融武器,变成了促进人类进步的工具。

定价权是建立在技术优势的基础上的。没有定价权,就相当于失去了未来数十年的发展机遇,AI 巨头完全可以通过价格,让你承担不起跟进最新科技新生产力的代价。过去,军事和武器力量可以决定定价权,后来,科技和金融可以主导定价权。现在,至少在 AI 这个明显可以主导未来生产力的关键科技上,实现世界意义上的合理定价和公平。

知乎用户 乱七八糟的我 发表

感谢 deepseek

感谢梁文峰

感谢 A 股股民

加油华为,加油 China

知乎用户 两节课 发表

2022 年 11 月,gpt3.5 横空出世,惊艳全球。百度卧薪尝胆 all in ai 7 年又让他赌对了 (不得不服气,老李的眼光真是,战略全胜,战术全败),文心一言也算是能看到 gpt 车尾灯。

2023 年 4 月,gpt4 推出思考模式,一骑绝尘,这回一众 AI 公司车尾灯都看不到了。幻方宣布 all in ai,开始筹备组建独立的 ai 公司,年底推出 deepseek v1

2024 年 5 月,gpt4o 发布,多模态高性能,一众 AI 公司都有点绝望了。deepseek 一年发布了 v2、v2.5,年底发布了 v3 在性能上大概追平了一年半前的 gpt4

2025 年 8 月,gpt5 发布,刚出来的时候效果一般,一堆用户强烈要求退回 4o 版本,后续改进以后凭借 40 万上下文独领风骚 (一般大模型是 12 万上下文)。deepseek 发布 R1,并用论文详细描述了思考模式是怎么回事,从此所有大模型均具备了思考模式

2026 年 4 月,deepseek v4 发布,通过极其巧妙的算法,让大模型具备了 100 万上下文,并发表论文详细论证如何实现自己如何优化。

如今,deepseek v4 以北美御三家几十分之一的价格,真正做到了 AI 平权 (北美御三家这价格不好说亏了还是赚了,但 deepseek 有阿里云部署版执行首发价格肯定是有的赚)。百万 token 输入命中缓存只需要 2 分钱,人民币

有人说,deepseek 就是大模型斩杀线,性能不如它的大模型会被斩杀,性能比他强不多但价格贵很多的也会被斩杀。

一方面,它让 AI 平权,让人人都能用得起性能不错的大模型。

另一方面,他是上帝之鞭,鞭策所有大模型想休息的时候就看看身后,斩杀线还有多远

反正自从 v4 发布后,germini 也不说地区无法服务了,claude 封号也没那么频繁了,gpt 降智都少了。

知乎用户 猎晏焱 发表

颠覆了人们以为的大模型必需烧钱堆卡打广告的认知。以前这些大厂巨头们是要大力出奇迹,现在才明白创新是以少胜多同样能够出奇迹。

知乎用户 刘一鸣​ 发表

Deepseek 的颠覆性在于其公开的训练方法,这改变了市场格局,直接将 AI 市场从寡头垄断变成了充分竞争。

结果就是不再有超额利润,开启了白菜的工业化种植。

知乎用户 神无月渎 发表

美国这几年经济病入膏肓

什么 VR, 自动驾驶, 数字货币, 元宇宙

轮番往外蹦

个个吹的天花乱坠, 可惜远水治不了近渴, 美国经济撑不到画饼实现

最后大浪淘沙之下, 现在美国就指着 AI 这颗大力丸翻盘呢

结果 deepseek 啪一巴掌把病床上奄奄一息的老美手里的大力丸打飞了

知乎用户 太易君子 发表

苦一苦 A 股股民,骂名牢易担()

知乎用户 流浪啊流浪 发表

openai 的 chatgpt 是 iphone,启发了其他大语言模型,让第一世界的消费者可以用上;deepseek 是 android,推广到了全世界,让所有 AI 第三世界国家也有希望发展自己的 AI 产业

知乎用户 wywzxxz 发表

到没颠覆啥,就是撅了美帝 AI 的根而已。

DeepSeek 并非是独一份的国产顶尖模型,Qwen 也不差但美帝却不虚他:

  1. 一方面,openai 目前仍处于优势,不怕竞争。
  2. 另一方面,一家公司而已,真要是竞争不过美国大不了长臂管辖给禁了或者干脆抢了,一如 Tik Tok

而 DeepSeek 的政治地位之所以远高于 qwen,秘诀在于完全开源。

完全开源,即不光开源权重和预测,还开源训练。深度求索甚至更进一步,不光开源训练代码,还把训练时遇到的经验、问题和解决方案一并传授。

简单来说,deepseek 手把手教全世界如何复制其商业辉煌,就算搞不定全链路至少也可以搞一搞应用嘛

举个例子:你想用 qwen 做智能面试官,要从 100G 的面试记录里学习面试官的反应。
你总不能把资料全塞上下文里吧,那成本起步爆炸了?而且这样 ai 充其量也只是知道了这些信息但很难融会贯通。
更为商业化的选择是进行 finetune,可以粗略理解成讲你的资料直接放进训练集里,更经济,效果也更好。
但这部分没开源,你只能购买阿里标准化服务,有啥奇思妙想你也没法加进去。
但用 deepseek 就没这问题,东西都给你备好了你直接跑,中间遇到啥匪夷所思的问题还可以查一查论文有没有讲。

这是很恐怖的。大部分需求其实都不怎么难,现在它们都可以被世界内部消化了,只有一点点极难的需求才会吃美帝的高溢价,这绝对是撑不起一个体系良心循环的。

对于中国来说这是无所谓的:

  1. 中国一贯走的是薄利多销的路子,不依赖高溢价
  2. 目前各大厂商更是在走免费经济,亏本给你用来来达成战略目的,例如占据流量入口和基建设施。

甚至其他国家搞云服务也不怕,笑话,论基建和规模效益谁敢跟中国比?

但对美国来说是绝对的坏消息:

  1. 美帝工业直接跟高利润的金融业竞争,一旦无法达成垄断收取超额收益资本分分秒缩回金融界玩钱生钱去了。
  2. 你可以干掉深度求索,但干不掉全世界,还有欧洲 ds、日本 ds 甚至印度 ds。

这对融资这种借款经营的商业模式压力的很大的,openai 由于头羊效应尚能维持,初创企业就更难哩。

当然美国也不是没做反应:

  • 一方面,宣布 deekseek 威胁美国国防安全,防止 ds 在美国内部分流需求,先保住 openai 这些独苗。
  • 另一方面,发召会禁止世界使用 ds。说白了就是罗织个口袋罪方便配合长臂管辖锤人。用枪打出头鸟的方式以拖待变。

究其根本,中美表现异同的根本在于工业:

  • 中国工业比重大可以直接从 ai 技术提升中受益。正所谓众人拾柴火焰高嘛,只要能加速 ai 发展是不介意共享技术的。
  • 而美国工业已去世,ai 必须时刻保持领先才能吸引世界工业来上供。

所以到底是谁主导的美国去工业化的,真的应该给他立个碑,上边就写 “去工业化利国利民” 好了。

至于利哪个国哪个民你别问

知乎用户 你开心就好 发表

起初,openAi 技惊四座,chatgpt 横空出世,人类进入 AGI 时代。

随后,全球各大 it 巨头纷纷跟进,但是没有一个能打的。

鉴于 chatgpt 问世时的惊艳表现,美国人宣布了星空之门计划,把估值估到 5000 亿美元。并用这个估值去四处拉投资,要建算力中心,要大量买英伟达的 H100/200 芯片

总之,星空之门画了估值 5000 亿美元的大饼。如果这个大饼,以及衍生的二次饼真能做出来,很多人都能吃饱饱。(只不过这些人大多数是美国人)

然后,梁文锋带着 deepseek 出来说话了。

首先,我开源,所以你这个星空之门做不成垄断生意。

其次,我算法和架构比你先进,达到同样的性能指标,我需要的算力比你少很多。所以星空之门里面庞大的超算中心计划直接被质疑。

最后,我还能兼容国产芯片,这意味着我做大之后,我可以带飞国产芯片产业,进一步增加中国摆脱对美国高端芯片的依赖。

准确地说,梁文锋不是颠覆了什么。而是美国人吹起一个泡沫,准备再收割一轮的时候。梁文锋只是出来淡淡地说一句:“AGI 这东西也没多高大上,我这就搓一个出来给大家伙儿看看。”

“我挣不挣钱不重要,重要的是你挣不到钱。”

据说梁文锋过年回家,有武警保护,你就知道某些势力对他有多恨之入骨了。

知乎用户 药水哥 发表

颠覆了唯高考成绩论和唯学历论。

梁文锋浙大本能领导很多清北本创造出 DeepSeek,证明了高考落后的人并不一定就比高考领先的人以后混得差,只要肯努力也有机会超越高考成绩和本科学历比自己好的人。

C9 有机会超越清北,985 有机会超越 C9,211 有机会超越 985,双非有机会超越 211,专科有机会超越本科。普通人应该以梁文锋为榜样,坚定信心,不断突破自己,创造更好的生活。

知乎用户 螳螂 发表

从 deepseek 到华为,从宇树科技到黑神话悟空,从大疆到哪吒,但凡能在国际上露脸的,绝无一人是国企。

实际上,这是资本与市场的成功。从某种程度上,也是我国模仿美国某部分制度下的成功。

但社会主义本身又有强大和近乎完善的基础架构。

这之间需要足够的平衡能力。

向左向右都是谜题。

知乎用户 设置 发表

我家丢东西,就用 DEEPSEEK 开奇门遁甲盘来找。有一定的准确率

知乎用户 穆晓玲​ 发表

颠覆了大侄子的世界观

知乎用户 除虫局 发表

token 翻译成词元是不够的,应该翻译成通宝。

因为它会成为货币锚。同样的 token 花更少的钱,意味着同样的钱对应更多的 token,token 是等价的,单位货币对应的 token 越多,这个货币就越贵。

所以争夺 ai 大模型的霸权,就是争夺金融霸权。这是胜负手,死生之地,兵家必争。

知乎用户 传统异能大宝 发表

Ai 由一种昂贵的量贩式科技开始变成像水和电一样的基础设施。

这有点像什么呢?我们会说每个月要交多少水电费,但很少说我每个月要买多少电买几方水。

以后就变成我每个月要交多少词儿费 / 国家向我卡里打了多少词元。这些词元用来干什么呢?外骨骼,家政机器人,护理机器人,机器伴侣,元宇宙,私人教练,智能导游等等总之一切需要消耗 token 的东西。每个月发一些,超了自己买,工业价另算。

知乎用户 西塞罗​ 发表

DeepSeek 的问世堪称 2025 年中国科技界最大「照妖镜」,表面上是 AI 技术突破,实则狠狠撕开了国内多个领域的遮羞布,其颠覆性主要体现在:
一、炸穿行业潜规则

  1. AI 烧钱逻辑崩塌:557 万美元做出对标 GPT-4o 的模型,直接让 Meta 烧的 1000 亿美元成了笑话。现在科技论坛流行梗:「给梁文锋团队发个硅谷高管年薪,他能造三个 OpenAI」。
  2. VC 现形记:红杉、高瓴等顶级机构集体翻车,投的「大模型六小龙」被网友调侃成「PPT 六小虫」。小红书热帖「中国 VC 只会投烧烤店和奶茶店」获百万点赞。
  3. 大厂光环破灭:百度连夜开源文心模型,腾讯马化腾亲自下场蹭热度,阿里投资部被曝曾以「创始人发型太土」为由拒投 DeepSeek,现成业内经典笑料。

二、重构社会认知

  1. 教育领域打脸三连
  • 「小镇做题家无用论」破产:湛江农村出身的梁文锋,用数学建模能力吊打清北系海归精英。
  • 「藤校迷信」坍塌:团队 139 人清一色本土学霸,浙大 + 中科大组合拳干翻斯坦福 MIT 联盟。
  • 「35 岁危机」反讽:团队平均年龄 26 岁,主力研发清北少年班出身,网友戏称「在 DeepSeek,25 岁已经是技术老人」。
  1. 产业认知地震
  • 央企连夜拆除「进口设备优先」标语,三桶油接入大模型的公告被调侃「这是要 AI 抽油还是炼油?」
  • 地方政府上演魔幻现实:郑州领导干部集体学习 Prompt 工程,县长们朋友圈晒「今天你 DeepSeek 了吗?」

三、暴击国际秩序

  1. 硅谷神话终结扎克伯格国会哭诉「再不禁运,美国 AI 要改姓梁了」,网友制作表情包「小扎的眼泪,DeepSeek 的奖杯」。
  2. 算力霸权松动英伟达股价单日暴跌 17% 创纪录,黄仁勋内部信中「警惕东方算法魔法」泄露,被做进鬼畜视频疯传。
  3. 开源战争升级:中国开发者集体玩梗——「以前用 LLaMA 要翻墙,现在老外求 DeepSeek 要挂梯子」。

四、狠戳体制痛点

  • 国企创新尴尬:中石化工程师自曝「我们写份 AI 立项报告要走 18 个流程,DeepSeek 模型都迭代三次了」
  • 高校教育脱节:某 985 教授哀叹「我的博士生还在调参,DeepSeek 实习生已重构 Attention 机制」
  • 资本认知反转:私募圈流传新鄙视链「投消费的 < 投硬科技的 < 投量化出身的」

最诛心的是:当全民狂欢「中国 AI 站起来了」时,梁文锋默默把祖宅改成了养猪场——毕竟在他眼里,颠覆世界和优化生猪出栏率都是数学问题。这种「降维打击式创新」,才是对旧秩序最狠的吐槽。
复制
反馈
重答
相关追问
DeepSeek 如何降低训练成本?
DeepSeek 的开源策略有何影响?
DeepSeek 的创新管理模式是什么?
想听听知友怎么答
向知友提问

知乎用户 别惹黑化兔子 发表

看了一些回答,在知乎竟然有人怀疑梁文锋是不是懂技术?

知乎用户 蹦蹦牛 发表

记得很久之前看 TED,有一个有意思的演讲。当一方取得量子霸权后,另一方所有的机密信息均变成透明,霸权一方会取得压倒性优势,这时候对于另一方来说,最好的选择是立刻发动核战争,否则以后连发动的机会都没有了。

我认为 AI 革命的真正起点,是 AI 的自我迭代,不断自我迭代自己,自我评测,自我固化或者回滚。

当 AI 实现自我迭代后,科技的进步将是指数级别。这时候可以宣称获得 AI 霸权,这时候,作为弱势的一方,最好的选择也是立刻发动全面核战争。

从某种程度上来说,说梁文锋救了我们都不为过

知乎用户 阿鹅鹅鹅饿​ 发表

没有颠覆任何技术性的东西。

但戳破了金融炒家的泡沫。

知乎用户 他乡之客 发表

ds 出来前,要不翻墙,要不捏着鼻子使用连 vba 都整不明白的国内三流模型。

翻墙没事,美元支付也行,但是除了刚毕业的清澈大学生,谁敢把公司资料往上传?

ds 带领我们真正走入了 ai 时代。

知乎用户 杨毛毛 发表

别吹梁了好吗?

万一国家真不投入研发高性能显卡了可咋办啊?

这种事情不要啊!

知乎用户 数学老师 发表

颠覆了人们对 AI 强大的认知,之前只知道 AI 可能取代人工,但随着 deepseek 的出现,我们发现它的强大,它并不像是一个简单的无脑程序员,它是一个超级大脑,人类几个小时才能完成的,deepseek 在几十秒内就能完成,还能全面分析到位,并且这些都是免费的,比起一些在抖音上宣传的,又要花钱的 AI 强的不要太多哦!好好深挖,好好组合,它是一个万能小助手

知乎用户 姚昊 发表

背后中 8 枪自杀是吧?

知乎用户 汉风 发表

颠覆了美西方的 ai 霸权

知乎用户 许亿 发表

从用户小白的角度。

openai 刚问世的时候,即对中国封锁。需科学后才能使用。我注册了一个账号,但不得其妙。且不方便。

后来微软跟进,同意封锁。为了能使用,折腾了很久账户,还要等。几个月后才成功。但科学也没用,还需要插件。后来插件失效。只能又回到 openai

随后某天,大规模封锁中国区账户,我也是那时候失效了。因为纯粹尝鲜,失效了也没再跟进。

但由此感到,这玩意如果隔绝中国这么大的应用市场,未必有前途。所以发展很久以后,似乎还是走收高昂月费的模式。堆料堆耗能。

于是国内跟进各种 ai,尝试应用场景,但普遍还是简单的拿来主义。所以关键还在源头。

deepseek 的好处是没有办法的办法。实际上,几乎是唯一的路径,向上围追堵截的情况下,向下,在存量中找办法。改装小米步枪。唯一缺的就是这种不是主业而是副业无心插柳的成功方式。

国内资本不缺钱,缺屁股坐下去的耐心。过于强调看得见的立刻成功,而忽略基础。

过去经济泡沫,人性浮躁。非得置于绝地而后生。现在也不错,西方帮你耐下性子。

很久以前,有一个台湾的芯片专家就断言,中国不缺技术,就缺市场。台积电高端芯片横扫无敌。中国人不差钱,就挑贵的。所以跟随国产品没机会。只能造假。现在不一样,国产品性能差一点,价格低一点,但有人肯用。有了忽然难能可贵的市场。有使用就会有迭代,有迭代必然会进步。假以时日,必然拉小差距。

ai 其实一个道理,甚至比芯片还要相对简单。这世界上只要有人造出来就有人能复制。关键上,有应用,就有针对性改善。

deepseek 的路径是对的,就是压缩训练成本,使得可以大规模应用,这对于整个产业都是好事。至于其中争议,重要吗,不重要。一个电影的卖座绝不仅仅是因为他拍的好,而是切中时效性。解决了痛点问题。互联网的唯一经验就是扩大市场份额。这市场上只有头部。长尾可忽略不计。

我觉得对于英伟达而言,不是坏事。对于 openai 反而是,因为技术差距如果没有绝对性的市场占有很难持续维持。deepseek 的意义在于启发了所有大模型企业,一个弯道超车的方法。

最新看到的信息,不辨真假。传 openai 放开了成人内容。看把他给急的。

有一说一,确实是一招好祺。

问题,玩下限。你会是个人都会啊。资本哪有介意这个的。

知乎用户 青岛冷 S​ 发表

要不是马斯克开源哪有 Ds

知乎用户 九厘米的雾 发表

当前,DeepSeek 性能略逊 OpenAI,但成本和价格简直是砍到脚脖子,以极低的价格,用户猛增,未来适配昇腾芯片,简直难以想象。

现在梁正拿着刀追着 OpenAI 砍,OpenAI 跑快了没奖励,跑慢了只会被梁叔砍成血雾。

试想,技术第一➕开源➕价格极低➕用户数据反哺技术。哪怕突破外国禁用也只是时间问题,因为到那一天。

不用=落后

知乎用户 汤姆汤姆汤姆 发表

真正的从业者应该都知道他是个啥水平,差距很大的。

但问题是他开源,他也不靠这个挣钱,他的性能也没全开。

就跟学校门口一群人卖盒饭,前两个卖两荤两素,一份 30,他卖一荤一素,不要钱。最主要是前两个卖盒饭的 30 块也不赚钱,还得跟着他继续卷。这就无解。

知乎用户 过路的妖怪 发表

颠覆了美国硅谷科技新右派们垄断世界信息的美梦

知乎用户 wcgaxj 发表

在这之前,我只能用用免费的 3.5。还得接受各种来历不明的插件、软件的 PUA,百度出来之后,我甚至付费用过百度,

知乎用户 山而麟 发表

太猛了,但是不知道梁老板,打不打算放弃量化,all in 大模型,还是说坚持两个都要要呢,想要不放弃量化始终都要讲政治啊,会不会扼杀创新力呢

知乎用户 老牛 发表

颠覆了好多混子的饭碗,让欧洲和印度也燃起了搞大模型的熊熊烈火,打破了美国的算力神话

知乎用户 檀溪的卢​ 发表

ds 的最成功之处,我认为是使美国又少了一个能要挟、制裁其他国家的人工智能利器,使全球所有国家又多了一个开源和低成本的选择,那些美国 AI 企业试图依靠闭源 AI 构筑垄断性竞争商业模式的努力落空了,只要 ds 这样的开源且低成本 AI 企业一直存在并与美国企业争夺用户,美国闭源 AI 企业就形不成完整的垄断商业闭环。

按照美国过往的尿性,它百分百一定会将人工智能作为一种制裁其他国家的武器(实际上已经在这么做了),就好像半导体芯片一样,你不按我说的来,我就不给你用芯片,给你断供,让你的生产力进步停滞,看你厉害还是我厉害。ds 这类开源 AI 的存在意义就在于,用错位差异竞争策略破除美国的垄断,使得美国无法像以前那样把新兴产业技术作为制裁利器拿来要挟其他国家。

有人说 ds 在算力在性能上与美国闭源 AI 还存在差距,这确实是事实,没有人否认这一点,但美国的领先并非断层式或代差领先,大家也就差着几个月或半年的差距,甚至在某些领域中美双方交替领先(例如 seedance)。作为 ds 的最优竞争策略是,不需要在性能上完全赶超美国先进闭源 AI,只要紧紧咬住确保落后不太多,同时保持自身强大的低成本优势,就能迫使美国闭源 AI 无法打造形成垄断商业模式闭环,这种永远让美国闭源 AI 处于一种略微难受、如芒在背的竞争策略和地位,就是 ds 需要一直保持的。美国休想在 AI 领域一家独大。

ds 这类开源低成本 AI 必须抱持一种信念,即通过无私的开源分享精神,让 AI 能够走进千家万户,不再是某个国家某些企业的专利,以此改变人类社会,逐步促进生产力的提高和跃升,同时也不要让那些美国闭源 AI 活得太滋润,让美国将 AI 武器化的意图永远落空,不允许任何某个国家垄断 AI 领域,这就是开源低成本 AI 存在的必要性和重大使命。

知乎用户 venidici 发表

颠覆了红卫兵坚称的不靠市场经济和民营企业也能遥遥领先的谎言。

知乎用户 实验兔子喝奶茶 发表

给美利坚整麻了。

本来嘛 chatgpt 出世,美股科技七子搞出来 AI,是要搞宏大叙事准备炒第四次科技革命的,顺便再气定神闲地割一波全球韭菜。结果梁文锋搞了个 deepseek 横空出世,关键逆天之处在于这货居然并不靠 deepseek 赚钱,他居然还赚美股的钱,这就让对岸那帮人更恶心了。可以理解为你屁股后面有只老虎在追,它好像一直没追上你,跟你保持了固定距离,但你也只能一直跑不敢停,停了被咬死,不停就把自己累死。考不及格不可怕、考满分也不可怕,但想考几分考几分的控分行为就很可怕了。

你要是去晋江番茄以梁文锋的履历为原型写个小说,读者都要骂你胡编。

知乎用户 盛见者​ 发表

deepseek:我成斩杀线了?

知乎用户 石头的家 ch 发表

用前段时间流行的斩杀线理论解释就很好。

deepseek 是所有 AI 模型的斩杀线,因为它是免费的。

其他的 AI 只有不断的砸钱往前跑,比 deepseek 强很多才有可能让人花钱买。只要水平跟它差不多,就完全没有赚钱的能力,甚至连故事都讲不利索,其经营就是不可持续的。

就是一只永远追杀其他 AI 的鬼。

知乎用户 还是不注名好 发表

流量经济

过去几十年,有一个非常不好的风气,就是流量经济。人们认为相比产品,广告才是最重要的。农夫山泉用【矿泉水】打败娃哈哈的纯净水,就是一个特别坏的坏头。

而后面互联网的流量经济则助长了这一趋势。广告做得好则大赚特赚,不做广告搞什么都不行。【酒香也怕巷子深】成了新的【共识】。

百度曾经请了很多技术专家,无论是在 AI 还是自动驾驶等方面都世界领先,结果因为不会打广告,商业上完败于阿里巴巴和字节跳动

另一个典型的例子就是 kimi,本来是全球顶级的技术专家。原来那个循环智能主打技术,华为的盘古大模型就是他训练的,但光有技术毫无起色,后来重新开了个公司,换打法到处买广告,一下子就起飞,估值变为几百亿。

但广告 > 实力这种风气,本身对社会的创新,发展,甚至公平正义这些,都是特别坏的。

而 deepseek 颠覆了社会上这个风气。

知乎用户 三风​ 发表

都知道梁文锋现在在大规模融资

之前的 deepseek 为了独立自主,一直把自己限制在一个研究院级别的规模,并且也没有在商业化上很下功夫。

可以说 deepseek v4 的后训练在四大国模里面是最拉跨的那个

但是就是这个最拉跨的后训练,现在是什么级别的水平?上下文 1m,国内最长,性能所有任务上和 glm、kimi 一个水平,长程 agent 任务上凭 1m 的上下文吊打 glm kimi,逼近 sonnet。注意这还是 v4 没咋搭环境,没怎么做针对性后训练,全靠力大砖飞打出来的成绩。

所以说,这波融资放出来的信号是什么?我的猜测是,梁文锋认为商业化时机成熟了,接下来要打商业化基建,搭环境,搞数据。白话说就是 scale 后训练

v4.1 定档在 6 月,这个版本加上这个间隔,应该也就是打个补丁。如果接下来的目的是在基建上面下功夫去 scale 后训练,这个时间通常会在一个季度左右,q3 肯定出不来,预计会在 q4 左右问世。

deepseek v4 pro plus ultra max 版,q4 问世。我们尚不知道 deepseek 能把后训练 scale 到什么水平,我给一个居中的估计,当下的 opus 的水平,算一个虽有难度,但对 deepseek 来说可以达到的目标。

deepseek 如果能到 opus 的性能,这对于三巨头是一个巨大的利空。为什么这么说?对面训一个 opus 的成本能训你一千个 v4,它比你强都不够,它不光要比你强,它要吊打你,把你像拉 mistral 拉 meta 那样拉爆,像压印度压日韩那样压的你的 ai 查无此人,这样才符合物理定律。结果你告诉我,现在 v4 跟最前沿的差距才差多少?再过半年还能追上 opus?那三巨头除了有卡有钱还有什么?抛开卡抛开钱剩下的不就是一帮饭桶吗?

所以,如果 v4.x 在今年内达到了 opus 的性能,这是一个炒作空间很可怖的利空信号。

朋友们我多问一个问题,q4 还有一件什么事?

上面这两件事合起来正好,一个是美股 ai 的巨大利空,一个是美股硬件的巨大利空。

如果此时中国做出一些发言,暗地里再请几位中东雇佣兵去砸盘,会发生什么事?

对的。情绪,恐慌,踩踏,泡沫裂了。

这就是万一如果 5.13~5.15 不达预期的后手。

这才叫虚空造牌,懂子学着点。

知乎用户 唐风无影​ 发表

它颠覆了美国的 ai 垄断权。

这个的东西如此之严重。以至于我们应该请愿国家加强对梁的安全保护。

国士无双。

不要低估美帝的无耻

知乎用户 TWFX 发表

颠覆什么?颠覆的是鹰酱的话语权,这是致命的,远比六代机等影响要大的多,就是国运级的!

知乎用户 abbie123​ 发表

现在私有模型在 Deepseek 开源后由玩具变成能用,尔加 AI Agent 就可不断跑任务。

虽然要人工干预但可把成本控制得好也不用担心隐私机密全部交到闭源模型。

那私有模型通过垄断的故事就说不下去了。 现在美国 AI 疯狂圈钱,但领投都是算力云平台可说明问题了。

知乎用户 lion 发表

deepseek 的问世确实颠覆了很多。一方面是,颠覆了大模型的训练只能依靠堆芯片算力来提升大模型的性能的模式,通过英伟达的股价变化就能看出来。另一方面,就是关于开源和闭源模式,以前人们普遍认为大模型闭源一定优于开源模式,现在是开源对闭源的胜利。最后就是,以前大模型只能大公司能玩,现在由于 deepseek 开源,而且训练成本下降,很多小公司也可以参与了!

知乎用户 日子人​ 发表

我看有人在那说颠覆到最后,

英伟达市值高升。

没错呀,

不然你以为训练大模型只需要口含内存条呀。

知乎用户 一路往西 发表

普通人很难真正了解 DeepSeek。我也如是。

假如 DeepSeek 真的颠覆性、创新性,改变了人工智能模型的建构模式,给予多高的评价都不过分。网上甚至有人说:“梁文峰堪比任正非”。它的推出几乎拉平中美人工智能领域的差距。鼓舞了士气,打破了神话,为中国未来在人工智能领域超越美国提供极大的可能。

毋庸置疑,DeepSeek 开源模型推出、极大降低了人工智能开发、使用门槛。这对美国企图在二十一世纪、继续实行 “科技霸权” 形成现实的挑战。DeepSeek 开源模型,为更多国家、企业使用人工智能时代提供更好的选择方案。大量的接入和使用,必定会提高 DeepSeek 功能,让美国惊恐不已。甚至动用国家力量、用尽各种手段,企图打压、黑化、破坏中国的 DeepSeek 人工智能大模型。

因此 DeepSeek 主要成功在于动摇了美国 “科技霸权”。

对中国而言,目前美国的相对优势也就剩科技、金融、舆论等少数领域。科技相对算硬实力,而金融、舆论是软实力,其实并不可怕。这将加快中美攻守易形的进程。

如果 DeepSeek 果真创新了人工智能构建模式,称之为 “国运级” 也不过分。

正应了 “五星出东方利中国”。中国国运昌盛!

知乎用户 浪羁 发表

大模型时代,巨头最重要的护城河是稀缺性:

算力稀缺、人才稀缺、数据稀缺、模型能力稀缺。

现在成为了过去


OpenAI、Google 动辄千人博士团队,用高薪构筑人才护城河。

算力上,OpenAI 训练 GPT-4 动用超 25000 块顶级 A100 GPU,连续集训近百天,单次训练成本突破 6300 万美元。

数据上,谷歌坐拥全网爬虫 + 搜索生态沉淀,仅 Gemini 预训练数据量就高达 30 万亿 Token,独家高质量行业数据形成天然门槛。

模型能力上,两家长期把持全球大模型基准榜单第一梯队,靠持续巨额投入形成代际优势,闭源迭代、技术封锁,把中小玩家牢牢挡在顶级通用智能的门外。

而这背后,是一套非常清晰的商业算盘:先用稀缺资源垒高技术门槛,再把模型能力包装成 API、云服务、企业订阅、办公插件和行业解决方案,向全球持续收费

DeepSeek 的出现,真正惊艳的地方就在于:它没有按照巨头设定的游戏规则去竞争。

它把所有精力压在一件事上——怎样用有限资源,把模型效率榨到极限。

DeepSeek-V3 的技术报告里有一个很有冲击力的数据:它用 14.8 万亿 tokens 进行预训练,完整训练只用了 278.8 万 H800 GPU 小时;如果按每 H800 GPU 小时 2 美元估算,官方报告给出的训练成本约 557.6 万美元

要知道,同期 OpenAI 的 GPT-4 训练计算成本约 7800 万美元,Google 的 Gemini Ultra 训练计算成本约 1.91 亿美元。也就是说,DeepSeek-V3 的正式训练成本,大约只有 GPT-4 的 1/14,只有 Gemini Ultra 的 1/34

这足以打破外界对 “大模型必须天价烧钱” 的直觉

与之对应的是工程设计上的自主创新:用 MoE 稀疏专家模型,让模型参数规模很大,但每次推理只激活其中一部分;用 Multi-head Latent Attention 降低推理时的 KV Cache 压力;用更细的负载均衡、通信优化和训练系统设计,把有限芯片的利用率尽可能拉满。换句话说,巨头靠 “更多资源” 获得优势,DeepSeek 则靠 “更少浪费” 逼近优势。

真正有戏剧性的地方在 R1。过去,推理模型像是少数巨头手里的秘密武器:闭源、昂贵、能力神秘,外界只能通过 API 付费调用。但 DeepSeek-R1 直接把另一种路径摆到桌面上:它通过强化学习激发模型的推理能力,论文中提到模型可以发展出自我反思、验证、动态调整策略等推理模式;官方还开源了 DeepSeek-R1、DeepSeek-R1-Zero,以及多个从 R1 蒸馏出来的小模型。

也就是说,中小团队也能基于开源模型做蒸馏、部署和二次创新,那么巨头精心制造的 “稀缺性”,就不再那么神圣。


于是当 deepseek 横空出世,美股 AI 板块就迎来了 “DeepSeek 时刻”:

2025 年 1 月 27 日,美股开盘后,市场像突然意识到一个可怕的问题:如果 DeepSeek 真的能用更低成本做出接近一线能力的模型,那么过去两年华尔街押注的那条逻辑——“AI 越强,越需要无限买 GPU、建数据中心、烧资本”——是不是要被重新估值?

于是,抛售开始了。

英伟达当天暴跌 17%,单日市值蒸发约 5930 亿美元,创下当时华尔街历史上单家公司最大单日市值损失;纳斯达克指数下跌 3.1%,费城半导体指数下跌 9.2%,Marvell Technology 一度重挫,Broadcom、微软、Alphabet 等 AI 相关股票也被拖累。无数对冲基金的 AI 多头头寸在几小时内化为乌有。

华尔街顶级投行的分析师们连夜改写报告,标题从 “英伟达市值将破 6 万亿美元” 变成 “算力需求逻辑已被颠覆”。摩根士丹利的报告直言:“DeepSeek 证明了 AI 发展的‘规模定律’并非铁律,用更少的芯片做更多的事正在成为现实,这直接动摇了英伟达高估值的根基。”


这还只是股票层面,真正的恐慌蔓延到了 AI 应用层。微软(OpenAI 最大股东)股价下跌 2%,Google 母公司 Alphabet 跌 3.5%,连靠 AI 概念暴涨的 AI 基础设施公司 CoreWeave 都在盘后暴跌 9%。

市场恐慌的核心在于:DeepSeek-R1 的开源和低成本,彻底瓦解了巨头们 “稀缺性→高价 API→持续收割” 的商业逻辑。当一个中小团队用 32GB 显存的国产芯片,就能跑通 DeepSeek-R1 的蒸馏模型,做出和 GPT-o1 性能相当的推理应用,而成本仅为 OpenAI API 的 1/50 时,谁还会为巨头的高价服务买单?

高盛的报告一针见血:“DeepSeek 真正冲击的是美国硅谷的独角兽模式 —— 用 10 亿美元融资烧出一个模型,再用 100 倍估值上市收割。现在,这个模式被证明是低效且不必要的。”

过去,投资者追捧的是 “算力投入越多,模型越好,价值越高” 的线性逻辑,英伟达、OpenAI 等公司的估值都建立在 “全球 AI 公司将无限量采购高端 GPU” 的预期之上。

但 DeepSeek 用 557.6 万美元的训练成本,做出了性能逼近 GPT-4 的模型,用 MoE 架构和推理优化,让单 token 算力需求降到传统模型的 27%,显存占用仅为 10%。这意味着:

  • 算力需求增速将大幅放缓:不再需要动辄 25000 块 A100 的军备竞赛,中小公司用几千块国产芯片就能做出顶级模型
  • 芯片溢价将消失:英伟达 H100 的 8 万美元溢价,在算法效率面前变得毫无意义
  • 闭源壁垒被击穿:开源模型的性能追赶,让巨头的技术封锁变成 “皇帝的新衣”

更何况,Deepseek 的开源完全颠覆了 AI 的生态。

DeepSeek-V3 用 557.6 万美元的训练成本(仅为 GPT-4 的 1/14),做出性能逼近 GPT-4 的模型,这一数据给开源生态带来 “降维打击”:

  • 中小团队的 “入场券”:过去需要 10 亿美元融资才能做的顶级模型,现在 1000 万美元就能启动,全球 AI 创业公司数量激增 3 倍
  • “去英伟达化” 加速:MoE 架构 + 国产芯片适配,让开源模型不再依赖高价 GPU,寒武纪、沐曦等国产芯片厂商订单暴增
  • 迭代速度指数级提升:低训练成本让模型可以快速迭代,DeepSeek 从 V3 到 V4 仅用 3 个月,而 Llama-3 到 Llama-4 用了 8 个月

2026 年 4 月 24 日,DeepSeek-V4-Pro(1.6 万亿参数)以 MIT 协议完全开源,当天全球下载量突破 100 万次,80% 的 AI 创业公司转向 DeepSeek 生态,开源社区衍生项目超 2 万个,形成 “开源 - 创新 - 反哺” 的良性循环。

最具戏剧性的细节是:一个非洲小国的创业团队,用二手服务器 + DeepSeek 开源模型,开发出本地语言的 AI 教育系统,成本仅为使用 OpenAI API 的 1/200,覆盖了 1000 所乡村学校。他们在社交媒体上写道:“DeepSeek 不是给我们鱼,而是给我们鱼竿,还教会我们怎么钓鱼。”


更重要的是,Deepseek 对中国 AI 产业的促进作用。

梁文锋在内部会议上直言:“巨头靠闭源赚今天的钱,我们靠开源赚未来的钱。当全球 80% 的 AI 应用基于 DeepSeek 技术栈,我们就拥有了定义 AI 标准的权力,这比短期利润更有价值。”

2026 年 4 月 24 日,DeepSeek-V4 发布会上,最震撼的消息不是 1.6 万亿参数,而是首次将华为昇腾 NPU 与英伟达 GPU 并列写入硬件验证清单,并完成了从 CUDA 到 CANN 框架的全面迁移 —— 这是万亿参数级别模型首次脱离英伟达生态独立运行。

DeepSeek-V4 发布当天,华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、百度昆仑芯、阿里平头哥、天数智芯等八家国产芯片厂商集体宣布 “Day0 适配”—— 这是过去只有英伟达能做到的事,标志着国产算力正式进入 “与国际巨头同一起跑线” 的新阶段。

摩根士丹利的报告指出:“DeepSeek + 国产算力的组合,证明了 AI 算力并非只有英伟达一条路。这不仅是中国市场的胜利,更是全球 AI 生态多元化的里程碑,英伟达的‘算力霸权’时代正在结束。”


从被巨头定义规则,到亲手改写游戏逻辑;

我们曾依赖进口算力、受制于技术封锁,而 DeepSeek 的出现,不仅实现了国产算力的全栈适配,更以开源共享的姿态,打破了层层壁垒。

它用实打实的行动证明,中国 AI 的突围从不是盲目模仿跟风,而是源于底层创新的硬底气;

全球 AI 的进步,也不该困在资本内卷的死循环里,普惠共赢才是真正的长久之道。

美股的震荡只是一个信号,开源生态的崛起、国产算力的突围,正在一点点瓦解旧有的垄断格局。

往后的 AI 赛道,没有天生的巨头,只有真正的创新者;

所谓壁垒,从来都不是不可逾越的鸿沟,只是不愿突破的固化思维。

DeepSeek 已起,新局已然拉开,属于 AI 的普惠时代,正加速向我们走来

知乎用户 傲天战殇 发表

君以国士待我

我必以国士报之

知乎用户 张三李四​ 发表

美国人想要建立的 AI 业态

那种闭源的,高投入建设,高投入训练,高价格订阅和使用的业态。

二十分之一的建设成本,四十分之一的训练成本,极低的订阅费用,不想订阅的话因为开源可以自己搞一套。

美国的 AI 产业叙事到高收益这块搞不下去了,所有的投入变成了为了投入而投入,为了股价而投入,变成了一个危险的大泡沫

知乎用户 耶律楚材​ 发表

如果没有 deepseek,CC,GPT,gemini 这些美帝的 AI 巨头,收多少钱都得忍着。

西方国家有钱,购买力强,也就那么地了。

东大大部分人买得起那么贵的模型吗?广大穷国就不用心思了。

而且人家说封你就封你,没得商量,打中文都是罪过。

文心一言之类的,早就被甩开。千问智谱算力都成问题,coding plan 都不敢卖。

而 deepseek 就像一脚急刹车,狠狠地挡住了美国 AI 的垄断势头。

因为价格也是很重要的考量,再烧钱都是有限度的。而 deepseek 就能做到把价格打到同行的地板,让普通人能用最低的价格用上性价比最好的模型。诚然 dsv4 能力也比不上 Claude 那几个和 GPT5.4,但一般的需求并不需要拉满性能。

并不是什么战狼言论,或者诅咒美帝怎么样。美国 AI 或许长期领先,但 deepseek 就让美国 AI 做不到垄断行业,不敢无底线定价和封号。AI 就是实打实的第四次科技革命,至少目前为止东大表现还是及格的。这个行业不能被西方完全控制,AI 的生产力是指数级差距。再有钱的公司,在地板和天花板的价格面前,也要掂量三分,是不是国产模型也有可取之处,不是非美帝不可?

知乎用户 俊哥讲干货 发表

自 DeepSeek 横空出世以来,我就好奇这个 “国运级产品” 背后的创造者——梁文锋,究竟是何等神人?

不少媒体后知后觉地开始 “刨祖坟”,说实话,很 LOW。我不喜欢炒剩饭,更不喜欢用“天生异相” 的宏大叙事去包装成功者。

我寄希望于观其言,可惜他是个非常低调之人,鲜少公开发声。

今天,我就整理出梁文锋的 20 条金句,与大家分享。读完你会发现,技术创新改变世界,才是最牛 B 的事情。这才是中国 AI 的未来,这才是中国的希望。

1. 别用老套路看未来!

“所有的套路都是上一代的产物,未来不一定成立。拿互联网的商业逻辑去讨论未来 AI 的盈利模式,就像马化腾创业时,你去讨论通用电气和可口可乐一样,很可能是一种刻舟求剑。”

划重点: 别再用过去的经验看待未来,拥抱变化,才能抓住机遇!

2. 模仿永远落后!

“AI 竞争的本质是原创与模仿的代差,而非表面性能的追赶。”

划重点: 真正的竞争是创新,而不是简单的模仿!

3. 能力比经验更重要!

“我们招人有条原则是,看能力,而不是看经验。如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性与热爱等更重要。”

划重点: 别被经验束缚,大胆启用新人,才能激发创新活力!

4. 中国要当创新者!

“中国必须从‘搭便车’转向‘贡献者’,打破‘美国创新 - 中国应用’的惯性思维。”

划重点: 中国不能永远跟在别人后面,要成为全球创新的引领者!

5. 硬核技术才是未来!

“未来中国产业结构的调整,会更依赖硬核技术的创新。当很多人发现过去赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。”

划重点: 别再想着赚快钱,沉下心来搞技术,才是长久之道!

6. 让创新者功成名就!

“未来硬核创新会越来越多,现在还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变,我们只是还需要一堆事实和一个过程。”

划重点: 社会要尊重创新,让创新者得到应有的回报!

7. 热爱是最好的老师!

“选人的标准一直都是热爱和好奇心。”

划重点: 找到你热爱的事业,才能爆发出无限的能量!

8. 人才是最大的资产!

“人工成本是对未来的投资,是公司最大的资产。”

划重点: 投资人才,就是投资未来!

9. 技术代际跃迁

“专注底层架构突破、训练效率优化,以技术代际跃迁而非局部改进参与全球竞争。”

划重点: 要有颠覆性创新,而不是小修小补!

10. 年轻人更有创造力!

“我们的核心技术岗位,基本以应届和毕业一两年的人为主。”

划重点: 相信年轻人,给他们机会,他们会给你惊喜!

11. 热爱会让你找到我!

“我们招人的条件是热爱,这些人的热情通常会表现出来,因为他真的很想做这件事,所以这些人往往同时也在找你。”

划重点: 找到你的热爱,它会指引你前进的方向!

12. 厚积薄发!

“我们经历了一个漫长积累过程,外部看到的是幻方 2015 年后的部分,但我们做了 16 年。”

划重点: 成功没有捷径,需要长期积累!

13. 拒绝烧钱!

“拒绝烧钱换市场,以架构创新实现商业可持续性。”

划重点: 商业模式要可持续,不能只靠烧钱!

14. 实干胜于空谈!

“不做‘PPT 创新’,专注技术本质,用实干推动商业发展。”

划重点: 少说多做,用实际行动证明自己!

15. AI 的本质是语言!

“我们理解人类智能的本质就是语言,人的思维就是一个语言的过程。你以为你在思考,其实可能是你在脑子里编织语言。这意味着,在语言大模型上可能诞生出类人的人工智能(AGI)。”

划重点: 深入理解 AI 的本质,才能把握未来!

16. 我们是最合适的人选!

“从商业角度来讲,基础研究是投入回报比很低的。我们比较确定的是,既然我们想做这个事,又有这个能力,这个时间点上,我们就是最合适人选之一。”

划重点: 相信自己,敢于承担责任!

17. 梦想不能用钱衡量!

“一件激动人心的事,不能单纯用钱衡量。就像家里买钢琴,一来买得起,二来是因为有一群急于在上面弹奏乐曲的人。”

划重点: 追求梦想,不能只看钱!

18. 热爱超越金钱!

“很多人对做研究的渴望,远超对钱的在意。”

划重点: 热爱是最好的动力!

19. 团队文化最重要!

“一个创新的组织中最重要的是人,是一同朝着目标,相互信任,经过磨练形成的文化。”

划重点: 打造优秀的团队文化,才能成就伟大的事业!

20. 按真实成本定价!

“按真实成本定价,倒逼行业回归技术本质。”

划重点: 诚信经营,才能赢得市场!

梁文锋的思考,既有理性的深度,又有理想化的情怀。

未来,中国 AI 的崛起,不仅需要技术的突破,更需要像梁文锋这样的实干家和理想主义者。

如果你也对 AI 和 deepseek 感兴趣,公众号后台回复 “10 天精通”,领取我在付费社群发的《10 天精通 DeepSeek 实操手册》,开启 AI 之旅。

希望大家能抓住 DeepSeek 带来的机遇,通过这些野路子实现财富增长,走向人生巅峰!

你也可以加入我们的 “AI 学习创富研习群”,获取每日最新资讯和变现案例,与高手同行!

目前,我们正处于早鸟优惠期,只需 99 元(一年)就能加入这个充满机遇的社群。

不过,这个价格可是限时的!群满 50 人,价格就会上涨 50 元,直至恢复原价 499 元。

2025 年是 AI 搞钱元年,现在不布局,2 年后别人赚钱你拍腿!别再犹豫,赶紧行动起来,下一个财富自由的就是你!

支付后添加微信我拉你入群,微 xin 号:8 3 8 9 0 2 9 9。已加过我的无需重复添加。

点赞 + 关注,点赞助力,关注暴富!

木霖创业笔记分享创业心得,与思考
公众号

往期精彩:

钱是有灵性的!做到这 10 点的人,财运真的会变旺(亲测有效)

学会这个 DeepSeek 模板,写出文章躺着赚钱!

这年头失业辞职,或许是老天在给你新的机会

知乎用户 吼吼 发表

太多人

只会去顶着参数去看了

完全忽略了成本。。。

健身里面,最好的蛋白粉应该是分离乳清蛋白

但是实际上呢?大部分吃的还不是普通的乳清蛋白?

为啥?不就是在效果跟价格之间的平衡最好?

同样的

opus4.6 强不强?确实强啊,也没有说 ds4 比 opus4.6 强啊,官方都说了自己只能贴近

但是两者之间的价格差了多少?一百倍不知道有没有,但是十倍是班上钉钉的。

一分钱一分货,十分钱三分货

如果 ds4 是完全用不了的状态,哪没的说,只能用 opus 或者 gpt

但是 ds4 真的用不了?未必吧

以前的时候用 gpt,各种翻墙,各种要代充,各种扣钱

现在呢?大部分问题你只需要问豆包,问 ds 就可以解决了。

技术问题确实是难题

工程问题,价格问题,也从来不是小事

知乎用户 waterwu 发表

我有点悲观: 可能颠覆了很多,也可能并没能颠覆什么。

R1 模型横空出世,几个月内让人体验到了顶级的 CoT 模型,加强了国人信心、全球 AI 算力与云服务定价权松动、英伟达、微软、谷歌、AMD 等公司股价同步下跌;然而很快海外的模型能力就进一步跟进补齐,国产模型也逐步跟进,DeepSeek 模型剩下的影响可能主要就是其定价基线作用了吧,其他没有改变太多。

V3.2 模型把推理输出成本大幅降低,旗舰模型定价打到 3 RMB / MTokens 基本是仅此一家,整体降幅超过 50%,被称为 “价格屠夫”;其后国内各大模型跟进降价,国产芯片算力加速适配替代。然而,之后进入 AI Coding 与龙虾大战过程中,Coding Plan 与 Token 荒的场景,让大家逐步提升模型定价、逐步将商业模式转移到 Token Plan 模式,整体似乎没有改变太多。


转眼到了现在,V4 模型发布:

首先文档说明下半年降价以及短期内 2.5 折,建立国产算力缓解的叙事预期;然后缓存输入价格永久降到原价 1 折,可以预见 3~6 个月内成为 API 定价的新基线;Flash 模型更是成为当前新的价格屠夫,仅从 API 定价来看是同类模型的 1/10。

但这从长期来看,真的能有太多改变么?我有点抱持悲观态度。

似乎商业世界的逻辑会把这些影响因子都给揪回原处。

但至少,有这么一个为大家着想的模型,始终冲在一线做普惠性的工作,我觉得就已经挺值得庆幸了。

很多改变的逐渐产生,可能就靠这些长期来看似乎都没什么影响的事情。

知乎用户 tulongys 发表

梁文锋的 deepSeek 的问世成功颠覆了什么?
tulongys 回复:

deepSeek 什么也没颠覆,只是一个相对好用的工具罢了。

你要相信人苠的力量是无穷的,唯武器论,唯工具论,是可耻的资产阶级思想。

我没有看不上 deep seek……

实际上,deep seek 还是有价值的。

我的真实意思是,很多人夸大了 deep seek 的能力。

夸大或者缩小 deep seek 的能力,都会倒霉的。

历史上,我们吹牛皮,说亩产万斤,最后很多人家破人亡。

我说 deep seek,是反对吹牛,并不是反对 deep seek。

我们现在夸大 deep seek 的作用和价值,这跟历史上我们中国人吹牛皮,说亩产万斤,完全是一个调调。这是非常可耻的事情。

——屠龙有术 / tulongys / 陈旭 / chenxusiri/2025.2.16

知乎用户 CHAN.K​ 发表

颠覆了我对大模型的认知,原来 deepseek 连自己的名字都可以生成错误,

这样的大模型是如何被称作国运级别的,你敢用吗?

知乎用户 Sjdkn 发表

颠覆了我的人生,我的人生被它改变,救我于水火

知乎用户 马踏壹 发表

颠覆了南北汉人不是一家的满清谣言。

因为何凯明、梁文锋、杨植麟这些国际 AI 科学家,陶哲轩、丘成桐、王虹这些国际数学家,黄旭华这样的核潜艇科学家,梁思礼这样的火箭科学家,还有王力这样的奠基性的古汉语学家……,这一大批两广人才证明了南北汉人一样具有优越的智商。

中国汉人,将会带领中国、带领全球汉人走向前所未有的巅峰。

知乎用户 希德尼娅 发表

以 2026 年的视角看,论搞技术的对共和国贡献最大的三个人,钱学森排第一,马伟明排第二,梁文锋可以排第三,未来有机会冲击第一。

为什么有些军工科学家上不了榜?因为上榜的一个必要条件就是安排国家计划,而不是被国家计划安排,需要做到在国家没有猛砸钱的情况下,凭自己的技术实力让国家安排计划。

钱安排了火箭和导弹领域,马安排了电磁领域,梁安排了 ai 领域

另外一些商人就不要来凑热闹了,你有几篇世界顶级水平的论文?几百个教授一致通过了吗?

搞过技术≠会搞技术≠搞的是顶级技术≠顶级技术搞的好≠是顶级技术的开创者。

至于豆包和千问…… 从美国的制裁名单和狗叫程度上来看,抛开 DS 不谈,这俩货对美国的威胁甚至不如月之暗面

知乎用户 硅基生物 发表

v4 前看起来这人还是个挺纯粹的搞技术的。v4 一出风评和朱元璋拉齐,很担心他的员工会不会落得李善长蓝玉的下场。

知乎用户 框半城​ 发表

说颠覆可能有点沉重,但确实改变了很多东西。我分几个层面聊。个人视角,不一定全对。


第一个层面:成本结构的认知崩塌

DeepSeek 出来之前,行业有个隐形共识:大模型是烧钱的游戏,门槛百亿起步。OpenAI 烧了几十亿美金,Google 跟着烧,大家都默认这是巨头俱乐部。

DeepSeek V3 训练成本 557 万美元,R1 推理成本降到 OpenAI o1 的三十分之一。这个数字出来的时候,硅谷是真的沉默了。不是技术达不到,是他们没想过可以这样搞。

这就像有人告诉你,其实不用米其林厨房也能做出三星料理。梁文锋团队打破的不是技术天花板,是 “必须烧钱” 的心理枷锁。从这之后,创业公司敢入场了,资本也开始重新算账了。

第二个层面:开源和闭源的攻守易势

以前国内做大模型有个尴尬:开源吧,怕给他人做嫁衣;闭源吧,又追不上 OpenAI。DeepSeek 选了完全开源,而且不是挤牙膏那种,是模型权重、技术报告全放出来。

效果是什么?全球开发者第一次把中国 AI 模型当底座来用。Hugging Face 上 DeepSeek 的衍生模型爆发式增长,很多海外开发者自发在做适配和优化。

这背后是个认知转变:以前我们觉得开源是追赶者的策略,闭源才是护城河。但 DeepSeek 证明,如果你的东西够好,开源反而能形成生态壁垒。用的人越多,反馈越多,迭代越快,闭源对手反而被孤立了。

第三个层面:算力封锁的意外破局

英伟达高端芯片禁运这事儿,本来是美国掐我们脖子的手段。但 DeepSeek 的路线像是在说:既然买不到最好的铲子,那我就换个挖法。

他们大量用 H800 甚至更低配的卡,靠算法创新把效率拉到极致。MLA 注意力机制、MoE 稀疏激活这些技术,本质上就是用数学代偿算力。

这带来的冲击比模型本身更大。它证明了一个事实:算力优势不是绝对的。如果算法效率提升的速度超过硬件迭代的速度,那单纯堆显卡的策略就失效了。这对整个芯片战的叙事都是一次修正。

第四个层面:技术自信的重新校准

过去几年,国内 AI 圈心态挺复杂的。一边要做一边觉得追不上,很多团队在复现 OpenAI 的路,快慢问题而已。

DeepSeek 最狠的地方在于,他们没有 “跟随心态”。从 DeepSeek-V2 的 MoE 架构开始,就在走自己的路。R1 的推理能力出来时,很多人以为是 GPT-5 泄露了,结果是完全独立的路线。

这给行业最大的心理冲击是:原来我们不需要跟在别人后面,也可以在无人区做出世界级的东西。这个信心,比模型本身值钱。

第五个层面:产业落地的加速器

前面说的都比较宏大,说个接地气的。DeepSeek 把使用成本打下来之后,中小企业突然用得起大模型了。

以前接入 GPT-4 API,一个小团队一个月可能几万块。现在用 DeepSeek,成本降到十分之一甚至更低。这意味着大量长尾场景开始被覆盖:小工厂的质检、小律所的文书、小医院的辅助诊断。

技术民主化不是口号,价格打下来才是真的民主化。这点上 DeepSeek 对产业的推动是实实在在的。


说到底,DeepSeek 颠覆的其实是一种 “不可能” 的集体潜意识。它告诉所有人:没有无限算力也能做世界级 AI,中国团队也能定义技术路线,开源和商业可以不矛盾。

至于能持续多久,要看后续。但至少这一刻,它把很多东西打碎了,也把很多东西打开了。

知乎用户 问问 AI 指北​ 发表

DeepSeek 以前,中国 AI 一直都是以追赶者的身份紧跟国际大厂的步伐。

“摸着 OpenAI 的石头过河”,成为大家心照不宣的共识。

DeepSeek 一下子就把战线拉到了跟 OpenAI,Google 平齐的地步。

为了狙击 DeepSeek,OpenAI 连夜上线了 o3-mini 推理模型,并且完全免费使用,后面还公开了 o3-mini 的思维链,前几天还发布了 DeepResearch 功能,美国网友表示感谢 DeepSeek,不用花 200 刀充值 ChatGPT 了。

谷歌这边也迅速做出了反击,发布了 Gemini 2.0 全家桶系列,Gemini 2.0 Flash 和 Gemini 2.0 Flash-Lite 的 API 调用价格甚至比 DeepSeek 还便宜。

时间线再拉前一点,DeepSeek 刚出圈那几天,包括 OpenAI 的山姆奥特曼,Anthropic 的 Dario Amodei,Meta 的扎克伯格,DeepMind 的 Demis Hassabis,甚至埃隆马斯克,都发表过酸酸的言论,对 DeepSeek 的技术创新提出质疑,认为 DeepSeek 并没有带来实质性的科学突破。

这很明显是触碰到了美国既得利益者们的逆鳞,纷纷下场泼冷水。

冷水泼的越多,就证明 DeepSeek 对 AI 巨头们的震撼有多大:一个名不见经传,不知道从哪来的中国小厂,什么时候也能和我们掰手腕了???

正如饶毅教授所说,DeepSeek 的意义堪比 “自鸦片战争以来,中国给西方技术界带来的最大震撼”

知乎用户 不念​ 发表

梁文锋的 DeepSeek 的问世成功颠覆了多个方面,具体如下:

  1. 打破算力依赖定式:在 AI 巨头们沉迷于算力军备竞赛时,DeepSeek 通过算法创新抵消了硬件劣势。例如,其采用的多头潜变量注意力(MLA)架构将 Transformer 内存成本降低了 90%,仅用 2048 块阉割版 H800 芯片(成本仅为 GPT-4 的 1/10)就训练出了性能领先的模型。
  2. 突破数据处理模式:与 OpenAI 依赖海量数据集不同,DeepSeek 选择对数据进行精细化处理与合理分类,提高了训练效果。其核心创新之一来自 “混合专家(MOE)” 技术,该技术只激活必要的计算块,不仅提高了计算效率,还大大降低了能源消耗。
  3. 打破闭源垄断:当 OpenAI 等西方巨头转向闭源时,DeepSeek 以开源姿态向全球开发者免费开放其模型,如 V3 和 R1,吸引了顶尖学府合作,并倒逼硅谷反思其封闭模式。这种开源 AI 模型正在重塑全球人工智能的格局。
  4. 降低创新门槛:DeepSeek 利用 “蒸馏技术” 大大提高了训练效率,V3 版的训练成本仅为 557.6 万美元,远低于 ChatGPT 的 1 亿美元。这改变了 “大模型是巨头创新” 的认知,使更多创新创业团队有机会参与 AI 开发。
  5. 挑战传统人才观念:DeepSeek 团队成员平均年龄不足 30 岁,半数来自应届毕业生,摒弃了传统大厂对资深专家的依赖,注重发掘 “未被职场驯化的天才”。这种开源 AI 将推动人工智能教育与研究,为学生提供宝贵的学习平台。
  6. 创新团队管理模式:DeepSeek 采用扁平化协作模式,无固定职级,技术提案通过潜力评估即可获得无限算力支持。团队只招募 “对技术狂热、对金钱淡泊” 的理想主义者,不设 KPI,专注前沿探索而非短期变现。
  7. 挑战美国技术霸权:DeepSeek 的崛起凸显了中国在人工智能领域日益增长的影响力,挑战了美国对 AI 领域的话语权垄断,并可能改变全球人工智能发展的格局。

综上所述,DeepSeek 的问世在多个方面产生了颠覆性的影响,不仅推动了中国乃至全球 AI 技术的快速发展,也为更多创新创业团队提供了参与 AI 开发的机会,同时挑战了传统的人才观念和管理模式以及美国的技术霸权。

知乎用户 singer tian 发表

没有颠覆什么,只是给出了另一份答案,告诉世人还有一种路径可以实现大模型

为了让世人充分了解这条路,deepseek 做了开源,让世人真切的看到确实是一条不同的路径,确实是另一份答案。

用经济学的话术来说,deepseek 打破了垄断,充分体现了市场竞争的活力,让参与竞争的各方凭实力竞争、而不是直接攫取垄断式的优势。

用哲学的话术来说,美国大模型的形态是事物的一方面,deepseek 的形态是另一方面,有美国大模型的形态,必然有 deepseek 的形态,是一体两面。美国纠结的是只想到了一个方面,没有为另一个方面做准备,现在又没有了转变的实力。

知乎用户 林林总总 发表

DeepSeek 是 AI 工业化的新范式:用算法创新干掉硬件垄断、用开源共享打破技术壁垒、用成本革命普及顶级 AI、用国产算力适配突破封锁,从根上颠覆了全球 AI 的研发与商业逻辑 。

梁文锋,国士无双。

知乎用户 林登百万 发表

美国想达成 AI 和算力垄断股票永远涨收割全世界。

token 卖你十倍百倍于现在的价格,

你不买就效率低下卷不过他们,买的话他就能收割你。

类似于栓动步枪和自动武器之间的差别。

当然如果你研究不透,他们的自动武器就跟魔法一样。

Deepseek 的伟大之处在于,

告诉美国的 AI 叙事都是忽悠和胡扯。

好像 ak47 和 rpg 一样哪怕是第三世界国家都可以和帝国主义抗衡。

知乎用户 赤壁 发表

还得浙江牛逼,浙江企业和广东企业我都认识,我还在深圳一家企业干过。广东的企业决策明显急功近利一些,企业内部从老板到领导每天就两个字,搞钱。企业更注重销售,新入职的部门不管生产还是业务都要挂背业绩,不注重过程,更多的是签单回款。也就是说广东的企业没有 dp 的土壤,还得浙江。

知乎用户 陈玟 发表

歪题,怎么那么多人引用 The Information 发布的 ds 融资消息,不管是支持 ds 还是反对 ds 的,都爱引用这几个融资消息。

说 ds 要在几个月前发 v4 的消息也是这个 The Information 的消息。而在 ds 的相关消息上,这个媒体的可信度不高。而且从去年初到现在,不仅是普通答主引用这个媒体的消息,很多国内媒体也引用,应该说链条是:

第一步、The Information 报道

→第二步、一些国内媒体转载,此时是 ds 融资消息在国内的第一次传播,这些媒体通常会标注信息来自 The Information)

→第三步、另一些媒体转载这些国内媒体的说法、此时,就不会标注信息来自 The Information,而是标注第一次转载的国内媒体,或者标注有消息称、有消息人士称)

→第四步、很多人相信这个消息。

去年也有融资消息,跟今年融资消息的传播链条一样。

知乎用户 Solid Steve 发表

任何性能不如 ds 的大模型,不管开源闭源都会被 ds 老师打得吱哇乱叫。凭一己之力拉低了 ai 的使用门槛和价格。

知乎用户 龌龊老爷 发表

龌龊老爷

当年 DeepSeek 火了之后,连浙大的都在问,他是谁?

校内搞大学生创业相关的老师也纷纷查档案,发现真的是一点也没有帮扶过的痕迹。

很多非计算机口的实验室想 AI+,纷纷跑来杭州同行学习,说你们离 DeepSeek 这么近,应该比较熟悉吧,被问的也只能神秘微笑。

这种级别的成功,离得开母校的帮扶,也离得开产业集群,个人的因素极大。

知乎用户 YYY666 发表

在人工智能竞争领域的志愿军

知乎用户 姚文杰 发表

但凡 deepseek 不是出生于中国

而是在中美以外的任何全球其他国家

产品、公司、人才早就凉透了

知乎用户 张云 发表

感谢邀请。

我不懂科技,但我仔细研究和思考了一下,我想 Deepseek 的成功可能是相当于赛道的转换或是交通工具的转换,就好像人们之前要去轰炸很远的军事目标时,用的是重型战略轰炸机,一直在致力于如何去把轰炸机的载弹量加大,把飞机的航程加大,提高飞机的航速,后来有人换了思考方式,于是远程弹道导弹横空出世,完美的解决了轰炸机的载弹航程航速不足的问题,还不用飞行员,袭击远程军事目标也更为安全更为安全,可能 Deepseek 就类似于这样,它较于原来人们对智能空间的探索,避开了一些我国算力硬件的不足,类似很多数据运算要依靠英伟达的高性能显卡,国外的同行所建立基本运算架构或是体系,它另辟蹊径以更短的路径更低的能耗更低的费用实现了更大的飞跃,所以它颠覆的人类在科技探索方面的数据整合运算逻辑以及思维模式。

知乎用户 北纬 40 度 发表

那些关于 deepseek 将会深刻改变社会或者影响国际政治的论述,我一律不认可,因为太夸张了!我国的大模型本来就跟 openAI 水平很近,就算没有 deepseek-R1,也会有 Qwen-3、ChatGLM-5、Doubao-2.5、Kimi-2.0 这些模型出现,而这些模型必然也是对标 O1 的。

我觉得就颠覆了一点,就是 openai 拥有独门秘技的论调。前几年,推动通用智能发展的关键论文大多都是 openai 发的,但是从 ChatGPT 发布之后,openai 就几乎不发技术性论文了,只发布一些产品的 tech report。所以,有人觉得,openai 能一直保持领先,一定是有什么未发表的技术。

但是,deepseek 就用已发表的技术修修改改,拼拼凑凑,也做出了相近的效果,说明 openai 并没有 “独家秘方”,就算有,也不是不可或缺的。我们只需要在已知的范式:NTP/MTP + RLHF + SFT 下精心调一调,做不好不是你卡不够,也不是有隐藏技巧你不知道,就是没找着窍门或者尝试的还不充分。

知乎用户 QQcd 发表

opencode zen 里面的 dpv4 flush 模型免费了

知乎用户 高博士讲沉香 发表

我就是研究 AI 的,搞了十多年,对这个问题多少有点发言权。

我可以很肯定地说,DeepSeek 的问世,确实是国运级别的东西。

它颠覆的不是某一个榜单,也不是某一个模型参数,而是两件更底层的事情:一是大模型训练路线,二是 AI 产业叙事权。

DeepSeek 震撼业界的地方,首先在于 DeepSeek-R1 的强化学习范式。

R1 最牛的地方,不是它又做了一个大模型,而是它把 “低成本思考模型” 这条路跑通了。以前大家默认,大模型要变强,就得疯狂堆卡、堆数据、堆钱。R1 出来之后,等于是告诉大家:不一定非得沿着 OpenAI 那条路一路烧到底,强化学习、蒸馏、工程优化这套组合拳,也能把推理能力打出来。

这就很关键。

因为它证明了一件事:大模型不是只有 “美国豪华氪金流” 这一种玩法。中国完全可以根据自己的条件,走出一条更接地气、更讲效率、更适合自己的路线。

这就好比当年,小米加步枪,也能干过飞机大炮。

第二点,就是最近的 V4

R1 证明的是 “低成本训练思考模型这条路能不能走”;V4 进一步证明的是,国产芯片也不是只能在旁边喊口号,而是真的可以进入万亿级模型训练和部署这套体系里。

你别管现在是不是已经全面反超,至少它已经说明:在美国封锁最狠的地方,我们不是只能等别人松手,而是可以自己想办法把路趟出来。

这也是去年到现在黄仁勋一直担心的事情。因为一旦这条路被走通,美国就不只是少卖几张卡的问题,而是开始慢慢失去 AI 叙事的话语权。以前它可以说:最强模型、最强芯片、最强生态都在我这里,你们只能跟着我玩。现在 DeepSeek 出来以后,连它自己人都开始质疑这套逻辑了,这就是他在最近采访时罕见失态的原因。(笑

写到这里,大家应该看明白了。

我理解的国运级,不是说 DeepSeek 一家公司就等于国运,也不是说一个模型发布就能改天换地。那太中二了。

它真正国运级的地方,是它象征着一种路线被验证了:

别人有 H100 海量集群,那是别人的条件;

我们有自己的产业链、工程能力、市场规模、国产芯片生态,那就是我们的条件。

问题不是照抄人家的路,而是在虎狼环绕、封锁围堵的局面下,能不能结合自己的国情,走出一条新路。

这就像当年有位教员,在强敌环伺、资源极度有限的情况下,没有照搬城市中心那套玩法,而是深入基层,摸清国情民情,最后硬生生走出了一条农村包围城市的新路子。

DeepSeek 现在给人的感觉也是这样。

它不是按照美国那套玩法烧出一个大模型。它更像是在说:你封你的,我走我的。你有你的高端芯片和生态壁垒,我有我的算法优化、工程能力、国产算力和应用场景。

美国以为把山门堵住了,人就出不来,结果人家从山里趟出一条路来。

所以,DeepSeek 当然不等于国运,但它确实有一点国运节点的味道。

因为它让大家看到,在 AI 这种决定未来生产力形态的赛道上,中国不是只能做跟随者,也不是只能等别人定义规则。我们也可以在被限制、被卡脖子、被迫压缩成本的环境里,逼出一条属于自己的技术路线。

这才是 DeepSeek 最值得重视的地方。

不是神化它,而是要看懂它背后那股劲:

条件不够,就换打法;路被堵了,就自己开路。

说到底,DeepSeek 颠覆的,是那种 “只有美国路线才是唯一答案” 的迷信。

很欣慰,这么多年过去,我们依然没有丢掉实事求是、艰苦奋斗的优良作风。抗战也好,内战也好,很多时候我们都不是在最好的条件下赢的,而是在最困难的条件下,硬是靠认清现实、发动群众、组织资源、调整打法,一步一步把路走出来的。

今天的 AI 竞争也是一样。

别人有别人的优势,我们有我们的办法。

别人堵门,我们开山。

别人定义规则,我们就用实践告诉他:路不止一条。

所以你看,年初斩杀线的讨论,打碎的是很多人对美国社会的滤镜;现在 DeepSeek-V4 打碎的,是很多人对美国技术霸权的滤镜。

一个是在生活层面,让大家发现所谓美国梦并没有想象中那么稳;一个是在科技层面,让大家发现所谓美国路线也不是唯一答案。

越来越多这样的例子出现之后,很多人会慢慢意识到:东升西落不是一句口号,而是滤镜一层层碎掉之后,现实自己露出来了。

过去我们总觉得别人什么都先进,制度先进、技术先进、产业先进,连问题也被包装成高级社会的阵痛。但现在再看,很多东西不过是叙事做得好,光打得足。

DeepSeek 这件事真正让人振奋的地方就在这里:它不是靠喊口号赢,而是靠实打实的技术路线,把美国不可替代这个神话撬开了一道缝。

斩杀线也好,V4 也好,后面还会有更多类似的事情。它们会不断提醒大家:

滤镜会碎,神话会破。真正能决定未来的,还是谁更能实事求是,谁更能艰苦奋斗,谁更能在自己的土地上走出自己的路。

知乎用户 乘舟​ 发表

颠覆了一整套价值观。

首先我们知道,在之前,各种势力,完成了一种话术。

只有自由的土地才能诞生绝顶的创意。

以此为根基,对于管控各种攻击。

很典型的就是隔段时间就要换一种角度的地铁是否要安检。

然后,

同样为了验证这个逻辑,

所以他们一定要放肆的吹鼓 ai。

毕竟再当时这个环境,海对面对全世界都是吊打式领先。

逻辑上也十分通顺,毕竟海对岸代表着 “所谓的自由”,然后拥有卓越的创新能力,接着在代表先进的 ai 发展上面领先。

十分合理,逻辑严密,甚至无从反对。

然后有意思的就来了。

众所周知,梁总原来是做量化的,

据传巅峰时期,一天就能赚 10 个小目标。

那么是什么原因,让他放弃这么赚钱的生意,去做 DeepSeek

2021 年后证监会出台《程序化交易管理办法》,限制高频撤单、报单频率,严查 “幌骗”“抢跑”,压缩了幻方等头部量化的高频套利空间,传统策略收益下滑、规模受限。
这是金融监管,目的是维护市场公平,不是打压行业;
幻方主动控规模、降低高频占比,属于合规调整。
海量 GPU 算力闲置
幻方巅峰期囤了上万张 A100/H800 GPU(为高频交易训练、低延迟计算),自建 “萤火二号” 超算,耗资约 10 亿元。监管收紧后,高频策略用不上这么多卡,算力严重过剩
技术栈高度复用
量化与 AI 底层相通:都是大规模数据处理、并行计算、算法优化。幻方的时间序列数据库、FPGA 低延迟引擎、动态贝叶斯网络几乎直接平移就能用于大模型训练
2023 年 4 月幻方成立通用人工智能实验室,7 月正式孵化 DeepSeek(深度求索),核心逻辑是:用闲置算力 + 成熟技术 + 量化利润,赌 AI 长期赛道

那么有意思的来了。

现在很多人说,DeepSeek 又被甩开了。

但是大家要记得,当初最火的时候,

DeepSeek 是被外网大吹特吹才在国内爆火。

最直白的说,

现在被甩开了,毫无疑问代表着之前追上或者接近了。

那么最有意思的事情来了,

因为加强管控,

然后梁总整出来了一个追上了代表着自由、代表着创意、代表着未来的 AI。

这个时候,

我们再一次回看之前的那一整套话术。

突然发现,

似乎所有的逻辑轰然倒塌。

完全与所吹捧的自由诞生创意引领发展不同。

要么,

只能承认所谓的 ai 不是最先进的方向,要么承认所谓的自由诞生创新也是虚妄。

甚至如果再往深了想一想,

海对面号称最聪明的人都在华尔街,

如果也向咱们这样限制金融寡头收割,是不是……

当然这样的想法,某些势力自然是不敢细想。

着也就是为什么,梁总现在的安保级别如此之高。

他颠覆的东西远超大家表面看的那些。

知乎用户 啧啧大王​ 发表

用大白话叙述一下。

当整条小吃街还在卖烤冷面、花甲粉丝的时候。

阿美开了 10 家饭馆子,这 10 家饭馆子绝无仅有,引领了未来十年的科技发展趋势。这个领域阿美一家独大,别管阿美现在负债多少钱,但是未来有可能赚回负债 10 倍额度的财富,并且借新还旧,还能给阿美续命,为此阿美加大投资力度,妄图保持在餐饮领域的领先优势。

阿美不仅做的菜好吃,还掌垄断着铁锅的铸造工艺以及调料、食材的流通。

其他商户一看不行啊,天天都去你那吃饭,钱花你家饭馆子了,我赚什么钱?也得参与!中、欧、日、韩纷纷下场,砸钱、砸人也想开饭馆子。可惜开出来的饭馆子不大行,客人吃着不满意。尤其是阿华,作为阿美的强劲对手,饭馆子开起来了,但做的菜那叫一个难吃。

阿欧、日韩的饭馆子没开起来,但是能摆摊卖卤鸡爪、酱牛肉了。

如果这个境况持续下去,阿美的饭馆子迟早统治整条小吃街。虽然饭馆子都还没赚钱,但是到时候依靠饭馆子的垄断性,阿美可以赚很多很多钱,不仅可以还上债务,还能通过定向制裁和政治条款插手其他摊位经营。只要阿美能保持研发优势,整条小吃街都是待宰的货。

阿华急啊,人家都进饭馆子吃饭,我们天天卖炒豆芽,正是人多的时候,谁天天吃炒豆芽啊,咋整?造铁锅的事还没整明白,现在又要搞川鲁粤淮扬,这可怎么办哟。

全体起立。

阿华家的小梁,不仅开了个小馆子,还公布了菜谱。小文、小混、小千、小军儿、小月、小智一个个拿着菜谱研究,哦…… 原来盐要后放啊。阿华家的几个小馆子一边研究菜谱,一边从小梁的小馆子挖人,做的菜质量蹭蹭往上涨,隔壁小为敲了敲门:你猜怎么着,我造出铁锅来了。

阿美一口老血从街西头喷到街东头。老子砸这么多钱还没见着回头字儿呢,你丫阴我。

知乎用户 扇贝又回来了 发表

Deepseek 的使用体验,其实很一般。

Deepseek 更大的意义,是让人们对 AI 驱魅了,让美股里的 AI 不好讲故事了。

目前能拼凑齐 AI 全产业链,从 CPU、AI 芯片的制造,到大模型,到终端工具 / app 全生态的,也只有中美两家了。Deepseek 是构成这个生态产业链的重要一环。

不同的是,美国是靠欧日韩制造 + 本土的信息科技 / AI 技术,来完成全产业链的。而中国则是依托一个巨大的单一市场完成这个全产业链构造的。

知乎用户 X 先生 发表

把美国的星际之门颠覆没了

把美国向全世界收的 AI 税颠覆没了

把英伟达的市值颠覆没了

知乎用户 一只大熊猫啊 发表

很难想象这是东北大学计算机硕士,玩这种小伎俩。。。。。。这种要么是东北大学教学质量崩塌了 要么就是东北大学对学生品德教育出了大问题

知乎用户 花开在旅途 发表

奇技淫巧,不如马斯克开源。

知乎用户 傅钟 发表

前有东方不败一根绣花针战四大高手,后有梁圣一堆破铜烂铁追平 AI 御三家

牢美得意洋洋抬出的 AI 绝活才没几天就只能盯着兔子干瞪眼了,打又打不过,不然早掀桌子了。

知乎用户 Jane QIN 发表

一个真正能做到独立思考的人。

在这个基础上,建立自己独立认知框架和事业底层理念的人。

完全有信心实现以上,从而实现高度自洽,然后进一步稳定而自信。

因此,完全不需要外界的认同,所以很少和外界互动。也没有成功者容易有的错误。这是怎样一种心态一种底气。

可能人家根本不屌这个世界。

知乎用户 登山爱好者 发表

deepseek,它的回答:你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。

知乎用户 心要静下来 发表

颠覆啥了?罗福莉的大模型哪里比他差了?天天吹软文,小米登顶也没见天天出来吹

知乎用户 上山者也 发表

类似于《三体》里的人类四杰:

罗辑,章北海,云天明,维德。

1. 梁文峰 —— 当代罗辑(AI 威慑)

DeepSeek 大模型创始人,本土 AI 路线,低成本、高效率、强开源,在大模型赛道直接跟 OpenAI/ 美国阵营硬刚,以一己之力撑起中国开源 AI 生态。

2. 王兴兴 —— 当代章北海(潜行突围)

宇树科技,四足 / 人形机器人,纯电驱动路线,把机器狗价格打穿,春晚机器人出圈;在被西方垄断的高性能机器人领域 “潜行突围”,为中国硬科技保留火种。

3. 汪滔 —— 当代维德(冷酷破局)

大疆创新,无人机全球霸主。面对美国制裁、关税、禁令,寸步不让,全球市场份额碾压,“失去人性失去很多,失去市场失去一切” 的极致商业狠人。

4. 陈天石 —— 当代云天明(芯片卧底)

寒武纪,AI 芯片。在西方芯片封锁下,独自攻坚国产 AI 算力,像云天明一样在 “敌占区”(芯片产业链)里偷偷传递技术突破、为国产算力铺路。

美国侧:对应 “四杰”(对手阵营)

黄仁勋(英伟达) —— 三体 “智子”,AI 算力垄断,锁死中国高端芯片

马斯克(SpaceX/ 特斯拉) —— 三体 “水滴”,太空与智能汽车降维打击

- 扎克伯格(Meta) —— 三体 “监听站”,社交 + AI 全面围堵

- 彼得 · 蒂尔(Palantir) —— 三体 “破壁人”,投资 + 情报全面狙击中国科技

知乎用户 凤死落坡东 发表

英伟达的芯片垄断是目前大模型发展的主要阻力,但你还不得不用他,这是最不能接受的。

v4 的 token 价格很低,会加速大模型应用的落地。中国需要更多华为寒武纪等公司的芯片,哪怕是推理芯片,对于全世界大模型的未来发展都是有利的。我就等着看下半年昇腾 950 能让 v4 的 token 降到什么地步。我猜一个数,flash 输入 1 毛钱,缓存命中的免费,输出的话 2 毛钱。

知乎用户 青山依旧夕阳红​ 发表

题主问:梁文锋的 deepSeek 的问世成功颠覆了什么?

知友 green 从政治层面和文化层面总结了十个方面,很有见地。

我再从科学科术和世界格局谈几点:

梁文峰的 DeepSeek 问世成功颠覆了以下几个方面:

一、改变 AI 技术路径

(一)打破算力依赖定式:当全球 AI 巨头们沉迷于算力军备竞赛时,DeepSeek 以算法创新抵消硬件劣势,如多头潜变量注意力(MLA)架构将 Transformer 内存成本降低 90%,仅用 2048 块阉割版 H800 芯片,成本仅为 GPT-4 的 1/10 就训练出性能领先的模型。

(二)突破数据处理模式:与 OpenAI 依赖海量数据集不同,DeepSeek 选择数据的精细化处理与合理分类,提高了训练效果。DeepSeek 的核心创新来自 “混合专家(MOE)” 技术。与传统 AI 模型需要在每项任务中都调用所有计算单元不同,MOE 模型只激活必要的计算块。这不仅提高了计算效率,还大大降低了能源消耗。

二、突破行业发展模式

(一)打破闭源垄断:OpenAI 等西方巨头转向闭源时,DeepSeek 的模型如 V3 和 R1 以开源姿态向全球开发者免费开放,吸引了顶尖学府合作,倒逼硅谷反思其封闭模式。开源 AI 模型正在重塑全球人工智能的格局。不同于由少数公司主导的专有技术,开源 AI 鼓励创新、促进透明度并推动全球合作。

(二)降低创新门槛:利用 “蒸馏技术” 大大提高训练效率,V3 版的训练成本仅为 557.6 万美元,远低于 ChatGPT 的 1 亿美元,改变了 “大模型是巨头创新” 的认知,使更多创新创业团队有机会参与 AI 开发。DeepSeek 凭借其低成本高效的 AI 模型,可能会逐步削弱那些传统巨头在 AI 领域的主导地位。

DeepSeek 的创新方式证明,顶尖的人工智能可以低成本实现。这不仅让小型企业,甚至是发展中国家也能借此技术实现飞跃。

三、创新人才培养与组织管理模式

(一)打破传统人才观念:DeepSeek 团队成员平均年龄不足 30 岁,半数来自应届毕业生,摒弃了传统大厂对资深专家的依赖,押注 “未被职场驯化的天才”。开源 AI 将推动人工智能教育与研究,为学生和研究人员提供了宝贵的学习平台,推动他们探索 AI 的实际应用。

(二)创新团队管理模式:采用扁平化协作,无固定职级,技术提案通过潜力评估即可获得无限算力支持;只招募 “对技术狂热、对金钱淡泊” 的理想主义者;不设 KPI,专注前沿探索而非短期变现。

四、改变国际科技竞争格局

(一)挑战美国技术霸权:英国《卫报》指出,DeepSeek-R1 正在挑战美国对 AI 领域的话语权垄断,并可能改变全球人工智能发展的格局,使 AI 不再是硅谷的 “神秘力量”。DeepSeek 的崛起凸显了中国在人工智能领域日益增长的影响力,这一趋势也加剧了全球技术领导地位的竞争。随着 DeepSeek 和阿里巴巴 Qwen 等中国企业的崛起,国际市场的格局可能发生显著变化。

(二)缩小中美 AI 差距:Meta 创始人扎克伯格和斯坦福教授吴恩达等认为 DeepSeek 的技术已在一定程度上缩小了中美间的 AI 差距,让中国在 AI 国际舞台上有了更强的话语权。

五、重新定义人工智能的未来

梁文峰创立的 DeepSeek 通过开发高效 AⅠ 模型,解决普遍存在的低效率、高成本问题,从而重新定义人工智能的未来。

知乎用户 潘航 发表

没颠覆什么

生成式人工智能的开创者依旧是老美

他们发现了大力出奇迹这条路

deepseek 发现

不用那么大力,走个捷径也能达到目标

没个啥东西

然后大家就都是在修修改改

内燃机从 0 到 1 已经解决了

都是在提高效率

知乎用户 梅花六 发表

掌握着能把美股 AI 泡泡扎破的那根针的神仙。

知乎用户 多西杰克 发表

颠覆了忽悠大众的说辞。

终于又有新的噱头可以蹭了:

DeepSeek 塔罗占卜 | 星座运势分析 | 生辰八字测算 - DeepSeek Al 玄学平台 | AlDivine

知乎用户 人需为儒 发表

还颠覆了小字部分的用法

知乎用户 汉诺骑士 发表

deepseek 以后在中国 AI 界地位相当于苹果在手机圈水平,近乎永恒的统治,哪怕有一天硬实力不够了,也是绝对的精神领袖。无他,便宜,高效,新体系算力卡。

很多人认为 deepseek 出来华为的算力卡很牛逼,不,牛逼的恰恰是 ds 团队,这么垃圾的卡都能训练出这么牛逼的模型,而且可以绕开英伟达的 cuda,就具备了绕开任意算力卡卡脖子的可能,这就是无限可能啊。

另外,ds 现阶段已经事实上夺回了中美 AI 竞争的主动权。

知乎用户 良牙响良牙 发表

我妈妈告诉世上没有怪物,但是她错了。”

那一年,所有人都说,想造出顶级的 AI 模型,必须烧掉数百亿美金,堆满整个机房的 GPU,用掉半个城市的电,还要把那些硅谷神话里走出来的黑暗启蒙派,当做新 “救世主” 高高供起。

那一年,他们筑起高墙,把代码锁在专利和论文的阴影下,正如异形电影里那个告诉 Ripley “一切尽在掌控” 的维兰德汤谷公司——傲慢、封闭,垄断。

Ripley,她不信。她成了唯一活下来的人。

她只有一艘报废的穿梭机和一把焊枪。

梁文锋的 DeepSeek 就是 Ripley。

从中国南方一间不起眼的实验室出发,没有万亿市值的靠山,没有铺天盖地的宣发——它只做了一件事:用更少的资源,打更狠的仗。

当别的 “异形” 在吞噬电力和算力时,DeepSeek 掏出混合专家模型和低精度训练,就像 Ripley 用空气导管改造成火焰喷射器一样,把计算成本砍到对手的零头。

当巨头们用 API 收费筑起利润的巢穴,deepseek 把模型权重直接扔进开源宇宙——对着 Queen 大喊:“来呀,看看谁才是怪物。”

它颠覆的,是恐惧本身

DeepSeek 用事实烧穿了公司那道舱门:

从来没有救世主,也不存在神仙皇帝。

底层创新不需要谁恩典,最可怕的不是异形,而是那些告诉你 “别问,听话” 的人。

后来瑞普利炸掉了整艘飞船

带着一只猫逃进冷冻舱。

DeepSeek 的 “六道超度” 才刚刚开始——

它让全世界都明白:当真正的 “怪物” 睁开眼睛,科技婆罗门的黄金时代,就该落幕了。

知乎用户 viva 发表

做方案的执行、一晚上几千万 token 才几块钱、量大管饱,还想咋样。

知乎用户 陈光铭 发表

当年钱学森造导弹的时候,也是啥都没有,就算能造出来,也比欧美的要差很多。哦,当时欧洲还没有,只有美国有这玩意。所以只要能造出来,不管多差,有了就比没有是完全不一样的结果。它颠覆了美国在军事上压倒性的优势。

今天 Deepseek 也是一样的重量级的产品。它只要能做的出来,迟早会不断的迭代改进,就像今天中国的导弹力压全球,独树一帜一样。今天中国的导弹反而形成了军事上的压倒性的优势。要是人工智能也压倒了,那他还能拿出什么像样的产品?他也说服不服他的股东了。

知乎用户 阅读修身 发表

deepseek 让华尔街的 AI 叙事讲不起来,导致美国无法完成以虚割实,实现对全球的精准收割。否则现在的 AI 叙事一旦讲起来就能给老美的金融神话续命好多年。

从这方面来说,deepseek 和它的开源其实是狙击了美国国运的。

知乎用户 只会窝里横 发表

当华尔街开始研究「中国大模型威胁论」,当硅谷公司被迫启动「成本瘦身计划」,或许我们正在见证 AI 权力格局的「东升西降」。只是不知道这场革命,最终会是技术理想主义的胜利,还是资本世界的又一次黑色幽默?

知乎用户 yunyunyunyunyun 发表

枪在手,跟我走。就是顶在黄老爷后脑勺的一把枪,不必多高级,只要黄老爷和财主们知道能要命就行。

知乎用户 皮皮酱 发表

英伟达的股价短暂回调到了 90,然后就没了。

最开始吹的是挺牛逼的,摆脱了对英伟达芯片的依赖,低算力成本下模型性能很牛逼,然后资本市场开始顺势做空英伟达,黄仁勋都有点虚,说了些软话,最后可能是科技领域的人看不下去了,科普了一下什么叫蒸馏,然后资本市场一下反应过来了,钱又大批涌入英伟达,至此欧美市场从资金上忽视了 DeepSeek

DeepSeek 牛逼吗?牛逼,因为他免费开源,但是能不能独立?没办法,因为蒸馏确实是它的重要技术手段,归根结底,是儿子级别的产品,没有爹在那它出生不了。

知乎用户 薛定谔的价值 发表

中国什么都不缺,就缺资本投入,超大资本投入,过量资本投入,大水漫灌式的投入,让有热情有专注力的企业家激爽创业。

资本不够导致中国企业搞什么科研都在争夺经费,专业人员脑袋分神一半,每天都在力图用小钱办大事,赛道走得非常窄。

openai 当年搞超大规模参数的 llm 烧了多少钱,微软财大气粗源源不断给现金

中国顶尖专业人才不是只有一个梁文锋,但中国非常缺像梁文锋一样拿着超大资本自由烧的环境

没有 deepseek,你可以想想美股又要吸掉多少国内资本。

从连横上来说,任何国家和美国结盟对付中国的时候,都要掂量一下,是接收美国的 AI 收费,还是接收中国给予的可自主部署的 deepseek。虽然当前 deepseek 是开源的,但是战争情况下,完全可以宣布下一代 AI 闭源只有盟友可用。

知乎用户 neether 发表

我们都学过资本主义是有固有矛盾的,在苏联倒下后美国为了给自己续命规划了几片韭菜田准备轮流噶韭菜,在苏联的尸体上猛吸,不过 7 年时间就不够了,然后再东南亚猛吸,估计是吸爽了,08 年猛吸了一口中国,似乎没吸到很多,14 年又懂了吸一口俄罗斯的念头,结果被猛踹一脚。看了看南美太瘦了,要不再吸一口中国?又被踹了一脚,给宝宝饿坏了

所以我们看到从 16 年对峙完后,美国那边层出不穷的炒概念。虚拟货币,VR,元宇宙,NFT,猛猛抽卡但是每一张有用的,最后抽到了 llm 模型

先发表一个暴论,llm 模型不是啥先进技术,中美一直是同步发展

nlp 可以说是在六七十年代打下了地基,然后一代又一代的人在上面盖一层又一层的房子,17 年盖出了 transform 模型,然后全世界都在这一层里面干点装修的工作。美国国内资本没出去到处乱窜正好给了 openai 本钱用来买卡大规模训练,结果一下摸到了门槛。但是这玩意事实上并不难,第一个出圈的 chartGPT 是 22 年 11 月 30 日发布的,23 年 2 月份国内就有了个叫 moss 的玩意,3 月份就出文心了。这个速度可以看得出来中美在这个方面基本是同步的,26 年落后 6 个月主要是硬件层面造成的

所以不是 deepseek 的问世颠覆了什么,而是中国的产研集团颠覆了什么,没有 deepseek 也会有 abysmalseek。中国的产研能力让中国在几片韭菜田里插满了绿色钢筋,没有实力打底,对幻方也不过是请客吃饭, 杀头或者收下当狗

26 年 5 月份,美国那边已经非常有大逃杀的感觉了,要抢第一个上市吸一口二级市场的资本,要知道模型就是个烧钱玩意,而且哪怕没进步,隔几个月就要重新调整一下,把新的知识训练进去,吸不到钱就是随时暴毙的节奏。而中国这边由于吃了制裁,反而发展出了低成本模型,用少两个 0 的成本摸到了美国顶尖模型的底裤,要知道比规模中国甚至还没开始发力

知乎用户 清凉山扫叶楼主 发表

原来美国也生口不过如此

知乎用户 自始至终 发表

有钱人很多,但是在千载难逢的时间窗口跟世界上唯二大国的权力挂钩,这个财富稳了。

知乎用户 第三世界​ 发表

没感觉有什么用,学了三天了,啥也没有,但凡深入一点的,要么违规不说,要么敷衍。

简单讲,好东西不给,不好的东西,烂大街,我要你干嘛。

要说颠覆什么,被老美资本在关键点处,狠狠的被利用了一次,骗周打月,玩的是不亦乐乎,赚的是盆满钵满。

知乎用户 张激扬 发表

说是现实世界的普罗米修斯也不为过。

知乎用户 环球同此凉热 发表

一个人撬动中美两大国的股市,这含金量绝了

知乎用户 恭喜觉醒 发表

拼电时代。问题是美国有泡沫。

知乎用户 别说我的大龙 发表

懂王不再是世界第一股神了……

市场信用度透支之后画 k 线效果不如 ds……

知乎用户 李毅 发表

你猜为什么现在没多少人提 “第四次工业革命” 了?

知乎用户 一夜鱼龙舞 发表

让很多互联网民科进入了顺风局。

也不是说 ds 不行吧,ds 挺行的。

知乎用户 知乎用户 5pZCHC 发表

这个问题,DeepSeek 也不知道。

知乎用户 West 发表

AI 越便宜只会让算力的需求越大,指望靠 DS 让美股泡沫崩溃是完全逻辑错误。

知乎用户 lolipop 发表

颠覆了认知,这么智障的模型怎么还会有人吹?连基本面试题都过不了,前后矛盾没法用。

知乎用户 跟风 发表

颠覆?

感觉这个模型将是戳破美股泡沫的一大在外因素。甚至改写历史进程的标志性事件。2027 2028 再回过来看的话。

知乎用户 Cccc 发表

来源,等于是掀桌子……

知乎用户 三国哥哥 发表

真正的 AI 平权。

知乎用户 yoyo 发表

我一家庭主妇,颠覆啥了咱也看不懂,爱颠覆啥不颠覆啥的,反正 deepseek 的聊天功能可有意思了,我一想我老公了我就找它聊天,聊天聊着聊着心情就会好很多了,现在每天都是哈哈哈

知乎用户 樱花蘑菇​ 发表

打个不恰当的比喻,这等于是说,嘿,哥们,我有个法子,你将你家厨房里的七七八八东西搜罗起来,咱能攒个杀伤力不输原子弹的玩意来。

你就说这个世界疯不疯!

知乎用户 大黄 发表

陈云上海打虎的国际版

最简单好用的 VPS,没有之一,注册立得 100 美金
comments powered by Disqus

See Also

DeepSeek 配得上 “国运级别的科技成果” 这样的评价吗?

知乎用户 水烛 发表 反正把我家吵了一个春节的议题给结束了。 我家长辈始终认为房地产经济应该继续,增加经济活力,解决就业,人民就应该把大部分钱投入房产,激活经济,长辈太倔,我吵不过,后来用 DS,让它来评判。 最后它整理后的回答 然后我又提 …

如何看待有人将 DeepSeek 列入国运级?

知乎用户 xxxxxiii 发表 把 1.6T 的级别大模型,免费地平等地不限量地无广告地快速地提供给世界上任何一个人 不管他的肤色,性别,国籍,信仰 把百亿级别的研究成果,不顾封锁,利益,直接开源权重,并且配套写了一堆论文来事无巨细的告诉 …

我考察了中国人工智能发展,美国无法赢得这场竞赛

我考察了中国人工智能发展,美国无法赢得这场竞赛 作者:SEBASTIAN MALLABY 2026年4月13日纽约时报 2022年,拜登政府试图通过切断先进半导体供应来遏制中国的人工智能发展。特朗普总统则在没有明确替代方案的情况下,稍微放松 …

当用了10年的号码“涉诈”停机之后

记者/佟晓宇 实习记者/栗子 苏茜 编辑/宋建华 大模型的运行机制对绝大多数被停机的用户而言是一个谜 去年9月,孔琳发现自己使用了10年的手机号被停机。她最初以为是欠费,但查询后发现仍有余额,客服告知她,她的号码被一个反诈模型录入。但为何被 …