如何看待有人将 DeepSeek 列入国运级?
知乎用户 xxxxxiii 发表 把 1.6T 的级别大模型,免费地平等地不限量地无广告地快速地提供给世界上任何一个人 不管他的肤色,性别,国籍,信仰 把百亿级别的研究成果,不顾封锁,利益,直接开源权重,并且配套写了一堆论文来事无巨细的告诉 …
问题出在了梁文峰似乎短期内不打算靠深度求索项目盈利,完全不跟其他家搞 “军备竞赛”,也没有 KPI 压力,感觉就像是业余爱好,弄着玩儿的一样。
API 的价格低廉得离谱近乎于免费,官网和 APP 也不用心维护,一副爱用不用的姿态。
DeepSeek R1 刚出时的主要对手是 Grok3 和 Gemini2.0,那肯定是薄纱之。
但现在这两家已经迭代到下一个版本了,而 DeepSeek 的 V4 和 R2 直到现在依然没有任何消息。
当前 AI 发展前景不是很乐观,各家的顶级大模型都有各自的问题,
甚至 GPT5 和 Grok4 的面世释放了非常不好的信号——Transformer 可能快走到头了。
越来越多的数据,越来越多的算力堆砌出越来越大的模型,却根本没有带来什么显著进步,在许多方面甚至还开倒车,训练成本的边际效应愈发明显。
大家都很期待深度求索的下一个版本能不能给整个 AI 圈子注入一针强心剂。
您大概不知道目前国内的多少 AI 服务是基于 deepseek 模型的。一堆公司搞的自己的 AI 其实都是基于 deepseek 模型的。所以,不是 deepseek 无人问津,而是基于他的应用一大堆,导致了大家都懒得去用他了。但这本来就是开源的代价啊。
你知道今年上半年卖了多少台 DeepSeek 一体机吗?
一天一个价!
我的代理服务器的基友去年都快要当掉裤子了,今年换了迈巴赫。
都私有化部署了,谁还去用 APP。
GPT 从两年前的 4.0“你国药丸” 到现在 5.0 被声讨要求退回 4o,OpenAI 到底哪里出问题了。
这背后是美国体制的问题还是犹太人 CEO 人种不行?
一大堆现在雨后春笋般出现的 AI
本质都是在 deepseek 上扩展
怎么就无人问津了?
知乎老格言:先问是不是,再问为什么
如果你指的是模型,那最近半年推出且已经被淘汰的模型有
o3-mini, o1 pro, o3.o3 pro,o4-mini, gpt-4.1, gpt-4.1-mini, gpt-4.1-nano, gpt-4.5, gpt-image
grok 3, grok 3-mini
claude 3.7 sonnet, claude 4 opus
gemini 2.0, gemini 2.0-flash, gemini 2.5-pro-0325, gemini 2.5-pro-0506, gemini 2.5-pro-0605
qwen2.5-max, qwq, qwen3-235b-a22b, qwen3-30b-a3b, qwen3-32b, qwen3-8b, qwen3-4b
doubao-0115, seed-1.5 thinking
glm-plus, glm-z1, glm-z1-flash, glm-4.1v
k1.5, k1.6
llama 4 scout, llama 4 maverick
还有没发出来就被淘汰的 llama 4 behemoth……
能提出这个问题说明对真实世界基本上一无所知。
先看模型实力:

在 5 月的节点上是能和 claude-4-opus 打得有来有回。即便到了 8 月,deepseek 的实力依然不弱,日常使用上是没问题的。
在应用侧,
腾讯元宝:


百度地图:

微信:

问小白:

国家超算中心:

字节飞书:

甚至你现在就在用的这个知乎:

在你看不到的地方用的就更多了:
deepseek 人家是开源的,而且是最友好的 mit 协议,谁都可以部署使用。世界不是只有一个 deepseek 的 app 才能用得上。
即便在手机上,你装一个 chatbox,接上各家 API,就能体验全球各种大模型。

说什么 deepseek 没人用,算是新时代的一叶障目了吧。
很反感这种,因为知道他们背后真正的想法和愿望是什么。
前两个月 DeepSeek 悄悄发过一个 R1 的更新,在推理能力方面有了很大提高(可以用于编程等等)。接下来还可以期待 R2 了。
直到现在,DeepSeek 依然是美国科技圈比较重视的 AI 大模型(应该是为数不多的能够在舞台上的非美国厂商的模型,欧洲、日韩等等几乎隐身),前不久互联网女皇 Mary Meeker 的报告里也有很多涉及 Deepseek 的数据,都比较正面。
另一方面,DeepSeek 的热度确实下降了,移动端的活跃用户在最初两个月之后就在下降。
主要有几个原因:
1. 开源策略的分流,大家用 DeepSeek 往往不是在他们自己的客户端或者主页,而是在腾讯、百度等等几个平台出的客户端里。而且现在大家用的家电等等有用到 AI 大模型的,几乎都集成的是 DeepSeek。
2.DeepSeek 自己的客户端、网页确实不好用,因为他们并不重视这一块,或者没有经验,或者足够的人力去做,大家经常抱怨的回答到一半自己删了,是因为他们没有很好的敏感词机制,不像另外几家大厂这方面都比较成熟,所以过于简单粗暴。
3. 其它模型在快速进步。AI 大模型的竞争就是这样,你追我赶,比如最近这两个月,豆包大模型 1.6,能力大幅度提升,然后是 Kimi 的 K2,提升很明显,再之后是马斯克的 Grok 4,号称各方面都能超过博士水平(我经常用,我觉得马斯克还是有些夸大),然后是 GPT 5,(当然还有谷歌的 Gemini 2.5),这些都在快速进步。如果用半年前的 DeepSeek R1 和这些模型比,确实已经落后了。但是这段时间 DeepSeek 也没闲着,等着 DeepSeek R2 发布,又会超越这些大模型一大截。
DeepSeek 的国运级意义在于,他们能够在美国的 AI 封锁之下,用更落后的芯片,在今年年初这个时间点,搞出来比当时美国的很多 AI 大模型更强的模型(按照 Mary Meeker 的报告,当时 DeepSeek R1 的能力应该仅次于 OpenAI 的 O1)。这证明了在大模型这条核心赛道上,中国厂商也有机会。
这直接导致了几个大厂在大模型方面的投入升级(当然也让小厂几乎没有大模型的机会了),这条赛道上中国军团有能够追上来的实力了。
别的我就不提了。
单说很多人诟病的所谓 “限制多”
实际上,但凡对大模型使用研究的稍微深入那么一点点的人。
都不会说出 DeepSeek” 限制多 “这种话。
这么讲吧。
我用 SillyTavern 碳基渲染簧片的时候。
DeepSeek 是最没下限的。
一、LLM 这个领域,一个模型能保持领先三周,就已经算神了
二、openrouter 上,DS 半年多的模型还能有排名
三、训出 R1 级模型,表面上看很多公司已经能做到了,但实际技术上离 DeepSeek 还有一年以上的差距
大部分公司还在魔改 megatron,DS 从 fp8 到 inference 都是重写的
甚至,光是为了 prefix caching 就从头写了个文件系统,6.6TB/s 的速度,印象里比 OAI 早了 1 个半月上线(V2 那会儿就有了)
四、从硬核技术排名,只有谷歌确定领先,openai -1/+3 月(落后 1 月或领先三个月都有可能),anthropic 看不出来,xai -6 月,其他家都是 - 12 月 +
我觉得 xai 的人要是没有 20w 张卡,应该也能做到这个优化水平
但有了 20w 卡就不想这事了,摆了
你说得无人问津,指的是刚刚在 ACL 2025 上拿了 best paper 吗?

比较可靠的消息是,梁文锋拒了好多个百亿级别的融资
好像他就是把这个当成自娱自乐?
但据路边社消息,他们还在憋大招
幻方是做量化的
deepseek 属于沿途下蛋,随便搞出来的
deepseek 的牛逼的地方都通过开源周公布出来了
本身他就不是做 toc 的,投入完全不是那么回事。
Deepseek 那个开源周,是人工智能业界最近几年含金量最高,技术密度最大的开源周。
Deepseek 人家是真的在开源:

Deepseek 开源周里每一个新东西出来都是业界震动:
原来真的有厂商在踏踏实实打牢 AGI 地基?
原来真有人开源给别人用还没有协议束缚?
大模型从业者应该能明白这些基建是什么含金量,这还只是 deepseek 冰山一角。
相比较于 OpenAI 最近的几次开源周,我更倾向于称之为 CloseAI 营销周,属于没有热度硬炒。
至于开源盛世马斯克先生,我只想说:
洗洗睡吧。
还是那句话,DeepSeek 在年初开源的架构,至今依旧是开源里面最优的。
这不是我说的,你看下面的原文。
Kimi k2 的研发人员在知乎发文,他们在启动 K2 这个项目之前,对现有的所有的开源大模型进行了 scaling 实验,发现能超过半年前 DeepSeek 发的 V3 架构的没有,最好的结果就是跟 V3 打个平手。

什么是 scaling,其实很好理解,你看 DeepSeek V3 的 Model Size,也就是模型大小是 685B,B 代表十亿,685B 就是 6850 亿。

而 Kimi K2 是 1 Trillion,也就是 1000 亿。

Scaling 就是缩放的意义,用 DeepSeek V3 来举例,那就是微调 V3 原来的架构,扩大或者缩小 V3,来看看性能有什么变化。
这里的 scaling 一般是基于原本的模型进行扩大,因为理论上模型大小和性能呈正相关,也就是模型越大,性能通常越好。
Kimi K2 对于所有的开源大模型都进行了测试,结果纵观全世界,DS V3 这个架构依旧非常的权威,从 685B 扩大到 1000B,DS V3 依旧能打。
这种其实算是一种 incremental 的工作,也就是 DS 在做 V3 的时候,很有可能已经试过这么做了,但是 DS 明显考虑的是另外一种思维,也就是纵向无止境的扩大模型大小其实并不是什么长久的生计,因为很明显这条路的边际效应很高。
但从 Kimi K2 公布的性能结果来看,只需要做 scaling up,性能就可以有一个不错的提升,说白了,K2 的这个工作就有一种致敬的感觉。

从 685B 到 1000B,DS 当然可以做,但是还是刚刚说的,这样完全没有质的变化,而堆量明显不是 DS 这种特意针对阉割版显卡搞创新的怪物喜欢做的。
别人的开源周大多是一些模型,DeepSeek 的开源周,几乎全是针对于 H800 这款专门针对于中国的阉割版芯片的技术。

其实这一点儿很能说明问题,那就是 DS 里面有对于硬件非常熟悉的人,之前就看到过一个英伟达的前员工是 DS 的作者之一。
要我说的话,把 DS V3 做 Scaling up,性能提升到世界第一梯队,远不如跟某一芯片厂商合作,把现有芯片的极限性能挖出来要重要的多。
前者只能说明在现有的 AI 大框架下,大家依旧遵循着卡多数据多就牛逼的第一定律,而从硬件入手,是可以再一次震荡一波英伟达的大手笔。
虽然从长期来看,英伟达在 AI 的 GPU 领域地位不可撼动,但短期内是可以被扰动的。
所以不管从哪一点来看 DeepSeek 都可以称得上国运级,及时它没有大版本更新,Kimi K2 的致敬级发布也反映了 DS 的权威。
扩大参数量,多搞点数据,更深入的 post training,当然可以提升性能,但是这样做的意义并不大,MIT 协议的存在就是让别人去搞这些。
所以我的观点,DS 要么不发布,要么就是算法层次上的提升,人家又不靠这个赚钱,所以底气足够硬。
王小东在视频里讲了个事,就是一位搞历史研究的用 Deepseek 查询了一些资料,DS 给出了答案,还注明了出自哪本书,谁写的,什么出版社,哪一页。那人比较轴,真去查了那本实体书,书名、作者、出版社这些都对,可是在这一页上,就没 DS 所说的内容。据这位搞历史研究的讲,DS 犯这类错误,不是一次两次,而是 N 次。
其实我也早发现了这问题。我作为球迷,有时会跟网友讨论一些球赛。我曾用 DS 查过 90 年、94 年世界杯上意大利队某场比赛的出场阵容,它还真给出了答案,但里面有个别球员,属于是一眼假,就不是那个时代的。用百度,感觉给出的答案还靠谱些。
这还不算。我印象里,梅西是在正式比赛里用右脚罚进过直接任意球的,问 DS,它也回答有,还列出了具体哪一年哪场比赛。我就自信满满在网上发表了这个观点,结果受到了网友的奚落。我就直接去搜那场球赛了,还真搜到了视频,梅西确实在那场比赛里进了一个球。问题是,他就没用任意球的方式,是直接射门打进的。
王小东的观点是,问题应该出在程序员身上。如果程序员不讲武德,为了出结果,在编程时搞点小手脚,还真审核不出来。我觉得,这种可能性很大,但如果老给 AI 投喂垃圾、虚假信息,这 AI 也会出问题。
国足输个球都能成为国运平衡器,你就能理解所谓国运级的评价含金量有多高了。
真正国运级的是什么?
在我看来,两件事
一,改开
二,恢复高考
deepseek 最大的好处难道不是开源私有化部署吗?任何一家企业投个一两千万,都能搞出一套,训练自己企业内部的数据。很多企业都有部署,一问就是 deepseek。
因为 DeepSeek 过得越来越好,已经成为 “自由民主发达国家” 了,你国官媒当然不敢报道。
今天是 2025 年 8 月 14 日。
截止今天,DeepSeek R1 0528 是中国大陆及港澳地区(经评论区提醒港澳可以用 Grok)能够合法合规访问的最强 LLM,也是全世界最强的开源推理模型。
结构继承自 DeepSeek V3 的 Kimi K2 是中国大陆及港澳地区能够合法合规访问的最强非推理模型,也是全世界最强的开源非推理模型,而 DeepSeek 自家的 V3 0324 大概可以排第二第三。
望周知。
第一步点开知乎 app,第二步点开页面下的直答按钮,把深度思考下面那行英文字母念一遍,再回来说说你的无人问津。

合规成本杀死了 deepseek
合规意味着不能反映真实情况
垃圾数据只会污染大模型的知识库
让它失去灵魂
杭州这个城市,可以说是对改革开放第一城深圳的成功在信息技术革命背景之下的重现。
深圳是早年间依靠 “三来一补”,即来料加工、来样加工、来件装配和补偿贸易,是改革开放初期尝试性地创立的一种企业合作贸易形式,总体上来说,给人的感觉是 “跟随国际” 和“引进”,所谓的开拓创新,那也是在内部算,算不到全世界去。
但是,以阿里为代表的互联网企业的崛起,确实代表了全球信息技术革命的最先进水平,这个代表在杭州发展壮大,也构建了现代杭州的气质。当然,我这里没有说深圳没有跟上信息技术革命的意思。
杭州这个城市在阿里崛起的同时高速发展,成为了全球数得上的信息技术城市,证明了中国的改革开放并不是只会跟随和引进,中国也有自己的创新型巨头企业。刚才说了绩效主义,这里我们可以说杭州这个城市的绩效是很不错的,宏观数字不错,微观体验也不错。
那么现在情况如何呢?
整个阿里系流量增长见顶,快速增长的惯性无法维持,蚂蚁上市失败,连带着杭州的房价都扛不住了。杭州能不着急吗,房价上不去土拍怎么办,土拍上不去钱从哪里来?
于是,杭州必须继续紧跟信息技术革命的第二波,即 AI 革命。所以就有了从去年底到今年初的那一轮全火力炒作,当然也就有了今年上半年杭州辉煌的土拍成绩。这就导致了,与当年的阿里崛起不同,本轮杭州科技企业崛起有着杭州市拼尽全力的支持。
至于目前有没有问题,或者说是否问题还没有暴露出来,现在也没法判断,依旧需要等待潮水退去。
没出问题啊
之前 gpt4.0 的时候,乎友们觉得老中已经亡国了
ds 之后乎友们已经不觉得 gpt 可以亡国了
鬼鬼,四舍五入等于 ds 拯救了汉人的命运
这么大功德已经足够给梁文峰立功德碑了
大哥,deepseek 是开源的啊
现在各种厂商都是拿 deepseek 做了私有化部署,比较我经常用的就是腾讯的元宝和百度部署的 deepseek。
你说你不用,那你干的活,肯定是不需要动脑子的。
deepseek 开源相当于,你以前不知道可以在手机上玩游戏。现在 deepseek 开源了,告诉你可以在手机上玩游戏了。至于 deepseek 是不是最好的手机,最好的游戏。或者说你还玩不玩 deepseek,那是另外一种事了。
谈不上无人问津啊,我就天天用。这东西刚出来的时候国外的老哥们就说,更牛逼的模型后面会一个个出来,但是谁也不会忘记今天的 deepseek。(因为曾经有一刻开源模型达到了很接近前沿的位置,把其它模型的价格天花板按住了)。
说真的,我听说 deepseek 的数据库停留在 2023 年,不信,遂验证之。
结果当场爆炸。

某一些群体,中国的产品或者公司如果出了问题,他们比死了叠还高兴。
我做 zf 项目的,从年初开始,2g 市场上,deepseek 得到了广泛应用。也确实实实在在的实现了节约人力,提质增效。
不信的可以搜 zf 口的大模型招标信息,公检法司纪委等部门涉密的搜不到,其他的你可以看看,多么火你就知道了。基础模型基本都是用的 deepseek.
哪里都没出问题,大模型本来就是你方唱罢我登场,deepseek-r1-0527 出来都好几个月了还活跃在 toB 市场,已经是非常好的表现了。
所谓的 “国运级”,我记得是黑神话悟空的制作人在微博上叫出来的吧?这说法本来就很强的互联网八卦色彩,纠结这个没什么意义。
如果非得给 “国运级” 找个继承者,那当下的 “国运级” 模型是阿里的 qwen3-coder-plus,实际用下来,这个玩意儿的生产力直逼 claude,你要是没用过 claude 以至于对 ai 编程印象不好,你一定要体验一下这个模型,此时此刻非美国大模型的最强生产力,就是它了(当然价格也是非常酸爽,一天一百人民币跟玩儿一样,刚听说现在注册账号每天免费用 2000 次,挺好,不然不报销真用不起)。
你可以担心中国的很多问题,但是中国的大模型真的不需要担心,最近 qwen、kimi、glm 轮番给美国大模型上强度,真不至于把希望都寄托在 deepseek 上。
话说回来,你怎么知道 deepseek-v4 和 r2 就不会再一次石破天惊呢?
一捧一踩没意思
DeepSeek 那个开源周的含金量
完爆其他几家开源大厂好不好
更是完爆国内各种院士杰青
问题下列位 DeepSeek 反对者,反对的不是 DeepSeek,是中国 AI 大模型。
我去 Bloomberg 的 AI 栏下面,统计了最近一个月的新闻中,各家厂商名称出现的次数,中国做大模型的只有阿里巴巴和 Deepseek 上榜,但阿里提到的是阿里,而不是千问。
明确提到 AI 模型(及对应公司的)只有 Deepseek。
换句话说,从外媒的角度来看,中国的 AI 大模型分为 DeepSeek 和其他。
列位对着 DeepSeek 哈气,不难理解,就是跟着外媒对中国 AI 哈气,可惜啊,哈气没啥用。
要是哈气真的有用,列位早发财了。



懂的人已经站在史学角度看待 “deepseek 时刻” 了,而不懂的人却以为 deepseek 只代表 deepseek 本身,在这说起风凉话来了。
deepseek 本身不是国运级,但 “deepseek 时刻” 是。如果不是 deepseek 当时选择把模型权重、推理方法和训练思路直接开源,开创了 “开源最顶级大模型” 的先河,在 “第三名开始才会开源” 的市场规则下,中国的大模型会像现在这么百花齐放么?
七月下半月超级模型四连发,本月开始各厂商纷纷开卷客户端智能体(建立在上个月发布的足够好的大模型的基础上),这种盛况如果不是因为 deepseek 为行业指引了新的发展路线,只靠市场按原有规则竞争,会推迟多久才能出现?
deepseek 在国内市场开创新的行业规则,其最大的意义就在于,为所有市场参与者尽可能降低了成本,令 gpu 算力这种昂贵的资源,能够在市场自由竞争环境下充分流动,尽最大可能提高了资源配置的效率。
试想,如果 deepseek 不是一个开源大模型,那么:
1. 当新的用户涌入 deepseek 开放平台后,deepseek 需要把新增的利润拿出多少来采购 gpu 算力,才能保证对用户的服务质量?
2. 当 deepseek 花了这么多钱去抢购显卡,勉强维持了对用户的服务质量,他还能剩下多少资金,来投入进一步研发中?deepseek-r1-0528 的诞生会因为投资减少而推迟多久?
3. 随着竞争对手推出新的顶级大模型 qwen3,市场风向变化,原本因为 deepseek-r1 而来的用户纷纷流失,之前快速增长期为满足服务需求而购置的 gpu 算力资源,是否应该再拆下来卖掉?这一来一回折腾一轮,对 deepseek 来说到底是赚了还是亏了?
deepseek 开创的建立在开源基础上的新的大模型商业模式,不仅是为自己解决了以上困境,还为行业的所有成员共同解决了以上困境。
他让模型提供方可以不再有后顾之忧,可以按照自己的思路去尝试训练新的大模型,既不用担心自己能否保证服务质量,也不用担心自己的产品开发思路被利润指挥棒倒逼失去战略自由;
他也让云算力资源提供方不再有后顾之忧,明星模型的存在让云计算服务商不用担心自家的大模型水平能否支持自己囤积的算力资源拥有足够的市场需求,他们打可以直接按照用户需要部署明星模型,以 api 的服务模式向用户提供服务,这当然比直接出租 gpu 切片要效率高得多了;
最后这个商业模式还让消费者享受到了实实在在的实惠,由于市场竞争,大模型 api 的价格会很快被锚定在硬件成本 + 电力成本的水平上,中国的消费者不必像美国消费者那样面对顶级模型的天价服务费用。
当下国内大模型领域的市场繁荣,正是 deepseek 商业模式促成的。可以说,deepseek 不仅仅是一个产品,它是一场起义的第一枪。而刚刚过去的七月,则是这场起义的转折点。帝国的命运将走向何方?是垄断的壁垒能继续维持算力优势,还是开源的洪流终将冲垮封闭的堡垒?我相信我们在不久的将来就能看到终章。
这场起义,以雄辩的实事证明了:当资本主义走向垄断阶段,只有运用公有制的思路,才有可能重新激活市场的潜力。公有制恰恰不是市场的敌人,相反,至少在它向垄断堡垒冲锋的时候,它是救赎市场的弥赛亚。
既然无 “人” 问津,好奇题主是什么种群?
我天天用豆包 AI,在两个月前豆包还承认自己嵌入了 deepseek 模型,把 deepseek 当做自家 AI 卖点,上次大更新后就没了,你在界面里面找不到任何关于 deepseek 的痕迹。
请问豆包 AI 现在不使用 deepseek 开源代码了嘛?
类似的还有腾讯元宝、百度 AI,都用着 deepseek-R1 代码,但并没有把 deepseek 放明面上。只有答主这种用 AI 两年以上的人,才能看出区别来。
换句话说,现在 deepseek 无处不在,国外 AI 也几乎内嵌了,你能不能看到,只能看二道贩子们良不良心。
这才是真正套壳、换皮,只可惜套的是中国团队科技产品的壳,没有一大帮华为黑在那孜孜不倦扒代码找证据,甚至这群人就希望大家看不到,这样就可以假装中国科技产品也是昙花一现,没啥贡献。
DeepSeek 的最大作用就是:
断美国人的财路!!!
按照沈逸的说法。
人工智能就是一个金矿。大家都可以来挖矿。但是:这个矿里面有没有金子,其实大家都不知道。美国的做法是卖铲子。你先别管矿里面有没有金子,想挖矿,先要买我的铲子。到最后,就算是矿里面没有金子,我起码把卖铲子的钱赚了。
DeepSeek 的做法是:我有一个非常便宜的铲子。想挖矿,可以用我的铲子。
到最后,就算是矿里面没有金子,我起码不让美国人赚卖铲子的钱。
俗称断人财路!!!
说句难听的,先别管,人工智能能不能实现。我东大的目的非常简单。就是:
搞死美国。。防止美国人用人工智能忽悠中国人。
不是说 DeepSeek 无人问津。而是人工智能到现在也没啥有价值的应用场景。
本来就是水军炒作的,国外人用 GPT5,grok4,gemini2.5 的多,哪有几个用什么 deepseek。
无人问津,指百度,你乎,学网乃至一些政府网站、机构网站(如图书馆)都已经本地内置了 DS。那颗【深度思考】按钮不知从什么时候起似乎也成了理所当然存在着的元素。
当然我知道你乎人均 985,大抵是看不上也不屑于在这些地方使用 DS 的。
但对于更广大的普通网民们而言 DS 提供的便利绝不亚于年初 R1 横空出世时给你我的震撼之大,虽然也随之带来了信息失真等问题。
DeepSeek 当时被称为国运级的原因有两个。
1.DeepSeek 解决了成本问题,让训练的成本大大的降低了,同时效果也算是第一梯队,直接快要追平 ChatGPT。
2.DeepSeek 开源,各家都可以用 DeepSeek 部署到自己的大模型应用里,这个对于比较封闭的体制内而言就很管用。
仅从实际效果来看,年初的 DeepSeek 用起来的效果是很优秀的,比之前的国内的一些大模型好用的多,但是从使用者的角度来说,我个人认为现在最好用的是 Kimi。
另外再一说 DeepSeek 的幻觉问题,很多人说他睁眼说瞎话,编数据,实际上这就是 DeepSeek 我觉得另一个领先的地方了,只是没把他用好,因为现有的 DeepSeek 的联网搜索是会把垃圾的东西都给作为引用的,但是 DeepSeek 是开源可以本地部署的,可以引用自己的知识库,那这个就非常有帮助了,你觉得不好用,不是它真的不好用,而是它的知识库太差。
想想如果法院自己的那么多的判决建立一个库,然后根据历史判决和典型判决根据实际情况走快速审判,会大大提高法院效率的,指不定可以像派出所一样,更落地。
没哪出问题,deepseek 商业策略就是这样,已经大规模授权给第三方了。
deepseek 是对的,目前市场没有任何通过大模型服务赚钱的迹象,通过引擎授权,保持小而精的规模,进行下一轮技术竞赛,是正确选择。
谁还记得光刻厂?
当年炮党不断地赢最后转进台湾了
我有另一个更有兴趣的问题,就是知乎的问答机制。
在另一个相似的提问里,高赞,几千上万赞的回答,就都是 ds 吃枣药丸,各类严格审核,技术落后,各种缺陷的冷嘲热讽。
不信的朋友移步这个提问如何看待有人将 DeepSeek 列入国运级?
这个提问里的高赞回答,几乎都是 ds 开源,人家根本不在意 c 端用户,早就依靠 b 端赚麻了。都是这一类 ds 大有可为,并且前途光明的立场。
我倒是认为,两方人马都有说的有道理的地方,我关心的地方也不在这里。
而是为什么两波人不在同一个提问里探讨问题?诉说观点,交流意见?
而是分别聚集在自己同伙的地方,报团取暖,形成信息茧房呢?
这不是 ds 讨论一个话题的问题,而是知乎这两年近乎所有话题的通病。
某提问一个高赞爆款,剩下的回答者几乎都是相同立场,顺着第一个爆款回答。
很多甚至就是复述一遍,更改顺序,或者换一种说法。
于是该回答下面,就形成了某一方观点形势一片大好的局面。
例外的可能性,观点对立两方同时聚集在一个提问的可能性,就是某一方翻车,形成合订本。
比如不跪泰王,远征澳大利亚,警察局饺子这些方面。
deepseek 已经无人问津了?
我只知道我的车机都已经接入 deepseek 了,使用体验比只会执行固定指令的车机更上一层楼。
对于个人来讲还是很有用处的
今年拿 DeepSeek 写了一篇论文,投了一个国自然,大大提升了遣词造句的效率
感觉在临床医学领域,DeepSeek 不会淘汰医生,但医生会用 DeepSeek 淘汰其他医生
我是在 deepseek 最火的时候下载了用的
我问它 rx78 的光束步枪的功率,结果它硬生生给我生造了一个型号,直接编了一段说明。
而且它甚至不知道加岛勇是谁,硬编造了一个虚构的苍蓝命运三号机的机师。
它甚至否认有 rgm79f 这个型号,说这个不是官方的设定,应该是某些同人作品。
我就知道这玩意是有问题的
是因为 deepseek 成为民主的发达国家了。
所以央视不报道了。
deepseek 已经融入各行各业了,市面上很多 AI,还有一些企业自己内部用的 AI,用的都是 deepseekR1,然后再套一层壳,不然哪有这么多企业有自己的 AI 大模型,不够现在国产的 AI 确实不错,我写程序用阿里的 QWQ,都挺不错的
我觉得无人问津只是因为 deepseek 的 pr 做的不太好。作为白嫖用户,我每天都在重度使用 chatgpt、deepseek(以及腾讯元宝的 deepseek 版),就我个人体验而言,deepseek 在编码相关的回答上是能接近 chatgpt 的,相比国内竞品(豆包、通义千问)而言回答效果要好出不少,最重要的它是完全免费的。免费又好用,已经非常不错了。
就我个人感官而言,deepseek 出来之前,chatgpt 对国内竞品都是断档式的领先;deepseek 虽然没能完全超越竞品,但是它的开源也大大实现了 AI 平权,对我国来说,说它是 “国运级” 也并无不可
你把周树人从坟里拖出来,然后让他背社会主义核心价值观以后再动笔写文章,你看能发表几篇?
兄弟们最爱的,不是没有原因


说实话我最不能理解的就是
Deepseek 对于一些很明确的问题会直接自己编造
比如一篇科学文章丢给他,有些生成的参考文献是根本没有的,doi 号都是瞎生成的
比如一个问题丢给他,引用的部分标注规范甚至也是现编出来的压根没有的
这问题其实很大程度上影响了人们对 ds 的信赖程度,我可以接受它有问题不知道,但我不能接受它直接乱编。
哪怕甚至是一些常识问题它也会编造
我不理解里面的原因和算法
无人问津?
这是你希望的吧
可惜事实恰恰相反
DeepSeek 已经席卷了所有行业
百度搜索接入了 DeepSeek
典型的是打不过就加入
百度搜索接入 DeepSeek 后好评如潮
现在甚至直接集成到了搜索框里
这叫无人问津?
华为小艺也集成了 DeepSeek
可以使用 DeepSeek 做推理
今年 7 月参加了一个大模型企业参访团
现场参观大企业是如何在业务里使用大模型
各个行业的企业都在基于大模型做业务重构
无一例外的他们的业务里都宣称自己集成了 DeepSeek
你以为的无人问津
实际已经如水银泄地无孔不入了
DeepSeek 远比你想象的在改变这个世界
现在哪个 ai 没这个功能?人家开源了。完成使命了。

首先,就是审核制度。
有这个玩意儿,AI 别想有多大发展。
其次,垃圾信息污染。
海量的营销号,批量制造的垃圾信息,已经严重污染了互联网环境。
最后,deepseek 本身问题。我使用中,发现它最大的问题就是喜欢胡编乱造,不光是数据,还是它给出的结论以及论据,很多都是瞎编的。甚至法律条文和政策文件,都能瞎编。
还有,它得出结论,会给一个出处。但是经常给出的出处,和它的结论,根本就是毫不沾边。
最后,它的回答越来越模板化了,根本不像一个会不断进化的 AI。
第三方入口的 deepseek 算不算 deepseek?
如果算,那么 deepseek 现在是国民级应用
因为你在百度搜索的时候,下面自动 AI 生成的回答都是百度部署的 deepseek R1 提供的。


从 deepseek 刚出来时候,大家都用 deepseek 去测试用骂人的方式回答问题,就能知道 deepseek 长久不了,且不说大模型的技术水平如何,就这种垃圾数据喂给他,他能成国之重器就怪了!国外的 gpt 出来的时候大家是把它当工具,做数学,做推理,写文章。咱们这倒好,到处都是拿这个来骂人来嘲讽!!
因为谁也不能一直保持领跑的地位。而深度求索更是没太把 “名” 当回事儿。
作为 DS 的深度用户,一个大语言模型你用的越多,他越了解你,我经常问很多技术问题,DS 为主,每次他给我的操作步骤要比千问详细很多,当然,幻觉问题也存在。
不过,最近明显感觉 DS 的服务器繁忙次数比以前多多了,而活跃用户数相对比较稳定,没准就是开始训练新的模型了。如果这个假设成立,快则仨月,慢则半年,可能就会迭代新一代模型。
ds 的历史任务已经完成了呀,就是和小红书对账一起扛起 25 年过年前后两个月的欣欣向荣的需要,26 年过年前后自然会有新的国运级出现
问题出在,很多人根本没有搞懂幻方为什么要公布 DS。
首先认清以下几个事实。
第一,幻方的主业是搞量化,人工智能是它的副业,deepseek 只是副产品。
第二,deepseek 是个开源项目,它本身不是为了出产品,而仅仅是为了推广它的理念和技术,做个产品出来是为了让大家看到唯算力论的短板,仅此而已。
第三,幻方压根就没有打算靠 deepseek 本身的产品化赚钱,甚至版本迭代都不怎么上心和着急。
第四,幻方确实会继续 DS,但什么时候更新,什么时候公布,完全取决于它们的心情,还是那句话,短期之内,它们不着急,或者压根不指望把 DS 产品化。
第五,下一次 DS 更新,还是会以推动技术路线为目的,而非产品化,而且长期来看,DS 会一直坚持开源。
第六,幻方从始至终,都是一家金融公司,量化才是它的老本行,它搞 DS 既是技术的,其实也可以是金融的。
第七,再也没有人相信什么美国 AI 能当新的核心竞争力,幻方推出 DS,其实有一部分原因可以理解为就是要破除 AI 咩鳖论。还是那句话,它首先是个金融公司,所以考虑它的动机,要从问题根源出发。甚至回应咩鳖论也只是表象,真正的本源,就是幻方自己说的那样,为了反过来咩唯算力论。
出什么问题大家都心里有数,但说它像国运,是一点问题也没有的
deepseek 就是个特供的友谊商店,专门用于在媒体和外国媒体面前显示自己的物产有多丰盈、制度有多先进,而现在采访已经结束了
先问是不是,再问为什么
OpenRouter 是最大的模型聚合网关和市场。
说人话,OpenRouter 就是 AI 的批发商,开发者从 Openrouter 进货,然后用到自己应用里。
所以 OpenRouter 公布的数据,不一定能反应谁好用。
但一定能反应,用量大不大,是不是 “无人问津”。
下面是 Openrouter 上 Deepseek 的数据:
占用率常年前 5、前 3,开源大模型里基本是第一!


之所以会有 “无人问津” 这种评价。
大概率是:
我们一个个来说!
生活中接触的都是客户端 AI,所以拿 “元宝”、“豆包” 去和 DeepSeek 客户端做比较。
觉得自己根本用不到 DeepSeek。
觉得元宝和豆包的检索更新,语气更好用。
元宝、豆包会做许多好用但壁垒不高的功能,比如语音聊天,比如基于抖音文案的 RAG。
这些都是功能性功能,实用,难度不低,也有工程壁垒。
但是和 AGI(通用人工智能,可以理解为人工智能之神)关系不大。
如果 AGI 出现,你这些功能可能都白搞了。

具体来说
2. 战略规划不同:
要知道,DeepSeek 上一次更新是 5 月 29 号,而官方说这只是一个小更新,模型还是叫 R1。
事实上,R1 在 5 月 29 日的更新被外界评价为一次 “性能飞跃”。
然而,DeepSeek 甚至不愿意给他命名为 R1.5(OpenAI 很喜欢这么命名)。
从这件事上,我们可以看出,DeepSeek 是很骄傲自矜的,我更愿意主观猜测他们无视竞争,在憋大招。
我们来看看友商发布了多少更新:
从 DeepSeek- R1 发布以来,
OpenAI 发布了:O3-mini 系列、O4-mini 系列、O3、GPT-4.1、GPT-4.5、GPT-5 系列
Anthropic 发布了:3.7-Sonnet、3.7-Opus、4.0-Sonnet、4.0-Opus、4.1 系列
更不要说许多诸如 Claude Code、Agent 模式等应用端的升级了。
从”更新频率 “和“搞个大新闻” 的角度,来说 DeepSeek 的确很久没有声音了。
聊到这里,上面都是针对 “无人问津” 这个问题的客观事实。
下面聊聊 “国运级” 和我对梁文锋的佩服之情!
梁文锋是国内头部量化基金 “幻方” 的掌门人。
早就财富大自由,而且相比许多上市公司的老总,人家挣的是管理费,拿的结结实实的现金。
(梁文锋 2023 年化名 “一只平凡的小猪” 个人捐款 1.38 亿人名币)


其实从 R1 之后,国内也有千问、智谱、K2 等优秀的模型,但这些公司的模型没有那么多的传奇色彩。
比如,他们或多或少有靠山。
比如,他们会更加功利和短期导向,没有人会像 DeepSeek 一样,尝试从底层编译,来降低对英伟达的依赖。
梁文锋在国产 LLM 发展的里程中,更像是一个中国式的英雄,没有大厂背景,靠自己赚的钱买卡。在被西方诟病封闭的市场环境中,做出优秀的开源模型。在复杂的国际环境中,依然对人类未来充满乐观和信心。
古人有云:为天地立心 为生民立命 为往圣继绝学 为万世开太平
梁文锋可以这么评价:为国产 LLM 树立信心,为普通开发者降低成本,为 LLM 写代码,为 AGI 做贡献。
前两天写东西让 deepseek 帮我罗列宋人笔记里关于宋徽宗和李师师记载的原文,结果这大聪明找了段宋徽宗和明达皇后的故事,把 “明达” 改成 “师师” 发给我,要不是我正好读过那段原文就真信了。
不知道说真话会不会被喷。
它唯一的优点——一直宣传的性价比是吹的,除开性价比外,它本身就是个幻觉率奇高且性价比极低的普通货色,基本差了两个代差。
很多老百姓并不知道的是,在它被吹疯后的半年里,它以及己它幕后的人几乎在各级政府的很多部门讲过课,听课的以为他们来讲课是教大家如何利用这个工具提高工作效率,结果听了之后才发现就是在一个部门一个部门的要钱去买显卡。
后面的决策者也是个半瓶水,一门心思盯着各省级层面的信息化推进进程,却丝毫不知道各地从过紧日子到持续过紧日子到习惯过紧日子到底节约到了什么地步,政府部门的事很多都是玩不得半点错误的,怎么可能给你钱买显卡然后花钱租你的服务去办需要人工进一步核验的活。
但是再怎么喷 DS,也无法扭转一个事实,即:
开源模型的王者近一年多是 DeepSeek 和 QWen,新的竞争者 Kimi、GLM 也来自中国。任何一家公司,只要愿意,随时随地可以利用这些建立自己的 AI 应用,甚至提供自己的 Token。任何一个个体可以利用这些开源模型进行学术研究。
这就是中国 AI 营商环境远超美国的事实。
咱们知乎在发问题之前,能不能先查一下事实?ds 的训练方法现在已经成为了开源界的行业标准,只是最近没有发新模型所以不在风口上罢了。
万斯几个月前,曾咬牙切齿的说:
DeepSeek 是世界上最恶毒、最邪恶的出现。
你不知道,这句话对美国意味着什么,你就根本不配来评价 DeepSeek。
其实那些 DeepSeek 刚出来时,铺天盖地捧 DeepSeek 的,和现在装模作样出来恶心 DeepSeek 的,本质上都是一类货色,根本就不懂 DeepSeek。
在 DeepSeek 出现之前,ChatGPT 可谓一统江湖、如日中天。全世界亿万子民如仰视神明一般,跪倒在 ChatGPT 脚心。在他们的心中,ChatGPT 就是普照宇宙的人工智能的灯塔。
川大爷为什么会刚一上任,就迫不及待义无反顾的,再次对中国开打贸易战?
川大爷最大的底气,就是 ChatGPT 可以收割全世界。
ChatGPT 和百度、谷歌最大的区别是什么?搜索一个问题,百度、谷歌会给你无数的 “答案”。尽管时常真假莫辨、鱼目混珠,但是你不容易被某一思想洗脑带偏。而 ChatGPT 只提供一个答案,在万民敬仰有如神明的光环下,很容易夹带私货,洗脑全世界、收割全世界。
DeepSeek 的横空出世,打碎了这个愚弄全世界、收割全世界的 “人工智能高科技” 的神明光环。
DeepSeek 犹如一把出鞘的利刃,一刀斩断了狂傲美利坚最招摇的那根脊梁。
泡沫过后一地稀碎,失去了 ChatGPT 这把最光亮的砍刀,川大爷不得不按下了中美贸易战的暂停键,不得不实打实地去收割他的那帮小弟和跟班了。
所以,万斯才不得不发出了那声痛彻心扉的嚎叫:DeepSeek 是世界上最恶毒、最邪恶的出现。
国运已然改变,世界已然不同。
DeepSeek 代表着一种思想、一种模型。这种思想、这种模型已然燎原了世界,DS 印度、DS 法国、DS 巴西。
DeepSeek 自身未来如何发展,纯粹是梁文峰商业团队自己的事情了。
DeepSeek 自身并没有任何问题,只是题主的认知水平,问题比较大而已。
已经进去了
DS 的堕落非常明显,几个问题交流下来就能发现它的改变。注意我和它对话的时间线






中国在 F 锈与 D 落,科技进步反而在遏制思想的进步。
它们把篱笆扎的更严密;
它们把高墙建设的更牢固。
原子弹都无人问津大几十年了……
当然举这个例子也不太对,因为原子弹放几十年也还一样有用,大模型可是几个月一刷新的,持续投入很大。
你觉得出问题说明你可能不是业内的,业内看这个事情不会说出问题了,而是风向变了。
deepseek 之前,大家没有能用的超大模型,尤其是能和国外云服务的模型比一比的(现在是能比一比但比不过,以前是完全没得比);所以一方面大家在乱七八糟地搞大模型,一方面不停地拿着中小规模模型搞领域微调,活儿也基本能干,但差点意思。
deepseek 出来以后,国内的产业化落地快速搞了一大波,但是整体上是围绕大模型本身的——有政策的极大关联,也有学国外大模型落地的影子。简单来说就是你直接跟大模型交流,获得知识。
现在大半年了,大家发现大模型本身的能力到了一个挺尴尬的地方:他比一般人厉害不少,但比专家差点意思;所以怎么把大模型变成专家,就成了今年中旬的主要关注点。
然而专家是要解决实际问题的,各领域解决实际问题的并不是大模型技术厂商,而是领域开发商集成商。举个大概的例子,你要做智能医疗的话,大模型厂商自己搞不定,医院也搞不定,反而是之前给医院开发挂号系统之类的软件开发商有数据、技术、能力和意愿。
再进一步,中间商赚差价,对终端来说是好事,毕竟定制化开发永远都是要花钱的;但对模型厂商来说就尴尬了,不赚钱了,工具类的东西又被开源的穷追猛打,导致大模型赛道现在的盈利模式改变了。
所以扣子都开源了。要不是挣不着钱了,谁开源商业产品啊。
但这一系列的风生水起、尘埃落定、鲸落万物生,都是 deepseek 为起始点的——它本身是国运,因为它改写了正在发生的未来。
没出什么问题,这个在大模型这个领域是很常见的现象:新的开源模型出来,旧的开源模型就会 “无人问津”。
dpsk 为什么被称为国运级?首先 dpsk 和幻方都没有这样称呼自己。某些人没必要先帮他捧上神坛,然后再一脚踹下来,这样的做法见得多了 ,捧杀嘛。
那如何客观的看待 dpsk 取得的成就呢(特指 deepseek-r1-671B 和 deepseek-v3-671B)?
1、第一个公开揭示思维链训练方案的模型。在此之前只有 OpenAI 探索出来,但闭源不公开训练方案。
2、同期最强开源模型,比肩顶尖闭源模型。
3、极高的工程优化能力,训练、推理成本大幅度压缩。
说白了就这三点。
第一点对学术界很重要,意味着有新的研究方向开辟,RL for LLM、LLM reasoning 再一次热门。
第二点对社会很重要,重要在于让国内企业有了一套自己部署顶尖大模型的方案,让国内做推理卡的企业有了盈利的可能。
第三点秀技术,一般般重要,对他们自己可能更有意义。
模型是开源的,本题下很多回答对模型回答的指控其实都毫无意义。他们作为公司,肯定要对生成内容进行监控,但这种监控本身不能算在模型头上。
dpsk 公司压根没想着做产品,app 或者官方网页端并不是让你重度使用的,只是一个体验的窗口罢了。想要得到更稳定的 deepseek-r1 模型,自己找其他服务商去吧。他就只是把模型和训练方案丢出来,至于你想做什么,随便你自己折腾去吧
再说回无人问津,qwen3 出来了,思维链训练方案是 GRPO 的变体,你觉得这个是无人问津吗?这种技术已经在 reasoning LLM 里面成为了共识。你只是不关心罢了。
gpt5 出现之后,说明 transformer 架构的潜力已经到头了。
大致有两个方向
一,编程,编程代表了一定程度的理性,编程能力提高,代表了理性逻辑能力的提高。可惜 GPT5 提高得也十分有限,这个路径很可能也到头了,至少是不能再沿用老架构。
二,数学逻辑能力,比如 deepseek 的 prover 模型。
还有就是完全新的架构了。
一道高中物理题,ds 做错了,豆包做对了。我把结果告诉它时,它说豆包是 ai,仅供参考!
它方程列对了,居然算错了,也是离谱。
找到原因了,它识图错误,把数据搞错了。识图能力有待提高。
到底哪里出问题?题主你这里出问题啊。
作为科技战的关键一环,君不见 Deepseek 已经完成大隐隐于朝的神操作,君处处不见 Deepseek,却处处有 Deepseek。
另外,Deepseek 真正的开发团队,大概率也和光刻机研发团队一样,列入最高国家机密,所以,你再吼,也不会有人告诉你,最新的进度在哪里?
我只是一个偶尔用一下 DeepSeek 的非专业人。我通过我用了 DeepSeek 没几天就放弃了它的经验总结的话,我认为 DeepSeek 从 “国运级” 到无人问津,核心在于技术定位偏差、功能局限性、稳定性不足三个弱鸡特点,叠加用户预期与实际体验的强烈反差,最终导致热度消退。
DeepSeek-V3 发布后,全球大模型评比榜单 Chatbot Arena 对最新的大模型进行匿名测试,据用户投票评分,DeepSeek-V3 在复杂问题和代码领域的表现均位列前 3。AI 集成平台 Composio 从推理、数学、编程、创意 4 个维度的测试证明,DeepSeek-V3 与 GPT-4o 性能不分伯仲。
Deepseek 的出现,让 AI 在应用端不再是过去的屎上雕花,而是有了一些共识。
过去大家都在卷大模型的学习,美国的大模型选择了不开源,只拼命堆高硬件成本,让大家跟着做军备竞赛,认为这样能建立所谓的 AI 护城河。
Deepseek 在深度推理算法上却趟出了一条道,提示了自主可控、节约高效的数字创新路径。
但是,DeepSeek DS 的研发初衷并不是想搞个牛逼的通用型 AI,DeepSeek 是其母公司幻方量化为满足量化投资等需求而设计的工具。

行业的智能化创新须通过垂直模型来实现。站在 Deepseek 深度推理的 “肩膀” 上,叠加可视化工具输出体系,体验下来简直是王炸!原因很简单,Deepseek 深度推理的能力实在是太优秀了,当 Deepseek 交换身份,站在持有人的角度去思考整个投资的链条时,它就是一个与投资者没有任何利益冲突的“独立投资顾问”。
不过,最初 DeepSeek 就是为了预测市场,喂金融数据可分析总结,其技术底层甚至早期是套用他人模型套了个壳,基础并不扎实。
幻方量化成立于 2015 年,创始人是梁文锋。在该公司官网上,赫然写着的是:使用 AI 投资的对冲基金。按照幻方量化的披露,在公司成立之前七八年时间,创始团队就在探索将技术应用于投资交易。当时量化投资在国内尚未流行,团队成员在这方面的经验同样寥寥,出于朦胧的市场感知和技术理想,梁文锋团队仍决定走上这条路。DeepSeek 在此基础上逐步发展为专注于人工智能技术研发的子公司。
所谓量化投资,指的是借助统计学和数学方法,利用计算机程序对大量数据进行分析,寻求获得超额收益的投资策略。在持仓风格上,量化投资倾向高度分散和多样化配置,以降低单一资产波动的风险。在决策上,不同于传统的依靠基金经理主观判断,量化公司是基于数据和模型进行交易。
幻方量化上演了一个 “一朝成名天下知” 的精彩故事,在它的叙事版本里,无论做金融交易还是进军大模型,都是比较纯粹的技术追求。

其早期研发重点是通过分析金融市场数据,为投资决策提供支持,例如预测市场趋势、总结金融数据等。
随着技术发展,DeepSeek 逐渐拓展至更广泛的 AI 应用场景,但仍保留了金融领域的技术积累和数据优势。
春节假期,泼天流量降到了 DeepSeek 的头上。被赋予 “国运级” 的高定位,可能伴随过度宣传,比如暗示技术领先性,所以导致用户对功能的期待远高于实际。
以前的 AI 只是单一文本模态,现在的生成式 AI 大模型可以学习和理解非结构化数据,生成新的非结构化内容,包括文本、音频、视频、图像和代码,适应多种任务。

现在 Deep seek 的功能还被严格限制在对话 + 简单总结。当用户发现它连基础对话篇幅长了就卡顿,显示服务器超时,更无法支持作图、视频、报表等多样化通用任务时,预期落差便会转化为失望。
所以不少用户吐槽 “只能对话…… 作图、做视频、做报表均不行”,正是这种需求错位的直接体现。
最新的大模型具备文本、视觉、语音多模态组合的感知、学习和交互的能力,突破了文本交互的局限性,能够感知、理解和模拟动态的物理世界,生成图片、处理复杂任务,用户自然会选择更 “全能” 的工具。
技术稳定性是 AI 产品的核心竞争力,但是 DeepSeek 总是啥都不敢说,还不承认,就说服务器繁忙!响应速度、准确性等基础体验长期不达标,用户肯定会逐渐失去耐心。
模型幻觉是指 AI 模型自发生成的看似合理、实则虚假的虚构数据、虚构影音、虚构事件。测试发现,马斯克 xAI 的 Grok-3、OpenAI 的 GPT-4o、DeepSeek 的 V3 都存在一定程度的幻觉率。
同时,DeepSeek 在一些专业领域是有局限性的,原因也很简单,知识密集型任务,AI 很难给到千人千面的有效决策。毕竟,Deepseek 可以给你一切心理问题的答案,但只有人类才能给你关系的连接。比如医学诊断和治疗,法律条文及案例解读与咨询方案,金融和投资建议或预测走势及顾问决策,工程和技术设计或施工,心理学专业服务,教育课程设计及评估,科学研究实验设计、数据分析和研究创新,艺术和设计创意表达、风格创新和作品评价指导,农业种养殖及病虫害防治、环境科学评估治理生态修复等……
当你发现它对话表现还行吧的表象下,是只能对话的脆弱能力时,热情自然消退。
openrouter 上,前十里面只有 deepseekv3 和 flash2.0 是五月份之前发布的。
而且各种软件排名还很靠前。
反而国内吹爆的 gpt,前十都没有。
那些回答里说能翻墙谁用的就是个笑话,只能暴露你才是那个没见过世面的。
全世界都在墙内是吧?
v3 有两个一个是付费的,一个是免费的。

哪里也没出问题,DeepSeek 依然是 DeepSeek,只是看热闹的外行人发生了变化。
我发现在中文互联网,有两个产品,可以很好的做为区分极端分子的坐标,一个是鸿蒙,一个是 DeepSeek。
鸿蒙这种垃圾产品,从技术上来说,本身就是安卓套壳;从市场来说,妄图绑架 App 开发者,凭行政力量强推一个新生态,更是搞笑。凡是相信鸿蒙能做起来的,基本可以归类为粉红。
而 DeepSeek 呢,又可以用来鉴定另一种相反的极端分子。从 ChatGPT 问世以来,可以说,只有一次「范式」的大更新,那就是 o1 的出现,而 DeepSeek r1 是 o1 的第一个成功的开源复现。有人可能说复现不就是抄袭么,那 Linux 还是 Unix 的复现呢,也没有意义吗?更别说,DeepSeek 在网络的架构上,训练的基础设施上,还有很多创新。所以说,凡是无脑喷「DeepSeek」的,基本可以归类为带路党。
即使你不懂这些术语,huggingface 下载排行榜总能看懂吧,看看前十的有多少是中国的模型,老外你总信吧。
回到这个问题,DeepSeek 是很有价值的,不管是技术上,还是商业上,可以说:
DeepSeek » 5G > 光刻厂 (如果存在的话) > 鸿蒙 (负价值)
但是,所谓的「国运」级,又是过度吹捧了,毕竟 r1 只是 o1 的一个开源复现,而不是首创的模式。至于「无人问津」,幻方是一个量化基金,又没打算做 to C,官方 app 只是做个 demo 而已。如果去看 to C 的产品,腾讯元宝的广告词不一直是 DeepSeek 吗?怎么就无人问津了?
他比一般 ai 更喜欢编吧
deepseek 已经深度融入到各行各业了吧,稍微有点实力的公司,哪个没有基于 deepseek 搭建的大模型服务,放在全球范围内 ds 也是最受欢迎的开源大模型。
先问是不是再问为什么。
deepseek 现在到底是不是国运级的,答案是肯定的。
deepseek 已经完全改变了搜索逻辑。基本已经取代了百度。
Google 是靠什么成为世界数一数二的公司的,还不是靠搜索引擎,百度已经完全不行了,你能接受 Google 再一次霸榜吗?
现在有 deepseek,Google 已经实实在在回不来了。
在多说一点,我觉得国家真的应该好好保护好 b 站,他里面的资料,有些东西真的太宝贝了,就这么无偿的放在那,有很多很棒的资料已经不见了,我应该快点去保存下啊。
问题在于
它是冒出来的
不是成长出来的
“国运级” 的目标不在于热度不减,也不在于一直领先,而在于证明,你能做的我也能做,甚至做得更好。
“邱小姐”肯定是国运级无疑了吧,但你在乎她的当量么?你在乎现在装备的核武器的构型和设计是不是跟 “邱小姐” 一样么?
完全不在乎,但 “邱小姐” 出嫁的那天开始,核平衡已经发生了变化,敌人的核讹诈失效了,这就是 “国运级”。
又来了(摊手)
根据 “央视为什么不报道阿根廷” 理论,当然是越来越好咯。

认真回答,因为只有不懂行也不想懂的人会只依据热度评价好坏。某个张雪峰点名表扬的 “四权 +” 专业不在此烂炒而是转投其他话题了。
而真正需要 AIGC 的人和企业已经学着合理利用各种工具提高工作效率,包括但不限于 DS,从来就没参与过烂炒,热度也只是回到了它应有的水平。
哪怕单从宏大叙事,在爆火的那几个月内有能力突破英美封锁,打击 closeai,打击 N 卡股价,本来也算不小的功绩了,现在不火又怎样?
(反正 DS 在我司内部还蛮流行的,写代码很好用。)
(另外,不会有人觉得 gpt 等英美大模型不会编假数据假链接假知识,不搞任何 censorship 吧?大殖子是真的在讨论大模型还是纯为了反华而开提问烂炒,一目了然)

没有出问题,DeepSeek 现在还能维持在第一梯队。这就已经超额完成国运级任务了(虽然最近似乎被喂了很多奇怪的数据,有些许降智表现)
互联网声量小了只是因为那群没有接触过 LLM 的人过了最初的新鲜劲儿,开始日常使用,不再制造幺蛾子言论了而已。
初期宣传调门起搞高了,太美的承诺因为太年轻嘛。
新模型发布时,尤其涉及多模态等突破,蒸馏成本变态的低,自媒体、各社区、360 老周等等等等等,基于利益驱动,都出现国运级表述、使用颠覆性词语等夸张表述,其本质是用发震爆弹手法吸引眼球的短期流量行为,本质为自己无风险套利。
当用户大量实际使用时,越来越多的会发现模型存在明显技术局限,如复杂推理不准确、幻觉严重、中文长文本处理不完善、不能识别图片、图表等等,似乎又一姜萍在线阴影笼罩,热度自然下降,国运级别下沉到非国运级别。
如今每个月,国内和歪果仁都有新模型发布,比如国内的腾讯混元、阿里通义、月之暗、文小言、海外的 Claude/Gemini/Groq 持续迭代,城头变换大王旗,也就是早饭和中餐的间隔,DS 就像极端偏科的学神开始步履蹒跚,恶补大部分挂科功课,神话变白话。
目前 DeepSeek-Vision 图像理解功能确实未开放公开使用**,**截止 2025 年 8 月 23 日,DS 官网 / App 均无入口。
当下能识别图片的模型很多,如 GPT-5 都高调调推出了,但落地需考虑算力成本的,测算的图像识别成本比纯文本贵 10 倍以上。安全审核成本, 图片内容的风险远高于文本,DS 只能保障核心文本功能稳定。
当然除了歪果仁的 GPT/Gemini 等少数产品,多数国产大模型的图像功能仍处于内测阶段。
服务器成本的是要花钱的,处理 1 千字≈2 分钱,90%+ 用户拒绝付费,国内企业定制占比低很多。 字节豆包推会员制、阿里通义靠云服务捆绑、月之暗专注 B 端。然鹅 DeepSeek 仍在苦苦的平衡免费体验与生存压力,不赚钱,赚什么?赚个哪个,那企业发展后劲靠什么。
当媒体热度消退,自媒体,360 周们也吃光抹净,攃攃嘴,转战开吹某为某蒙,台词套话都熟,换个台头就行。炮弹 DS 投资人趋于谨谨慎,DS 用户从猎奇转向狂热下头、理性上头的实用主义。
DeepSeek 的这种火箭式一飞冲天,如来神掌砸下的舆论变化,映射了整个行业的理性化进程,是个好事情。当技术光环褪去,真正考验创新企业的是持续迭代能力与商业话落地速度我们都以实用工具而非革命神器的预期看待当前 AI 发展。
作为一个普通网民,我认为 deepseek 的确是国运级。缺点是某些社会政治相关的无法回答或者吞掉答案,还有幻觉较重的问题,其他都很好。
1 是知识类:以前需要花十几分钟的问题,绝大部分都会放弃探究。现在只需要几秒,就能得到相对正确全面的答案。我都不敢想,AI 时代成长起来的孩子们理应断层式的渊博胜于上一代。
2 是购物:作为了解少量硬件知识的普通人,几周前电脑的所有配件几乎都换了,都是 deepseek 推荐的性价比品牌且符合木桶原理。我现在买任何东西都让 ds 来参考。
3 是健康:几周前熬夜得了病毒性或者细菌性鼻炎,半个多月咳嗽鼻涕痰没自愈,自己花 10 元买了药 3 天就治好了, ds 帮我诊断开药的。以前一定是扛不住了去医院。
先不谈专业领域,仅仅是能引领十亿网民日常行为从平凡向高效精准跃升,怎么不是国运级,怎会无人问津?

现在国产 AI 大多都换成 DS 内核了兄弟。
DS 的母公司是搞量化的,他们靠炒股赚钱,那玩意来钱多快啊!
你不能指望一个赚快钱的公司去专心搞那种光投入,没产出的行当。
苹果不是吹自己创新而大卖的,是因为触屏开创者和优秀的系统。
大米不是南方人强制春晚上宣传而被大部分人接受的,是因为它比小麦更便捷的加工方式而被接受的。
大众丰田在中国,不是因为国产车垄断而跌下神坛的,是因为同比给的更多和现阶段使用成本更低而大卖的。
ds 还是挺火的,还是开源第一梯队。基层接入应用遥遥领先。。ds 公司重点不在商业和服务,有自己的创新理想,不在乎高原在乎高峰。ds 又是个小公司,不可能面面俱到。所以有些问题困难会解决的慢一些。。ds 甘当人梯和肩膀,让别人复制和优化,最早打破了资本垄断的暴利愿景。
今天听办公室里大姐聊天,说 deepseek 平时聊聊天还行,一问到自己专业问题就露出马脚了。虽然大姐不懂深度学习,还不懂自己本职业务吗?
之前 GPT 在海外爆火,国内普通人不容易接触到,直到 deepseek 出现,大语言模型算是破圈了。但是时间长了,ds 几斤几两也被摸透了,老百姓对大语言模型逐渐褪魅了而已。
因为简中网也就这样了,大伙都明白。
你说还怎么训练这玩意?结果只能与现在的小学数学似的,搞的跟语文加脑筋急转弯一样。
别说这只是个软体,就算是一个实体,就比如一把锤子,一个碟子,一扇门,一颗玻璃珠,在一个要求所谓正确与封闭的环境下,也会停止或者畸形发展。
不到啊,我问代码相关问题都是找 ds 的
你确定无人问津?
看了看其他回答,真是让人欢乐。很多人的认知不过如此。跟这些人生活在一起真让我有信心。因为我比这些人强。
DeepSeek 只是很少投流而已,热度过去了很正常。公众的注意力本身就是飘忽不定的。但要说无人问津,恐怕是题主想多了。多少现有服务就是以 DeepSeek-R1 为基础。人家作为老黄牛还在默默 carry。
这种问题是自媒体水军问题,或者是自媒体人视角的问题,识别它们方法是看的论据都不是来自身体验,而是援引第三方数据。也就是说它们自己并不以身入局,而是在自身毫无瓜葛的情况下,发问,下结论,引导舆论。
跟原神相关一样,它们只能干巴巴的复读——“原神快死了,9 月份有一个四个字的新游戏出来,会薄纱原神”。感情你们连 DeepSeek 用都没有用过,原神下都没有下载过呀。
下面的代码,连中文注释,都是 DeepSeek V3 写的,我自己写是不会有那么详细的注释的。

B 端用户不吃营销套路,DeepSeek 的目标群体但凡多看你们的话术一眼,那都是对他们专业的侮辱。
无非就是想要团建一下 deepseek 在外行心中的地位。可惜因为这是没有经济意义的无效流量,所以只能拿美国政府的微量财政拨款,不像黑华为和黑比亚迪,美国政府的拨款是微量的,他们的友商随便哪一家都拿出了远超拨款的钱。
所以各位可以发现,这个团建问题到现在都只有几百,和比亚迪和华为那种动辄几千的团建问题呈指数差距。这就是没有资本效益光靠财政拨款能达到的流量。
知乎用户 xxxxxiii 发表 把 1.6T 的级别大模型,免费地平等地不限量地无广告地快速地提供给世界上任何一个人 不管他的肤色,性别,国籍,信仰 把百亿级别的研究成果,不顾封锁,利益,直接开源权重,并且配套写了一堆论文来事无巨细的告诉 …
我考察了中国人工智能发展,美国无法赢得这场竞赛 作者:SEBASTIAN MALLABY 2026年4月13日纽约时报 2022年,拜登政府试图通过切断先进半导体供应来遏制中国的人工智能发展。特朗普总统则在没有明确替代方案的情况下,稍微放松 …
记者/佟晓宇 实习记者/栗子 苏茜 编辑/宋建华 大模型的运行机制对绝大多数被停机的用户而言是一个谜 去年9月,孔琳发现自己使用了10年的手机号被停机。她最初以为是欠费,但查询后发现仍有余额,客服告知她,她的号码被一个反诈模型录入。但为何被 …
知乎用户 环保的伐木工 发表 这篇文章更像是 Anthropic 自己的认罪说明。 首先截止到目前,联邦巡回上诉法院由法官 Patricia Millett 主笔的全体一致意见指出:蒸馏不违反 1976 年《版权法》。于是 Thaler 说 …
知乎用户 pola 发表 杀里长违法。 杀县令违法。 杀巡抚违法。 杀总督违法。 杀将军违法。 杀丞相违法。 杀皇帝违法。 但以上加在一起,就不违法了。 知乎用户 吴如翔 发表 在炎热的夏天砸碎别人锁好的车窗,违法。 从别人的车里抱走睡着 …