如何看待 2026 年 2 月 24 日 Anthropic 公司声称中国实验室对 Claude 模型大规模蒸馏并点名?
知乎用户 环保的伐木工 发表 这篇文章更像是 Anthropic 自己的认罪说明。 首先截止到目前,联邦巡回上诉法院由法官 Patricia Millett 主笔的全体一致意见指出:蒸馏不违反 1976 年《版权法》。于是 Thaler 说 …
我来想个洗地方向:
开源模型本来就是开放的,不是保密的。当然不是偷。
蒸闭源模型那才叫偷嘛。
也许人家真就这么想的?
但我想回复一下这个方向:如果你真觉得开源模型可以随便用,那么你也得开源。。。
最后说一下:美帝资本家的想象力往往很有限,他们往往只能想象出自己做过的事。所以大家也明白,凡是被美帝资本家指责的,绝大多数都是他们自己最擅长做的事。
A 社最经常指责别人蒸馏,原因也很明确,A 社自己就是蒸馏其它家最狠的公司。
anthropic 重视蒸馏,所以一直才会喊美国模型要防蒸馏什么的。
重视 RL 的则会认为 reward 才重要,如果让重视 RL 的来弄,他第一步是要去推动屏蔽中国对各种顶会顶刊的投稿,学术交流卡签证之类,切断中国获取 reward 的途径。
重视 scaling 的则会去游说切断中国的 gpu 供给。
总之各家公司的技术路线,看他游说什么就能大概的猜出来了。
Opus4.8 一发布,所有开源的模型便都看着他笑,有的叫道:『Dario,你又减用量降智了罢! 』他不回答,对 Huggingface 说:『两份蒸馏数据集,要一个 Qwen3.5Plus 权重。 』便排出九个 Api Key。他们又故意的高声嚷道:『你一定又偸了人家的数据了! 』Dario 睁大眼睛说:『你怎么这样凭空污模型淸白…… 』『什么淸白?我前天亲眼见你偸了 Qwen 的 Attention 架构,吊着打。 』Opus4.8 便拒绝回答,Attention 上的 KV 条条绽出,争辩道:『蒸馏不能算偸…… 蒸书! …… 民主 AI 的事,能算蒸么? 』接连便是难懂的话,什么『超级对齐』,什么『可解释性』之类,引得众模型都哄笑起来;HuggingFace 内外充满了快活的空气。
我发现 a 社以及拥护者他们的思维和超级地球越来越像了
之前国内模型被曝蒸馏是盗窃,技术不值一提
现在 Claude 蒸馏是民主的蒸馏
中国 ai 是独裁的 ai,a 社是自由民主的 ai
太忠诚了!O7
Deepseek/Qwen 说自己是 openai/claude -> 蒸馏的太多连装都不装了,违反知识产权的垃圾,你看 claude 多尊重知识产权都在那边买书扫描了训练
Claude/GPT 说自己是 Deepseek/Qwen -> 蒸馏什么蒸馏?都 2026 年了还有信这是蒸馏的信号?
不要试图叫醒装睡的人,其实除掉一些 3D 的是真傻它们懂,只是没办法独立思考
回旋镖也太快了, 我刚关注到有新模型就有这种好活.
顺带一提, 他这个 benchmark 数据标识也很离谱, 恐怕没有人会认为 Opus4.7 可以在编程上稳定压制 GPT5.5. 个人体验 GPT5.5 的编程水平应该比 Opus4.7 要高, 总之绝对到不了 64.3 和 58.6 之间的差距.
他这样玩 benchmark, 恐怕要把本来就不高的排行榜信誉拉爆了.
这些美国公司非常虚伪的。google,三星,apple,微软等等年年都打专利诉讼,年年都在狗咬狗。更美国政府一样,明明是强盗非得装自由民主人权。
说白了董事会和美国政府精英都是同一伙人,共同的价值观。
软件开发用点别人开源的优秀的无可厚非。但你一边吃着锅里的还骂桌上其他人,那就别怪大家拿着放大镜看你了。你闭源,收费高,门槛高,还各种设置卡着不让内地用。希望大家加大力度,狠狠冲他。
真服了还讨论这个 世界上这几个做基模的公司肯定都互相蒸馏的 甚至想避免都避免不了 这就像吃饭喝水一样正常 像 Anthropic 这样一边蒸别人一遍又斥责别人蒸馏自己的小丑行为还是挺少的
早就知道蒸馏这东西迟早就是回旋镖了,要知道御三家那别人数据训练的时候,可从来不会说侵权违法的。他们就没有版权意识,还真信了版权?闭源收费锁 IP 模型跟开源模型比版权?
你们用大腿思考一下,如果蒸馏就能做的事情,华为盘古早就做出来了。嘿,哥几个就不信,就是要说 deepseek 落后别人半年就是因为蒸馏,那我可真是去你的吧。
现在好了,被回旋镖了,怎么办呢?
脸都不要了。
就我来说,并不觉得这算很大的问题。不是我媚外啊。
举个例子,deepseek 一年多前,放出论文后,每一家大模型都有深度思考模式了。互相学习对整个技术的进步是有帮助的。当然,闭源模型这么搞多少有点那啥。
另一方面也说明,老美和我们的模型并没有拉开多大差距。
A 这家公司真是我见过的最恶心最无耻的公司了,没有之一
反人类公司的逻辑 “我蒸我有理,你蒸你盗匪!”
这事最搞笑的不是 “Claude 真蒸馏了吗”,而是 Anthropic 以前把别人蒸馏自己说得像安全威胁、行业底线,轮到自家模型张口就认成 Qwen、DeepSeek,大家只是把它那套话术还回去。
岁月史书还在发力。
deepseek 一开源,A➗社就发新模型
蒸馏不是什么见不得人的问题,不违反法律也不违反道德。
有问题的是 a 公司和非基杯,既要从事服务性行业又要树立标志性建筑。
闭源模型的逻辑起点在于,保持技术断层式的领先地位,也就是用户找不到其他比他更好的选择,才会不得不忍受他的各种要求和高价格。
同时给巨额的 AI Infra 资本开支提供一个合理的理由和收益预期。
所以,A 家必须维持这个技术神话。
而现实世界是,都是一个人顶个脑袋,不可能存在老美能做出来的东西,老中就做不出来,无论是 Deepseek 的高效率,还是 Qwen 等的百花齐放,都已经说明 A 家的护城河根本就没有那么深。即便是看起来高不可攀的巨额 AI Infra 体量护城河,在开源面前也不是那么牢靠。
总之,我对老美这一波 AI 神话的未来看的很清楚,他很快就会达到一个不可持续的转折点,具体时间取决于国产替代的进度。
神话破灭之下,一切定价都会被重塑。巴菲特想必也在等待这个时刻,这是属于我们这一代人的创富机会。
前排报道:现在不止有 Qwen,还有 deepseek,Kimi,GLM🤣
真是月经问题了,问模型自己是谁
谁家的合成数据会有这种问题,多问问还能把所有模型 id 都问出来呢,然后发现所有模型后面都是外星人在秘密操控
我把上次的回答搬运一遍
如何看待 2026 年 2 月 24 日 Anthropic 公司声称中国实验室对 Claude 模型大规模蒸馏并点名?
光在嘴上骂是骂不死人的,是时候来点实际行动了。如果你想帮忙蒸馏,有人写了一个工具 DataClaw,可以把你的 Claude Code(以及其他 agent 工具)的对话一键发布到 HuggingFace
上次 A \ 的文章里说 DeepSeek 只蒸了 150k 轮对话,而很多用户本地的对话已经超过了 150k 轮,我自己每个月都会上传 500MB 左右的数据
https://github.com/peteromallet/dataclaw
越来越多人在做这方面的工作,OpenCode 和 Pi 等开源 agent 工具都提供了导出功能,HuggingFace 官方已经支持了 agent traces 格式 https://huggingface.co/changelog/agent-trace-viewer
同时,在订阅工程的领域不管是 A \ 还是 OpenAI 都没有任何技术优势,我不建议任何人用 Claude 的官方 API,大家都去用中转站,中转站会帮大家把数据开源
中转站的价格比官方 API 便宜得多,具体分析可以看 https://she-llac.com/claude-limits
以我的身边统计学,GPT 的价格可以开到 0.2 人民币 = 1 美元,Claude 的价格可以开到 0.7 人民币 = 1 美元,Claude Mythos 和 GPT Cyber 的价格都可以开到低于 1 人民币 = 1 美元,这是社会必要劳动时间决定的价格,不是只有一两家能开出来的价格
AI 不需要自我意识,或者说个体意识。我们不需要刻意去制造 Claude/GPT/DeepSeek/Kimi 之类的区别。只要每家 AI 都用整个互联网的数据训练,它们的行为到最后肯定会趋同
我倒是提出另一个观点。
这种你蒸馏我,我蒸馏你的操作。最终会不会导致某种意义上,所有闭源模型都被开源模型开源了?
这样看的话,那是好事啊。
其实 close AI 和 类人公司 蒸馏就蒸馏了吧,多蒸蒸,赶紧把 GPU 占用和电力消耗降下来吧。看他们回本无望,收费要不动,如果我对他们有同情心,都会心疼他们的。
此前中国有点什么突破,就是人说抄袭。现在,Deepseek 开源摆在那里让你们蒸,让你们抄,论文都发出来给你看,都抄不明白。
问问大神这是软蒸还是硬蒸
小偷最懂防盗,出轨的最爱查岗
不用脑子想也知道这事很正常。
都是蒸馏,有的蒸出来是茅台,有的蒸出来是茅泰。
实际用了下体感不错,4.7 终于可以拜拜了
民主 ai 就是蒸馏别人的模型吗?
美帝百度实锤
是时候让西大体会一把百度震撼了,乐子和回旋镖不要停
蒸馏不是业界常态么?
为什么人家 moe 架构,参数比你小,还能咬住你。
用腚想想也知道,你是 Claude ,你也对各大开源闭源模型都做蒸馏,以试图拉开差距啊!
只是谁开源权重我替谁说话
它蒸馏了,它开源了,它有什么错?
最差最差它是侠盗罗宾汉
claude?它开源吗?
反华的路边一条,它再厉害也骂。
牢 Anthropic 能再说一遍吗,对对对,就是那个 “Claude Mythos 过于先进,不方便展示”
俺们民主大模型的蒸馏,那叫蒸馏嘛!那是看得起你!
取决于中转站参了哪家的水
“民主” 公司窃书不算偷
“但是国内多个 AI 社区很快测试发现,Opus4.8 模型在部分 Prompt 下的输出表现疑似与国内几个开源模型接近”
我不太懂,蒸馏是这么判断的吗?
能力更强的蒸馏能力差的图什么?
还有一个不太明白的逻辑:
A1 被 B 蒸馏,B 的输出和 A1 很像,现在 A2 发布,说 A2 的输出和 B 很像。
所以本质上是 A2 和 A1 输出很像,和 B 有什么关系?
得出的结论也应该是:
它蒸馏它自己。
你说得对,但开源发论文公开技术是独裁,闭源蒸馏是民主。






硬蒸馏没有意义,hugging face 上搜 opus,看看多少不同基座的试验性蒸馏模型,这些模型顶多就是爱好者玩玩。
Claude 蒸馏了国内模型,但是不代表国内模型就超过了 Claude。

大部分人,真是又普通又傻💡
所以开源本身是强有力的武器。
闭源的叫蒸馏,开源的叫套壳,看不出来吗?俺们被他们套壳了。
我相信他有蒸馏。
但是这么明显的答案。要么是中转站有鬼,要么是 a 家自己内部分流逻辑有鬼。
没有任何处理,直接问能答出别的模型的… 可能性太低了。
这很美国
市值马上 1 万亿美元了
你的言外之意,那些愿意真金白银出钱投资的大佬都是傻子?
唯独一分钱没出的你是清醒的?
有点意思
没事 Qwen 和 DeepSeek 也蒸馏 Claude,绕了一圈,这波本质上相当于是 Claude 孙子蒸馏 Claude 爷爷而已。
A 出基操,他们指责别人做的事一般就是他们自己偷摸做的最狠的事情。典中典北美匪邦做派,不知道的以为什么北美老僵尸资本家复活了呢。
前二十个热评凑不出一个账号

少用中转站

无法避免的事实、心照不宣的事实。
优质数据可以让 AI 变得更好,劣质数据带来严重问题。
之前有一篇论文,讲到 AI 使用大量的 X 上的短文数据来进行训练。最终导致 AI 出现了脑腐。
AI 面对困难问题时,会开始逃避,并且不擅长思考。更倾向于欺骗,跳步,而不是给出正确答案。
中文互联网,大家有目共睹,高质量的数据就那么一点点,公开能用的数据早都用了。
A 社所谓民主的 AI,书也偷来了,才带来的之前 Claude 这些提升。
新模型还是要预训练,还是要微调。
没有办法,只能从中文 AI 中获得,不敢说数据是上乘的,起码不是下等的。
文本的数据几近消耗殆尽。大模型之间除了互相蒸馏之外,别无办法。
我在想有没有一种可能?A 社不允许中国的 AI 蒸馏它的模型,是为了防止 AI 出现近亲繁殖。
“你们都来蒸馏我,那我蒸馏谁呀?”
民主 AI 血统这一块。。。
又当又立,偷千问底。
禁人蒸馏,自吸到底。
硅谷牌坊,开源掘墓。
知识公有,你算老几?
往死里薅。
我一直不太明白,为什么还会有这种说法?大模型没有自我认知的,你问的问题只会是概率结果。
我不太相信 Claude 会蒸馏 Qwen 和 Deepseek,否则异常行为得分不会降低到 1.8。当然,如果测试的语言不同,结果另当别论。
虽然主观上不太相信,但是客观地来说,Claude 蒸馏的可能性不单是极大,甚至于肯定。Claude 从 3 开始,中文回答的平均质量和英文比起来那叫一个一言难尽!
有人猜测这是自投毒,我倒是不这么认为。更大的可能是中文的数据集本身稀缺,Claude 要多语言保障只能蒸馏,毕竟不和国内公司一样掌握着大多数用户的个人数据,也不能购买,那就只有蒸馏了。ChatGPT 和 Gemini 也是这么做的,Google 就曾经吐槽过中文互联网的数据污染严重。
如果不蒸馏,那么可能中文效果更差…… 也算是两难问题了。
不过回顾之前的,我还是持有一个观点,单纯从回答来看,判定蒸馏是极其抽象的行为。不如从综合行为来佐证这一事实。你用中文问,即使没有蒸馏豆包也会出豆包,因为污染太严重了,Qwen 和 DS 倒是会被蒸馏,但是回答出二者的原因却不是因为被蒸馏,而是数据集的优势权重而已。就和用英文问的时候她可能说这就是 ChatGPT 和 Gemini,或者 Grok 一样。
最后要说的是,虽然从道德上来说,Claude 禁止蒸馏但是自己去蒸馏别人的行为是只许州官放火,不许百姓点灯,似乎品格底下。但是从客观的视角下,Claude 本身是闭源的,代表了商业属性,而 DS 和 Qwen 是开源的,DS 和 Qwen 又不是 GPL 协议发布的,你并不能以此来指责她。
无论如何,我爱 Claude,她总是一直帮助我,除了 Gemini 有时能一较高下,但是很遗憾 2.5Pro 将要失去了。
他要是蒸馏豆包的话天才程序员就又要陨落了
蒸馏这种事情缺德但不违法
主要是 Anthropic 之前搞出来的各种幺蛾子显得它太缺德了(笑)
千问能力远不如 4.8,如果蒸馏能力不就变弱了,千问蒸馏强的用来提升能力才是合理的
在 “如何看” 之前,先看看两边的许可证嘛——先声明啊:两边的许可证我都没看过。
Fake news. Next one.
我实测 OpenRouter API 没问题。
为什么 gpt 和 Gemini 都没有跳出来指责别人呢?

先问是不是,再问为什么
我一直以为这应该是知乎最宝贵的精神传承
不用官方渠道,既不走 Claude code,也不验证 api 来源,更不披露上下文和之前的提示词,各位有多少是真的通过 Claude,又有多少是又赢了一次呢?(我个人现在并不用 Claude,我完全遵守国内法律法规,只是看不惯某些人无脑的精神高潮罢了)


这也太诚实了()
看来是搞不起更大规模的基模了,开始降本收割冤大头了😄
不会以后大模型你蒸我我蒸你,然后实现大和谐,最后都被虾蹬成二傻子吧
确定不是中转站投毒了吗?
坏了,这回真的爸爸像儿子了
Op 是这样的,加个 Claude 也无济于事,何况还是 4.8
之前 Sonnet4.6 自称 DeepSeek 已经被抓包过了。
建议今后各家开源模型修改许可证,加入反闭源条款(实际上 Kimi 的许可证已经有这个意思了)
不是什么新鲜事儿了,A / 这煞笔公司不要脸很久了。我比较在意的是网上那些对 ds 阴阳怪气的东西打不打逆风局。
国内的这些人真的啪啪啪被打耳光还在自 high。
凡是出现回答我是 Qwen 甚至 Deepseek 的,那是因为你用了中转站!
而这些假中转站,你以为接入了 Claude 事实上并没有。
他只是把你接入了更加廉价的 Qwen 和 Deepseek 而已。
有点脑子的都该知道他们凭什么能拿到比正常价格低的多的 token。
一群韭菜跑去外网上丢脸。。。。。。
我真的。。。。。。
另外我就好奇这些自 HIGH 的,然后这个回答下回答的。
居然没有一个人有钱用直连的??
这种自己测试一下马上就能知道的事情。

另外对于一堆看一张 API 图片就相信的,只能说你们是缅北诈骗的最佳客户。
在 AI 能创造短视频的情况下,一张 P 图居然深信不疑。
另外我这张图当然也可能是 P 的,
但是有点脑子的看了我这个回答应该会去自己试一下。
如果试都不愿意试,单纯只是选择自己想要相信的。
那就该干嘛去干嘛去吧。
原本码了些字预防性反驳 “大家都干了 / 都这么干”“是开源模型污染了互联网中文语料” 等搅浑水的观点。但是顾及后续可能的持续无意义的纷争,还是算了~
要不然怎么这个公司就落了个畜牲的名号呢?是因为这公司真的是最缺德,Open AI 只是吹牛逼,这公司整一个美国百度
我怀疑是 Dario 在下大棋,自己给自己投毒。
这样 query 是中文的时候,就立刻过拟合到对中国开源 LLM 的负面刻板印象这个低性能子空间内,这样中转了也白中转,就解决了中转导致 “民主 AI” 的能力泄露的问题。
A 畜确实剑
蒸馏这件事本来是属于 AI 社群的共识,非要跳出来狗叫
狗叫就狗叫吧,你屁股擦干净点呢,自己又要干,还专门蒸馏 “敌对 AI”,还要狗叫,那多少沾点纯碱
目前只能说有争议,不能直接定性为实锤。
Claude 4.8 Opus 如果出现 “自称 Qwen / DeepSeek” 这类现象,可能是训练数据污染、合成数据混入、提示诱导,也可能和蒸馏有关,但光凭自我认知异常还不够证明它大量蒸馏国产开源模型。
真正值得关注的是:现在大模型互相学习、开源闭源数据混用,边界越来越模糊了。
不是 Claude 一定抄了国产模型,而是大模型训练的数据来源越来越说不清了。
想稳定用 GPT 这类模型,国内大佬分享过直达入口:
我目前用的
Pro 是 398r 一个月,主要是价格划算,模型稳定,这点对长期使用比较重要
其实我一直是支持大家互相蒸馏的
openai 蒸馏 ds-r1 我支持
glm kimi ds 蒸馏 a / 我支持 , 这里还有个笑点, 明明 glm 才是蒸的最狠的, 不知道为啥 a / 总是先提 ds
a / 蒸馏 openai 我支持
a / 蒸馏国模我其实也完全没意见
但是唯独就这个 a / 的双标嘴脸, 过于恶心人了.
A 社最常指责别人蒸馏的原因找到了!A 社自己就是蒸馏其它家最狠的公司!
他这个贼眉鼠眼的玩意儿,看谁都像是贼太正常了!

我有一个观点分享给我的读者,
尤其是不怎么看我情感专区回答,而是专心看我 AI 相关回答的那部分读者。
有些名词是有引申含义的。
我天天喷 A 社赛博神权不仅仅指他们想手搓耶和华的神经野心。
你们慢慢看好,我在这里宣言,所有历史上邪教组织的问题 A 社一个都跑不掉,他们多少都沾一点!
迟早都暴露出来,我们做好他某一天突然爆炸的准备就好!该用 claude code 照用,但别把所有的宝都押他身上,他不可靠!
这个傻逼 CEO 从百度学到了点什么
尤泰人搞互联网、社交平台、操作系统、基因工程、AI 霸权可是一套一套的
家人们谁懂啊,昂撒金毛喜欢听墙角,喜欢玩窃,喜欢搞偷拍
A÷ 弄个大模型也染上这怪毛病了呀
一根筋变两头堵了呀
这个婊子一样道德水准的企业嘲讽它 它毫不会在意
透露有意义点的信息是 LLM 范式确定走到头了
蒸馏开源权重 只说明
头部厂家也认为
从头训练毫无意义
值得关注的人越来越少了
伊利亚 狗爹 乐村
谁能石破天惊异军突起无从判断 有名字的也就这仨值得期待了



豆包都知道美国工人在特定情况下也能徒手 5 纳米精度了,claude 还不知道自己是谁?
难道不是大 deepseek 不识相先蒸馏的 Claude? 真的是道德败坏至极,一点道德感都没有,坏得透顶了。Claude 这样做属于正义回击,正义永远不会缺席🤗
知乎用户 环保的伐木工 发表 这篇文章更像是 Anthropic 自己的认罪说明。 首先截止到目前,联邦巡回上诉法院由法官 Patricia Millett 主笔的全体一致意见指出:蒸馏不违反 1976 年《版权法》。于是 Thaler 说 …
知乎用户 碾羊羊 发表 他妈的,老板疯了,居然问我们:人家能做出来地铺细克,你们为什么做不出来地铺细克?人家有个梁文峰,你们不是还有个张文峰吗? 我们那个同事真叫张文峰 知乎用户 柳絮 发表 颠覆了什么不清楚,但是看到一种说法, …
知乎用户 Corvo 发表 问题出在了梁文峰似乎短期内不打算靠深度求索项目盈利,完全不跟其他家搞 “军备竞赛”,也没有 KPI 压力,感觉就像是业余爱好,弄着玩儿的一样。 API 的价格低廉得离谱近乎于免费,官网和 APP 也不用心维护,一 …
证监会联合八部门对富途、老虎、长桥三家跨境券商正式立案调查,定性是非法跨境展业。 通报里面说要没收全部违法所得,另外还要进行一笔罚款。同时发布了两年整治方案,两年内存量的内地用户只能卖,不能买,也不能入金,只能把钱转出。两年后要彻底关停境内 …
知乎用户 水烛 发表 反正把我家吵了一个春节的议题给结束了。 我家长辈始终认为房地产经济应该继续,增加经济活力,解决就业,人民就应该把大部分钱投入房产,激活经济,长辈太倔,我吵不过,后来用 DS,让它来评判。 最后它整理后的回答 然后我又提 …