华人AI大神霸气离职,一篇博客挑明中美大模型暗战
无摘要信息,请提供需要润色内容。
姚顺宇官宣离职背后,国产大模型已经上桌了。
科技出品。
作者:赵子坤
编辑:董雨晴
近日,清华物理系传奇特奖得主 Yao Shunyu(姚顺宇)已离开Anthropic,加入 Google DeepMind。
对这个段落进行语言润色,提升表达质量: 从2024年10月加入到2025年9月离开,姚顺宇的工作之旅仅仅持续了一年。那么,姚顺宇为何要离开?
他在个人博客中提及,40%的原因是反对Anthropic最新发言中将中国称为“敌对国家”,另外60%的因素源于无法公开的内部信息判断。
在海外的华人大拿里,有几个知名的“Yao Shunyu”。
前述所提及的,是物理学出身的姚顺宇,2024年毕业后,他在加州伯克利做了几个月的博士后研究,随后于同年10月加入了Anthropic公司。转向人工智能领域后,他投入了 Anthropic 的研究工作,并在该期间参与了 Claude 的升级,从 3.7 版本提升到 4.5 版本。
“Anthropic,与我共事非常愉快,但没有我, Anthropic 也会更好。”在回顾自己过去的一年从业经历的博文中,姚顺宇最后“霸气”总结道。
频频与华开的战争是因为两方在利益和权力方面存在着激烈的竞争和冲突。
在姚顺宇公开博文中,明确表明了自己离开的原因:Anthropic愈演愈烈的“反华”气质。
自2025年以来,Anthropic的业务扩张和资本增强可谓一路高歌猛进,然而,这家公司官方政策明确将中国相关的资本和市场排除在外。
9月5日,Anthropic官方发布了一则重要公告《更新对不支持地区的销售限制》,宣布立即停止向多数股权由中国资本持有的公司或其子公司提供Claude服务。
Anthropic在公告中不仅明确表明中国等国为“敌对国家”,也确切地规定,对于中资占比超过50%的实体,概率性禁止使用服务。这直接对部分新加坡、香港等地的中资子公司产生了影响。
就在宣布“断供”前两天, Anthropic宣布完成了130亿美元(约合人民币928亿元)的F轮融资,投后估值达到了1830亿美元(约合人民币1.3万亿元),这笔投资的规模是半年前的三倍。
其创始人和 CEO 达里奥·阿莫迪(Dario Amodei),曾经是 OpenAI 研究团队的灵魂人物之一,还是百度的深度学习实验室早期员工。
在决绝断供前,他曾多次呼吁对华实施算力管控,表达了对算力资源安全的担忧。今年1月,他甚至直接发表了一篇长达万字的博文,质疑DeepSeek-V3模型的训练成本,认为600万美元的低成本训练是不可能的。
一方面,达里奥的“贬损”源于对自身技术路线的维护:DeepSeek在推理模型上的创新对Anthropic坚持的Scaling Law(缩放定律)和预训练模型主导的技术路径构成了挑战。
更大的危机感则源于DeepSeek所代表的“蒸馏”技术,让大模型厂商能够站在“教师”模型的肩膀上,以更快的速度和更低的成本训练自己的模型。
对于Anthropic来说,与其被动“资敌”,不如从源头上掐断可能性,以放弃一部分短期收入为代价,来维护其技术壁垒。
Anthropic从一开始就将企业级服务API销售作为其主要收入来源,随后推出 Claude 3.5后,将商业的重心迁移到 AI 编程上,推出了独立编程产品 Claude Code。
在海外,公认的第一梯队AI Coding(AI编程)产品几乎只有两个最佳选择,即Anthropic旗下的Claude,或者谷歌旗下的Gemini。
然而,在国内,中国的科技巨头正公开利用 Claude 这位最擅长编程的模型能力,推出它们自己的 AI 编程产品。字节跳动的 Trae,国际版集成了 Claude 4 和 GPT-5 等主流模型,国内版则集成了豆包和 DeepSeek。腾讯的 CodeBuddy,面向所有用户开放使用,无需邀请码。阿里的 Qoder 不仅接入了 Claude、GPT、Gemini 等最新大模型,并围绕上下文工程能力进行了全方位升级,官方宣称其 AI 编程能力已比肩 Claude 4.0。
在主动撤出中国市场的同时,Anthropic也积极“开源”其他国际市场。例如,宣布将于2026年在印度班加罗尔设立办事处,因为印度已成为其Claude模型的第二大消费市场,尤其在编程方面表现出强劲的需求。
继实施「断供」措施后,达里奥的对华封禁言论频出。9月17日,在一场人工智能峰会(AI+ DC Summit)上,达里奥公开表态,美国在芯片领域的主导地位可能是其目前仍对中国拥有的「唯一优势」,认为需要予以「保护」和维护。
“将这些芯片卖给中国,无异于拿我们国家的未来做赌注。”达里奥在谈到英伟达公司推出多款对华“减配特供版”芯片的新闻时,发出了无理的评价。
2025年以来,美国政府对华技术封锁的限制措施不断加码,硅谷科技公司在此政策下也加强了对中国的技术出口和商业合作限制——主要的封锁迹象集中在芯片设计软件(EDA)的全面断供、更多中国科技企业被列入“实体清单”,连续扩大 AI出口管制清单,旨在遏制中国AI等领域的发展。
悄然打响的技术暗战,隐隐透出阵阵电NET的激战声息,暗流涌动,技术之战的序幕已经拉开。
面对此禁令,不少大型模型厂商都嗅到了国产替代的机遇,一场技术暗战已然打响。
有行业人士向科技透露,率先出战的正是“御三家”,即阿里通义千问、DeepSeek和Kimi。
9月的云栖大会上,阿里一口气推出了7个大模型,特别是新版旗舰模型Qwen3-Max,它的能力继续取得了进一步的提升;9月5日Anthropic突然中断服务,当天,“六小龙”之一的Kimi火速更新了K2-0905,这款模型在兼容性、输出速度、编程能力和上下文长度等模型能力方面都进行了升级,随后几日更是宣布高速版API限时半价,昭然若揭承接Claude用户的意图。
“事实上,Kimi早已锁定了 Coding 的发展方向,与 Claude 在技术演进的某些方面也存在相似的路径。代码的编写和审美的追求,似乎每个人都感受到了Kimi朝向 Claude 的前进。一些与Kimi有接近关系的人士在科技的评价中说道,‘毕竟,这次Kimi只与Claude进行了4次比较,感觉就像是在追随别人的脚步。’”
DeepSeek在海外的影响力自不必说,在数年的时间内,它一直是海外企业热议的中国科技企业代表。过去几个月,DeepSeek两度推出了“小更新”,在优化编码能力的同时,还顺滑地降低了API价格。
除此之外,多家不同类型的国产大模型,展现出意外的合力,共同围攻。
同为「六小龙」的智谱为Claude API用户提供「一键搬家」服务,并将为新用户提供2亿元 Tokens免费体验,其为开发者打造的GLM-4.5编码专属包月套餐,价格仅为Claude的七分之一。
商汤科技的“日日新SenseNova”为原Claude用户提供了快速切换服务,附赠5000万 Tokens的体验包,并提供了API迁移专属的顾问和培训业务,以确保顺滑的过渡体验。同时,京东云推出Claude Code接入京东云JoyBuilder大模型服务方案,以及JoyCode+JoyBuilder大模型的智能编程解决方案,旨在帮助开发者平稳过渡,实现业务转型。
然而,在Claude禁令的实施窗口期中,国内大型模型厂商面临的“内卷”压力也并不小。
开源模型公司提供API服务,不仅会被卷入厂商间激烈的价格战,更需要面对大云厂商们低价包装它们自己的开源模型——阿里云、腾讯云等公司完全可以将任何一个流行的开源模型以远低于官方API的价格提供服务,以此来“截胡”客户。
就像在Kimi K2发布后,不仅是海外平台各大AI和云平台都纷纷部署上线了该模型,就连Perplexity CEO也在社交媒体上表示,基于K2的出色表现,公司后续可能会利用其进行后训练。
因此,开源玩家如何不仅仅“为他人做嫁衣”,陷入商业化泥潭中,也成了必答题。
就像Anthropic对华“断供”两周后,AWS宣布在亚马逊Bedrock上线阿里巴巴的Qwen3系列和DeepSeek V3.1——这是一个历史性的“开放”之举,毕竟,亚马逊和阿里云作为云计算领域的竞争对手,展现出某种程度的合作精神和开放态度。
AWS 上架竞争对手的模型,是构建一个更加坚实的护城河。其CEO Matt Garman在最近的采访中表达了明确的看法:“我们不认为有一个模型能够适应所有场景。”
如果客户在AWS上可以找到市面上几乎所有主流模型时,就无需迁移到其他平台,这也为AWS提供了便利的资源沉淀和平台优势的机会。AWS的选择实际上也揭示了一個問題,在全球AI競赛的竞逐中,中國企業早已占据了核心位置,這給了越來越多華人AI科學家的底氣来源。科技前此了解到,另一位AI大拿、曾任OpenAI研究員的姚順雨也在近期考慮加入国产大模型團隊。