2026年5月,中国AI大模型赛道两枚重磅炸弹同时引爆:DeepSeek首轮融资目标直指500亿元人民币,投后估值有望突破3500亿元;月之暗面(Kimi)则以20亿美元D轮融资刷新纪录,投后估值超200亿美元。两大事件叠加,标志着中国大模型竞争正式进入“诸神之战”阶段。

1、DeepSeek:从“不差钱”到“主动融资”

DeepSeek此前是中国大模型圈最独特的存在——创始人梁文锋凭借量化交易收入自掏腰包,婉拒了无数投资人。然而2026年的局势让他不得不改变策略。

首先是人才保卫战。字节、小米等大厂以数倍薪资挖角DeepSeek核心研究员,没有股权激励机制的DeepSeek留人日益困难。融资成为建立员工期权池、稳定军心的必经之路。

其次是生态壁垒构建。DeepSeek正在深度适配华为昇腾芯片,打造“模型+芯片”的国产AI基础设施闭环。这条路径所需资金规模远超个人出资能力。

本轮融资的核心数据令人咋舌:目标500亿元人民币,由国家集成电路产业投资基金(大基金)洽谈领投,腾讯、阿里巴巴等互联网巨头参与跟投。创始人梁文锋本人也将出资至最高允许额度,以保持控制权。若完成,这将是中国AI公司历史上最大单笔融资

技术层面,DeepSeek V4与Kimi K2.6包揽全球开源模型榜单前两名,API价格仅为竞品的1/20。黄仁勋在CES上首次以DeepSeek和Kimi作为基准模型展示,标志中国开源模型获得全球认可。

2、月之暗面:从追赶到领跑的资本跃迁

月之暗面的融资故事同样精彩。D轮融资20亿美元(约136亿元),由美团龙珠领投,中国移动、CPE源峰参投,累计融资超376亿元,成为中国大模型创业公司中累计融资最多的玩家。

更值得关注的是其商业表现。Kimi ARR收入从3月初突破1亿美元,到4月已超2亿美元,付费订阅和API调用双轮驱动。技术层面,Kimi K2.6采用1T参数MoE架构,32B激活参数,多项基准测试持平甚至超越GPT-5.4和Claude Opus 4.6,夺回开源模型全球第一宝座。

半年内估值从50亿美元飙升至200亿美元,翻4倍有余,资本市场的热情可见一斑。

3、“AI六小虎”分化加速

融资潮的背后,中国大模型公司正加速分化:

  • DeepSeek、Kimi:走技术基础设施路线,开源生态+API变现,占据独立发展空间
  • 智谱AI:深耕政企B端,MaaS ARR达17亿,但亏损近50亿,港股上市后承压
  • MiniMax:C端全球化,C端收入占比超70%,已登陆港交所
  • 百川智能:转型AI医疗垂直赛道,退出通用竞赛
  • 零一万物:业务大幅收缩,转向轻量化定制

竞争格局已形成三层结构:第一层是字节(豆包)和阿里(千问),凭借流量和云生态占据通用AI入口;第二层是DeepSeek和Kimi,作为技术基础设施供应商独立发展;第三层是其余参与者,转向垂直应用层求生。

4、数据背后的全球格局

2026年Q1,中国大模型全球周调用量达12.96万亿Token,为美国的4.3倍。全球API调用中,中国开源大模型周Token占比超60%。Artificial Analysis榜单全球前五开源模型全部为中国模型。

这些数字说明一个事实:中国大模型在应用层面已形成压倒性优势,但基础研究和底层芯片仍是短板。这也是大基金领投DeepSeek的战略意义所在——通过资本力量补齐算力和芯片层的关键缺口。

5、从“谁更聪明”到“谁更有用”

当前竞争焦点已悄然转移。纯粹比拼benchmark的时代正在过去,真正的较量在于谁能把技术转化为持续的商业价值。

DeepSeek计划6月推出V4.1版本,新增MCP协议适配、图像和音频理解能力,剑指企业服务市场。Kimi则凭借K2.6的Agent能力实现“连续编码13小时、自主运行5天”,在生产力工具赛道抢占先机。

与此同时,大厂持续加码——阿里3800亿、字节1600亿资本支出——独立AI公司的生存空间受到挤压。行业并购整合或将成为大概率事件。

资本潮水退去后,真正能站住脚的,不是融资最多的,而是技术创新与商业落地双轮驱动的玩家。2026年,是中国大模型从“技术突破”迈向“规模商业化”的关键转折年,这场诸神之战的结局,将在未来12个月内见分晓。

参考来源