更为重要的是,中国AI芯片厂商已经在推理场景上找到了部分切入口,比如在功耗、性价比、特定模型优化方面做文章,取得了一定成就,但不能忘记,距离芯片的核心技术提升,仍有很大的距离。
中国的算力芯片发展是一场没有硝烟的科技长征,从“跟随者”到“并跑者”的跨越,每一纳米制程的突破都是对极限的挑战,芯片厂商们既要突破“卡脖子”的技术封锁,又要构建自主可控的产业生态,这场硬仗考验着中国芯片人的智慧与韧性。
芯片是数字时代的石油,算力是智能社会的基石。从行业层面看,此前美国对华芯片出口限制与英伟达H20安全约谈、停产事件,为国产AI芯片创造了关键市场真空。在AI芯片这个万亿级赛道上,2025年的全球格局将呈现出微妙的权力重构。
虽然英伟达在中国市场上依然占有主流,垄断高端训练市场,但华为昇腾Mate60系列的惊艳亮相让世界看到其技术底蕴,而寒武纪在地缘政治背景下,其“英伟达平替”价值开始被市场重新发现,在资本市场气势如虹,促使其市占率逐步上升。寒武纪精准聚焦大模型算力赛道,云端智能芯片及配套产品踩中“国产替代”风口。
2022年年末ChatGPT横空出世引爆AI算力需求,2025年初,DeepSeek等国产大模型密集发布,掀起新一轮AI浪潮,显著推高算力需求,2025年上半年,人工智能算力需求持续增长。
从全球来看,AI大模型训练和推理需求爆发,海内外云厂商资本开支持续提升,有研究机构预测自2024年起未来5年的全球算力规模增速将超过50%。在全球产业趋势和国内产业政策双重推动下,中国算力规模高速增长,AI训练和推理算力正在爆发,算力总量位居全球第二,占比超过30%。
算力的核心是芯片,2025年,全球AI芯片规模有望达920亿美元,同比增长29.58%,有权威机构预计,2025年我国AI芯片市场规模将达380亿美元,2029年将增至13830亿元。其中国产芯片销售额预计将从2024年的60亿美元增长至160亿美元,增速高达112%,市场份额从29%提升至42%,2027年将达55%。
鉴于国产替代趋势,华为昇腾、寒武纪等国产AI芯片的地位将快速提升,那么,寒武纪目前在中国AI芯片市场处于何种地位?
先看一组数据:2024年中国AI芯片市场份额,英伟达出货量超过190万枚,占比70%;华为昇腾出货量超过60万枚,占比约23%;百度昆仑芯6.9万枚、天数智芯3.8万枚、寒武纪2.6万枚、沐曦2.4万枚、燧原1.3万枚,其他厂商的出货量均未过万。
因此,从销售量、销售额来看,寒武纪在英伟达、昇腾、昆仑芯之后,排名第四,当然,和前几名相比,寒武纪差距不小,但后生可畏。在国产替代中,国内客户通常会优先采购华为、百度、阿里等大型科技公司的AI芯片,并且2025年,百度昆仑芯3代、阿里APG智算芯片等国产AI芯片都在大规模出货。
然而,鉴于芯片对算力的重要作用,国内政企客户,通常不想被单一供应商绑定,寒武纪是大型科技公司之外的一个好的选择。并且,华为、百度、阿里做芯片,是集团多元化的一项产业,它们还有主业,并不会全力以赴,而寒武纪只有芯片一种业务,肯定会不惜一切代价而硬拼。
寒武纪作为智能芯片领域的上市企业,一直致力于技术创新与产品研发,以满足市场对高性能、低功耗AI芯片的需求,产品已广泛应用于服务器厂商和产业公司,面向互联网、金融、交通、能源、电力和制造等领域的复杂AI应用场景提供充裕算力。
寒武纪2024年推出了思元590芯片,对标英伟达的A100GPU。那是一款采用7nm工艺的国产芯片,应用ASIC架构,支持512TOPS的算力,在推理场景能效或超越国际巨头,几乎支持所有国内主流大模型。据说,寒武纪思元590已应用于字节跳动、百度、阿里云等企业的云端大模型训练,以及省级智算中心项目等。
百度内部测试结果显示,思元590在某些大模型训练任务上的表现已非常接近英伟达A100芯片;即便在相对弱势的场景,其性能也能达到A100的一半左右;整体性能大致可达到A100的80%水平。
寒武纪的芯片及产品还有价格优势,思元590芯片售价为6万-8万元/枚,八卡服务器不超过100万元/台,定价略低于其他国产主流AI芯片——比如,目前昇腾910系列八卡服务器约为140万元/台,昆仑芯三代八卡服务器约为130万元/台,阿里APG16卡智算服务器约为180万元/台。
2024年寒武纪云端芯片出货量约2.5万颗,截至2025年第一季度,寒武纪云端芯片出货量预估超过3.1万颗,另据高盛预测,2028年寒武纪云端芯片出货量有望突破百万颗。
目前国企央企和运营商牵头在国内继续投建智算中心,鉴于安全考虑,新建数据中心现阶段把国产AI芯片作为首位选择,第一要求是“可用”。其实,进入2025年,国产AI芯片的性能和成熟度正在稳步提升,从“可用”向“好用”迈进。据说,在我国政企算力中心的AI芯片的采购名单上,前三位依次为华为昇腾、百度昆仑芯、寒武纪。
寒武纪作为少数具备云端AI芯片量产交付能力的厂商,已构建涵盖芯片架构、训练推理软件平台、整机系统的全栈方案。从技术角度说,寒武纪主要产品包括思元590AI训练芯片、思元370系列AI推理芯片,思元590性能参数(TPP,总处理性能,Total Processing Performance)接近英伟达A100,略高于英伟达H20。
与DeepSeek合作开源FlashMLA技术,让大模型推理效率提升50%,2025年4月,寒武纪还通过DeepSeek兼容性测试,成为国内唯一支持新一代FP8精度格式的芯片厂商。
8月21日,国产大模型DeepSeek-V3.1正式发布,相关推文提及使用了UE8M0 FP8 Scale的参数精度,并且明确指出“新精度格式是针对即将发布的下一代国产芯片设计”,这句话被市场解读为直接利好寒武纪。
研发是迭代的基础,进步的武器。寒武纪持续保持高强度研发投入,上半年研发费用达4.56亿元,较上年同期增长2.01%,占其营收的比例为15.85%;寒武纪研发团队规模达792人,占员工总人数的77.95%,其中80.18%的研发人员拥有硕士及以上学历。
累计申请专利2774项,其中境内专利1783项、境外专利690项、PCT专利301项;累计已获授权专利1599项,包括1526项发明专利,同时拥有65项软件著作权及6项集成电路布图设计。在这个算力决定话语权的时代,真正的芯片王者终将由技术实力而非资本游戏铸就。
目前,寒武纪定增募资40亿,按照寒武纪所公布的计划,其将在未来三年内投入45亿元用于AI芯片及软件的研发工作,主要用于“面向大模型的芯片平台项目”“面向大模型的软件平台项目”,平均每年投入15亿元,以持续维持在技术层面的领先地位,但如何将技术优势转化为持续盈利,仍是寒武纪亟待解决的难题。