Title
您当前的位置: 首页 > > 文章详细
【国联民生计算机】Token“通胀”呼唤国产算力:“一芯二模三云”之“一芯”
发布时间:2026-04-19

  1.本周观点

  1.1 Token需求“通胀”:头部云厂商现涨价潮

  AI Agent时代Token需求的非线性增长,或直接带来超预期的AI算力需求,国内头部云厂商开始涨价,是需求端景气度持续提升的体现之一。3月以来,阿里云多次发布涨价通知:1)3月18日,阿里云发布AI算力、存储等产品调价的公告,将于2026年4月18日起对AI算力、CPFS(智算版)等服务价格进行调整。2)4月13日,阿里云发布公告,大数据开发治理平台 DataWorks 调整标准版、专业版用户的API免费额度并支持按量付费。3)4月15日,阿里云发布DDoS防护产品调价公告,为统一产品定价规范,决定于2026年7月15日起对DDoS原生防护2.0(包年包月)、DDoS高防(中国内地)以及DDoS高防(非中国内地)商品的弹性95功能进行价格调整。当天,阿里云还发布了部分模型单元服务涨价通知,将对部分 MU(Model Unit)模型单元的服务价格进行适度调整。

  腾讯、百度等云厂商也宣布开始涨价。1)腾讯:腾讯云将于2026年5月9日起对AI算力相关产品服务、容器服务TKE-原生节点相关产品服务、弹性MapReduce(EMR)相关产品服务价格均上调5%,覆盖云服务器CVM-GPU计算型、高性能计算集群GPU型、高性能计算平台THPC工作空间等相关规格全地域、全计费模式。2)百度:百度智能云将于2026年4月18日00:00起对AI算力相关产品服务价格上调约5%-30%,并行文件存储等产品价格上调30%,生效时间前已购买的相关产品服务当前计费周期内价格不受影响,新价格将在后续续费周期生效。百度千帆Coding Plan首购优惠活动库存已全部售罄,暂无库存供应,同时自2026年3月13日00:00起对白天高峰时段部分模型的调用进行限流处理,期间部分模型可能出现响应速度变慢、调用排队甚至失败情况,建议切换其他可用模型或错峰使用。

  Token需求“通胀”有望成为当前AI发展主线:根据人民日报的报道,国内日均Token调用量,从2024年初的1000亿,到2025年底的100万亿,到2026年3月已经达到140万亿。同时,政策大力支持词元发展。国家数据局近日发布公告,就《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》向社会公开征求意见,在创新行业高质量数据集商业模式方面,方案提出,推动商业模式从基础数据包销售向应用程序接口(API)调用、模型化解决方案及全栈服务梯次跃升。探索词元交易等新型数据集交易模式,构建以词元为基础,可量化、可定价的数据集价值体系。

  1.2 国产算力有望加速发展:景气度提升与算力架构革新

  国产算力龙头业绩保持快速增长态势。1)寒武纪:收入从2018年的1.17亿元增长至2025年的64.97亿元,归母净利润则对应从亏损转为盈利,2025年实现归母净利润20.59亿元。2)海光信息:收入利润同样实现双高增,2025年收入、归母净利润分别达到143.77亿元、25.45亿元,同比增速分别达到57%、32%。

  同时,生态的优化也成为国产算力发展的关键。以寒武纪为例,经过多年投入与技术积累,寒武纪Cambricon NeuWare基础软件平台已日趋成熟:不仅全面兼容社区最新版本PyTorch和Triton算子开发语言,支持用户模型与自定义算子快速迁移;且经过持续全栈优化,平台多项指标均已达到业界领先水平。尤其针对当前行业内极具挑战的大规模集群运维实践需求,平台进一步完善了多项集群工具,为集群环境下大规模训练、推理业务的部署、运维、调试及调优提供了坚实底座。

  技术进步有望成为推动国产算力发展的又一重要动力。2026年4月,月之暗面(Moonshot AI)与清华大学联合发表了一篇论文,提出了一种名为 PrfaaS(预填充即服务)的新架构,成功打破了物理机房的限制,让大模型的推理算力可以跨越城市、跨越普通网络进行灵活调度。PrfaaS并非简单依赖缩减后的KVCache,而是将模型端的KV效率与系统端的选择性卸载、带宽感知调度及缓存感知请求分配相结合。这一设计消除了异构加速器必须共享相同低延迟 RDMA 架构的要求,使得预填充与解码能力可在松散耦合的集群间独立扩展。在一项针对内部1T参数混合模型的案例研究中,采用PrfaaS增强的异构部署方案,其服务吞吐量分别比同构PD方案和基础异构方案高出54%和32%,同时仅消耗了适度的跨数据中心带宽资源。随着模型架构的不断优化,大模型的推理算力将更多脱离物理限制,跨数据中心协作让国产算力有更多参与重要模型推理的机会,进而有望在长期内推动国产算力的发展。

  AI发展推动算力架构革新,国产超节点加速发展,有望成为国产算力“弯道超车”的重要机遇。AI算力与传统数据中心的计算方式有所区别,它是持续在线的智能生产系统,核心性能取决于推理、上下文处理与数据移动效率,而非仅服务器峰值算力。AI工作负载需在超长上下文中执行多步骤推理,对平台全层级能力形成压力,微小效率损耗在数万亿token规模下会严重影响成本、吞吐量与竞争力。AI计算的进步可以由三大扩展定律来体现:预训练扩展让模型学习固有知识,后训练扩展通过微调与增强学习赋予模型思考能力,测试时扩展则在推理中通过生成更多token实现深度推理。

  大模型自回归推理存在Prefill(计算密集)与Decode(内存带宽密集)两种资源需求冲突的阶段,超节点可以成为实现P/D分离的重要支撑,因此有望成为下一代AI算力架构的核心形态。在Decode阶段,决定性能的关键因素不再是GPU的峰值算力,而是其在单位时间内能够从显存中读取或写入数据的总量。这一性能直接影响着用户的另一个核心体验指标,即单字生成延迟,它决定了后续文本生成的流畅度,进而P/D分离架构应运而生,新型的超节点服务器架构实现高效物理分离,凭借强大的内部互连网络,在内部进行P/D任务的划分。同时,在互联协议端,技术的进步可以更有效实现物理带宽能力的释放。以中国移动推动的OISA协议为例,新一代互连技术已经超越了单纯“数据管道”的角色,正在向系统管理中的主动参与者演进。

  浪潮信息:元脑SD200超节点是当前国内大模型推理性能最强的本土AI超节点产品之一。1)元脑SD200超节点搭载64张本土AI芯片运行DeepSeek R1 671B大模型时,在输入长度4096、输出长度1024的场景下,单用户token生成速度达112 tokens/s,单token生成时延低至8.9ms,是国内首个突破10ms大关的本土超节点产品,大模型推理端到端体验领先行业。2)自研多主机低延迟内存语义通信架构,采用3D Mesh高性能互连超扩展系统,支持64张本土AI芯片高密度扩展,整机最大显存4TB、系统内存64TB。创新三层精简互连协议,报文有效数据利用率超96%,物理层误码率低至1012;首创交换域全局统一显存编址并研发影子设备技术,实现跨主机GPU P2P直接访问。

  中科曙光:全场景覆盖产品矩阵,开放生态助力国产算力前行。中科曙光推出世界首个无线缆箱式超节点scaleX40。scaleX40采用正交无线缆一级互连架构,实现计算节点与交换节点直接对插,从根源上消除线缆带来的性能损耗与运维风险。scaleX40单节点集成40张GPU,总算力超过28PFLOPS (FP8精度),HBM总显存超过5TB,访存总带宽超过80TB/s,形成高密度算力单元,满足万亿参数大模型的训练与推理需求。部署层面,产品采用标准19英寸箱式设计,实现算力单元与机柜解耦,部署周期从数月级大幅缩短至数小时,交付效率显著提升;系统可靠性达99.99%,高密场景信号损耗与整体能耗同步优化,长期运维成本有效下降。

  华为昇腾:从384超节点到万卡集群,国产算力龙头打造坚实计算底座。1)Atlas 900 AI超节点:搭载384颗Ascend 910C AI芯片,FP8精度总算力达300PFLOPS,采用自研灵衢1.0全光互联协议。2)Atlas 950 AI超节点:面向万亿参数大模型训练推理场景打造的万卡级旗舰超节点,搭载8192颗Ascend 950DT AI芯片,FP8精度总算力达8EFLOPS、FP4精度达16EFLOPS。3)Atlas 960 AI超节点:面向AGI场景打造的超大规模旗舰超节点,搭载15488颗Ascend 960 AI芯片,FP8精度总算力达30EFLOPS、FP4精度达60EFLOPS,可组成最大百万卡级的SuperCluster集群。4)TaiShan 950通用计算超节点:面向金融、政务等通用计算场景推出的超节点产品,最大支持32颗Kunpeng 950通用处理器,系统内存最大48TB,支持内存/SSD/DPU池化。

  1.3 投资建议

  AI Agent时代Token需求的非线性增长,或直接带来超预期的AI算力需求,而超节点有望成为AI算力发展的重要趋势;我们仍建议按“一芯二模三云”作为投资主线,以“一芯”为代表的国产算力景气度有望持续提升。建议重点关注:1)国产AI芯片/CPU:寒武纪、海光信息、中国长城、云天励飞、龙芯中科、禾盛新材等;2)国产超节点龙头:浪潮信息、中科曙光、软通动力、神州数码、中国长城、慧博云通、拓维信息等;3)云计算:金山云、网宿科技、优刻得、青云科技等。

  2.行业新闻

  4月17日 OpenAI推出GPT-Rosalind,AI加速向生命科学领域渗透

  OpenAI推出面向生命科学研究的新模型 GPT-Rosalind,并与安进、Moderna 等机构展开合作,主要应用于药物发现与基因分析等场景。该模型体现出大模型能力正从通用对话向科研级复杂任务延伸,AI在高壁垒专业领域的应用深度持续提升,AI for Science 有望成为下一阶段重要产业方向。

  4月15日 Anthropic调整企业端定价模式,算力成本传导逐步显性化

  Anthropic对Claude企业版定价体系进行调整,在原有席位收费基础上增加算力使用计费模式。随着AI工具在企业端的使用频率持续提升,算力消耗显著增加,AI服务厂商开始将底层算力成本逐步向用户侧传导,反映出算力资源约束对商业模式的影响正在强化。

  4月17日谷歌发布AI智能体开发指南,AI Coding向工程化交付演进

  谷歌开放最新Android开发指南,并推出配套工具支持AI智能体开发,帮助AI更好理解系统规范并生成高质量应用。该举措表明AI编程能力正在从代码生成向“符合工程规范的应用交付”升级,AI Coding商业化路径逐步清晰,开发工具链价值持续提升。

  4月17日政策强调“人工智能+基础设施”,算力需求中长期确定性增强

  政策层面持续强调“人工智能+”基础设施建设,并提出加大相关领域投资力度。同时,国内AI调用规模持续增长,反映出AI应用需求快速释放。在政策支持与需求扩张双重驱动下,算力基础设施仍将是中长期确定性最强的产业方向之一。

  3.公司新闻

  金山办公:4月13日消息,公司预计2026年第一季度实现营业收入15.65亿元至16.62亿元,同比增长20.24%至27.68%;预计实现归属于母公司所有者的净利润20.22亿元至23.07亿元,同比增长401.89%至472.81%。公司表示,报告期内持续锚定“AI、协作、国际化”三大核心战略,AI全场景服务能力加快落地,WPS个人业务、WPS 365及WPS软件业务均保持增长。

  先进数通:4月15日消息,公司2025年实现营业收入35.84亿元,同比增长61.48%;实现归属于上市公司股东的净利润1.19亿元,同比增长210.45%。公司表示,报告期内IT基础设施建设业务收入大幅增长,其中来自互联网行业和全国性银行客户的收入均明显提升;受AI及大模型技术需求拉动,客户在下一代智算中心等方向的投入持续增加。

  顶点软件:4月16日消息,公司2025年实现营业收入5.82亿元,同比下降12.38%;实现归属于上市公司股东的净利润1.78亿元,同比下降8.14%。同时,公司董事会审议通过利润分配预案,拟向全体股东每10股派发现金红利6元(含税)。顶点软件作为金融IT厂商,公告反映出公司在资本市场IT领域经营仍保持稳定,但在收入端仍面临一定压力。

  通富微电:4月17日消息,公司董事会审议通过2025年度利润分配预案,拟以2025年12月31日总股本为基数,向全体股东每10股派发现金红利0.81元(含税),不进行资本公积转增股本,不送红股。作为算力产业链上游的重要封测企业,公司年报披露后市场关注度较高,也反映出AI算力链核心环节的景气延续。

  4.本周市场回顾

  本周(04.13-04.17)沪深300指数上涨1.99%,中小板指数上涨2.96%,创业板指数上涨6.65%,计算机(中信)板块上涨3.82%。板块个股涨幅前五名分别为:盛视科技、ST汇科、春秋电子、航天长峰、传艺科技;跌幅前五名分别为:GQY视讯、网达软件、锐明技术、实达集团、四方精创。

  5.风险提示

  1)人工智能政策落地不及预期:如果在未来一段时间内,人工智能相关政策落地进度缓慢或存在变化,都有可能导致产业发展不及预期。

  2)行业竞争加剧:AI领域存在大量竞争者,未来为了在细分领域获取更大份额,可能存在市场、技术等方面竞争持续加剧的情况。

  计算机团队介绍

  吕伟:执业证书:S0590525110033

  国联民生证券计算机行业首席分析师,北京大学理学硕士,2021年加入民生研究院,2025年加入国联民生研究所

  分析师承诺

  本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并登记为注册分析师,基于认真审慎的工作态度、专业严谨的研究方法与分析逻辑得出研究结论,独立、客观地出具本报告,并对本报告的内容和观点负责。本报告清晰准确地反映了研究人员的研究观点,结论不受任何第三方的授意、影响,研究人员不曾因、不因、也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。

上一篇:
有投资者1.2万美元存一年亏4000元,美元理财“稳赚”神话破灭
下一篇:
民生银行“三十而励”:营收终结四年连降,风险出清仍是关键考题
Title