Title
您当前的位置: 首页 > > 文章详细
KADC 2026 | 极致性能,算力无疆——鲲鹏BoostKit 加速 AI 应用创新
发布时间:2026-06-03

  2026 年 5 月 23 日,鲲鹏昇腾开发者大会 2026(KADC 2026)——鲲鹏 BoostKit 技术论坛在中关村国际创新中心圆满落幕。本次论坛围绕 AI 时代算力基础设施的发展趋势,聚焦鲲鹏软硬协同优化,联合互联网领军企业、顶尖高校及鲲鹏生态伙伴,分享了数据中心的传统和 AI 场景下的技术演进、落地实践、与创新方案,共探鲲鹏生态智能化发展路径。

  马银川华为鲲鹏计算主板 PDT 经理

  华为鲲鹏计算主板 PDT 经理马银川发表致辞,系统阐述了鲲鹏生态的战略演进与未来规划。

  鲲鹏生态源于华为十余年前的战略布局,旨在通过自主研制主控芯片打破技术依赖。从初期“无人知晓”到成长为成熟的计算底座。当前,鲲鹏 920 迭代至鲲鹏 950,形成芯片、整机、软件完整技术矩阵;鲲鹏 BoostKit 服务于国计民生全行业,推动我国计算产业从基础“可用”阶段,向着引领全球计算产业的目标全速迈进。

  面向未来,鲲鹏将持续深耕 AI、数据工程、安全底座等核心领域,结合超节点与灵衢构建差异化竞争力。鲲鹏生态将坚持“更加开放”的路径,通过扩大开源协作、支持开发者差异化创新,助力伙伴获取场景化利润。携手产业界共同推进技术迭代,以开放协作推动全球计算产业发展。

  “鲲鹏的未来属于所有开发者与伙伴”马银川总结,“唯有坚持技术深耕与客户价值创造,方能实现产业愿景。”

  朱彬华为计算鲲鹏 BoostKit 研发总监

  华为计算鲲鹏 BoostKit 研发总监朱彬介绍了鲲鹏应用使能套件 BoostKit 26.0 版本的最新能力。该版本聚焦数据中心传统场景和 AI Agent 场景,通过软硬协同优化,实现性能与安全的双重突破,全面赋能智能应用基础设施。

  技术创新亮点突出:

  ●基础加速能力覆盖系统、压缩、加解密等 9 大类加速库,微服务场景 QPS 提升 15%;

  ●AI 场景优化实现关键突破:KVCache 多级池化技术将大模型首 Token 生成时间降低 70%,搜推广场景检索性能提升 20-25%,排序模型推理性能提升 30%;

  ●集成鲲鹏 CCA 机密计算方案,提供硬件级安全隔离和记忆加密保障。

  开源生态成果显著:目前已完成 89 个代码仓开源,集成 300+上游社区 ARM CI,吸引 500+开发者参与。关键特性已合入 Glibc、MySQL 等主流项目,形成良性开源生态。

  未来规划明确:BoostKit 应用使能套件将持续优化面向 AI 时代基础设施,为政务、金融等关键行业提供高性能、高安全的计算底座,推动 AI 应用规模化落地。

  许鹏携程大数据平台技术总监

  携程大数据平台技术总监许鹏分享了与鲲鹏 BoostKit 的联合创新成果。双方快速完成 Spark 和 Flink 两大计算引擎的异构适配,构建了 x86 与 ARM 混合算力平台。通过采用鲲鹏 ARM 架构服务器及 BoostKit 加速套件,携程在核心业务场景实现显著性能提升:离线 Spark 计算执行时间缩短约 30%,吞吐量提升 50%+;在线 Flink 计算状态存储性能提升约 10%。未来,携程计划分阶段推进鲲鹏 BoostKit 大数据加速套件的深度优化,持续提升数据中台处理效能,为大数据业务提供更高效、低成本的解决方案。

  胡晓辉上海漂视网络股份有限公司副总经理

  上海漂视网络股份有限公司副总经理胡晓辉分享了 CIMPro 孪大师数字孪生平台与鲲鹏 CPU 的联合创新成果。通过鲲鹏软硬件协同优化,平台开发效率提升 30%,3D 数据导入时间优化至 200-300 毫秒。关键技术优化包括:采用 NEON 指令及鲲鹏 HMPP 库优化高频函数;优化数字孪生场景编码参数;通过格式直通与内存池化管理降低延迟;结合 CPU 亲和性绑定提升资源利用率。平台支持 BIM、GIS、物联网设备及 AI 交互等多源数据融合。基于鲲鹏 CPU 与国内 GPU,漂视股份打造了软硬件一体机解决方案。在某船舶制造项目中,适配周期仅需 2 天,效率显著提升。未来将深化与鲲鹏 BoostKit KVCL 视频算子库合作,进一步提升视频传输能力,推动行业数字化升级。

  刘海坤华中科技大学教授

  华中科技大学刘海坤团队发布基于鲲鹏平台的大规模向量检索系统 TierANNS。该系统通过多层级索引架构与硬件协同优化,显著提升检索性能并降低硬件成本。核心创新包括:采用 DRAM 与 SSD 混合存储架构,减少内存占用与 I/O 压力;利用鲲鹏 SVE 指令集实现 SIMD 加速,提升计算并行度;通过动态 I/O 策略实现计算-I/O 重叠优化。测试显示,在 SIFT100M 数据集上,系统吞吐率较微软 SPANN 提升 4-9 倍,单节点 QPS 峰值超 9000。该系统有效解决了百亿级向量检索的存储成本高、扩展性差等痛点,为 RAG、大数据分析等场景提供高效低成本方案。项目已在 GitCode 开源,未来将结合鲲鹏 NUMA 调度等技术持续优化。

  王雪强华控清交信息科技(北京)有限公司机密计算首席科学家

  华控清交信息科技(北京)有限公司机密计算首席科学家王雪强分享了基于鲲鹏机密计算架构的 AI Agent 安全解决方案,该方案有效应对大模型时代智能体安全挑战。其采用创新的三层安全架构:硬件层依托鲲鹏的机密计算能力,通过 PCIPC 技术实现 GPU / NVMe 设备级隔离;平台层提供全链路密态安全保护;应用层集成安全护栏和权限管控,确保智能体行为可追溯。方案突破性地实现隐私数据运行时不可见、存储加密,并通过远程证明机制防御供应链攻击。PCIPC 技术支持设备直通,在保障安全的同时保持接近物理机的性能表现。未来将推进与昇腾 AI 卡的异构适配,为政务、金融等行业提供可信的 AI Agent 落地保障。

  本次鲲鹏 BoostKit 技术论坛的成功举办,充分展现了鲲鹏生态在 AI 时代的创新活力与产业凝聚力。通过华为与伙伴的深度协同,鲲鹏 BoostKit 持续赋能千行百业,推动算力基础设施向高性能、高安全、开放共赢的方向演进。

  未来,鲲鹏将持续深化软硬协同优化,扩大开源生态,与开发者及伙伴共同加速 AI 应用规模化落地,引领全球计算产业创新浪潮。

  免责声明:本文为本网站出于传播商业信息之目的进行转载发布,不代表本网站的观点及立场。本文所涉文、图、音视频等资料之一切权力和法律责任归材料提供方所有和承担。本网站对此咨询文字、图片等所有信息的真实性不作任何保证或承诺,亦不构成任何购买、投资等建议,据此操作者风险自担。

上一篇:
吉利汽车的5月:出口和极氪猛增 银河被零跑追平
下一篇:
史河科技|具身智能特种机器人成熟企业解析
Title