Title
您当前的位置: 首页 > > 文章详细
对话浪潮数据张东:可演进AI基础设施,破解AI落地难题
发布时间:2025-08-27

  文/黄海峰的通信生活  独立AI超算与传统业务系统割裂,CPU、GPU、TPU等多芯多生态共存,传统IT基础设施利用率降低……当AI大模型竞赛步入深水区,产业界却陷入“算力喊得响,落地走得难”的困局。这些基础设施领域的“硬骨头”,正成为AI技术渗透千行百业的最大梗阻。  在2025中国算力大会“算力注智,激发产业新动能主论坛”上,浪潮数据董事长张东直指应对AI时代挑战核心:可演进AI基础设施是破局AI产业发展困局的关键。    在IT基础设施市场,浪潮数据取得出色成绩,比如其超融合产品InCloud Rail,出货量稳居中国市场前二,成为许多企业构建IT基础设施的最佳选择。  为何众多企业会选择浪潮数据?我想答案是行业洞察力以及与时俱进的创新。在2025中国算力大会期间,张东在与《海峰看科技》深度交流时表示,企业需要的不是颠覆式重构,而是可演进能力。云数智融合不是一蹴而就的工程,而是长期迭代的过程。  同时,“可演进架构”通过模块化设计、开放标准和全栈协同,最终实现“应用智慧化、系统弹性化、效能最优化”的目标。  AI落地困局:三大矛盾直指基础设施“顽疾”  在AI技术浪潮中,AI基础设施发展趋势清晰。其一,大模型部署私有化,模型本地化部署成本持续降低,企业因数据安全、服务可控、灵活适配等需求转向私有化基础设施,金融、医疗等行业以“数据不出厂”规避合规风险,部分企业用混合云平衡实时性与安全性。  其二,算力架构呈多芯多模协同,“一云多芯”成常态,CPU、GPU/TPU、FPGA/ASIC各司其职,“智能体”动态调度算力,私有云平台提升异构资源管理能力。  其三,私有云AI能力持续演进,企业复用现有私有云资产,叠加AI芯片与框架实现升级,达成“一份硬件承载双业务”。  其四,“平滑演进”成目标,从资源扩展、模型优化到运维兼容,均追求低成本高效升级。    新趋势给AI基础设施带来三重挑战。首先,在成本上,算力架构、私有化等趋势,需要企业重新构建AI设施。这无疑增加了企业基础设施投入资金,增加了企业运营成本。  其次,可靠性上,新建AI基础设施与原有设施无法完美融合,使得AI在应用场景中无法保障生产环节可靠性需求。  最后,智能体发展加剧适配难度。CPU、GPU等多样的算力基础设施,让智能体在算力调度时需突破“硬件差异壁垒”与“任务适配精度”双重挑战。  对此,张东直言,AI产业融合受阻根源并非技术,而是基础设施“不兼容、高成本、不可靠”,且三者均源于AI架构与传统IT体系的长期割裂。  笔者注意到,早期AI架构带有明显“超算基因”,超算系统未云化且长期独立于传统IT架构,AI训练需求爆发时,行业直接沿用这一体系,导致大量算力游离云外。  张东详细解释,十几年前云计算、大数据与应用构成的IT架构已趋稳定,但AI技术快速发展后,训练端算力消耗远超应用端,传统AI架构开始变革;而超算本就独立,AI训练又需GPU、IP网等超算组件,使得很多算力长期游离云外,与“IT 资源云化”初衷相悖。  在笔者看来,这种算力“体外循环”,本质是技术迭代速度与基础设施适配节奏脱节。传统IT体系云化成果未完全消化,AI算力需求又爆发式打破平衡,最终让资源整合陷入两难。  这种割裂在企业落地中尤为直观。正如张东坦言,企业上AI常先单独采购AI服务器,使其与传统IT系统分离;72卡液冷机柜对承重、供电、散热的要求,与传统机房条件格格不入,许多企业不得不频繁切换设备。“这是现阶段算力特点导致的过渡状态,绝非未来方向。”张东略带担忧地表示。  破局关键:可演进AI基础设施,让存量资产“长AI能力”  企业在构建AI能力时,有些企业选择“另起炉灶”,新建独立架构。这需配套独立硬件与云管理软件,不仅浪费十几年IT云化存量资产,还会增加操作复杂度。  有些企业选择维持传统IT体系,却难以满足AI对算力、散热的特殊要求,甚至被迫频繁切换设备。  针对以上两条发展路径,张东提出“可演进AI基础设施”理念,其核心逻辑直指AI与传统IT体系的割裂问题,避免形成“新的资源孤岛”,让企业依托现有IT资产逐步拓展AI能力,而非重建独立架构。  谈及行业趋势,张东认为,当前“AI厂商垂直一体化”与“云平台拓展AI能力”两条路径终将融合。“没有企业愿意维护两套独立系统,未来必形成兼顾‘算力效率+存量兼容’的统一架构。”  他进一步解释,过去十几年各行业已完成IT基础设施云化,好不容易消除了物理资源、数据与应用的管理孤岛,若因AI再建独立架构,既是资源浪费,还会让IT管理重回“多头并行”的复杂状态。  在笔者看来,这一理念的核心价值,在于跳出“非拆即建”的传统思维。它不否定过去IT云化成果,并实现从传统IT到云再到AI的渐进迭代,形成整体智能IT基础设施。  张东更是风趣地补充,可演进AI基础设施的关键是让存量IT资产“长出AI能力”。传统服务器无需替换,叠加智算芯片即可实现“一台设备同时运行传统业务与AI任务”。  既然“可演进AI基础设施”是破局企业AI建设的利器,那么如何助力企业构建“可演进AI基础设施”?  在与张东的交谈中,笔者发现,浪潮数据以应用为导向,以系统为核心,坚持开放标准、分层解耦,坚持软件定义、软硬协同,让技术架构具备足够的弹性。具体来说有四大举措。  举措一:构建可演进技术架构。浪潮云海通过模块化、积木式扩展迭代AI能力,支持应用从“基础云服务”向“智慧化服务”逐步升级,降低转型门槛,最终实现从传统IT到云再到AI的渐进迭代,形成整体智能IT基础设施。  举措二:积极适配多元算力与场景。浪潮云海通过可演进架构,适配多元算力与场景,面向“一云多芯”系统设计、支持高性能高可靠的分布式推理。这为“一台设备承载多元任务”提供了技术支撑。  举措三:高性能高可靠融合存储管理,通过优化存储资源配置,提升资源利用率,加快AI训练速度,满足大规模AI场景对存储的严苛需求。  举措四:提升全栈一体化运维管理能力。浪潮云海从硬件到软件、从资源到模型、从应用到智能体,全链路运维确保架构迭代中“可管、可控、可优化”。  对于未来趋势,张东预言:“未来所有服务器都会搭载AI卡,不再有‘人工智能服务器’与‘普通服务器’的区别,通用计算与AI计算能力会实现均衡,现阶段只是转型过渡。”  简言之,这一理念通过统一算法库与框架,让不同AI算力在同一平台融合,使基础设施能随算力类型、应用需求动态调整,避免因硬件迭代导致整体架构淘汰。而要实现“可演进”,需依托现有IT架构的资源池化基础推进。  一方面,延续云计算“云管资源”路径,将AI算力纳入统一管理,让CPU、GPU等多元算力像传统IT资源一样高效调度,解决算力游离云外的问题。  另一方面,通过数据技术整合内外部数据、规则库与知识库,结合AI算法框架形成智能体并与业务系统联动,构建“云管资源,数据管资产,AI连业务”的贯通体系。  笔者发现,这套“云-数-智”贯通体系,恰好破解了AI落地的核心痛点:既实现算力统一调度,又打通“数据-算法-业务”链路,让AI从孤立“算力工具”转变为融入业务的“智能组件”。  实践验证:可演进AI基础设施已展露实力  当我们清楚了挑战,也明白可演进AI基础设施是破局关键时,大家或许好奇,浪潮数据的可演进AI基础设施能力能否发挥价值?  从实际应用看,目前,浪潮云海InCloud OS云操作系统以“可继承、可演进”为核心实现“一云多芯”“智算融合”;浪潮云海超融合一体机则凭全栈RDMA技术助力企业搭建可演进架构。  这些实践已在浪潮数据内部与行业案例中验证。浪潮数据内部AI转型采取“小步快跑”模式。两年前,张东要求研发团队全面应用AI工具,强调“不上AI就会落后”。  如今,研发团队每月用AI生成数万行代码,效率大幅提升且保留人工验证;测试环节引入AI做白盒测试,解决了过去的复杂难题。更关键的是,转型未颠覆原有体系——如客服AI推荐模块先内部试用,由客服修正反馈,既保稳定又优化数据。  目前,浪潮数据已实现GPU与CPU管理平台融合,用户可通过统一入口调度多元算力,验证了统一架构的可行性。  此外,不少企业基于浪潮数据可演进AI基础设施加速转型。比如,中国铁塔在浪潮云底座部署AI模块,无需切换设备即可智能调度基站资源,降低运营成本且缩短项目周期。  又比如,山东某政府部门,在传统安防系统叠加AI模块,实时处理多路视频数据,数秒内联动警务系统,出警速度大幅提升;上海某实验室基于EB级存储平台+GPU设备管理平台,支撑科研创新;某智能中心建设中,采用基础设施扩展,而非重建方式。  未来展望:可演进AI基础设施成“关键先生”  面向未来,浪潮数据如何加速可演进AI基础设施发展?张东介绍道,浪潮数据将从“软、硬、生态”三方面推进可演进AI基础设施落地。第一,在软件层面,优化算力管理平台,增强GPU等算力调度能力,实现AI与传统云资源统一纳管,打破算力与业务壁垒。  第二,在硬件层面,研发模块化设备,兼容不同架构,国内外厂商的处理器和AI卡,支持算力灵活扩展。  第三,在生态层面,加强与AI算法、传统IT服务商合作,推动AI基础设施与应用结合,助力AI融入传统业务。  笔者认为,浪潮数据“软-硬-生态”三位一体规划,抓住了可演进AI基础设施落地的核心——软件是“调度中枢”,硬件是“承载底座”,生态是“协同网络”,三者结合让“可演进”从理念落地。  不难发现,浪潮数据通过可演进AI基础设施,帮助中小企业新增AI节点、运行AI任务,消除了“想上AI却不敢上、上不起”的顾虑。  独行快,众行远。正如张东在主论坛演讲中所讲,希望上下游联合建立自主技术体系,形成中国自主的可演进技术路线,推动算力、算网综合提升,支撑AI+应用落地。

上一篇:
良品铺子上半年净亏损近亿元,超去年全年两倍
下一篇:
总资产逼近5万亿!江苏银行利息收入大增19%,营收占比三年来首回升
Title