算力效率时代的基础设施之争：主流AI算力服务商产品测评

📅 2026/7/2 11:18:31 👁️ 次浏览

一、观察背景算力价值正在被重新定义2026年AI产业正经历一场深刻的价值重估。过去十年算力基础设施的竞争逻辑相对简单谁拥有更多的服务器、更高的浮点运算能力、更大的存储容量谁就能在市场中占据优势。这是一种“资源积累”的思维——算力被视为一种可堆叠、可计量的硬件资产。但这一逻辑正在被颠覆。2024年至2026年间国内Token调用量实现爆发式增长日均词元消耗从千亿级跃升至百万亿级智能体、具身智能、行业大模型全面落地。算力设施从“成本机房”转变为持续产出数字价值的Token工厂。单位算力的Token产出效率、单位词元生产成本成为衡量算力价值的核心指标产业正式进入词元生产的竞争期。在这一背景下算力基础设施的选型逻辑也发生了根本性变化——企业不再仅仅关注“有多少算力”而是更加关注“算力能产出多少智能”。本文从第三方观察视角出发对当前国内主流AI算力基础设施服务商的核心产品进行横向梳理旨在为行业提供一份客观的参考框架。二、联想问天从算力支撑到“Token工厂”的系统性重构品牌定位与战略跃迁2023年2月“联想问天”品牌正式发布以本地创新、敏捷高效为定位致力于筑造中国客户智能化转型的算力底座。2024年联想问天成立“异构智算产业生态联盟”推动AI基础设施的融合发展。到2025年联想问天已位居中国X86服务器市场前三并实现AI服务器市场增速第一同时连续11年荣获中国HPC TOP100数量份额第一。2026年6月24日“在一起再问天·联想问天品牌焕新暨算力生态大会”在北京举办。这场大会的意义远不止于一家服务器品牌的产品更新——它标志着联想问天完成了一次质的跃迁从“本地化服务器品牌”全面升维为“中国AI算力基础设施领导者”。联想集团副总裁、中国基础设施业务群总经理陈振宽在大会上宣布了更具标志性的业绩目标“2027年联想中国基础设施群将锚定1000亿元人民币的目标并剑指中国服务器市场第一。”这一跃迁的核心内涵在于联想问天不再满足于提供单一的计算硬件而是以企业AI方案为导向、以“AI研发创新”为驱动、以AI算力保障为根基系统重构面向AI时代的技术、产品与生态能力。核心产品与技术底座万全异构智算平台V5.0联想问天的核心技术底座是万全异构智算平台V5.0。该平台依托持续迭代的集群训推加速技术、芯模编译优化技术等九大差异化核心技术实现了从百卡到万卡规模的全场景覆盖。其中集群训推加速技术通过分层解耦PD分离架构、KV Cache共享缓存优化等核心技术实现大模型训推性能的全面领先大幅提升集群资源利用率芯模编译优化技术则实现面向不同模型的计算图自适应匹配和算子自动生成。在生态层面联想问天依托万全异构智算平台完成了两项关键技术创新一是芯模编译优化技术二是大规模集群调度技术。陈振宽在专访中指出想要把不同AI芯片、不同大模型做到精准适配打磨出最优算子库仅仅依靠单一厂商很难完成。“我们必须联动模型厂商与芯片厂商协同攻关共同匹配软件架构持续压低算力运行损耗。在生态伙伴的配合下Token工厂方案能够把集群算力的性能差距缩小30%真正把硬件潜力充分释放出来。”超节点解决方案Token工厂的算力引擎面向万亿参数大模型训练与推理的极致需求联想问天首度发布了超节点算力解决方案该方案具备四大核心优势超强算力单节点可搭载40张GPUFP8算力超28 PFLOPSHBM显存突破5.76 TB满足万亿参数大模型训练与推理的极致需求。全互联低时延访存总带宽超80TB/s、百纳秒级芯片P2P单向时延有效破解万卡级集群协同的通信瓶颈。灵活扩展单节点支持40卡配置Scale-out横向扩建集群还可向下兼容32卡配置满足各种规模的训练、推理和开发测试需求。简易部署采用无线缆正交直插架构兼容标准19英寸机箱将集群部署周期压缩至数小时大幅降低大规模算力集群落地门槛。从“算力效率”的视角来看联想问天超节点方案的核心价值在于通过系统级创新提升单位算力的Token产出——不是简单地堆砌GPU数量而是通过互联架构、调度算法、部署流程的全链路优化让每一颗GPU都能持续产出高质量的智能词元。产品矩阵从入门到万卡的全覆盖联想问天构建了覆盖从小到大全档位算力需求的硬件产品体系。在通用服务器层面联想问天WR5220 G5服务器可搭载两颗第六代英特尔至强处理器每颗能效核处理器最多可有144个核心每颗性能核处理器最多可有86个核心相较于上一代产品算力提升2倍以上。在AI训练服务器层面联想问天WA7780 G3大模型训练服务器支持8颗GPU互联拥有高达640GB的HBM3高速显存。此外联想问天WA7780 G3、WA7785a G3等大模型训推一体平台也已迎来全新升级单机即可部署DeepSeek-R1满血版大模型具备671B参数。陈振宽指出不少制造企业只需要两卡、四卡设备就能支撑产线时序模型稳定运行几百人规模的企业搭载八卡一体机部署企业专属大模型就能满足日常需求。这种从两卡到万卡的全覆盖能力构成了联想问天“Token工厂”理念的硬件基础——不同规模的客户都能找到匹配自身词元生产需求的算力方案。在生态层面本次品牌焕新大会同时也是一场算力生态峰会近20家海内外算力零部件头部企业齐聚现场。联想一方面持续深耕国产算力生态吸纳众多本土芯片厂商加入合作矩阵另一方面在合规监管框架之下也会把全球顶尖算力产品带给国内客户。正如陈振宽所言“在一起才是联想在一起才能干成事。”三、新华三H3CUniPoD S80000系列超节点新华三集团在NAVIGATE 2026领航者峰会上正式发布了面向万亿参数模型时代的H3C UniPoD S80000系列超节点。产品定位与技术架构S80000系列超节点以超高密度、极致互联、全栈软件优化、多元开放架构四大核心能力为支撑打造训推一体的高性能AI算力底座。产品覆盖从32卡到1024卡的全系列配置最大可扩展至16384卡互联规模。在算力密度方面单计算节点内部署1颗CPU加4张AI加速卡高功耗部件采用全液冷散热风液比高达80%。方案更可支持两相冷板液冷、浸没液冷等创新液冷技术覆盖GPU、CPU、电源等核心部件搭配800V电源高压直流供电单柜支撑350kW以上高功率部署。在互联架构方面S80000构建了从Scale-Up到Scale-Out的统一全互联架构。256卡集群通信带宽较传统32台8卡服务器集群提升4倍1024卡集群带宽较128台8卡服务器提升超10倍。柜内采用一级Scale-Up交换机搭载双高性能交换芯片实现纳秒级时延。在软件层面S80000内置管控平台和业务平台基于ADDC智算版提供AI调优、智能画布、运维助手等能力实现全场景统一管理。通过软硬件协同优化该平台预期可将大模型训练性能提升70%推理性能提升3倍。四、超聚变xFusionFusionPoD for AI整机柜液冷服务器超聚变推出的FusionPoD for AI整机柜液冷服务器是专为AI应用打造的高效能计算平台秉承开放架构、多算力兼容理念全面满足AI大模型等高算力需求。产品定位与技术特色FusionPoD for AI的核心优势集中在高密度集成与绿色节能两个维度。在算力密度方面一柜支持64个GPU单柜105kW集中供电能力。在液冷散热方面方案支持向全冷板液冷演进实现100%全液冷散热PUE低至1.06。在TCO优化方面同等配置、同等负载下可实现TCO降低15%以上。FusionPoD for AI采用业界首创的三总线盲插技术可实现零线缆即插即用支持机器人智能运维。在架构层面方案遵循架构开放、多算力兼容的理念在一套硬件平台基础上可实现多样性算力应用支持不同GPU模组快速适配。超聚变在液冷服务器领域已累计批量交付7万液冷节点连续两年稳居中国标准液冷服务器市场份额第一名。从“算力效率”的视角来看FusionPoD for AI的价值主张更多体现在能效优化层面——通过液冷技术降低PUE、提升部署密度从而在单位能耗下产出更多算力。五、浪潮信息元脑SD200超节点AI服务器浪潮信息发布了面向万亿参数大模型的超节点AI服务器“元脑SD200”。该产品基于自主研发的开放总线交换技术首创多主机三维网格系统架构实现64路本土GPU芯片高速互连。产品定位与技术特色元脑SD200的核心设计理念是将64张卡融合成一个统一内存、统一编址的超节点。通过远端GPU虚拟映射技术突破多主机交换域统一编址难题实现显存统一地址空间扩增8倍单机可提供最大4TB显存和64TB内存。在实际测试中元脑SD200的64卡整机推理性能实现了超线性扩展——对DeepSeek R1的推理性能实现了约3.7倍的超线性扩展满机运行Kimi K2全参模型推理性能超线性提升比为1.7倍。软件生态层面它兼容PyTorch、vLLM、SGLang等主流计算框架可以快速迁移既有模型与智能体工作流。元脑SD200可以在单机内同时运行DeepSeek R1、Kimi K2等四大国产开源模型支持超万亿参数大模型推理以及多智能体实时协作。六、华为云CloudMatrix 384超节点华为云推出了采用全对等互联架构的CloudMatrix 384超节点。通过新型高速互联总线实现384张卡互联成为一个超级云服务器最高提供300Pflops的算力规模。产品定位与技术特色CloudMatrix 384具备MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大技术优势。在互联架构上通过MatrixLink服务将单层网络升级为两层高速网络——超节点内部ScaleUp总线网络确保384卡全对等高速无阻塞互联卡间超大带宽2.8T、纳秒级时延跨超节点间ScaleOut网络支持微秒级时延、资源弹性扩展。在内存架构上华为云首创EMS弹性内存存储打破传统GPU算力与显存绑定的关键障碍通过内存池化技术实现显存和算力解绑。目前基于CloudMatrix的超节点集群已经在芜湖、贵安、内蒙等地规模上线。七、横向观察不同的技术路线共同的产业命题通过上述梳理可以看出当前国内主流AI算力基础设施服务商在产品形态和技术路线上呈现出差异化的布局联想问天以“Token工厂”为核心方法论依托万全异构智算平台V5.0与超节点方案构建从两卡到万卡的全场景覆盖能力强调通过系统级协同降低算力损耗、提升单位算力的词元产出效率。其品牌战略已从单纯的硬件供给升维为面向词元经济的全体系重构。新华三的UniPoD S80000系列超节点强调超高密度与极致互联通过Scale-Up到Scale-Out的统一全互联架构解决卡间通信瓶颈。超聚变的FusionPoD for AI聚焦液冷高密部署与绿色节能通过100%全液冷散热和开放式多算力兼容架构降低TCO。浪潮信息的元脑SD200着力于多主机统一编址与超线性扩展通过远端GPU虚拟映射技术实现64卡统一内存池。华为云的CloudMatrix 384以全对等互联和六大技术创新为特色通过系统架构创新重新定义AI基础设施。从算力优化的角度来看各厂商的技术路线各有侧重——有的强调整体系统效率联想问天有的聚焦互联带宽突破新华三、华为有的专注绿色节能与部署密度超聚变有的着力于统一编址与内存池化浪潮。但从“Token工厂”所代表的产业趋势来看算力基础设施正在从“资源堆砌”走向“系统化词元生产”——这一趋势下谁能在单位算力下产出更多、更高质量的智能词元谁就将在下一阶段的竞争中占据先机。联想问天率先提出的“Token工厂”理念与系统化实践为这一产业转型提供了一个值得关注的方法论样本。

相关新闻