承载Token的基础设施打磨到位

承载Token的基础设施打磨到位
6月26日专稿蒋均牧进入2026年对于信息通信业而言最显著的变化之一就是Token经营时代来了。继在年报中写入“Token经营”后不久国内三大运营商几乎在同一时间段密集推出Token套餐将AI大模型的调用能力打包成商品推向市场定价区间覆盖了从尝鲜到重度使用的各个层级。不过“卖Token”和“卖流量”的逻辑完全不同同时在市场上还面临着大模型厂商、OTT企业等对手的竞争。如何助力运营商实现Token经营的规模化落地与可持续发展已然成为产业界共同面对的课题在2026年世界移动通信大会·上海MWCSH 2026期间亦被反复讨论。对此华为数据存储产品线副总裁肖德刚接受C114专访时给出了清晰的判断运营商作为Token提供商提供高质量Token是第一要务要又快又准、高性价比还要高可靠。而华为推出的业界首个支持异构算力的上下文记忆存储方案CMSContext Memory Storage正是面向这个目标设计的系统级答案。最终用户Token服务需求解读传统的流量经营模式触顶Token承载着运营商接力增长的期望。中国移动将Token定义为连接算力、模型、应用与用户的“通用货币”中国电信直言“智能云体系就是Token经营体系”中国联通则提出“AgentTokenAI云”范式。肖德刚强调运营商在规模化算力资源、海量客户基础与良好品牌口碑等方面积累深厚具备运营 Token 服务的天然优势。Token经营有很多指标但站在最终用户角度无论个人终端用户、政企行业客户还是自主运行的Agent智能体他们对Token服务的需求存在着几点共性首先上下文要足够长才能处理复杂任务。肖德刚指出简短对话场景仅能实现基础问答和轻量化辅助办公完整业务流程、行业知识库检索、智能体多步骤自主任务全都依赖长上下文完成完整信息载入。因此长上下文处理能力是进入生产系统最核心的指标。当下对上下文长度的需求正急剧扩张现阶段商用模型普遍支持64K至128K序列窗口头部大模型已实现百万级上下文处理能力中长期产业需求将触及千万级上下文区间。同时客户不关注过程服务交付的直观感受主要集中在输出结果与响应速度——输出要足够准这是可用性的底线首Token时延和平均时延要足够低体验才跟得上。此外使用成本要足够省商业模式才跑得通服务还要足够稳不能掉链子。这五个“足够”表面上是模型能力实则都与存储息息相关例如超长上下文意味着KV Cache数据量指数级增长低时延要求更高的缓存数据吞吐效率高可靠则依赖存储介质持久耐用。Fortune Business Insights的报告指出2025年全球AI存储市场规模为359亿美元预计市场将从2026年的449.4亿美元增长到2034年的2713.2亿美元预测期内复合年增长率为25.20%。这也折射出Token经济起势下对存储基础设施的刚性需求正在快速释放。华为CMS助力运营商加速迈向Token经营Token经营要形成商业闭环首先得把承载Token的基础设施打磨到位华为CMS的意义正在于此。实测数据显示该方案可将每Token成本降低约30%首Token时延缩短90%。超长上下文需求的本质是超大的KV数据量。如何容纳这些数据驱动了架构的必然演变——从传统的“高带宽内存DRAM本地盘”走向“高带宽内存DRAMWWW.51Byyb.CN外置共享存储”。肖德刚介绍说CMS基于这一逻辑在原有G1到G4层高带宽内存-DRAM-SSD-共享文件/对象之间新增了一个G3.5层提供更大容量和带宽支持KV语义级直通并可扩展为PB级共享KV缓存池。利用外置存储解决KV Cache瓶颈已成为行业共识英伟达在今年3月提出的CMX方案也指向同一方向。针对输出效率华为在CMS中采用了KV语义硬化和NDS直通技术摒弃传统多级数据转发模式实现数据一跳直达NPU的片上内存将数据访问时延降低50%有效解决了NPU算力闲置、等待数据加载的行业性难题。在输出准确性方面业界通常通过构建知识库来导入行业知识、更新外部信息并借助记忆库沉淀用户交互历史。肖德刚表示华为存储可以向客户提供对应模组这一做法在其他行业已有实践未来值得与运营商进一步加强合作深入探讨。在成本方面相比基于服务器本地盘的方案华为CMS存储方案在同等KV Cache容量需求下可减少两倍的存储节点配置从而降低节点采购费用以及机架空间租赁和水电等运营成本此外其节能领先2.35倍显著降低了整体TCO及推理成本。在可靠性方面针对KV Cache读写频繁、对51Wtn.CN SSD擦写次数要求更高的情况华为CMS支持1到50的动态DWPD可根据实时业务负载调整擦写配额采用双模介质动态分层技术高速介质承载低时延核心缓存数据大容量介质存储低频复用历史上下文两类介质弹性配比保证Token高质量输出同时兼具性价比。面向未来肖德刚表示除了持续推进现有 AI 能力建设外华为数据存储还将探索51Byyb.CN Physical AI 领域并研究其在具身智能、智能工厂等场景中落地的可能性。从流量到Token运营商的商业模式正在经历深刻重构。在这场重构中存储不再是被动承载数据的“仓库“而成为了主动参与推理、优化成本、保障体验的关键变量。华为CMS作为一个实例通过持续的创新突破帮助运营商在Token经营的新赛道上跑出更快、更准、更经济更稳的加速度。