GPT-5.6三档模型发布:能力强效率高,发布受美国政府介入

GPT-5.6三档模型发布:能力强效率高,发布受美国政府介入
三档命名新颖产品分层熟悉GPT-5.6来了OpenAI未沿用旧命名推出GPT-5.6 Sol、GPT-5.6 Terra、GPT-5.6 Luna。虽名字花哨实则还是熟悉的产品分层有旗舰、均衡、轻量三种模型。OpenAI称GPT-5.6系列未来几周全面开放目前应美国政府要求在Codex和API中向小群“值得信赖的合作伙伴”有限预览。三档模型层级分明价格差异显著OpenAI给GPT-5.6分三档Sol是旗舰Terra面向日常工作Luna是快速便宜的轻量模型。对应大模型常见三层结构从价格能看出层级。按API价格每100万token计费Sol输入5美元、输出30美元Terra输入2.5美元、输出15美元Luna输入1美元、输出6美元。GPT-5.6 Sol价格对齐GPT-5.5标准版Terra是GPT-5.5一半Luna是五分之一GPT-5.5 Pro仍是最贵模型。Sol最强模型能力突出Sol是最高档被OpenAI称为目前最强模型重点展示写代码、生物研究和网络安全能力。定位是“最会干活的模型”处理复杂工作任务。为支撑处理更难任务引入“最大推理强度”和“超强模式”。在Terminal-Bench 2.1测试中Sol拿到88.8%高分Ultra模式下更高模型广泛开放时还会公布完整评测结果。Terra均衡模型日常首选Terra是中间档是面向日常工作的均衡模型在效果、速度和成本间平衡。能力接近GPT-5.5但价格便宜一半可能是最常用档。在Terminal-Bench 2.1测试中拿到84.3%和Claude Fable 5持平。Luna轻量模型成本优先Luna是最低成本档定位快且便宜适合大量高频、对成本敏感任务如批量摘要等能以低成本完成轻量任务。这三档模型各有职责OpenAI只是重新包装大模型行业成熟分层。性价比凸显多领域表现出色GPT-5.6 Sol放出的benchmark不多方向集中在代码、生物学和网络安全。Terminal-Bench 2.1属代码方向GeneBench v1是生物学benchmarkSol在其上比GPT-5.5强且用token少。网络安全方面Sol是最强模型ExploitBench上表现可与Mythos Preview媲美只用约三分之一输出token。ExploitGym上三档模型网络安全能力提升且推理强度提高表现变强。有限预览政府介入模型发布OpenAI未直接全面开放GPT-5.6目前先在Codex和API中有限预览应美国政府要求名单已共享。美国政府加强对前沿AI模型介入今年6月发布行政令建立自愿框架。GPT-5.6 Sol发布模式有政府介入痕迹OpenAI是为探索可重复流程支持未来发布。政府介入背后核心是网络安全政府介入核心是网络安全官方公告大量篇幅提及。Sol是最强网络安全模型但没跨过Cyber Critical门槛。OpenAI将高风险能力分级反复强调Sol没达Critical表明不会自主完成最危险网络攻击链。网络安全能力是双刃剑OpenAI不认为政府访问流程应成长期默认机制否则用户等会晚拿到最好工具。前沿模型进入新发布阶段发布权难完全留公司手中。