Token的成本与收费标准

Token的成本与收费标准
大模型LLM的收费核心是按Token词元计费而非按字数或时间计费。Token是模型处理文本的最小单位通常1个汉字约对应1-2个Token英文1个单词约对应1-3个Token标点和空格也单独计为Token。一、计费逻辑与公式输入与输出分开计费输入Token用户提问、上下文和输出Token模型回答分别计费且输出Token的单价通常高于输入Token因为模型生成内容比理解内容消耗更多计算资源输出单价通常是输入的2-5倍。计算公式总费用输入Token数×输入单价输出Token数×输出单价。计费单位通常以“每百万Token1M”为计价单位因为单Token价格极低。二、主流模型收费标准按百万Token计不同模型、不同版本、不同平台的价格差异巨大整体呈现“国产模型性价比高海外高端模型价格高”的格局。以下为2026年主流模型的参考价格注价格随平台、用量阶梯、缓存命中率等动态变化请以各平台官方最新报价为准国产主流模型人民币计价性价比高DeepSeek系列输入约0.21元输出约26元如DeepSeek-V3输入约0.2元输出约2元DeepSeek-R1输入约4元输出约16元。通义千问Qwen系列输入约0.92元输出约212元如Qwen-Plus输入约0.9元输出约2.1元Qwen-Max输入约2.6元输出约10.4元。智谱GLM系列输入约0.86元输出约228元如GLM-4-Air输入约0.8元输出约2元GLM-5.1输入约6元输出约28元。Kimi月之暗面系列输入约0.360元输出约0.960元如Kimi长文档版输入/输出约60元。2.海外主流模型美元计价价格较高OpenAI系列输入约0.152.5美元输出约0.615美元如GPT-4o输入2.5美元输出10美元GPT-4omini输入0.15美元输出0.6美元GPT-5.4输入2.5美元输出15美元。Anthropic系列输入约0.85美元输出约425美元如ClaudeSonnet4.5输入3美元输出15美元ClaudeOpus4.5输入5美元输出25美元。GoogleGemini系列输入约0.11.25美元输出约0.410美元如Gemini2.0Flash输入0.1美元输出0.4美元Gemini1.5Pro输入1.25美元输出5美元。三、影响实际成本的关键因素缓存命中率若相同或相似的提示词Prompt被重复调用缓存命中可大幅降低输入Token成本通常可降70%~90%。用量阶梯部分平台提供阶梯定价用量越大单价越低。上下文长度部分模型对超长上下文如超过200K会收取溢价。计费模式按量计费按实际调用量适合波动型业务包年包月/预付费资源包适合用量稳定的业务通常比按量计费单价更低。四、成本估算示例简单问答输入50Token输出50Token使用低价模型如DeepSeek-Flash单次成本约在0.01元以内。长文档分析输入5000Token长上下文输出250Token使用通用模型如GPT-4o单次成本约在0.1元左右。