DEEIX Chat 的计费不是单一价格表。它同时支持自用模式、周期计费、按量计费、免费模型、按 Token、按次、按秒、阶梯计费、缓存计费、服务倍率、官方工具计费和兑换码。

计费结构#

计费可以分成三层理解:

层级管理内容影响
计费模式自用、周期、按量决定用户侧看到订阅、余额还是仅用量记录。
模型定价Token、按次、按秒、阶梯、免费决定每次模型调用如何计算费用。
附加计费缓存、服务倍率、官方工具决定额外项目是否单独计费或按倍率计费。

管理员应先决定计费模式,再配置模型价格和附加计费。不要反过来只改价格,而不确认用户侧是周期还是按量。

三种计费模式#

自用模式只记录用量,不向用户展示购买、充值或套餐扣减。它适合内部部署、团队统一承担成本或试运行阶段。

周期计费按订阅方案提供周期额度。用户购买方案后获得一段权益,调用会消耗周期额度。它适合套餐制、月度额度、年度额度和固定权益场景。

按量计费按账户余额扣费。用户需要充值或兑换余额,模型调用按真实账单消耗余额。它适合用量波动大、希望按实际消耗控制预算的场景。

预付费金额#

按量计费可以设置预付费金额。它不是最终费用,而是发起调用前的余额门槛。

预付费金额可以减少长任务中途余额不足的概率。高成本模型、长上下文、多工具调用场景建议设置合理门槛;但金额过高会让普通用户难以开始使用。

模型定价模式#

定价模式计费依据适合场景
按 Token输入、输出、缓存读写主流文本和多模态模型。
按次每次调用固定价格固定成本模型、工具型模型、一次性任务。
按秒按生成或处理时长计费视频、音频或耗时型生成任务。
阶梯计费按原始输入区间命中不同价格长上下文、超大输入或供应商分层价格。

免费模型可以独立标记。免费模型不单独计费,也可以在周期套餐说明中提示“不计入额度”。

Token 计费#

Token 定价可以分别设置输入、输出、缓存读和缓存写。这样可以匹配不同供应商的真实价格结构,而不是把所有 Token 混成一个价格。

输入和输出是最常见的计费项目。缓存读写用于支持带缓存能力的模型,尤其是长上下文、重复上下文和 Claude 类缓存场景。

缓存计费#

缓存计费用于处理供应商对缓存读、缓存写、不同缓存时长的差异化收费。管理端会区分缓存读、缓存写,以及 5 分钟、1 小时等不同缓存写入场景。

例如,Claude 缓存写可以按后台配置价乘以不同倍率;Fast Mode 可能基于输入、输出和缓存费用再应用倍率。这样既能保持用户侧展示简洁,又能在后台保留真实成本结构。

缓存计费对长对话和大文档尤其重要。没有缓存计费时,管理员很难解释为什么相似 Token 量的请求费用不同。

服务倍率#

部分供应商会根据服务等级、快速模式或优先级产生倍率。DEEIX Chat 支持把这类倍率纳入计费说明和调用详情。

管理员应在定价说明里保持透明:哪些模型或模式会产生倍率,哪些项目受倍率影响。用户侧如果开启了费用显示,也能在调用详情里看到更接近真实成本的结果。

阶梯计费#

阶梯计费也可以理解为层级计费。它按原始输入规模命中不同价格区间,适合供应商对长上下文或大输入设置分层价格的场景。

配置阶梯时,要明确每一档的上限和价格。最后一档可以作为不限量区间。阶梯过多会增加维护难度,过少则无法准确反映成本差异。

官方工具计费#

官方原生工具可以单独按次计费。工具价格和模型价格分开:工具调用本身按工具价格计算,工具产生的模型输入输出仍按模型价格计算。

如果工具价格填 0,表示工具不单独计费,只记录调用。对于供应商收取额外费用的搜索、执行、浏览或外部能力工具,建议单独配置工具价格。

周期套餐和兑换码#

周期套餐由价格、周期、额度和折扣组成。用户购买后获得权益队列,续费、升级和切换会根据已有权益决定立即生效或排队生效。

兑换码可以发放余额或套餐权益,并可限制计费模式、有效期、总次数、单用户次数和账号范围。兑换码适合活动、内部发放、补偿和手动开通。

计费快照和调用日志#

调用日志会记录当次调用的计费结果和关键上下文。价格变更通常只影响后续调用,历史调用会保留当时的计费快照。

排查费用时,不要只看当前价格表。应打开调用日志详情,看当次模型、Token、缓存、倍率、工具调用和计费模式。

配置建议#

先用自用模式完成模型和文件能力验证,再切到周期或按量。上线前至少配置核心模型价格、免费模型、缓存价格和工具价格。每次改价后,用测试账号发起一次典型调用,检查用户侧费用、订阅页、调用日志和后台计费是否一致。