AI API 计费方式：Token、按次、按秒与按分钟

常见计费单位

语言请求的基础成本通常为：

成本 = 输入 Token / 1,000,000 × 输入单价
     + 输出 Token / 1,000,000 × 输出单价

如果平台设置渠道倍率或服务倍率，应在价格页面清晰展示最终单价或倍率，避免用户只能看到上游基础价。对于缓存 Token、推理 Token 和批处理折扣，应作为独立价格项记录。

图像成本可由请求次数、张数、分辨率、质量等级和编辑模式组成。视频成本通常由生成秒数、分辨率、帧率、是否包含音频以及模型档位决定。异步任务失败时，计费系统必须区分“已提交”“上游已扣费”“生成成功”和“已退款”等状态。

模型价格会变化。账单不能在查询时用最新价格反算历史请求，而应在请求执行时保存币种、计费单位、各项单价、倍率和最终金额。这样才能复核每一笔用量，并在价格更新后保持历史账单稳定。

请求前可按最大输出估算费用并检查余额，请求后再按实际用量结算差额。企业账户还需要日预算、月预算、模型白名单、并发上限和异常用量提醒。对于视频等高成本任务，建议采用预授权或冻结余额，任务完成后结算。

“按量计费”不是一种完整的计费单位。前端应明确显示“输入 /1M Token”“每张”“每秒”或“每分钟”等可计算单位。