大模型单次成本反推器
用一段时间的总 token 与调用次数,反推平均每次调用成本、平均 token 用量与总额。
输入参数
高级设置(汇率)
单次平均成本
| 维度 | USD | CNY |
|---|---|---|
| 单次平均 | — | — |
| 总额 | — | — |
一个从总量反推单次的大模型单次成本反推器:把账单、日志或用量报表里的总输入 token、总输出 token、缓存命中 token 和调用次数填进去,自动折算平均每次调用成本、平均输入输出 token、缓存命中率与总额。适合搜索 LLM cost per call、AI API unit cost、token usage cost breakdown 的场景,所有计算只在浏览器本地完成。
相关搜索场景: 大模型单次成本 · 总 token 反推单次费用 · AI API 单次调用成本 · LLM cost per call · cost per API call calculator · average token cost per request · API usage cost breakdown · 账单 token 反推成本 · Claude 单次调用费用 · GPT 每次调用成本 · Gemini 调用成本 · 缓存命中成本计算 · total tokens to per-call cost · AI API unit cost estimator
FAQ
和「单次算总量」有什么区别?
那个是"先有单次用量,往外推每日/每月总量";这个是"先有一段时间的总量,往回折算平均单次"。有账单/日志用这个,做方案预估用那个。
命中率是怎么算出来的?
命中率 = 总命中输入 ÷(总命中 + 总未命中输入)。不使用缓存时把命中填 0 即可。
调用次数填错会怎样?
调用次数只影响"折算出的单次均值",不影响总额(总额由总 token 决定)。次数越大,折算的单次用量越小。
阶梯定价模型也能用吗?
可以。工具用折算出的单次输入/输出长度自动选档,并在结果区显示本档实际单价。
我的数据会被上传吗?
不会。所有计算都在你的浏览器本地完成,页面不记录你填写的任何数值或文本。
三步反推单价
- 选一个模型(按厂商分组,标注计费币种)。
- 填入这段时间的总输入命中、总输入未命中、总输出 token 与调用次数。
- 右侧给出单次平均成本与总额(美元人民币),并显示折算出的单次均值与本档单价。
一个典型例子
某天共调用 1 万次:总命中输入 500 万、未命中输入 2500 万、总输出 1200 万 token。选 Claude Sonnet 4.5、汇率 7.2:折算单次约 3000 输入 + 1200 输出、命中率约 16.7%,单次约 ¥0.18,当天总额约 ¥1,850。
使用前请注意
- 反推得到的是"平均单次",掩盖了单次用量的波动;想看典型单次成本可换用「单次算总量」。
- 模型费率来自本站「大模型 API 费率表」整理的官方价格页与核对日期;页面访客不能修改本站数据,实际账单请以厂商官方价格为准。
- 命中率由"命中 ÷(命中+未命中)"得到;未建模缓存价的模型,命中部分不影响结果。