结论
- DeepSeek 当前规则以官方价格页为准。
- 比较成功任务成本,不只看 token 单价。
- cache-hit 折扣不适用于每次请求。
- 扩量前要准备 fallback 和预算日志。
怎么做
- 记录当前价格、缓存和离峰规则。
- 用真实高流量 workflow 测试。
- 记录重试、JSON 失败、延迟和最终成本。
- 对比 DeepSeek、Qwen、GLM 和 fallback。
- 需要路由、日志和预算上限时接 OpenLLMAPI。
推荐路径对比
| 平台 | 免费/额度 | 适合 |
|---|---|---|
| DeepSeek | 当前额度/价格需核实 | 低价推理和代码 |
| 通义千问 | 注册额度变化 | 中国大陆友好兼容接入 |
| 智谱 GLM | 注册 tokens 变化 | 国产 fallback |
| OpenLLMAPI | 体验额度变化 | 统一 endpoint、日志和 fallback |
自有平台承接
把便宜 DeepSeek 调用变成可控路线
优先路由 DeepSeek、失败兜底,并按 app、用户、功能或 Agent run 追踪花费。
FAQ
DeepSeek 一定最便宜吗?
不一定,重试、cache miss、长输出和失败任务会改变有效成本。
价格在哪里核实?
看 DeepSeek 官方 API pricing 文档和账号控制台。
什么时候加 fallback?
用户依赖或定时 Agent 上线前。