结论
- 低价首选测试:DeepSeek 适合推理/代码循环,Qwen 适合中国大陆友好代码和长上下文。
- 小模型/免费模型只适合分类、摘要、heartbeat,不适合所有关键决策。
- 定时 Agent 上线前必须有每日预算、最大轮数、最大重试和告警。
- 多 Agent、多 provider、多项目计费时,中转/网关比直连更容易控成本。
怎么做
- 先测一个真实工作流:输入/输出 tokens、工具调用、重试、失败率和耗时。
- 常规步骤走便宜模型,规划、失败修复、最终 review 走更强模型。
- 加停止条件:最大迭代、最大 tokens、每个工具最大重试、每天预算。
- 用 OpenAI-compatible base_url,把 DeepSeek、Qwen、GLM 或网关做成可切换配置。
- 每周看成功任务成本;便宜但高重试的模型要降级或换路由。
推荐路径对比
| 平台 | 免费/额度 | 适合 |
|---|---|---|
| DeepSeek | 当前注册额度 / 低价随官方变化 | 低价推理与代码循环,但要控重试 |
| 通义千问 | 百炼注册额度随活动变化 | 中国大陆友好长上下文和代码 Agent |
| 智谱 GLM | 注册 tokens / Flash 路线随官方变化 | 国产兜底和轻量 Agent 步骤 |
| OpenRouter | 免费模型限速 | no-card 实验和 fallback 测试 |
| OpenLLMAPI | 体验额度随活动变化 | 一个端点做 routing、fallback 和成本可见性 |
自有平台承接
让长时间 Agent 不再失控烧钱
把 Agent 流量放到一个兼容端点后面:按任务路由模型、失败自动兜底,并按项目/用户记录成本。
FAQ
Agent 只看 token 价格可以吗?
不可以。Agent 会放大重试和错误决策。稍贵但少循环的模型,最终成功任务成本可能更低。
定时 Agent 应该设哪些限制?
最大轮数、每轮最大 tokens、每日预算、每个工具最大重试,以及超出基线时的告警。
免费 API 能跑生产 Agent 吗?
通常不建议单独使用。免费路线适合 smoke test 和低风险步骤,生产需要稳定额度、日志和付费兜底。
什么时候需要网关?
当你有多个 Agent、需要 provider fallback,或要按用户/功能/项目归因成本时,网关更合适。