结论
- Qwen、DeepSeek、GLM 分别适合中国友好 API 栈的不同部分。
- Agent、代码工具或生产用户流不要只依赖一个 provider。
- OpenAI-compatible 配置能降低 SDK 和工具迁移成本。
- 上线前必须重新核验价格、额度、模型名和权限。
怎么做
- 准备一组测试:中文 prompt、英文 prompt、代码修改、JSON 输出和 streaming。
- 用环境变量配置 Qwen、DeepSeek、GLM 的 base_url、api_key、model。
- 同一批任务跨 provider 跑,记录成功率、重试、延迟和成本。
- 按 workload 选择主路线,再把另外两个设为 fallback 或专项路线。
- 团队需要一个 key、统一日志、预算上限和切路由时,接 OpenLLMAPI。
推荐路径对比
| 平台 | 免费/额度 | 适合 |
|---|---|---|
| 通义千问 DashScope | 注册额度变化 | 阿里云兼容模式、中英文应用、长上下文 |
| DeepSeek | 核验当前额度/价格 | 低价代码和推理基准 |
| 智谱 GLM | 注册 tokens 变化 | 国产 GLM fallback 和路线多样性 |
| 硅基流动 | 免费/开源路线变化 | 中国大陆直连多模型兼容测试 |
| OpenLLMAPI | 体验额度变化 | 一个 key 管路由、fallback、日志和预算 |
自有平台承接
用一个 key 管 Qwen、DeepSeek、GLM
让中国友好 provider 可配置、可观测、可兜底,切路线不必重写应用。
FAQ
哪个 provider 做主路线?
按 workload 选。Qwen 常适合阿里云和长上下文;DeepSeek 常赢在低价推理/代码;GLM 适合国产 fallback。
这能替代中国大陆的 Claude 吗?
能覆盖许多 workload,但不要假设一比一。用自己的任务 benchmark,并避免不支持地区绕过。
兼容设置最常坏在哪里?
base_url 错、模型名过期、缺 bearer header、模型权限不足,以及客户端静默请求默认 OpenAI endpoint。
什么时候值得用网关?
需要一个 SDK 路径、自动 fallback、用户级成本日志、团队 key 管理或快速换 provider 时。