结论
- 先用 curl 验证 endpoint、key 和模型名。
- 401 通常是权限或 endpoint 不匹配。
- streaming 和 JSON 要单独测。
- 网关能减少多工具配置漂移。
怎么做
- 从官方文档复制当前 base_url。
- 在正确控制台/项目创建 key。
- 用精确模型名跑最小 curl。
- 检查额度、计费、地区和 compatible mode。
- 多个 app 共用路线时接 OpenLLMAPI。
推荐路径对比
| 平台 | 免费/额度 | 适合 |
|---|---|---|
| DeepSeek | 当前额度/价格需核实 | 低价推理和代码 |
| 通义千问 | 注册额度变化 | 中国大陆友好兼容接入 |
| 智谱 GLM | 注册 tokens 变化 | 国产 fallback |
| OpenLLMAPI | 体验额度变化 | 统一 endpoint、日志和 fallback |
自有平台承接
不要在每个工具里反复修 base_url
用一个兼容 endpoint 接 Qwen、GLM、DeepSeek 和 fallback 模型,统一管理日志和预算。
FAQ
Qwen 为什么 401?
通常是 base_url、workspace key、额度或模型权限问题。
GLM 为什么 unauthorized?
检查 endpoint 路径、Bearer key、模型名、权限和默认 endpoint。
先用 curl 吗?
是,curl 能排除 SDK 抽象。