结论
- 代码 Agent 的兼容不只是 chat completion,要测 streaming、tool calls、长上下文、patch 质量和错误格式。
- Qwen、DeepSeek 是低价代码路线;GLM 和硅基流动适合中国大陆兜底。
- 很多失败来自工具仍使用默认 OpenAI endpoint,或 preset 覆盖了 custom base_url。
- 多工具、多人或自主循环需要一个 key、路由日志、fallback 和预算上限时,用网关更稳。
怎么做
- 创建正规 provider key,并从官方文档或网关后台复制准确 compatible base_url、认证格式和 model name。
- 在 Cline、RooCode 或 KiloCode 里显式配置 model、base_url、API key;不要只换 key。
- 跑三个 smoke test:小型读仓库、一文件修改、JSON/tool-call 任务;记录可接受 patch 率、延迟、错误体和 token 成本。
- 用日志或代理 trace 确认请求到达目标 endpoint,而不是默认 OpenAI host。
- 开启自主循环或大重构前设置日/月预算。
- 给失败 patch、JSON/tool-call 无效、上下文溢出或连续重试保留强 fallback。
推荐路径对比
| 平台 | 免费/额度 | 适合 |
|---|---|---|
| 通义千问 | 注册额度变化 | 中国大陆友好代码、长上下文和自定义兼容配置 |
| DeepSeek | 额度/价格变化 | 低价代码和推理路线 |
| 智谱 GLM | 注册 tokens 变化 | 国产 GLM 代码兜底和兼容客户端测试 |
| Groq/OpenRouter | 免费路线变化 | 快速 smoke test 和多模型实验 |
| OpenLLMAPI | 体验额度变化 | 代码 Agent 统一兼容 endpoint、路由、日志、预算和 fallback |
自有平台承接
给代码 Agent 一个带预算的统一 key
把 Cline、RooCode、KiloCode 等代码工具放到一个 OpenAI-compatible endpoint 后面,统一日志、预算、fallback,并携带代码 Agent 意图 UTM 注册。
FAQ
任何 OpenAI-compatible API 都能用于 Cline/RooCode 吗?
基础聊天可能能跑,但代码 Agent 还依赖 streaming、tool-call、长上下文、稳定错误和 patch 质量。一定要跑编辑任务 smoke test。
为什么工具还是在调用 OpenAI?
常见原因是 base_url 为空、provider preset 覆盖 custom settings、读取了另一个环境变量,或只设置 key 没改 endpoint。
先用哪个模型?
先用 Qwen 或 DeepSeek 这类低价代码路线,再给大重构和连续失败 patch 保留 GLM、Groq/OpenRouter 或高质量路线。
一定需要网关吗?
不一定。多工具、多人、预算或 fallback 规则变复杂时,网关才明显省心,也避免每个 IDE profile 单独保存 provider key。
能把共享或转卖 key 粘到 IDE 插件里吗?
不要。使用正规 provider key,生产 key 放服务端或受控网关,并定期轮换测试 key。