yangmao.ai · 每日更新的 AI 羊毛数据库
vLLM 中国大陆访问与可用性指南
如果你在中国大陆使用 vLLM,先确认网页端、API、注册和付款是否稳定,再决定是否接入生产。
快速结论
- 免费额度:Apache-2.0 开源免费。
- API 免费试用:Self-hosted OpenAI-compatible API; no vendor credits required.
- 中国大陆访问:相对友好
- 适合人群:selfhosted / inference
可用模型与限制
| 模型 | 上下文 | 限制 | 说明 |
|---|---|---|---|
| OpenAI-compatible server | Depends on the model you serve | Hardware-bound | vLLM 是推理引擎,不卖额度;你自己部署什么模型,服务什么模型。 |
API 免费额度
可以
Self-hosted OpenAI-compatible API; no vendor credits required. · Hardware-bound; depends on GPU memory, model size, and concurrency.
vLLM 可把开源模型变成 OpenAI 兼容 API,适合需要私有化部署、低成本推理和高吞吐的团队。
中国大陆访问
中国大陆直连
自托管部署,中国大陆可用性取决于你的集群、镜像源和模型下载路径。
建议使用路径
先看 vLLM 主详情页,确认它是否适合你的任务。
注册后进入控制台创建 API Key,优先消耗 Self-hosted OpenAI-compatible API; no vendor credits required.。
测试 1-2 个真实任务,再决定是否升级或切换到替代工具。
如果中国大陆访问不稳定,优先看 API 中转或同类国产替代。
生产决策检查
vLLM 的免费额度只适合验证;上线前记录每 1K 请求成本、失败重试成本和月度预算上限。
如果你已有 OpenAI SDK 代码,优先确认 vLLM 的 base URL、model name、streaming、tool calling 和 JSON mode 是否兼容。
至少准备一个同类 provider 或 OpenLLMAPI 路由,避免免费额度耗尽、区域访问失败或模型下线时中断。
把本页 source snapshot 与官网控制台截图一起保存,方便后续复核额度、价格和速率限制变化。
同类替代
订阅额度变动提醒
如果 vLLM 免费额度、价格或中国大陆访问状态变化,我们优先提醒;需要生产接入时,再比较官方平台、API 网关和同类替代。
订阅提醒 → 比较 API 网关 → 用 OpenLLMAPI 统一接入 →数据来源快照
页面由 yangmao.ai 数据库和厂商公开文档生成;免费额度、价格、速率限制可能随时变化,生产使用前请以官网控制台为准。
- 数据源
- yangmao.ai provider tracker + official provider documentation review
- 官方来源
- https://docs.vllm.ai/
- 最后更新
- 2026-06-16
- 免费额度
- Apache-2.0 开源免费。
- API 免费额度
- Self-hosted OpenAI-compatible API; no vendor credits required.
- 速率限制
- Hardware-bound; depends on GPU memory, model size, and concurrency.
常见问题
vLLM 有免费额度吗?
有,当前记录为:Apache-2.0 开源免费。。具体政策可能变化,建议注册前再看官网。
vLLM API 可以免费试用吗?
可以,当前记录:Self-hosted OpenAI-compatible API; no vendor credits required.,速率限制:Hardware-bound; depends on GPU memory, model size, and concurrency.。
vLLM 不绑信用卡能用吗?
通常可以先试免费功能,但是否强制绑卡以注册页为准。
vLLM 有哪些替代品?
可以看本页下方同类替代,或进入 vLLM alternatives 页面。