14元代金券
SiliconCloud为新注册用户提供14元代金券,可用于API调用,有效期30天。
AI DEAL COLLECTION
集中整理注册送额度、免费调用、OpenAI 兼容 API 和开发者可直接测试的 AI API 羊毛。
集中整理注册送额度、免费调用、OpenAI 兼容 API 和开发者可直接测试的 AI API 羊毛。 适合想快速比较免费额度、领取门槛和可用替代方案的开发者、独立开发者和 AI 工具用户。
yangmao.ai 会通过自动化数据管道和人工抽查更新免费额度、到期时间、领取条件和可访问性;领取前仍建议查看官方页面。
优先查看同页的替代平台、OpenAI 兼容 API、中国大陆可用入口或长期免费方案,避免只依赖单一供应商。
SiliconCloud为新注册用户提供14元代金券,可用于API调用,有效期30天。
月之暗面 Kimi 大模型 API 新注册用户赠送 $10 额度,支持长上下文(128K),中国大陆可直接访问,适合文本生成和对话场景。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token $2,输出价格降至每百万token $8,相比GPT-4o降低约26%,为开发者提供更具性价比的AI能力。
SiliconFlow新用户注册即送14元(约$2)API代金券,可用于多种模型。
模拟Gemini CLI、Antigravity、Codex、Grok和Kiro客户端请求,兼容OpenAI API。每天支持数千次Gemini模型请求,内置Kiro中的Claude模型免费使用。通过API轻松连接任何客户端,让AI开发更高效!
Anthropic for Startups 是官方企业/创业公司向免费 API credits 和 priority rate limits 申请的高置信线索,但不是无门槛注册送额度。适用对象是与 Anthropic VC partners 合作的 venture-backed startups;金额未公开,必须以官方审核和发放为准。
Anyscale API 当前记录有免费试用:$10 free credits;速率限制:30 RPM。
Anyscale 当前记录有免费额度:按额度。适合先试用再决定是否升级。
Anyscale 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$10 free credits。适合直接替换 SDK base_url 做低成本测试。
百川智能为新注册用户提供 100 万 token 免费 API 额度,支持 Baichuan4 系列模型,中国大陆直连,无需科学上网。
百川智能为 Baichuan4 模型提供新用户注册即送100万token免费API额度,支持中文优化,中国大陆直接访问,适合开发者快速集成。
注册百川智能开放平台即送 100 万 token,支持 Baichuan4 和 Baichuan3-Turbo 模型,中国大陆直连,无需海外支付方式。
百川智能 API 当前记录有免费试用:500万 tokens;速率限制:5 RPM。
百川智能 当前记录有免费额度:无明确限制。适合先试用再决定是否升级。
百川智能为新注册用户提供 100万 token 免费额度,可用于调用 Baichuan4 系列模型 API,国内直连,注册即用,支持文本生成和对话场景。
百川智能 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:500万 tokens。适合直接替换 SDK base_url 做低成本测试。
百度千帆平台为注册用户提供每月 100 万 Token 的免费 API 额度,支持 ERNIE 系列模型,中国大陆直接访问,适合个人开发者和学生。
百度千帆大模型平台为新注册用户提供 100 万 token 的文本模型免费额度及 50 万次图片生成/理解额度,支持 ERNIE 系列模型,中国大陆用户可直接注册使用。
百度千帆大模型平台为新用户提供200万Token免费额度,支持ERNIE系列模型,国内直接访问,注册即可使用,无需海外环境。
百度千帆大模型平台为新用户提供100万Token免费调用额度(支持ERNIE 4.0、ERNIE Speed等),另赠50元体验金。中国大陆开发者可直接使用百度账号注册,API兼容OpenAI格式,迁移成本低。
百度千帆大模型平台为新用户提供 100 万 token 的免费调用额度,支持 ERNIE-Bot、ERNIE-Bot-turbo 等模型,中国大陆直接访问,注册即用,无需绑定支付方式。
百度千帆平台为新用户提供 ERNIE-Bot 系列模型免费调用额度,包含 100 万 tokens,支持 API 调用,中国大陆直接可用,无需海外支付方式。
百度千帆平台为新用户提供 ERNIE-Bot、ERNIE-3.5 等模型免费调用额度,每月基础免费额度充足,中国大陆直接使用,支持 SDK 和 REST API。
百度千帆平台近期调整免费政策,ERNIE-Bot、ERNIE-Bot-Turbo 等模型每日免费调用次数提升至 1000 次,注册即享,无需绑定银行卡,中国大陆开发者友好。
百度千帆大模型平台为新用户提供 200万 token 免费额度,支持 ERNIE-Bot、ERNIE-Bot-turbo 等模型,中国大陆网络直接使用,注册即送。
百度千帆大模型平台为新用户提供100万 token 免费额度,适用于 ERNIE 3.5 和 ERNIE 4.0 模型,支持文本生成、对话等场景。中国大陆直接访问,无需科学上网,注册即用。
Cerebras API 当前记录有免费试用:1M tokens/day;速率限制:30 RPM / 60K TPM / 1M TPD。
Cerebras 使用自研 WSE 芯片,推理速度全球最快(2000+ tokens/s,比 GPU 快 20 倍)。免费层每天 100 万 token,30 RPM,无需信用卡。 支持模型:Llama 3.3 70B、Llama 3.1 8B、Qwen 3.5 等。OpenAI 兼容格式,一行代码切换。 适合对延迟敏感的场景:实时对话、流式输出、Agent 工具调用。速度是 Groq 的竞争对手,但每天额度更大(100 万 vs Groq 的 RPD 限制)。
Cerebras 当前记录有免费额度:100 万 tokens/天。适合先试用再决定是否升级。
Cerebras 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:1M tokens/day。适合直接替换 SDK base_url 做低成本测试。
ChatGPT (OpenAI) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$0。适合直接替换 SDK base_url 做低成本测试。
Anthropic API API 当前记录有免费试用:$5;速率限制:5 RPM。
Cloudflare Workers AI API 当前记录有免费试用:每天 10000 神经元(永久有效);速率限制:10000 requests/day。
Cloudflare Workers AI 当前记录有免费额度:每天 10000 次免费调用。适合先试用再决定是否升级。
Cloudflare Workers $5/月套餐内置 Workers AI,每天 10000 次免费 AI 调用(以神经元计量),永久有效。 支持 50+ 开源模型: - LLM:Llama 3.1 8B、Llama 3.3 70B、Gemma、Mistral 7B、Phi-2 - 图片生成:Stable Diffusion XL(完全免费!) - 嵌入向量:BGE Base/Large(适合 RAG 和语义搜索) - 语音转文字:Whisper 亮点: - 永久有效,不会过期 - 推理在 Cloudflare 全球 300+ 边缘节点运行,延迟极低 - 中国大陆可直连,无需代理 - 支持 OpenAI 兼容格式(通过 AI Gateway) - 超出免费额度后按量计费,不会突然断服务 - 如果你已经在用 Cloudflare Workers,这基本是白送的 适合轻量 AI 场景:博客辅助写作、内容标签生成、文本摘要、嵌入向量、产品图生成等。
Cloudflare Workers AI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:每天 10000 神经元(永久有效)。适合直接替换 SDK base_url 做低成本测试。
Cohere将Command R+和Command R API价格降低50%,新模型Command R7B定价更低。
Cohere API 当前记录有免费试用:1000 calls/month;速率限制:Trial rate limits。
Cohere 当前记录有免费额度:1000 次/月(Trial Key)。适合先试用再决定是否升级。
新用户注册 Cohere 平台即获 $10 免费 API 额度,可用于 Command R+、Embed 等模型,支持 RAG 和分类任务,中国大陆需科学上网。
Cohere 为新注册用户提供 100 美元免费 API 额度,支持 Command R+、Embed 等模型,适合 RAG 和文本生成场景。需绑定信用卡验证身份,中国大陆用户可用虚拟卡。
Cohere 提供免费 Trial API Key,每月 1000 次调用,覆盖旗下所有模型: - Command R+:顶级 RAG 和对话模型 - Rerank:文档重排序,RAG 必备 - Embed:文本嵌入向量,支持多语言 无需信用卡,每月自动重置。适合个人开发者和 RAG 项目原型验证。注意:Trial Key 不允许用于生产环境。
Cohere 为新注册用户提供 $20 免费 API 额度,可用于 Command R+、Embed 等模型,有效期 30 天,需绑定信用卡,中国大陆需科学上网。
Cohere 提供每月 100 万 token 免费额度,支持 Command R+、Embed 等模型,API 稳定,中国大陆需科学上网,适合 RAG 和文本生成场景。
Cohere 近期将免费试用额度从 40 万 token 提升至每月 100 万 token,支持 Command R、Embed 等模型 API,注册即享,中国大陆需科学上网访问。
扣子 (字节跳动) API 当前记录有免费试用:Free tier;速率限制:Varies。
扣子 (字节跳动) 当前记录有免费额度:无明确限制。适合先试用再决定是否升级。
DeepSeek 官方文档确认 API 并发默认限制之外存在 capacity expansion request:需要更高并发的账号可提交业务需求,由 DeepSeek 匹配适当并发,并且扩容没有额外费用。适合需要 DeepSeek V4 Pro / V4 Flash 更高并发的团队或企业;这不是免费 token 额度,也不是自动开通。
DeepSeek 为新注册用户提供 500 万 token 免费 API 额度(含对话和代码模型),支持中国大陆直接访问,无需海外信用卡。
注册即送 500 万 token,支持 DeepSeek-V2 和 DeepSeek-Coder 模型,兼容 OpenAI API 格式,中国大陆直连可用,无信用卡要求。
新注册用户可获得 500 万 token 免费额度,支持 DeepSeek-V2 和 DeepSeek-Coder 模型,中国大陆可直接访问。
DeepSeek 为新注册用户提供 500 万 token 的免费 API 额度(含输入和输出),支持 DeepSeek-V2 等模型,中国大陆可直接访问,无需海外信用卡。
DeepSeek API 当前记录有免费试用:$5;速率限制:2 RPM。
DeepSeek 为新注册用户提供 500 万免费 tokens,支持 DeepSeek-V2 和 DeepSeek-Coder 模型,API 兼容 OpenAI 格式,中国大陆可直接访问,无需海外信用卡。
DeepSeek 为新注册用户提供 500万 token 的免费 API 调用额度,支持 DeepSeek-V2 和 DeepSeek-Coder 模型,中国大陆可直接访问,无需海外信用卡。
DeepSeek 提供每日 50 次免费推理(V3 + R1 模型),注册即送 $5 API 额度。R1 推理模型在数学和代码方面表现优异,是目前性价比最高的免费 AI 之一。
DeepSeek将免费用户每日对话次数限制从50次提升至100次,为用户提供更多免费使用额度。
DeepSeek 当前记录有免费额度:50次/天。适合先试用再决定是否升级。
DeepSeek继续提供免费API额度,新用户注册即送500万token,无需付费即可开始使用。
DeepSeek 为新注册用户提供 500 万 token 的免费额度(含输入和输出),可用于 DeepSeek-V3 和 DeepSeek-R1 模型 API,有效期 30 天,支持中国大陆直接访问,无需翻墙。
DeepSeek 为新注册用户提供 500 万 Token 免费额度,可用于 DeepSeek-V2 和 DeepSeek-Coder 系列模型 API 调用,支持文本生成与代码补全,中国大陆直接访问,无需翻墙。
DeepSeek 为新注册用户提供500万Token免费额度,可用于其最新大模型API调用,支持文本生成、代码编写等,中国大陆可直接访问注册,无需海外信用卡。
DeepSeek 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$5。适合直接替换 SDK base_url 做低成本测试。
DeepSeek 公布 R1 模型 API 定价,输入 $0.14/百万 token,输出 $0.28/百万 token,价格极具竞争力。
新注册 DeepSeek 平台即赠送 500 万 token 免费额度,可用于调用 DeepSeek-V2 等模型 API,支持中国大陆网络直接使用,无需海外信用卡。
DeepSeek-V3输入价格降至$0.27/百万token,输出价格降至$1.10/百万token,适用于所有API用户。
新注册用户赠送500万token免费额度,支持 DeepSeek V3 模型,中国大陆直接使用,无需翻墙。
DeepSeek-V4 正式发布,带来百万级Token上下文窗口,显著提升长文本处理能力。该模型面向Agent应用优化,支持更复杂的多步骤推理和工具调用。开发者可通过API免费使用,无需额外付费。这是目前开源模型中上下文长度最长的之一,适合文档分析、代码库理解等场景。
DeepSeek V4 Pro 模型的价格优惠将于2026年5月31日结束,此前享受的2.5折优惠将调整为原定价的1/4。这意味着价格有所上调,但相比原价仍有一定折扣。用户需注意价格变动,合理规划使用成本。
豆包 (字节跳动) API 当前记录有免费试用:50万 tokens;速率限制:5 RPM。
豆包 (字节跳动) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:50万 tokens。适合直接替换 SDK base_url 做低成本测试。
ElevenLabs API 当前记录有免费试用:10K chars/month;速率限制:Varies。
ElevenLabs 当前记录有免费额度:10000 字符/月。适合先试用再决定是否升级。
文心一言 (百度) API 当前记录有免费试用:Free tier;速率限制:5 RPM。
文心一言 (百度) 当前记录有免费额度:无明确限制。适合先试用再决定是否升级。
fal.ai API 当前记录有免费试用:Promotional credits;速率限制:N/A。
fal.ai 当前记录有免费额度:注册送 credits。适合先试用再决定是否升级。
Fireworks AI 提供每日 100 万 token 免费额度,支持 Llama 3、Mixtral、Gemma 等主流开源模型。API 兼容 OpenAI 格式,中国大陆可直连,适合原型开发和轻量应用。
提供高速推理 API,支持 Llama、Qwen 等开源模型。新用户有每日免费的 token 额度,适用于开发和测试。
Fireworks AI API 当前记录有免费试用:$1 free credits;速率限制:600 RPM。
Fireworks AI 当前记录有免费额度:600 RPM。适合先试用再决定是否升级。
Fireworks AI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$1 free credits。适合直接替换 SDK base_url 做低成本测试。
FLUX (Black Forest Labs) API 当前记录有免费试用:Free via platforms;速率限制:Varies。
Gemini API 官方免费层适合个人开发者、小项目和原型验证;具体免费速率限制会随模型、项目和 billing tier 变化,需在 AI Studio 查看当前项目限额。
Gemini (Google) 当前记录有免费额度:无明确限制。适合先试用再决定是否升级。
GLHF.chat 提供 Llama、Mistral 等开源模型的免费 GPU 推理服务,注册即送每月 25 美元额度,无需绑定信用卡。支持中国大陆网络访问,适合低成本运行大模型。
Google AI (Gemini) API 当前记录有免费试用:免费 API 无需信用卡;速率限制:15 RPM (Flash)。
Google AI (Gemini) 当前记录有免费额度:Gemini 免费版无限使用。适合先试用再决定是否升级。
Google 最新 Gemini 2.5 Pro 模型提供免费 API 层,每分钟最多2次请求,无需付费即可体验长上下文推理能力,适合开发测试和小型应用。
Google在AI Studio中免费提供Gemini 2.5 Flash模型,用户可免费使用,但速率限制低于付费层。
Google 调整了 Gemini 免费层的额度,Gemini 2.5 Flash 模型在 AI Studio 中免费提供,速率限制为每分钟 30 次请求。
Google AI Studio免费层现已支持Gemini 2.5 Flash模型,用户每日可享受免费配额,无需付费即可使用该模型进行开发与测试。
Google 调整了 Gemini API 的定价,Gemini 2.5 Flash 模型输入降至 $0.15/M tokens,输出降至 $0.60/M tokens,价格极具竞争力。
Gemini 2.5 Flash输入价格降至$0.15/百万token,输出价格降至$0.60/百万token,大幅降低使用成本。
Gemini 2.5 Flash输入价格$0.15/百万token,输出$0.60/百万token,性价比极高。
Gemini 1.5 Flash 和 Gemini 1.5 Pro 模型免费层,每分钟 60 次请求,无需付费即可使用,中国大陆开发者可通过代理访问。
Google将Gemini API免费层速率限制提升至每分钟30次请求,支持Gemini 2.0 Flash模型,适合开发者和个人项目使用。
Gemini API / AI Studio 官方 no-card 免费层新增可抓入口:除 Gemini API Free Tier 免费输入/输出 token 外,Google I/O 2026 官方 Blog 还确认 AI Studio 新手可免信用卡、零成本把前两个 app 部署到 Google Cloud。注意:生产环境、更高限额或已启用 billing 项目仍按官方 Cloud Run / Paid Tier 规则走。
Google Gemini API 提供永久免费套餐,支持 Gemini 1.5 Flash 和 Gemini 1.5 Pro 模型,每分钟最多 60 次请求,无每日 token 上限,适合个人开发者和学习使用。中国大陆需科学上网。
Google Gemini API 提供免费层,支持 Gemini 1.5 Pro 和 Flash 模型,每分钟最多 60 次请求,无需付费即可使用多模态能力,中国大陆需代理访问。
Google Gemini API 提供免费层级,每分钟最多60次请求,支持 Gemini 1.5 Flash 和 Gemini 1.5 Pro 模型,中国大陆开发者可通过代理或直接访问(部分地区可用)。无需绑定信用卡即可开始使用。
Google将Gemini免费层上下文窗口从32k提升至100万token,并增加每日请求次数,大幅提升免费用户的使用体验。
OpenAI 发布了 GPT-5.5 Instant 模型,这是 GPT 系列的最新迭代版本。该模型针对低延迟响应进行了优化,适用于需要即时交互的应用场景。用户可以通过 OpenAI API 直接调用,无需额外申请。具体定价和免费额度信息尚未公布,建议关注官方文档更新。
OpenAI 发布了 GPT-5.5 系统卡,标志着新一代模型的到来。该模型在推理、编码和多模态能力上均有显著提升。具体定价和免费额度信息尚未公布,但预计将延续 GPT 系列的分层定价策略。用户可通过 OpenAI API 或 ChatGPT 体验新模型。
Grok (xAI) API 当前记录有免费试用:$25/月;速率限制:Varies。
Grok (xAI) 当前记录有免费额度:有限次数/天。适合先试用再决定是否升级。
xAI 的 Grok 每月送 $25 API 额度,自动重置。支持 Grok-2 等模型,OpenAI 兼容格式。是目前每月免费额度最高的 AI API 之一。
Grok (xAI) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$25/月。适合直接替换 SDK base_url 做低成本测试。
Groq 提供基于 LPU 推理引擎的免费 API,支持 Llama 3、Mixtral 等模型,每日 1440 次请求限制,速度极快。需海外邮箱注册,中国大陆可访问但需翻墙。
Groq 提供每日100万Token免费API调用额度,基于其自研LPU芯片实现极速推理(支持Llama 3、Mixtral等模型)。注册需海外邮箱,但API中国大陆可直连,适合低延迟场景。
Groq 提供基于 LPU 推理引擎的免费 API,支持 Llama 3、Mixtral 等模型,每天最多 1440 次请求,中国大陆可直连,适合低延迟推理测试。
Groq 提供完全免费的 API 访问,支持 Llama 3、Mixtral 等开源模型,速率限制为 30 次/分钟,无总量上限。中国大陆用户需自行解决网络访问问题,注册无需信用卡。
Groq API 当前记录有免费试用:Free tier(永久免费);速率限制:30 RPM / 6000 TPM。
Groq 是今天最值得补的高速推理羊毛之一:免费层可直接测试 Llama / Mixtral / Gemma 等模型,接口兼容 OpenAI SDK。适合做 AI Agent、RAG 摘要、低延迟聊天原型。中国大陆访问稳定性需要自行确认,必要时可用 API 中转。
Groq 提供免费 API 额度,支持 Llama 3、Mixtral 等开源模型,推理速度极快,每日有限免费调用次数,注册即用,中国大陆需科学上网。
Groq 使用自研 LPU(Language Processing Unit)推理芯片,提供业界最快的 AI 推理速度。 免费模型列表: - Llama 3.3 70B Versatile — 6000 TPM / 30 RPM - Llama 4 Scout 17B — 6000 TPM / 30 RPM - Llama 4 Maverick 17B — 6000 TPM / 30 RPM - Mixtral 8x7B — 5000 TPM / 30 RPM - Gemma 2 9B — 15000 TPM / 30 RPM - DeepSeek R1 Distill Llama 70B — 6000 TPM / 30 RPM 亮点: - 速度比 GPU 方案快 10 倍以上,Llama 3.3 70B 可达 300+ token/秒 - API Key 以 gsk_ 开头,兼容 OpenAI 格式 - 不限总量,只限速率 - 需要代理访问(中国大陆可通过 openllmapi.com 中转)
Groq 将免费套餐的每日 API 请求上限从 500 次提升至 1000 次,支持 Llama 3、Mixtral 等开源模型,中国大陆开发者可直接通过 API 调用,无需绑定信用卡。
Groq 使用自研 LPU(Language Processing Unit)芯片,提供全球最快的 AI 推理速度。免费层无需信用卡,日常使用完全够。 免费额度详情: - Llama 3.3 70B:30 RPM,6000 tokens/min,14400 requests/day - Llama 3.1 8B:30 RPM,20000 tokens/min - Gemma 2 9B:30 RPM,15000 tokens/min - Mixtral 8x7B:30 RPM,5000 tokens/min - 还支持 Llama 4 Scout/Maverick(新上线) 为什么 Groq 速度这么快: - 自研 LPU 芯片,专为 LLM 推理设计 - 确定性执行,没有 GPU 的内存带宽瓶颈 - Llama 3.3 70B 输出速度 300+ tokens/s(GPU 通常 30-50 tokens/s) - 首 token 延迟极低,适合实时对话和流式输出 适合场景: - 实时 AI 对话(速度是体验的核心) - Agent 工具调用(低延迟 = 更快的多步推理) - 流式输出(打字机效果极其流畅) - 需要快速迭代的原型开发 中国大陆可直连。API 兼容 OpenAI 格式,base_url 为 https://api.groq.com/openai/v1。
Groq 当前记录有免费额度:6000 tokens/min (Llama 3.3 70B)。适合先试用再决定是否升级。
Groq免费层用户现在可以调用Llama 4 Scout和Maverick模型,有速率限制。
Groq免费层速率限制从30 RPM降至20 RPM,但每日请求上限提高,适合轻度使用。
Groq免费层速率限制调整,部分模型每日请求上限降低,具体限制请参考官方文档。
Groq将免费层API速率限制从每分钟30次提升至60次,支持更多模型。
Groq提升免费层API速率限制,支持更多并发请求,适合开发者测试和原型开发。
Groq 将免费层速率限制提升至每分钟 60 次请求,适合开发测试。
Groq提升免费用户API请求速率限制,支持更多并发调用。
Groq将免费层API请求速率限制提升至每分钟60次,支持Llama 3等模型。
Groq免费层每日请求限制提升至1440次,支持更多模型,包括Llama 4系列等,适合开发者测试和轻量级应用。
Groq将免费层速率限制从每分钟30次提升至60次,支持Llama 3和Mixtral模型,适用于API调用。
Groq在其平台上部署了Meta的Llama 4 Scout和Llama 4 Maverick模型,提供免费API。
Groq 于2026年4月底上线Mixtral 8x7B免费推理服务,每日500次请求,无需信用卡,API兼容OpenAI格式,中国大陆开发者可直接调用。
Groq 提供 Mixtral 8x7B 等模型的免费 API 访问,速率限制为每分钟30次请求,适合快速原型开发。中国大陆需通过代理访问。
Groq 提供基于 LPU 的高速推理服务,Mixtral 8x7B 模型每日免费额度高达100万token,注册即用,中国大陆可直接访问 API。
Groq 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:Free tier(永久免费)。适合直接替换 SDK base_url 做低成本测试。
Hugging Face API 当前记录有免费试用:Free tier;速率限制:Varies。
Hugging Face 推出免费推理 API,支持多种开源模型,无需信用卡,每月提供 30,000 次免费推理请求。
Hugging Face推出免费推理API,支持数千个开源模型,每日有请求限制,适合开发者测试和集成。
Hugging Face 推出免费推理 API,支持多种模型,用户无需付费即可调用。
Hugging Face 当前记录有免费额度:按模型不同。适合先试用再决定是否升级。
Hugging Face 提供 Inference API 免费套餐,每月 3 万次调用,支持数千个开源模型(文本、图像、音频等),中国大陆可访问但速度较慢,适合学习和实验。
Hugging Face 提供免费推理 API,可调用数千个社区模型(包括文本、图像、音频等),中国大陆可直接访问,无需付费。
Hugging Face将Spaces免费GPU时长从每月10小时提升至20小时,用户可更长时间运行AI应用和演示。
腾讯混元 API 当前记录有免费试用:100万 tokens;速率限制:5 RPM。
腾讯混元 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:100万 tokens。适合直接替换 SDK base_url 做低成本测试。
Kimi (月之暗面) API 当前记录有免费试用:¥15 + 充 $5 送 $5;速率限制:3 RPM。
月之暗面(Moonshot AI)为 Kimi 大模型 API 新用户提供100万 token 免费额度,支持长上下文(128K),中国大陆直接访问,无需代理。注册即送,可用于对话、文档分析等场景。
Kimi (月之暗面) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:¥15 + 充 $5 送 $5。适合直接替换 SDK base_url 做低成本测试。
DGX Cloud Lepton (原 Lepton AI) API 当前记录有免费试用:$10 free credits;速率限制:10 RPM。
DGX Cloud Lepton (原 Lepton AI) 当前记录有免费额度:10M tokens/day。适合先试用再决定是否升级。
DGX Cloud Lepton (原 Lepton AI) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$10 free credits。适合直接替换 SDK base_url 做低成本测试。
LM Studio API 当前记录有免费试用:Unlimited;速率限制:Local。
LM Studio 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:Unlimited。适合直接替换 SDK base_url 做低成本测试。
万量引擎 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:按量付费。适合直接替换 SDK base_url 做低成本测试。
MiniMax为新注册用户提供100万Token免费体验额度,支持abab系列模型,中国大陆用户可直接使用,注册无需海外信用卡。
MiniMax (稀宇科技) API 当前记录有免费试用:¥15;速率限制:Varies。
MiniMax (稀宇科技) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:¥15。适合直接替换 SDK base_url 做低成本测试。
Mistral AI 于2026年4月更新免费政策,Le Chat 平台每月提供100万token免费额度,支持Mistral Large 2模型,中国大陆可直连。
Mistral AI 的 Le Chat 聊天应用提供免费无限对话,支持 Mistral Large 等模型,中国大陆可直接访问网页版,无需注册即可使用基础功能。
Mistral为新用户提供免费API试用额度,注册后即可在控制台查看具体额度,适合体验Mistral的AI模型能力。
Mistral AI API 当前记录有免费试用:Free tier;速率限制:1 RPM。
Mistral AI 为新用户提供 500 万 token 免费 API 额度,支持 Mistral Large、Small 等模型,中国大陆可注册但需海外邮箱。
Mistral AI 的官方免费 API 入口是 Experiment plan:可免费评估和做原型,但速率限制较低,生产或更高额度需升级 Scale plan。
Mistral AI 提供免费开发者计划,每月 50 万 token 的 API 调用额度,支持 Mistral Large、Mistral Small 等模型,中国大陆需科学上网。
Mistral Small 3.1模型已加入免费层,开发者可免费使用API,每日享有500万token的免费额度。
Mistral AI 当前记录有免费额度:无明确限制。适合先试用再决定是否升级。
Mistral AI 为新注册用户提供 50 万 token 免费额度,可用于调用 Mistral Large、Mistral Small 等模型,支持文本生成和代码能力。中国大陆用户需自行解决网络访问,注册需邮箱验证。
Mistral AI 的官方免费 API 入口是 Experiment plan:可免费评估和做原型,但速率限制较低,生产或更高额度需升级 Scale plan。
新注册用户赠送 €10 API 额度,可用于 Mistral Large 等模型,支持中国大陆邮箱注册,需绑定国际信用卡。
Mistral AI 的 Le Chat 平台提供免费层,支持无限次对话、文件上传(图像、PDF、Word、Excel)和网络搜索,无需付费。中国大陆可直接访问网页版。
Mistral AI 推出的 Le Chat 聊天助手提供每日100次免费对话额度,使用自家 Mistral Large 模型,支持中文。可通过网页或 API 使用,注册即享,无需付费。中国大陆可正常访问。
Mistral AI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:Free tier。适合直接替换 SDK base_url 做低成本测试。
注册月之暗面开放平台即送 1500 万 token,支持 Kimi 长上下文模型(128K),中国大陆直连,适合长文本处理任务。
新注册用户获赠 1500 万 token 免费额度,可用于 Kimi 大模型 API,支持长上下文(128K),中国大陆网络直接使用。
月之暗面(Moonshot AI)为新注册用户提供 100 万免费 tokens,支持长上下文模型,API 兼容 OpenAI 格式,中国大陆直接使用。
月之暗面 Moonshot 为新注册用户提供 150万 token 的免费 API 额度,支持 Moonshot-v1 模型,中国大陆可直接访问,适合长文本处理。
月之暗面 Kimi 大模型 API 新用户注册即送 1500万 token 免费额度(约 15元),支持长上下文模型,中国大陆直连,适合开发者和个人使用。
月之暗面 Kimi 为新注册开发者提供 100 万 Token 免费额度,支持长上下文模型,中国大陆直接使用,无需海外信用卡。
月之暗面 Kimi 大模型为新注册开发者提供 500 万 token 的免费 API 调用额度,支持长上下文模型,中国大陆网络可直接使用,适合构建对话和文本处理应用。
Novita AI API 当前记录有免费试用:$0.50 free credits;速率限制:60 RPM。
Novita AI 当前记录有免费额度:按额度。适合先试用再决定是否升级。
Novita AI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$0.50 free credits。适合直接替换 SDK base_url 做低成本测试。
NVIDIA Build (NIM API) API 当前记录有免费试用:无限制(已取消额度限制);速率限制:40 RPM(可申请提升到 200 RPM)。
NVIDIA Build (NIM API) 当前记录有免费额度:无限制(40 RPM 速率限制)。适合先试用再决定是否升级。
NVIDIA Build (NIM API) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:无限制(已取消额度限制)。适合直接替换 SDK base_url 做低成本测试。
OctoAI API 当前记录有免费试用:$10 free credits;速率限制:60 RPM。
OctoAI 当前记录有免费额度:按额度。适合先试用再决定是否升级。
OctoAI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$10 free credits。适合直接替换 SDK base_url 做低成本测试。
Ollama API 当前记录有免费试用:Unlimited;速率限制:Local。
Ollama 当前记录有免费额度:无限制(本地运行)。适合先试用再决定是否升级。
Ollama 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:Unlimited。适合直接替换 SDK base_url 做低成本测试。
OpenAI API 当前记录有免费试用:$5;速率限制:3 RPM (free tier)。
OpenAI 当前记录有免费额度:ChatGPT 免费版无限使用。适合先试用再决定是否升级。
OpenAI 推出 GPT-4.1 API 新功能,包括受控生成、结构化输出改进、图像理解能力增强,并支持代码执行,为开发者提供更强大的模型能力。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token仅$2,输出价格降至每百万token仅$8,相比GPT-4o降低约26%,大幅降低开发者调用成本。
OpenAI推出GPT-4.1系列API,相比GPT-4o价格降低约26%,输入仅$2/百万token,输出$8/百万token。GPT-4.1 mini和nano版本价格更低,适合不同场景需求。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token 2美元,输出价格降至每百万token 8美元,相比GPT-4o降低约50%,大幅降低开发者调用成本。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token仅2美元,输出价格降至每百万token仅8美元,相比GPT-4o降低了26%,为开发者提供更具性价比的AI能力。
OpenAI宣布GPT-4.1系列API降价,相比GPT-4o输入价格降低26%,输出价格降低50%,GPT-4.1 mini和nano价格更低。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/百万token,输出价格降至$8/百万token,相比GPT-4o便宜26%,大幅降低开发者使用成本。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token 2美元,输出价格降至每百万token 8美元,相比GPT-4o更具性价比,适合大规模推理和生成任务。
OpenAI宣布GPT-4.1系列API降价,输入价格降至每百万token $2,输出价格降至每百万token $8,相比GPT-4o更具性价比。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/百万token,输出价格降至$8/百万token,相比GPT-4o更具性价比,适合大规模API调用。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token 2美元,输出价格降至每百万token 8美元,相比GPT-4o降低约50%,大幅降低开发者使用成本。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/百万token,输出价格降至$8/百万token,相比GPT-4o降低26%-50%,为开发者提供更具性价比的AI能力。
OpenAI推出GPT-4.1系列API,相比GPT-4o价格大幅降低,其中GPT-4.1 nano输入仅$0.1/百万token,输出$0.4/百万token,适合高性价比AI应用。
GPT-4.1输入价格$2/百万token,输出$8/百万token,比GPT-4o低约26%。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/1M tokens,输出价格降至$8/1M tokens,相比GPT-4o更具性价比。
OpenAI宣布GPT-4.1 API价格大幅下调,输入价格降至每百万token 2美元,输出价格降至每百万token 8美元,相比GPT-4o降低了26%至50%,为开发者提供更具性价比的AI能力。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/百万token,输出价格降至$8/百万token,相比GPT-4o降低约50%,为开发者提供更具性价比的AI能力。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token仅2美元,输出价格降至每百万token仅8美元,相比GPT-4o降低了26%,大幅降低开发者调用成本。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token 2美元,输出价格降至每百万token 8美元,相比GPT-4o降低约26%,为开发者提供更具性价比的AI能力。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万tokens 2美元,输出价格降至每百万tokens 8美元,相比GPT-4o有显著降幅,适合高性价比的AI应用开发。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/百万token,输出价格降至$8/百万token,相比GPT-4o降低约50%,大幅降低开发者使用成本。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token仅$2,输出价格降至每百万token仅$8,相比GPT-4o降低26%-50%,大幅降低开发者使用成本。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token $2,输出价格降至每百万token $8,相比GPT-4o降低26%,大幅降低开发者调用成本。
OpenAI 宣布 GPT-4.1 系列模型新增通过 API 调用代码解释器的功能,使开发者能够在应用中直接利用代码解释器进行编程辅助、数据处理和分析,显著提升模型在编码和数据分析场景下的实用性。
OpenAI 于2026年4月将GPT-4o免费层从每日10次提升至50次,无需绑定支付方式即可使用,支持文本和图像输入。
ChatGPT 免费用户现在可以有限使用 GPT-4o mini 模型,体验更强大的 AI 对话能力。
OpenAI 为 GPT-4o-mini 模型提供免费层,注册后每日可免费调用约100次,适合轻量级应用和测试。中国大陆需通过代理访问。
OpenAI 宣布 GPT-4o mini API 价格大幅下调,输入价格降至 $0.15/百万 token,输出价格降至 $0.60/百万 token,为开发者提供更具性价比的 AI 服务。
新注册用户可获 $5 API 额度,用于体验 o3-mini 模型,有效期30天,支持中国大陆信用卡注册。
OpenAI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$5。适合直接替换 SDK base_url 做低成本测试。
新注册用户可获得 $50 免费 API 额度,可用于 Realtime API 及 GPT-4o 等模型,有效期 90 天。
OpenAI对GPT-4.1系列进行了Structured Outputs功能改进,提升了JSON模式的可靠性和性能,使开发者能够更稳定地获取结构化输出。
OpenRouter API 当前记录有免费试用:Free models;速率限制:20 RPM。
新注册用户可获得少量免费额度,用于体验其聚合的众多模型API(如 Claude、GPT、Llama 等)。额度有限,适合初步测试。
OpenRouter 为新用户提供 $1 免费额度,同时提供多个永久免费模型(如 Mistral 7B、Llama 3 8B 等),支持统一 API 调用多种模型,中国大陆需科学上网。
OpenRouter 聚合多模型 API,新注册用户赠送 $1 免费额度,可用于 GPT-4、Claude 3.5、Gemini 等模型,中国大陆可访问,无需信用卡。
OpenRouter 当前记录有免费额度:按模型不同。适合先试用再决定是否升级。
OpenRouter 为新注册用户提供 $1 免费额度,可用于调用多种开源和商业模型(如 GPT-4、Claude、Llama 等),中国大陆需代理访问。
OpenRouter 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:Free models。适合直接替换 SDK base_url 做低成本测试。
Perplexity AI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$0。适合直接替换 SDK base_url 做低成本测试。
Perplexity Pro 提供1个月免费试用,包含无限次搜索、高级模型(GPT-4、Claude 3等)和文件上传功能。需绑定支付方式,试用结束后自动续费(可取消)。中国大陆可访问,但需科学上网。
通义千问 (阿里) API 当前记录有免费试用:7000 万 tokens(新用户一次性);速率限制:按模型不同。
阿里通义千问 Qwen3.6-Plus 是国产编程最强模型,新用户注册百炼平台送 7000 万免费 token(一次性)。编程能力接近 Claude Sonnet 4.6,定价仅 2 元/百万 token。
通义千问 (阿里) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:7000 万 tokens(新用户一次性)。适合直接替换 SDK base_url 做低成本测试。
Replicate API 当前记录有免费试用:Free tier;速率限制:Varies。
Replicate 平台新用户注册即送$10免费额度,可用于运行多种开源模型(如Llama 3、Stable Diffusion),无需绑定信用卡,中国大陆可注册使用。
平台托管大量 AI 模型,新用户注册可获得少量免费 GPU 时间,用于运行各种开源模型。超出后需付费。
Replicate 提供每月 50 次免费推理额度,支持大量开源模型(如 Stable Diffusion、Llama、Whisper),中国大陆需代理访问,适合模型测试和小型项目。
Replicate 当前记录有免费额度:按额度。适合先试用再决定是否升级。
Replicate 为新用户提供 $5 免费额度,可运行多种 AI 模型(图像生成、文本、语音等),中国大陆可注册但需绑定支付方式。
SambaNova Cloud 提供全球唯一的 LLaMA 3.1 405B 免费 API 调用。 核心优势: - LLaMA 3.1 405B(4050 亿参数)完全免费 — 这是目前最大的免费可用开源模型 - 全球唯一提供 405B 免费调用的平台,没有之一 - 自研 RDU(Reconfigurable Dataflow Unit)芯片加速,推理速度极快 - 30 RPM 速率限制,但不限总量 — 一天调几千次都行 - API Key 以 sn- 开头,兼容 OpenAI 格式 支持模型: - LLaMA 3.1 405B(旗舰,复杂推理首选) - Llama 3.3 70B(性价比之王) - DeepSeek R1/V3(671B MoE) - Qwen 2.5 72B - 更多模型持续上线 405B vs 70B 的差距: - 复杂推理能力显著提升(数学、逻辑、多步推理) - 长文本理解更强(128K 上下文) - 代码生成质量更高 - 指令遵循更精准 需要代理访问(中国大陆可通过 openllmapi.com 中转)。适合需要大参数模型能力但预算有限的开发者。
SambaNova API 当前记录有免费试用:Free tier(永久免费);速率限制:30 RPM。
SambaNova 当前记录有免费额度:30 RPM(不限总量)。适合先试用再决定是否升级。
SambaNova 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:Free tier(永久免费)。适合直接替换 SDK base_url 做低成本测试。
商汤 Token Plan 公测提供 DeepSeek-V4-Flash 免费 API 入口线索,中国大陆开发者可用它做低成本文档处理、摘要和简单 Agent 子任务测试。当前信息来自公开文章和平台入口,额度与限制需二次验证。
正规运营商低价 AI Token 套餐线索,适合做每百万 token 成本实测。当前信息来自 2026-05-16 财联社截图:1 元约 25 万额度点、话费支付、可接入多种大模型。上线前请按最低档验证额度点换算、支持模型和限速。
SiliconFlow为新用户提供14天免费API额度,支持多种主流模型,适合开发者快速体验和测试。
SiliconFlow为新用户提供200万token免费额度,支持多种模型调用,适合开发者快速上手体验。
SiliconFlow 为新注册用户提供 2000 万 token 免费额度,支持 Llama、Qwen、DeepSeek 等多个开源模型,兼容 OpenAI API 格式,中国大陆可直连,注册即送。
SiliconFlow为新用户提供免费API调用额度,支持多种模型,注册即享。
SiliconFlow 是中国大陆领先的 AI 模型聚合平台,新用户注册即赠送 2000万 token 免费额度,支持 Llama、Qwen、DeepSeek 等多种开源模型,API 兼容 OpenAI 格式,中国大陆直接访问。
注册即送 14 元 API 额度,支持 Llama、Qwen、DeepSeek 等多种开源模型,中国大陆网络可直接访问,适合开发者快速测试。
硅基流动 (SiliconFlow) API 当前记录有免费试用:¥14;速率限制:Varies。
SiliconFlow 提供长期免费API额度,每月200万Token调用量,另赠送15元体验金可用于更高性能模型。支持多种开源模型(如Qwen、Llama、ChatGLM等),中国大陆直连,注册即用。
SiliconFlow 提供每日200次免费API调用额度,支持Llama、Qwen、DeepSeek等主流开源模型,中国大陆用户可直接注册使用,无需海外信用卡。
SiliconCloud新增多个免费模型,包括DeepSeek-V3和Qwen2.5系列,用户可免费调用。
硅基流动提供 14 个开源模型的完全免费 API,包括 Qwen、DeepSeek、Llama 等。中国大陆直连,速度快,OpenAI 兼容格式。是中国大陆开发者最方便的免费 AI API。
注册 SiliconFlow 平台即送 2000 万 token,支持 Llama、Qwen、DeepSeek 等多种开源模型,中国大陆直连,提供 OpenAI 兼容 API。
硅基流动 (SiliconFlow) 当前记录有免费额度:按模型不同。适合先试用再决定是否升级。
SiliconFlow为新注册用户提供$10 API免费额度,有效期30天。
SiliconFlow新用户注册赠送14元代金券,可用于API调用。
SiliconFlow新用户注册即送14元(约$2)API代金券,可用于DeepSeek等模型。
SiliconFlow旗下SiliconCloud为新用户提供2000万token免费额度,支持多款模型,活动持续进行。
SiliconCloud为新注册用户提供2000万token免费额度,支持多模型调用,适用于各类AI应用开发。
SiliconFlow 新用户注册即送 2000 万 token 免费额度,支持多种模型。
SiliconFlow旗下SiliconCloud为新用户提供14天免费体验,赠送2000万token,覆盖平台所有模型。
SiliconCloud为新注册用户提供2000万token免费额度,支持多模型调用,适用于各类AI应用开发。
SiliconCloud为新注册用户提供2000万token免费额度,支持多种主流模型,适合开发者快速上手测试。
SiliconCloud为新注册用户提供2000万token免费额度,支持多款模型,适合开发者快速上手体验。
SiliconFlow新用户注册即送200万token免费额度,可用于多种模型,无门槛使用。
SiliconFlow为新注册用户提供$5免费API额度,可用于多种模型调用。
SiliconCloud新用户注册即送14元代金券,可用于调用多种模型API,覆盖主流开源模型。
SiliconFlow为新注册用户提供免费API调用额度,支持多种模型,适合开发者快速上手体验。
SiliconFlow 为新注册用户提供 14元 免费额度,可用于调用 Llama、Qwen、Yi、DeepSeek 等多种开源大模型 API,国内直连,支持 OpenAI 兼容接口,适合开发者测试和集成。
硅基流动 (SiliconFlow) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:¥14。适合直接替换 SDK base_url 做低成本测试。
讯飞星火 API 当前记录有免费试用:200万 tokens;速率限制:5 RPM。
讯飞星火 当前记录有免费额度:无明确限制。适合先试用再决定是否升级。
讯飞星火 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:200万 tokens。适合直接替换 SDK base_url 做低成本测试。
阶跃星辰 API 当前记录有免费试用:¥10;速率限制:5 RPM。
阶跃星辰为新注册用户提供 100万 token 免费 API 额度,支持 Step-2 万亿参数大模型,中国大陆直连,注册即用,无需复杂审核。
阶跃星辰 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:¥10。适合直接替换 SDK base_url 做低成本测试。
阶跃星辰 Step-2 大模型为新注册用户提供 100 万 token 的免费 API 调用额度,支持多模态和文本生成,中国大陆直连,适合快速体验和开发测试。
腾讯混元大模型为开发者提供每月 100 万 token 的免费 API 调用额度,支持文本生成、对话等能力,中国大陆开发者可直接使用微信/QQ 登录,无需绑定信用卡。
天工 AI (昆仑万维) API 当前记录有免费试用:Free tier;速率限制:Varies。
Together AI 为新用户提供 $25 免费 API 额度,可用于调用 Llama、Mixtral、Stable Diffusion 等开源模型,支持 OpenAI 兼容接口,中国大陆需代理访问。
Together AI 为新用户提供每月 $25 免费额度,支持 Llama、Mistral、DeepSeek 等多种开源模型,中国大陆需代理,适合模型微调和推理测试。
新注册用户获得 $25 免费 API 额度,支持 Llama 3、Mixtral、Falcon 等多种开源模型,兼容 OpenAI 格式,中国大陆需代理访问,注册无需信用卡。
Together AI 新注册用户获得 $5 免费额度,可调用 200+ 开源模型 API。 亮点: - $5 免费额度,足够数万次 API 调用 - FLUX 图片生成模型完全免费,不消耗额度(这是隐藏福利!) - 支持 Llama 3.3 70B/405B、Mixtral 8x22B、Qwen 2.5、DeepSeek V3/R1 等 - Serverless 和 Dedicated 两种部署模式 - OpenAI 兼容格式,一行代码切换 - 推理速度快,支持 JSON Mode、Function Calling FLUX 免费图片生成是最大亮点: - FLUX.1 Schnell(快速版,1-4 步出图) - FLUX.1 Dev(高质量版) - 完全免费,不限次数,不消耗 $5 额度 - 质量媲美 Midjourney,适合批量生成产品图、营销素材 适合需要高质量开源模型 API + 免费图片生成的开发者。
Together AI 为新用户提供 $25 免费 API 额度,支持 200+ 开源模型。 最大亮点:FLUX.1 Schnell Free 图片生成完全免费! - 不消耗任何额度 - 无限使用 - 高质量 AI 图片生成 - 这是目前唯一提供免费高质量 AI 图片生成 API 的平台 LLM 模型支持: - Llama 3.3 70B Turbo、Llama 4 Maverick - DeepSeek V3、Mixtral 8x22B - 以及 200+ 其他开源模型 API Key 以 together- 开头,兼容 OpenAI 格式。 base_url: https://api.together.xyz/v1 需要代理访问(中国大陆可通过 openllmapi.com 中转)。
Together AI API 当前记录有免费试用:$5(注册赠送);速率限制:Varies by model。
Together AI 当前记录有免费额度:按额度($5 注册赠送)。适合先试用再决定是否升级。
Together AI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$5(注册赠送)。适合直接替换 SDK base_url 做低成本测试。
useknockout 是一个开源项目,提供免费的状态最优(SOTA)背景去除和超分辨率API,作为remove.bg和Topaz的替代方案。该项目采用MIT开源协议,运行在Modal平台上,用户可以在Modal的免费额度内使用。适合需要图像背景去除或超分辨率处理的开发者和企业。
Vidu API 当前记录有免费试用:$1;速率限制:N/A。
字节跳动火山引擎提供的豆包大模型 API,新用户通常有一定量的免费 tokens 额度,中国大陆可直接使用且稳定。
Warp 宣布基于 OpenAI 的 GPT-5.5 构建开源模型,并免费向开发者开放。该模型支持多种自然语言处理任务,包括文本生成、代码编写和逻辑推理。用户可通过注册 Warp 账号获取 API 密钥,立即开始使用。此举旨在推动开源 AI 生态发展,降低开发者使用前沿模型的门槛。
零一万物 API 当前记录有免费试用:¥10;速率限制:5 RPM。
零一万物 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:¥10。适合直接替换 SDK base_url 做低成本测试。
注册智谱AI开放平台即送 100 万 token,可用于 GLM-4 系列模型,支持文本和图像生成,中国大陆开发者直接使用,无需翻墙。
新注册用户获赠 100 万 token 免费额度,可用于 GLM-4、GLM-4V 等模型 API 调用,中国大陆直连,支持联网搜索和图像理解。
智谱清言 (智谱AI) API 当前记录有免费试用:500万 tokens;速率限制:5 RPM。
智谱AI 为新注册用户提供 100万 token 的免费 API 额度,可用于 GLM-4、GLM-4V 等模型,中国大陆直连,支持 Python 和 HTTP 调用。
智谱 AI 为新注册用户提供 500 万免费 tokens,支持 GLM-4 系列模型,中国大陆直接使用,无需翻墙,注册即送。
智谱清言 (智谱AI) 当前记录有免费额度:无明确限制。适合先试用再决定是否升级。
智谱AI为GLM-4系列模型提供注册即送18元免费API额度,支持对话、代码生成等,中国大陆开发者可直接使用,无需海外工具。
智谱 AI 为新注册开发者提供 500 万 token 免费额度,可用于 GLM-4、GLM-4V 等最新模型,中国大陆直接使用,支持手机号注册,无需海外支付方式。
智谱AI为新注册用户提供500万Token免费额度(含GLM-4、GLM-4V等多模态模型),额外赠送100元API体验金,可用于更高阶模型调用。中国大陆手机号直接注册,无需海外支付方式。
智谱AI为注册用户提供100万Token免费额度,支持GLM-4、GLM-4V等模型,国内直接访问,注册即用,无需海外环境。
智谱 GLM 是今天适合中国大陆开发者优先领取的 API 羊毛:注册路径友好、中国大陆直连、OpenAI 兼容,适合做中文客服、知识库、内容生成和多模态测试。额度和模型列表会随官方控制台调整,领取后建议先跑一个真实请求确认到账。
智谱AI 为新注册用户提供 100 万 token 的免费调用额度,同时赠送 100 元体验金,可用于 GLM-4、GLM-4V 等模型,支持中国大陆直连,适合开发者和学生使用。
智谱 AI 为新用户提供 100 万 token 免费额度,可用于 GLM-4 系列模型(含 API 和 Web 端),中国大陆直接注册使用,无需海外支付方式,适合中文场景开发。
智谱 AI 为开发者提供 GLM-4、GLM-3-Turbo 等模型的免费 API 调用额度,每月 100 万 Token,注册即享,支持中国大陆网络直接使用,适合个人开发者和中小企业测试集成。
智谱 AI 为注册用户提供免费 100 万 token 额度,可用于 GLM-4、GLM-4-Flash 等模型 API 调用,中国大陆开发者可直接使用,支持 Python SDK 和 OpenAI 兼容接口。
智谱清言 (智谱AI) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:500万 tokens。适合直接替换 SDK base_url 做低成本测试。
智谱 AI 为新注册用户提供 500万 Token 免费额度,可用于 GLM-4、GLM-4V 等模型 API 调用,中国大陆直接访问,支持微信/支付宝实名认证。
Databricks 宣布在其企业代理工作流中集成 OpenAI 的 GPT-5.5 模型。该模型专为复杂任务设计,支持多步骤推理和自动化操作。企业用户可通过 Databricks 平台直接调用,无需额外配置。此次更新标志着 OpenAI 模型在企业级应用中的进一步扩展。
Google宣布关闭其免费搜索索引,这意味着依赖网络搜索的AI应用和开发者将无法再免费获取实时搜索结果。Cloudflare等流量防御服务也在加强AI爬虫的拦截,进一步加剧了网络搜索的困难。用户需要寻找替代方案,如使用Bing API、DuckDuckGo或自建爬虫,但成本和技术门槛可能上升。
OpenAI于2026年5月11日发布GPT-5.5及专为网络安全设计的GPT-5.5-Cyber模型。该模型系列强化了可信访问能力,适用于安全分析、威胁检测和自动化响应等场景。新模型在推理准确性和安全性上有所提升,为企业和安全团队提供更可靠的AI助手。
模拟Gemini CLI、Antigravity、Codex、Grok和Kiro客户端请求,兼容OpenAI API。支持每天数千次Gemini模型请求,内置Kiro中的Claude模型免费使用。通过API轻松连接任何客户端,让AI开发更高效!
OpenAI正式发布GPT-5.5及GPT-5.5-Cyber模型,这是GPT系列的最新升级版本。GPT-5.5-Cyber专为网络安全领域设计,提供更强大的可信访问控制功能,适用于威胁检测、漏洞分析等场景。该模型通过增强的安全机制,帮助企业更好地保护敏感数据和系统。
UUSEC WAF 是一款业界领先的免费、高性能 Web 应用防火墙与 API 安全网关,融合 AI 与语义分析技术,支持 SQL 注入、XSS、DDoS 防护、数据脱敏、RASP 等功能,兼容 ModSecurity 规则,适合企业级应用安全防护。
Google 将 Gemini 1.5 Flash 的免费层每分钟请求数提升至 30 RPM,每日 1500 次,大幅提高了免费使用额度。
2026年5月21日,Claude.ai 出现高错误率,导致用户无法正常使用服务。该问题由官方状态更新确认,目前仍在持续影响中。建议用户暂时使用其他替代工具或等待官方修复。此事件不涉及任何优惠或新功能,仅为服务中断通知。
2026年5月12日,Claude 官方发布状态更新,确认 Claude Sonnet 4.6 和 Haiku 4.5 出现错误率升高问题。该问题影响部分用户请求,官方正在积极修复中。目前没有提供免费额度或其他补偿方案。建议用户关注官方状态页面获取最新进展。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token 2美元,输出价格降至每百万token 8美元,相比GPT-4o降低了26%至50%,大幅降低使用成本。
OpenAI 宣布 GPT-4.1 API 降价,输入价格降至每百万 tokens 2美元,输出价格降至每百万 tokens 8美元,相比 GPT-4o 更具性价比。
SiliconFlow旗下SiliconCloud为新注册用户提供2000万token免费额度,支持多模型。
Hugging Face 推出免费推理 API,支持多种开源模型,提供速率限制的免费访问。
OpenAI 发布 GPT-4o mini,定价为输入 $0.15/百万 token,输出 $0.60/百万 token,比 GPT-4o 便宜 97%,大幅降低 API 使用成本。
Google Gemini 2.5 Flash 模型提供免费 API 调用额度,每分钟最多1500次请求,适合开发者和中小应用集成,中国大陆可通过代理或 Google Cloud 端点访问。
Groq 提供基于 LPU 推理引擎的免费 API,支持 Mixtral 8x7B 等模型,每日1440次请求限制,响应速度极快,中国大陆可通过代理访问。
Mistral AI 的 Le Chat 聊天机器人提供完全免费的无限对话额度,支持多语言和代码生成,无需绑定信用卡,中国大陆可直接访问网页版。
Cohere 为新用户提供100美元免费 API 额度,支持 Command R+ 等最新模型,适用于 RAG、摘要和分类任务,中国大陆需通过代理注册和使用。
DeepSeek V3 模型新注册用户赠送500万 token 免费额度,支持中文优化,中国大陆直接访问,无网络限制,适合文本生成和对话场景。
🎁 免费资料包
免费 API 清单、出海工具站案例、支付收款表、避坑指南和赚钱路径图,一次打包。