GPT-4.1降价
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token $2,输出价格降至每百万token $8,相比GPT-4o降低约26%,为开发者提供更具性价比的AI能力。
AI DEAL COLLECTION
承接 OpenAI free api、API key 获取、平替网关等搜索,整理官方免费层、替代平台和低成本调用路径。
承接 OpenAI free api、API key 获取、平替网关等搜索,整理官方免费层、替代平台和低成本调用路径。 适合想快速比较免费额度、领取门槛和可用替代方案的开发者、独立开发者和 AI 工具用户。
yangmao.ai 会通过自动化数据管道和人工抽查更新免费额度、到期时间、领取条件和可访问性;领取前仍建议查看官方页面。
优先查看同页的替代平台、OpenAI 兼容 API、中国大陆可用入口或长期免费方案,避免只依赖单一供应商。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token $2,输出价格降至每百万token $8,相比GPT-4o降低约26%,为开发者提供更具性价比的AI能力。
OpenAI发布GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,支持高达100万token的上下文窗口,同时API定价显著降低,为开发者提供更强大、更经济的AI能力。
Anthropic 发布了 Claude Security 公测版,这是一款 AI 安全工具,能够自动扫描代码库、验证自身发现的安全问题,并提出修复方案。公测期间所有用户均可免费使用,无需额外付费。该工具旨在帮助开发团队在开发早期发现并修复安全漏洞,提升代码安全性。
百度千帆平台为注册用户提供每月 100 万 Token 的免费 API 额度,支持 ERNIE 系列模型,中国大陆直接访问,适合个人开发者和学生。
百度千帆平台为新用户提供 ERNIE-Bot、ERNIE-3.5 等模型免费调用额度,每月基础免费额度充足,中国大陆直接使用,支持 SDK 和 REST API。
百度千帆平台近期调整免费政策,ERNIE-Bot、ERNIE-Bot-Turbo 等模型每日免费调用次数提升至 1000 次,注册即享,无需绑定银行卡,中国大陆开发者友好。
Cerebras 使用自研 WSE 芯片,推理速度全球最快(2000+ tokens/s,比 GPU 快 20 倍)。免费层每天 100 万 token,30 RPM,无需信用卡。 支持模型:Llama 3.3 70B、Llama 3.1 8B、Qwen 3.5 等。OpenAI 兼容格式,一行代码切换。 适合对延迟敏感的场景:实时对话、流式输出、Agent 工具调用。速度是 Groq 的竞争对手,但每天额度更大(100 万 vs Groq 的 RPD 限制)。
ChatGPT (OpenAI) 当前记录有免费额度:有限次数/天。适合先试用再决定是否升级。
ChatGPT (OpenAI) 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$0。适合直接替换 SDK base_url 做低成本测试。
一位开发者两个月前使用Claude付费版构建了“AI世界”原型,如今Emergence AI发布了几乎完全相同的产品。该产品允许用户免费创建和探索AI驱动的虚拟世界,无需支付Claude的订阅费用。这对于希望体验AI世界构建但不想付费的用户来说是一个绝佳的免费替代方案。
一位开发者制作了一个免费文件,旨在修复 Claude 在聊天中的行为表现,目前正在 Reddit 上招募测试者。该文件可能通过调整提示或配置来优化 Claude 的响应质量。用户无需付费即可获取并尝试该文件,但需要提供反馈以帮助改进。
一位开发者分享了使用Claude Code构建iOS/macOS应用时总结的四个免费技巧。这些技巧涵盖代码生成、调试优化、项目结构建议等,可帮助用户更高效地利用Claude Code进行苹果平台开发。所有技巧均无需额外付费,适合Claude用户参考学习。
社区开发者发布了一套免费的 Claude Code 工具包,显著扩展了 Claude Code 的功能。该工具包包含50项预定义技能、7个专业智能体、11个斜杠命令以及自动格式化钩子,覆盖前端、后端、数据库、DevOps 等全栈工程场景。用户无需付费即可下载使用,大幅提升开发效率。
一位开发者构建了免费的本地MCP服务器,可显著优化Claude Code的PR审查流程。该工具将每次PR审查的令牌消耗从63K降至8.7K,大幅降低使用成本。用户需自行搭建本地服务器并集成到Claude Code工作流中。此方案适合频繁使用Claude Code进行代码审查的开发者。
Claude于2026年5月6日发布状态更新,修复了因组织限制GitHub IP地址导致的部分用户连接失败问题。该问题影响了通过IP白名单限制GitHub访问的企业或组织用户。Claude已部署修复方案,所有受影响用户现已恢复正常使用。此更新确保用户无需更改网络配置即可继续访问Claude服务。
Reddit社区用户正在为Claude免费版用户整理一份隐藏技巧指南,重点涵盖Artifacts和Projects的高级用法。这些技巧可以帮助用户在免费额度内获得更好的使用体验,包括如何优化提示词、利用项目功能管理对话历史等。该指南由社区自发组织,持续更新中。
一位开发者分享了如何在一个月内利用Claude的免费额度,通过Ralph Wiggum循环和Shell脚本批量构建62个免费工具的完整流程。该教程详细介绍了自动化提示工程和工具生成的方法,极大提升了Claude免费层的使用效率。适合希望低成本探索AI工具开发的用户。
根据 Reddit 社区讨论,Claude AI 目前提供免费试用选项,新用户可注册后体验基础对话功能。具体免费额度和使用限制可能随地区和时间变化,建议用户直接访问官方页面确认最新信息。该试用适用于希望初步了解 Claude 能力的用户。
该 Reddit 热点指向一场围绕 OpenSpec 与 Claude Code 的免费在线课程,主题为“规范驱动原型设计”。课程将演示如何结合 OpenSpec 规范和 Claude Code 工具快速构建原型。由于来源是社区活动信号,当前仅作为 Claude Code 生态学习资源记录,不改写 Anthropic 官方免费额度或定价。
Claudex 是一款由社区开发者构建的免费开源命令行工具,旨在模拟 Claude Code 的工作流体验。用户无需支付订阅费用即可试用,只需拥有 Claude API 密钥即可运行。该工具适合开发者探索 Claude 的编程辅助能力,并支持自定义工作流。
Cloudflare Workers $5/月套餐内置 Workers AI,每天 10000 次免费 AI 调用(以神经元计量),永久有效。 支持 50+ 开源模型: - LLM:Llama 3.1 8B、Llama 3.3 70B、Gemma、Mistral 7B、Phi-2 - 图片生成:Stable Diffusion XL(完全免费!) - 嵌入向量:BGE Base/Large(适合 RAG 和语义搜索) - 语音转文字:Whisper 亮点: - 永久有效,不会过期 - 推理在 Cloudflare 全球 300+ 边缘节点运行,延迟极低 - 中国大陆可直连,无需代理 - 支持 OpenAI 兼容格式(通过 AI Gateway) - 超出免费额度后按量计费,不会突然断服务 - 如果你已经在用 Cloudflare Workers,这基本是白送的 适合轻量 AI 场景:博客辅助写作、内容标签生成、文本摘要、嵌入向量、产品图生成等。
Cohere 提供免费 Trial API Key,每月 1000 次调用,覆盖旗下所有模型: - Command R+:顶级 RAG 和对话模型 - Rerank:文档重排序,RAG 必备 - Embed:文本嵌入向量,支持多语言 无需信用卡,每月自动重置。适合个人开发者和 RAG 项目原型验证。注意:Trial Key 不允许用于生产环境。
DAAF(数据分析增强框架)2.1.0 版本现已发布,完全免费且开源。该框架旨在让用户以最安全、最简单的方式使用 Claude Code 进行数据分析和处理。新版本在易用性、安全性和分析严谨性方面进行了显著改进,适合数据科学家、分析师和开发者使用。
国产开源大模型下载量突破100亿次,标志着中国开源AI生态的蓬勃发展。这些模型包括多个知名厂商和机构发布的开源版本,覆盖从轻量级到大规模的不同参数规模。用户无需付费即可下载模型权重,用于学术研究、商业应用或二次开发。这一里程碑反映了开源社区对国产AI技术的广泛认可和采用。
Fireworks AI 提供每日 100 万 token 免费额度,支持 Llama 3、Mixtral、Gemma 等主流开源模型。API 兼容 OpenAI 格式,中国大陆可直连,适合原型开发和轻量应用。
提供高速推理 API,支持 Llama、Qwen 等开源模型。新用户有每日免费的 token 额度,适用于开发和测试。
FreeModel 是这批 GPT-5.5 免费体验渠道里风险较低的一项:不绑卡、上手快、适合轻度体验。核心不确定性是模型是否为原生 GPT-5.5、额度是否稳定刷新,以及长期服务稳定性。
Gemini API 官方免费层适合个人开发者、小项目和原型验证;具体免费速率限制会随模型、项目和 billing tier 变化,需在 AI Studio 查看当前项目限额。
GitHub Copilot Free 是官方长期免费层:每月 2,000 次补全 + 50 次 agent/chat 请求,官方定价页明确 no credit card required。适合开发者先用免费 AI coding tools,再决定是否升级 Pro / Business / Enterprise。
Google 最新 Gemini 2.5 Pro 模型提供免费 API 层,每分钟最多2次请求,无需付费即可体验长上下文推理能力,适合开发测试和小型应用。
Gemini 1.5 Flash 和 Gemini 1.5 Pro 模型免费层,每分钟 60 次请求,无需付费即可使用,中国大陆开发者可通过代理访问。
Google Gemini API 提供永久免费套餐,支持 Gemini 1.5 Flash 和 Gemini 1.5 Pro 模型,每分钟最多 60 次请求,无每日 token 上限,适合个人开发者和学习使用。中国大陆需科学上网。
Google Gemini API 提供免费层,支持 Gemini 1.5 Pro 和 Flash 模型,每分钟最多 60 次请求,无需付费即可使用多模态能力,中国大陆需代理访问。
Google Gemini API 提供免费层级,每分钟最多60次请求,支持 Gemini 1.5 Flash 和 Gemini 1.5 Pro 模型,中国大陆开发者可通过代理或直接访问(部分地区可用)。无需绑定信用卡即可开始使用。
GPT免费用户近期发现,不同用户获得的免费福利存在差异。部分用户获得更高的每日消息限额,另一些用户则获得优先体验新模型或功能的权限。这一变化似乎是逐步推出的,可能与用户活跃度、账户历史或地理位置有关。目前OpenAI尚未正式公告具体规则,但社区讨论热烈。
Groq 提供基于 LPU 推理引擎的免费 API,支持 Llama 3、Mixtral 等模型,每日 1440 次请求限制,速度极快。需海外邮箱注册,中国大陆可访问但需翻墙。
Groq 提供每日100万Token免费API调用额度,基于其自研LPU芯片实现极速推理(支持Llama 3、Mixtral等模型)。注册需海外邮箱,但API中国大陆可直连,适合低延迟场景。
Groq 提供基于 LPU 推理引擎的免费 API,支持 Llama 3、Mixtral 等模型,每天最多 1440 次请求,中国大陆可直连,适合低延迟推理测试。
Groq 提供完全免费的 API 访问,支持 Llama 3、Mixtral 等开源模型,速率限制为 30 次/分钟,无总量上限。中国大陆用户需自行解决网络访问问题,注册无需信用卡。
Groq 是今天最值得补的高速推理羊毛之一:免费层可直接测试 Llama / Mixtral / Gemma 等模型,接口兼容 OpenAI SDK。适合做 AI Agent、RAG 摘要、低延迟聊天原型。中国大陆访问稳定性需要自行确认,必要时可用 API 中转。
Groq 提供免费 API 额度,支持 Llama 3、Mixtral 等开源模型,推理速度极快,每日有限免费调用次数,注册即用,中国大陆需科学上网。
Groq 使用自研 LPU(Language Processing Unit)推理芯片,提供业界最快的 AI 推理速度。 免费模型列表: - Llama 3.3 70B Versatile — 6000 TPM / 30 RPM - Llama 4 Scout 17B — 6000 TPM / 30 RPM - Llama 4 Maverick 17B — 6000 TPM / 30 RPM - Mixtral 8x7B — 5000 TPM / 30 RPM - Gemma 2 9B — 15000 TPM / 30 RPM - DeepSeek R1 Distill Llama 70B — 6000 TPM / 30 RPM 亮点: - 速度比 GPU 方案快 10 倍以上,Llama 3.3 70B 可达 300+ token/秒 - API Key 以 gsk_ 开头,兼容 OpenAI 格式 - 不限总量,只限速率 - 需要代理访问(中国大陆可通过 openllmapi.com 中转)
Groq 将免费套餐的每日 API 请求上限从 500 次提升至 1000 次,支持 Llama 3、Mixtral 等开源模型,中国大陆开发者可直接通过 API 调用,无需绑定信用卡。
Groq 使用自研 LPU(Language Processing Unit)芯片,提供全球最快的 AI 推理速度。免费层无需信用卡,日常使用完全够。 免费额度详情: - Llama 3.3 70B:30 RPM,6000 tokens/min,14400 requests/day - Llama 3.1 8B:30 RPM,20000 tokens/min - Gemma 2 9B:30 RPM,15000 tokens/min - Mixtral 8x7B:30 RPM,5000 tokens/min - 还支持 Llama 4 Scout/Maverick(新上线) 为什么 Groq 速度这么快: - 自研 LPU 芯片,专为 LLM 推理设计 - 确定性执行,没有 GPU 的内存带宽瓶颈 - Llama 3.3 70B 输出速度 300+ tokens/s(GPU 通常 30-50 tokens/s) - 首 token 延迟极低,适合实时对话和流式输出 适合场景: - 实时 AI 对话(速度是体验的核心) - Agent 工具调用(低延迟 = 更快的多步推理) - 流式输出(打字机效果极其流畅) - 需要快速迭代的原型开发 中国大陆可直连。API 兼容 OpenAI 格式,base_url 为 https://api.groq.com/openai/v1。
Groq 于2026年4月底上线Mixtral 8x7B免费推理服务,每日500次请求,无需信用卡,API兼容OpenAI格式,中国大陆开发者可直接调用。
Groq 提供 Mixtral 8x7B 等模型的免费 API 访问,速率限制为每分钟30次请求,适合快速原型开发。中国大陆需通过代理访问。
Groq 提供基于 LPU 的高速推理服务,Mixtral 8x7B 模型每日免费额度高达100万token,注册即用,中国大陆可直接访问 API。
Hugging Face 提供 Inference API 免费套餐,每月 3 万次调用,支持数千个开源模型(文本、图像、音频等),中国大陆可访问但速度较慢,适合学习和实验。
Hugging Face 提供免费推理 API,可调用数千个社区模型(包括文本、图像、音频等),中国大陆可直接访问,无需付费。
Mistral AI 于2026年4月更新免费政策,Le Chat 平台每月提供100万token免费额度,支持Mistral Large 2模型,中国大陆可直连。
Mistral AI 的 Le Chat 聊天应用提供免费无限对话,支持 Mistral Large 等模型,中国大陆可直接访问网页版,无需注册即可使用基础功能。
Mistral AI 的官方免费 API 入口是 Experiment plan:可免费评估和做原型,但速率限制较低,生产或更高额度需升级 Scale plan。
Mistral AI 提供免费开发者计划,每月 50 万 token 的 API 调用额度,支持 Mistral Large、Mistral Small 等模型,中国大陆需科学上网。
Mistral AI 的官方免费 API 入口是 Experiment plan:可免费评估和做原型,但速率限制较低,生产或更高额度需升级 Scale plan。
Mistral AI 的 Le Chat 平台提供免费层,支持无限次对话、文件上传(图像、PDF、Word、Excel)和网络搜索,无需付费。中国大陆可直接访问网页版。
Mistral AI 推出的 Le Chat 聊天助手提供每日100次免费对话额度,使用自家 Mistral Large 模型,支持中文。可通过网页或 API 使用,注册即享,无需付费。中国大陆可正常访问。
OpenAI发布Agents SDK新版本,新增MCP(Model Context Protocol)集成和Web搜索工具,完全免费开源,开发者可自由使用和修改。
OpenAI发布了Codex CLI,一个开源的命令行编程工具,允许用户在终端内直接进行AI辅助编程,完全免费使用。
OpenAI Codex Enterprise Promo 是面向企业/团队新增 Codex 用户的官方限时申请入口。官方页面已确认“eligible enterprise accounts”的新增 Codex 用户可申请两个月免费 Codex usage;资格、路由和获批结果以 OpenAI 团队回复为准。
OpenAI Codex for Open Source 是面向开源维护者的官方申请项目。高价值点是 6 个月 ChatGPT Pro with Codex、API credits,以及按仓库/维护者条件审核的 Codex Security access;所有权益均以 OpenAI 审核和 Program Terms 为准。
OpenAI Codex for Students 是 OpenAI Developers 官方学生权益入口:通过验证的美国/加拿大大学生可领取 $100 ChatGPT credits(余额页约 2,500 credits)用于 Codex,credits 自发放日起 12 个月过期。注意:这不是 API credits,也不是全球学生通用优惠。
OpenAI 正式推出 DeployCo,这是一项专为企业设计的新服务,旨在帮助客户围绕 AI 智能构建和部署应用。DeployCo 提供端到端的部署解决方案,包括模型集成、性能优化和运维支持。该服务可能包含免费试用额度或初始使用层,以降低企业入门门槛。具体定价和免费层细节尚未完全公布,但标志着 OpenAI 在企业级服务上的重要扩展。
OpenAI宣布推出DeployCo,这是一项新服务,旨在帮助企业将AI能力深度集成到其运营中。DeployCo提供定制化部署方案、持续优化支持以及行业特定解决方案,使企业能够围绕智能构建核心业务。该服务面向需要大规模、安全且高效AI部署的企业客户。
OpenAI API 当前记录有免费试用:$5;速率限制:3 RPM (free tier)。
OpenAI 当前记录有免费额度:ChatGPT 免费版无限使用。适合先试用再决定是否升级。
OpenAI 推出 GPT-4.1 API 新功能,包括受控生成、结构化输出改进、图像理解能力增强,并支持代码执行,为开发者提供更强大的模型能力。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token仅$2,输出价格降至每百万token仅$8,相比GPT-4o降低约26%,大幅降低开发者调用成本。
OpenAI推出GPT-4.1系列API,相比GPT-4o价格降低约26%,输入仅$2/百万token,输出$8/百万token。GPT-4.1 mini和nano版本价格更低,适合不同场景需求。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token 2美元,输出价格降至每百万token 8美元,相比GPT-4o降低约50%,大幅降低开发者调用成本。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token仅2美元,输出价格降至每百万token仅8美元,相比GPT-4o降低了26%,为开发者提供更具性价比的AI能力。
OpenAI宣布GPT-4.1系列API降价,相比GPT-4o输入价格降低26%,输出价格降低50%,GPT-4.1 mini和nano价格更低。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/百万token,输出价格降至$8/百万token,相比GPT-4o便宜26%,大幅降低开发者使用成本。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token 2美元,输出价格降至每百万token 8美元,相比GPT-4o更具性价比,适合大规模推理和生成任务。
OpenAI宣布GPT-4.1系列API降价,输入价格降至每百万token $2,输出价格降至每百万token $8,相比GPT-4o更具性价比。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/百万token,输出价格降至$8/百万token,相比GPT-4o更具性价比,适合大规模API调用。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token 2美元,输出价格降至每百万token 8美元,相比GPT-4o降低约50%,大幅降低开发者使用成本。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/百万token,输出价格降至$8/百万token,相比GPT-4o降低26%-50%,为开发者提供更具性价比的AI能力。
OpenAI推出GPT-4.1系列API,相比GPT-4o价格大幅降低,其中GPT-4.1 nano输入仅$0.1/百万token,输出$0.4/百万token,适合高性价比AI应用。
GPT-4.1输入价格$2/百万token,输出$8/百万token,比GPT-4o低约26%。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/1M tokens,输出价格降至$8/1M tokens,相比GPT-4o更具性价比。
OpenAI宣布GPT-4.1 API价格大幅下调,输入价格降至每百万token 2美元,输出价格降至每百万token 8美元,相比GPT-4o降低了26%至50%,为开发者提供更具性价比的AI能力。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/百万token,输出价格降至$8/百万token,相比GPT-4o降低约50%,为开发者提供更具性价比的AI能力。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token仅2美元,输出价格降至每百万token仅8美元,相比GPT-4o降低了26%,大幅降低开发者调用成本。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token 2美元,输出价格降至每百万token 8美元,相比GPT-4o降低约26%,为开发者提供更具性价比的AI能力。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万tokens 2美元,输出价格降至每百万tokens 8美元,相比GPT-4o有显著降幅,适合高性价比的AI应用开发。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至$2/百万token,输出价格降至$8/百万token,相比GPT-4o降低约50%,大幅降低开发者使用成本。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token仅$2,输出价格降至每百万token仅$8,相比GPT-4o降低26%-50%,大幅降低开发者使用成本。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token $2,输出价格降至每百万token $8,相比GPT-4o降低26%,大幅降低开发者调用成本。
GPT-4.1新增代码补全功能,可无缝集成到IDE中,提升开发效率。
GPT-4.1支持通过API调用代码执行沙盒,增强编程和数据分析能力。
GPT-4.1系列支持内置代码执行功能,用户可直接在对话中运行代码,适用于编程、数据处理和分析等场景,提升开发效率。
GPT-4.1系列新增代码执行和图像生成能力,免费用户也可使用。
OpenAI发布GPT-4.1系列,重点提升代码生成和图像理解能力,支持结构化输出和函数调用,适用于开发者和高级用户。
OpenAI 宣布 GPT-4.1 系列模型新增通过 API 调用代码解释器的功能,使开发者能够在应用中直接利用代码解释器进行编程辅助、数据处理和分析,显著提升模型在编码和数据分析场景下的实用性。
ChatGPT新增基于GPT-4.1的图像生成功能,支持多轮编辑和文本渲染,免费用户可直接使用。
OpenAI 发布 GPT-4.1 mini 和 nano 模型,输入价格分别为 $0.4/M tokens 和 $0.1/M tokens,均支持 100 万 token 上下文窗口。
OpenAI发布GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,支持100万token上下文,API价格降低。
OpenAI正式发布GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。新系列支持高达100万token的上下文窗口,同时API定价相比前代大幅降低,为开发者提供更强大、更经济的AI能力。
OpenAI发布GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,支持100万token上下文,API价格降低。
OpenAI正式发布GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano三个版本,均支持高达100万token的上下文窗口,同时API定价相比前代大幅降低,为开发者提供更强大、更经济的AI能力。
OpenAI发布GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,支持100万token上下文,性能显著提升,同时降低API价格,输入价格从$2/百万token起。
OpenAI正式发布GPT-4.1系列模型,包括标准版、mini版和nano版,在多项基准测试中性能显著提升,同时推理成本大幅降低,为开发者提供更高效、更经济的AI能力。
OpenAI正式发布GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。新系列在性能上显著提升,同时价格更加优惠,适合各类AI应用场景。
OpenAI正式发布GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。所有模型均支持100万token的超长上下文窗口,在代码生成、指令跟随和长文本理解等任务上性能大幅提升。同时,API价格相比GPT-4o系列大幅降低,输入价格最低$2/M tokens,输出价格最低$8/M tokens,为开发者提供更高性价比的选择。
OpenAI发布GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,支持100万token上下文,API价格降低。
OpenAI发布GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,支持高达100万token的上下文窗口,性能显著提升同时价格降低。
OpenAI发布GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,支持100万token上下文,API价格降低。
OpenAI发布GPT-4.1、GPT-4.1 mini和GPT-4.1 nano三款新模型,支持100万token上下文窗口,API价格相比GPT-4o显著降低,适合长文本处理与高并发场景。
OpenAI 于2026年4月将GPT-4o免费层从每日10次提升至50次,无需绑定支付方式即可使用,支持文本和图像输入。
OpenAI 发布 GPT-4o mini 更新版本,性能提升且成本更低。
ChatGPT 免费用户现在可以有限使用 GPT-4o mini 模型,体验更强大的 AI 对话能力。
OpenAI 为 GPT-4o-mini 模型提供免费层,注册后每日可免费调用约100次,适合轻量级应用和测试。中国大陆需通过代理访问。
OpenAI 宣布 GPT-4o mini API 价格大幅下调,输入价格降至 $0.15/百万 token,输出价格降至 $0.60/百万 token,为开发者提供更具性价比的 AI 服务。
OpenAI 发布轻量级模型 GPT-4o mini,成本更低,适合高性价比应用场景。
新注册用户可获 $5 API 额度,用于体验 o3-mini 模型,有效期30天,支持中国大陆信用卡注册。
OpenAI 当前记录支持 OpenAI 兼容调用方式,免费/试用信息:$5。适合直接替换 SDK base_url 做低成本测试。
新注册用户可获得 $50 免费 API 额度,可用于 Realtime API 及 GPT-4o 等模型,有效期 90 天。
OpenAI对GPT-4.1系列进行了Structured Outputs功能改进,提升了JSON模式的可靠性和性能,使开发者能够更稳定地获取结构化输出。
OpenAI 的免费权益正在从个人试用扩展到学生、教师、军人和国家项目。这个追踪项聚合资格、地区、期限、官方入口和不符合条件时的替代方案。
一位开发者在其 AI 平台上集成了 OpenAI TTS 功能,提供完全免费的无限语音生成服务,不设任何付费墙。用户无需付费即可生成任意数量的语音内容。该功能旨在测试市场对免费 TTS 服务的实际需求。
Perplexity Pro 提供1个月免费试用,包含无限次搜索、高级模型(GPT-4、Claude 3等)和文件上传功能。需绑定支付方式,试用结束后自动续费(可取消)。中国大陆可访问,但需科学上网。
Replicate 提供每月 50 次免费推理额度,支持大量开源模型(如 Stable Diffusion、Llama、Whisper),中国大陆需代理访问,适合模型测试和小型项目。
Replit 推出免费编程日活动,用户可在一天内免费使用其AI辅助开发平台。该平台集成了代码生成、自动补全和智能调试功能,帮助开发者快速构建项目。活动旨在让更多人体验AI驱动的编程效率提升。
SambaNova Cloud 提供全球唯一的 LLaMA 3.1 405B 免费 API 调用。 核心优势: - LLaMA 3.1 405B(4050 亿参数)完全免费 — 这是目前最大的免费可用开源模型 - 全球唯一提供 405B 免费调用的平台,没有之一 - 自研 RDU(Reconfigurable Dataflow Unit)芯片加速,推理速度极快 - 30 RPM 速率限制,但不限总量 — 一天调几千次都行 - API Key 以 sn- 开头,兼容 OpenAI 格式 支持模型: - LLaMA 3.1 405B(旗舰,复杂推理首选) - Llama 3.3 70B(性价比之王) - DeepSeek R1/V3(671B MoE) - Qwen 2.5 72B - 更多模型持续上线 405B vs 70B 的差距: - 复杂推理能力显著提升(数学、逻辑、多步推理) - 长文本理解更强(128K 上下文) - 代码生成质量更高 - 指令遵循更精准 需要代理访问(中国大陆可通过 openllmapi.com 中转)。适合需要大参数模型能力但预算有限的开发者。
SiliconFlow 提供长期免费API额度,每月200万Token调用量,另赠送15元体验金可用于更高性能模型。支持多种开源模型(如Qwen、Llama、ChatGLM等),中国大陆直连,注册即用。
SiliconFlow 提供每日200次免费API调用额度,支持Llama、Qwen、DeepSeek等主流开源模型,中国大陆用户可直接注册使用,无需海外信用卡。
Superset 是一款专为智能体时代设计的集成开发环境(IDE),由 YC P26 孵化。它提供了一套完整的工具链,帮助开发者构建、调试和部署AI智能体应用。该项目完全免费开源,任何人都可以访问GitHub仓库获取源码并参与贡献。作为新发布的首日产品,Superset 旨在降低智能体开发的门槛,让更多开发者能够快速上手。
腾讯混元大模型为开发者提供每月 100 万 token 的免费 API 调用额度,支持文本生成、对话等能力,中国大陆开发者可直接使用微信/QQ 登录,无需绑定信用卡。
useknockout 是一个开源项目,提供免费的状态最优(SOTA)背景去除和超分辨率API,作为remove.bg和Topaz的替代方案。该项目采用MIT开源协议,运行在Modal平台上,用户可以在Modal的免费额度内使用。适合需要图像背景去除或超分辨率处理的开发者和企业。
字节跳动火山引擎提供的豆包大模型 API,新用户通常有一定量的免费 tokens 额度,中国大陆可直接使用且稳定。
Warpdrv是一个新发布的开源Llama.cpp启动器,专为在Strix Halo和RTX Pro硬件上日常运行Qwen 35b和27b模型而设计。该项目完全免费,用户可以直接从Reddit或GitHub获取代码。它简化了本地大模型的部署流程,适合有硬件基础的用户进行本地推理。
智谱 GLM 是今天适合中国大陆开发者优先领取的 API 羊毛:注册路径友好、中国大陆直连、OpenAI 兼容,适合做中文客服、知识库、内容生成和多模态测试。额度和模型列表会随官方控制台调整,领取后建议先跑一个真实请求确认到账。
智谱 AI 为新用户提供 100 万 token 免费额度,可用于 GLM-4 系列模型(含 API 和 Web 端),中国大陆直接注册使用,无需海外支付方式,适合中文场景开发。
智谱 AI 为开发者提供 GLM-4、GLM-3-Turbo 等模型的免费 API 调用额度,每月 100 万 Token,注册即享,支持中国大陆网络直接使用,适合个人开发者和中小企业测试集成。
Voker 是 YC S24 支持的初创公司,推出专为 AI 代理设计的分析平台。新用户可免费试用,无需信用卡。平台提供实时监控代理性能、成本、错误率和延迟等功能,帮助开发者优化 AI 代理部署。该工具支持多种代理框架,并提供可定制的仪表盘和警报。
Google宣布关闭其免费搜索索引,这意味着依赖网络搜索的AI应用和开发者将无法再免费获取实时搜索结果。Cloudflare等流量防御服务也在加强AI爬虫的拦截,进一步加剧了网络搜索的困难。用户需要寻找替代方案,如使用Bing API、DuckDuckGo或自建爬虫,但成本和技术门槛可能上升。
OpenAI宣布推出DeployCo,这是一项全新的企业级服务,旨在帮助各类组织将AI能力深度嵌入其业务运营中。DeployCo提供端到端的部署支持,包括模型定制、安全合规、性能优化和持续监控,使企业能够更高效地利用OpenAI的先进模型。 该服务面向需要大规模部署AI解决方案的企业,特别是那些对安全性、可靠性和合规性有高要求的行业,如金融、医疗和法律。DeployCo团队将与客户紧密合作,从概念验证到生产环境部署全程提供专业指导。 目前DeployCo已开始接受企业咨询,具体定价根据客户需求定制。这一举措标志着OpenAI从提供API服务向提供完整企业AI解决方案的战略转型。
OpenAI宣布推出DeployCo,这是一家专注于帮助企业围绕人工智能构建部署解决方案的新公司。DeployCo旨在为企业提供从模型选择到生产环境部署的全流程支持,包括定制化模型微调、安全合规咨询、以及持续优化服务。该服务主要面向大型企业客户,帮助其将AI能力深度集成到业务系统中。
一位用户在Reddit上分享了利用Claude构建的免费照片筛选工具,可自动完成照片的筛选、去重和排名流程。该工具能将8000张旅行照片高效压缩至最佳50张,大幅节省人工筛选时间。目前该工具完全免费,用户只需拥有Claude API访问权限即可使用。
Runtime 是 YC P26 支持的新项目,推出了面向团队的沙盒编码代理。该工具允许团队成员在隔离的沙盒环境中安全地运行 AI 编码代理,支持协作和代码审查。目前提供免费试用,适合开发团队探索 AI 辅助编码的新方式。
马耳他 AI for All 计划把 ChatGPT Plus 作为国家级 AI 素养福利发放:先完成课程,再领取一年 Plus。该权益是国家/地区限定,不适合作为普通用户薅羊毛入口,但适合追踪 AI 公共福利趋势。
该开源工具专为AI代理设计,可在调用API前执行预算检查,防止因无限循环或错误配置导致的高额账单。发布3天即获得560次下载,表明开发者对此类防护有强烈需求。工具完全免费开源,适合任何使用AI代理的团队。
ChatGPT Go 在泰国、印尼、越南、菲律宾、马来西亚五个东南亚市场推出本地化定价,价格低于美元定价,但新加坡被排除在外。Claude 在亚洲市场的定价则显得异常偏高。该更新反映了 OpenAI 在亚洲市场的定价策略调整,旨在提高区域竞争力。
ChatGPT 免费用户现可使用 GPT-4o mini,替代 GPT-3.5,提供更强大的免费体验。
OpenAI宣布GPT-4.1 API大幅降价,输入价格降至每百万token 2美元,输出价格降至每百万token 8美元,相比GPT-4o降低了26%至50%,大幅降低使用成本。
OpenAI 宣布 GPT-4.1 API 降价,输入价格降至每百万 tokens 2美元,输出价格降至每百万 tokens 8美元,相比 GPT-4o 更具性价比。
OpenAI发布GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,支持高达100万token的上下文窗口,同时API定价显著降低,为开发者提供更强大、更经济的AI能力。
OpenAI正式发布GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,支持高达100万token的上下文窗口,API价格相比GPT-4o更低,为开发者提供更强大、更经济的AI能力。
OpenAI 发布 GPT-4o mini,定价为输入 $0.15/百万 token,输出 $0.60/百万 token,比 GPT-4o 便宜 97%,大幅降低 API 使用成本。
OpenAI 发布 GPT-4o mini,更小更便宜,支持多模态
Google Gemini 2.5 Flash 模型提供免费 API 调用额度,每分钟最多1500次请求,适合开发者和中小应用集成,中国大陆可通过代理或 Google Cloud 端点访问。
Groq 提供基于 LPU 推理引擎的免费 API,支持 Mixtral 8x7B 等模型,每日1440次请求限制,响应速度极快,中国大陆可通过代理访问。
Mistral AI 的 Le Chat 聊天机器人提供完全免费的无限对话额度,支持多语言和代码生成,无需绑定信用卡,中国大陆可直接访问网页版。
🎁 免费资料包
免费 API 清单、出海工具站案例、支付收款表、避坑指南和赚钱路径图,一次打包。