按任务找免费 AI 工具
免费 Embedding API
适合搜索、推荐、RAG 和去重,重点看维度、价格、批量限制、中文语义和向量库兼容。
搜索意图
找能免费生成文本向量的 API。
向量维度批量限制中文效果向量库兼容
推荐工具
Cohere Cohere 专注于企业级 NLP,提供 Command R+(对话/RAG)、Rerank(重排序)、Embed(嵌入)三大核心能力。
免费 Trial Key 每月 1000 次调用,覆盖全系列,无需信用卡。
特别适合 RAG 场景:R... Cloudflare Workers AI Cloudflare Workers AI 是 Cloudflare 推出的边缘 AI 推理平台。
$5/月 Workers 套餐自带每天 10000 次免费 AI 调用,永久有效,不会过期。
支持 50+ 开源模型:LLM(Llama 3... 通义千问 (阿里) 通义千问是阿里巴巴推出的大模型系列。最新 Qwen3.6-Plus(2026年4月2日发布)是国产编程模型新王,
编程能力接近 Claude Sonnet 4.6,100 万 token 上下文,原生多模态(OCR、物体定位、万物识别)。
... Hugging Face Hugging Face 是全球最大的 AI 模型社区和平台。
提供免费的模型推理 API、Spaces 应用托管,以及海量开源模型下载。
... Gemini (Google) Gemini 是 Google 的旗舰 AI 模型,3.1 Pro 提供 200 万 token 级长上下文能力。
通过 Google AI Studio 提供免费 API,Flash / Flash Lite 适合高频开发与低成本原型验证... TextGen TextGen 是 oobabooga 的本地 LLM 桌面应用,GitHub 描述明确为开源、100% private,AGPL-3.0 许可。... LocalAI 开源本地 OpenAI 兼容 API,支持 LLaMA、Mistral、Stable Diffusion 等多模态模型,完全离线。... Google AI (Gemini) Google AI (Gemini) 是 Google 的 AI 平台,提供 Gemini 系列模型。
AI Studio 提供完全免费的 API 访问,无需信用卡。
Gemini 3.1 Pro 拥有业界最大的 200 万 token 上... Baseten Baseten 面向需要部署自定义 AI 模型的团队,核心产品围绕 Truss、GPU 推理、autoscaling、模型服务和生产监控。
如果你只需要 cheapest LLM API,Baseten 可能不是第一选择;如果你需要把自有模... RunPod RunPod 是 GPU 云和 serverless 推理平台,常用于 ComfyUI、Stable Diffusion、vLLM、训练/微调和自定义模型 API。
它不是典型“注册送大量免费 token”的 LLM API,但对需要 GP... DeepInfra DeepInfra 是面向开发者的开源模型托管 API 平台,覆盖 Llama、Qwen、Mistral、embedding、rerank、图片等模型。
它适合想用 OpenAI 兼容接口快速测试开源模型、但不想自己维护 GPU 的团队。
... Anyscale Anyscale 是 Ray 分布式计算框架背后的公司,由 UC Berkeley 教授 Ion Stoica 创办。
提供 Anyscale Endpoints API 服务,支持 Llama、Mixtral 等开源模型。
基于 Ray ...
下一步怎么做
- 先打开 2-3 个工具详情页,比较免费额度和限制。
- 优先用真实任务测试,不要只看模型参数。
- 如果要接入产品,再看 API 价格和中国大陆可访问性。
相关任务
常见问题
免费 Embedding API怎么选?
先看是否有免费额度,再看是否满足你的核心场景:找能免费生成文本向量的 API。
这些工具都免费吗?
不是。yangmao.ai 会优先展示有免费额度或可免费试用的工具,但具体政策以官网实时信息为准。
是否需要信用卡?
不同工具不同。优先选择标注有免费额度、注册送额度或网页端可直接试用的平台。