Panorama de API de LLM (opciones gratuitas y rentables)

Una descripción general práctica de las principales opciones de API de LLM centrándose en los niveles gratuitos, la velocidad y la rentabilidad.

API de Google Gemini (mejor nivel gratuito)

Para promocionar la línea Gemini, Google ofrece actualmente una de las cuotas gratuitas más generosas. Precios/detalles: https://ai.google.dev/gemini-api/docs/pricing?hl=zh-cn

Modelos: Gemini 3 Flash Preview, Gemini 2.5 Pro (a partir del 12 de febrero de 2026). En general, el modelo Pro de gama alta más nuevo puede tener límites gratuitos más estrictos, mientras que muchos otros modelos aún ofrecen uso gratuito.

Ventajas:

  • Incluso los modelos de primer nivel pueden incluir cuota gratuita.
  • Ventana de contexto muy grande (más de 1 millón de tokens).
  • Fuerte soporte multimodal (entrada de imagen/vídeo).

Contras:

  • Privacidad de datos: Google puede utilizar entradas de nivel gratuito para mejorar los modelos (úselo con precaución en producción).
  • Restricciones de propiedad intelectual: política regional estricta; Las ubicaciones no admitidas pueden marcar “403” o “Ubicación del usuario no admitida”.

Groq (Rey de la velocidad)

Groq utiliza su hardware LPU (Unidad de procesamiento de lenguaje) de desarrollo propio y proporciona una inferencia extremadamente rápida. Precios/detalles: https://groq.com/pricing

Modelos: GPT OSS / Kimi K2 / Llama 3,4 / Qwen3 Cuota: Sin nivel gratuito, pero precio relativamente bajo.

Ventajas:

  • Muy baja latencia; El TTFT suele estar dentro de los 200 ms.
  • Ideal para chat en tiempo real y asistentes de voz.

Contras:

  • El alcance del modelo es en su mayoría modelos de código abierto; no hay GPT-4 o Claude alojados directamente.

SiliconCloud (opción nacional sólida)

Una plataforma de inferencia de rápido crecimiento con sede en China que agrega muchos modelos nacionales de código abierto de alta calidad. Precios/detalles: https://siliconflow.cn/pricing

Modelos: Qwen 2.5 (7B/14B/72B), DeepSeek-V2, Yi-1.5, Kimi K2. Cuota: Algunos modelos (por ejemplo Qwen 7B, GLM-4-9B) actualmente ofrecen llamadas gratuitas permanentes.

Ventajas:

  • Rápida conectividad doméstica.
  • Los nuevos modelos nacionales de código abierto suelen estar disponibles rápidamente.

Contras:

  • El acceso gratuito es principalmente para modelos más pequeños.
  • Los modelos de gama alta (como el 72B / DeepSeek 236B) suelen ser de pago.
记录并分享
Creado con Hugo
Tema Stack diseñado por Jimmy