Cómo funcionan los límites de uso de Codex: límites de 5 horas, límites semanales y créditos

Explica los límites de 5 horas de Codex, límites semanales, consumo de créditos, tareas locales frente a tareas cloud y por qué el uso semanal puede bajar aunque la cuota de 5 horas no se haya agotado.

Cuando la gente mira por primera vez los límites de uso de Codex, es fácil asumir que el 5-hour limit es un saldo de corto plazo y que el weekly limit solo empieza a bajar cuando se agota la cuota de 5 horas.

No funciona así. Codex se entiende mejor como un sistema que revisa varias ventanas de límite al mismo tiempo: una ventana corta evita el uso en ráfaga, mientras la ventana semanal controla el uso total de la semana. Una solicitud de Codex normalmente cuenta contra ambas.

Así que esta situación suele ser normal:

1
2
5-hour quota still has plenty left
but weekly quota has already decreased

01 Versión corta

Puedes entender el uso de Codex con tres reglas:

  1. El 5-hour limit y el weekly limit se aplican al mismo tiempo.
  2. Si se agota el límite semanal, normalmente no puedes seguir usando el mismo pool de cuota de suscripción aunque la cuota de 5 horas aún tenga margen.
  3. Codex no se cobra por simple número de mensajes. El uso depende del modelo, tokens, complejidad de tarea, tamaño de contexto y ubicación de ejecución.

En pseudocódigo:

1
2
3
4
can_use_codex =
    five_hour_remaining > 0
    && weekly_remaining > 0
    && no other product policy is triggered

Cuando se reinicia la ventana de 5 horas, solo se restaura esa cuota. No restaura la cuota semanal. La cuota semanal se reinicia según su propio calendario, o puede que puedas comprar créditos extra en planes compatibles.

02 Por qué bajan ambas ventanas

Piensa en los límites de Codex como dos puertas:

Window Purpose
5-hour window Prevents high-frequency burst usage
Weekly window Controls total weekly usage

Cada tarea de Codex crea uso real. Ese uso se refleja en las ventanas de rate limit relevantes.

No es:

1
2
3
Use 5-hour quota first
After the 5-hour quota runs out
Start using weekly quota

Se parece más a:

1
2
3
One Codex request
=> counts toward the 5-hour window
=> also counts toward the weekly window

Por eso el uso semanal puede bajar aunque la cuota de 5 horas no esté agotada.

03 Mira los créditos basados en tokens

OpenAI no publica una fórmula que permita a los usuarios reproducir exactamente el cargo de Codex. Lo público es la rate card, los factores principales y el precio de créditos por modelo.

A fecha de 2026-04-15, el modelo principal de la rate card de Codex es token-based credits. El uso se estima a partir de tokens de entrada, tokens de entrada cacheados y tokens de salida.

Ejemplos de tarifas oficiales:

Model Input / 1M tokens Cached input / 1M tokens Output / 1M tokens
GPT-5.4 62.50 credits 6.250 credits 375 credits
GPT-5.4-Mini 18.75 credits 1.875 credits 113 credits
GPT-5.3-Codex 43.75 credits 4.375 credits 350 credits
GPT-5.2-Codex 43.75 credits 4.375 credits 350 credits
GPT-5.1-Codex-Max 31.25 credits 3.125 credits 250 credits
GPT-5.1-Codex-mini 6.25 credits 0.625 credits 50 credits

Una estimación aproximada es:

1
2
3
4
usage
~= input tokens / 1,000,000 * model input price
+ cached input tokens / 1,000,000 * model cached input price
+ output tokens / 1,000,000 * model output price

No es una fórmula exacta de facturación, pero explica la tendencia: la salida es cara, el contexto largo es caro y los modelos más potentes cuestan más. La rate card oficial también dice que Fast mode usa 2x créditos y que Code review usa precios de GPT-5.3-Codex.

04 No cuentes solo mensajes

Diez mensajes de Codex pueden consumir cantidades muy distintas.

Las tareas ligeras suelen ser más baratas:

  • Editar una función pequeña
  • Explicar un snippet corto
  • Escribir un párrafo breve
  • Hacer un cambio local en un archivo claramente especificado

Las tareas pesadas cuestan más:

  • Escanear una codebase grande
  • Ejecutar una sesión larga de agente
  • Bucles repetidos de leer, editar, probar y corregir
  • Generar mucho código o un informe largo
  • Usar tareas cloud
  • Activar fast mode

Así que el número de mensajes solo da una impresión aproximada. No refleja el uso real.

05 Tareas locales frente a tareas cloud

La ubicación de ejecución puede marcar una gran diferencia.

Una local task trabaja en tu workspace local: lee archivos, edita código y ejecuta comandos. Una cloud task se delega a un entorno cloud alojado, mejor para flujos más largos y automatizados.

Las tareas cloud suelen ser más caras porque implican:

  • Un entorno de ejecución alojado
  • Tareas más largas
  • Más llamadas a herramientas
  • Contexto más grande
  • Un bucle de automatización más completo

Para ediciones normales de código, limpieza de artículos o correcciones pequeñas, las tareas locales suelen ser más baratas. Usa tareas cloud cuando el trabajo realmente necesite ejecución alojada.

06 Por qué el uso semanal baja rápido

Si tu cuota de 5 horas apenas se mueve pero el uso semanal baja mucho, causas comunes incluyen:

  1. Usaste tareas cloud.
  2. Usaste un modelo más caro.
  3. Activaste fast mode.
  4. El contexto era grande, con muchos archivos o una conversación larga.
  5. La salida fue larga, como mucho código, un informe extenso o análisis de logs.
  6. La cadena de tareas fue larga: buscar, editar, probar, corregir y probar otra vez.
  7. Tu script de cuota etiquetó mal las ventanas de límite.

Si lees campos desde algo como /backend-api/wham/usage, no confíes solo en etiquetas procesadas como five_hour% o weekly%. Revisa los campos raw JSON:

  • limit_window_seconds
  • percent_left
  • reset_at
  • bucket / feature name

Ventanas típicas:

1
2
3
4
5
limit_window_seconds = 18000
=> about 5 hours

limit_window_seconds = 604800
=> about 7 days

Si tu script etiqueta las ventanas al revés, la visualización de cuota será engañosa.

07 Cómo ahorrar cuota

Para hacer que la cuota semanal dure más:

  1. Divide trabajos grandes en tareas más pequeñas.
  2. Prefiere tareas locales cuando sea posible.
  3. Indica a Codex las rutas relevantes para reducir escaneo innecesario.
  4. Evita volcar logs enormes, archivos largos o contexto no relacionado.
  5. Usa modelos mini más baratos para trabajo ligero.
  6. Pide un plan antes de empezar una tarea larga.
  7. Pide respuestas concisas cuando no necesites un informe largo.

Un modelo mental útil:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
can continue using
= short window has quota
&& weekly window has quota

usage speed
= model price
* tokens
* output length
* task complexity
* execution location

No es matemática exacta de facturación, pero explica la mayoría del comportamiento de límites de uso de Codex.

Enlaces relacionados

记录并分享
Creado con Hugo
Tema Stack diseñado por Jimmy