Cómo funcionan los límites de uso de Codex: límites de 5 horas, límites semanales y créditos

Cuando la gente mira por primera vez los límites de uso de Codex, es fácil asumir que el 5-hour limit es un saldo de corto plazo y que el weekly limit solo empieza a bajar cuando se agota la cuota de 5 horas.

No funciona así. Codex se entiende mejor como un sistema que revisa varias ventanas de límite al mismo tiempo: una ventana corta evita el uso en ráfaga, mientras la ventana semanal controla el uso total de la semana. Una solicitud de Codex normalmente cuenta contra ambas.

Así que esta situación suele ser normal:

1
2


5-hour quota still has plenty left
but weekly quota has already decreased

01 Versión corta

Puedes entender el uso de Codex con tres reglas:

El 5-hour limit y el weekly limit se aplican al mismo tiempo.
Si se agota el límite semanal, normalmente no puedes seguir usando el mismo pool de cuota de suscripción aunque la cuota de 5 horas aún tenga margen.
Codex no se cobra por simple número de mensajes. El uso depende del modelo, tokens, complejidad de tarea, tamaño de contexto y ubicación de ejecución.

En pseudocódigo:

1
2
3
4


can_use_codex =
    five_hour_remaining > 0
    && weekly_remaining > 0
    && no other product policy is triggered

Cuando se reinicia la ventana de 5 horas, solo se restaura esa cuota. No restaura la cuota semanal. La cuota semanal se reinicia según su propio calendario, o puede que puedas comprar créditos extra en planes compatibles.

02 Por qué bajan ambas ventanas

Piensa en los límites de Codex como dos puertas:

Window	Purpose
5-hour window	Prevents high-frequency burst usage
Weekly window	Controls total weekly usage

Cada tarea de Codex crea uso real. Ese uso se refleja en las ventanas de rate limit relevantes.

No es:

1
2
3


Use 5-hour quota first
After the 5-hour quota runs out
Start using weekly quota

Se parece más a:

1
2
3


One Codex request
=> counts toward the 5-hour window
=> also counts toward the weekly window

Por eso el uso semanal puede bajar aunque la cuota de 5 horas no esté agotada.

03 Mira los créditos basados en tokens

OpenAI no publica una fórmula que permita a los usuarios reproducir exactamente el cargo de Codex. Lo público es la rate card, los factores principales y el precio de créditos por modelo.

A fecha de 2026-04-15, el modelo principal de la rate card de Codex es token-based credits. El uso se estima a partir de tokens de entrada, tokens de entrada cacheados y tokens de salida.

Ejemplos de tarifas oficiales:

Model	Input / 1M tokens	Cached input / 1M tokens	Output / 1M tokens
GPT-5.4	62.50 credits	6.250 credits	375 credits
GPT-5.4-Mini	18.75 credits	1.875 credits	113 credits
GPT-5.3-Codex	43.75 credits	4.375 credits	350 credits
GPT-5.2-Codex	43.75 credits	4.375 credits	350 credits
GPT-5.1-Codex-Max	31.25 credits	3.125 credits	250 credits
GPT-5.1-Codex-mini	6.25 credits	0.625 credits	50 credits

Una estimación aproximada es:

1
2
3
4


usage
~= input tokens / 1,000,000 * model input price
+ cached input tokens / 1,000,000 * model cached input price
+ output tokens / 1,000,000 * model output price

No es una fórmula exacta de facturación, pero explica la tendencia: la salida es cara, el contexto largo es caro y los modelos más potentes cuestan más. La rate card oficial también dice que Fast mode usa 2x créditos y que Code review usa precios de GPT-5.3-Codex.

04 No cuentes solo mensajes

Diez mensajes de Codex pueden consumir cantidades muy distintas.

Las tareas ligeras suelen ser más baratas:

Editar una función pequeña
Explicar un snippet corto
Escribir un párrafo breve
Hacer un cambio local en un archivo claramente especificado

Las tareas pesadas cuestan más:

Escanear una codebase grande
Ejecutar una sesión larga de agente
Bucles repetidos de leer, editar, probar y corregir
Generar mucho código o un informe largo
Usar tareas cloud
Activar fast mode

Así que el número de mensajes solo da una impresión aproximada. No refleja el uso real.

05 Tareas locales frente a tareas cloud

La ubicación de ejecución puede marcar una gran diferencia.

Una local task trabaja en tu workspace local: lee archivos, edita código y ejecuta comandos. Una cloud task se delega a un entorno cloud alojado, mejor para flujos más largos y automatizados.

Las tareas cloud suelen ser más caras porque implican:

Un entorno de ejecución alojado
Tareas más largas
Más llamadas a herramientas
Contexto más grande
Un bucle de automatización más completo

Para ediciones normales de código, limpieza de artículos o correcciones pequeñas, las tareas locales suelen ser más baratas. Usa tareas cloud cuando el trabajo realmente necesite ejecución alojada.

06 Por qué el uso semanal baja rápido

Si tu cuota de 5 horas apenas se mueve pero el uso semanal baja mucho, causas comunes incluyen:

Usaste tareas cloud.
Usaste un modelo más caro.
Activaste fast mode.
El contexto era grande, con muchos archivos o una conversación larga.
La salida fue larga, como mucho código, un informe extenso o análisis de logs.
La cadena de tareas fue larga: buscar, editar, probar, corregir y probar otra vez.
Tu script de cuota etiquetó mal las ventanas de límite.

Si lees campos desde algo como /backend-api/wham/usage, no confíes solo en etiquetas procesadas como five_hour% o weekly%. Revisa los campos raw JSON:

limit_window_seconds
percent_left
reset_at
bucket / feature name

Ventanas típicas:

1
2
3
4
5


limit_window_seconds = 18000
=> about 5 hours

limit_window_seconds = 604800
=> about 7 days

Si tu script etiqueta las ventanas al revés, la visualización de cuota será engañosa.

07 Cómo ahorrar cuota

Para hacer que la cuota semanal dure más:

Divide trabajos grandes en tareas más pequeñas.
Prefiere tareas locales cuando sea posible.
Indica a Codex las rutas relevantes para reducir escaneo innecesario.
Evita volcar logs enormes, archivos largos o contexto no relacionado.
Usa modelos mini más baratos para trabajo ligero.
Pide un plan antes de empezar una tarea larga.
Pide respuestas concisas cuando no necesites un informe largo.

Un modelo mental útil:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10


can continue using
= short window has quota
&& weekly window has quota

usage speed
= model price
* tokens
* output length
* task complexity
* execution location

No es matemática exacta de facturación, pero explica la mayoría del comportamiento de límites de uso de Codex.