Cuando la gente mira por primera vez los límites de uso de Codex, es fácil asumir que el 5-hour limit es un saldo de corto plazo y que el weekly limit solo empieza a bajar cuando se agota la cuota de 5 horas.
No funciona así. Codex se entiende mejor como un sistema que revisa varias ventanas de límite al mismo tiempo: una ventana corta evita el uso en ráfaga, mientras la ventana semanal controla el uso total de la semana. Una solicitud de Codex normalmente cuenta contra ambas.
Así que esta situación suele ser normal:
|
|
01 Versión corta
Puedes entender el uso de Codex con tres reglas:
- El
5-hour limity elweekly limitse aplican al mismo tiempo. - Si se agota el límite semanal, normalmente no puedes seguir usando el mismo pool de cuota de suscripción aunque la cuota de 5 horas aún tenga margen.
- Codex no se cobra por simple número de mensajes. El uso depende del modelo, tokens, complejidad de tarea, tamaño de contexto y ubicación de ejecución.
En pseudocódigo:
|
|
Cuando se reinicia la ventana de 5 horas, solo se restaura esa cuota. No restaura la cuota semanal. La cuota semanal se reinicia según su propio calendario, o puede que puedas comprar créditos extra en planes compatibles.
02 Por qué bajan ambas ventanas
Piensa en los límites de Codex como dos puertas:
| Window | Purpose |
|---|---|
| 5-hour window | Prevents high-frequency burst usage |
| Weekly window | Controls total weekly usage |
Cada tarea de Codex crea uso real. Ese uso se refleja en las ventanas de rate limit relevantes.
No es:
|
|
Se parece más a:
|
|
Por eso el uso semanal puede bajar aunque la cuota de 5 horas no esté agotada.
03 Mira los créditos basados en tokens
OpenAI no publica una fórmula que permita a los usuarios reproducir exactamente el cargo de Codex. Lo público es la rate card, los factores principales y el precio de créditos por modelo.
A fecha de 2026-04-15, el modelo principal de la rate card de Codex es token-based credits. El uso se estima a partir de tokens de entrada, tokens de entrada cacheados y tokens de salida.
Ejemplos de tarifas oficiales:
| Model | Input / 1M tokens | Cached input / 1M tokens | Output / 1M tokens |
|---|---|---|---|
| GPT-5.4 | 62.50 credits | 6.250 credits | 375 credits |
| GPT-5.4-Mini | 18.75 credits | 1.875 credits | 113 credits |
| GPT-5.3-Codex | 43.75 credits | 4.375 credits | 350 credits |
| GPT-5.2-Codex | 43.75 credits | 4.375 credits | 350 credits |
| GPT-5.1-Codex-Max | 31.25 credits | 3.125 credits | 250 credits |
| GPT-5.1-Codex-mini | 6.25 credits | 0.625 credits | 50 credits |
Una estimación aproximada es:
|
|
No es una fórmula exacta de facturación, pero explica la tendencia: la salida es cara, el contexto largo es caro y los modelos más potentes cuestan más. La rate card oficial también dice que Fast mode usa 2x créditos y que Code review usa precios de GPT-5.3-Codex.
04 No cuentes solo mensajes
Diez mensajes de Codex pueden consumir cantidades muy distintas.
Las tareas ligeras suelen ser más baratas:
- Editar una función pequeña
- Explicar un snippet corto
- Escribir un párrafo breve
- Hacer un cambio local en un archivo claramente especificado
Las tareas pesadas cuestan más:
- Escanear una codebase grande
- Ejecutar una sesión larga de agente
- Bucles repetidos de leer, editar, probar y corregir
- Generar mucho código o un informe largo
- Usar tareas cloud
- Activar fast mode
Así que el número de mensajes solo da una impresión aproximada. No refleja el uso real.
05 Tareas locales frente a tareas cloud
La ubicación de ejecución puede marcar una gran diferencia.
Una local task trabaja en tu workspace local: lee archivos, edita código y ejecuta comandos. Una cloud task se delega a un entorno cloud alojado, mejor para flujos más largos y automatizados.
Las tareas cloud suelen ser más caras porque implican:
- Un entorno de ejecución alojado
- Tareas más largas
- Más llamadas a herramientas
- Contexto más grande
- Un bucle de automatización más completo
Para ediciones normales de código, limpieza de artículos o correcciones pequeñas, las tareas locales suelen ser más baratas. Usa tareas cloud cuando el trabajo realmente necesite ejecución alojada.
06 Por qué el uso semanal baja rápido
Si tu cuota de 5 horas apenas se mueve pero el uso semanal baja mucho, causas comunes incluyen:
- Usaste tareas cloud.
- Usaste un modelo más caro.
- Activaste fast mode.
- El contexto era grande, con muchos archivos o una conversación larga.
- La salida fue larga, como mucho código, un informe extenso o análisis de logs.
- La cadena de tareas fue larga: buscar, editar, probar, corregir y probar otra vez.
- Tu script de cuota etiquetó mal las ventanas de límite.
Si lees campos desde algo como /backend-api/wham/usage, no confíes solo en etiquetas procesadas como five_hour% o weekly%. Revisa los campos raw JSON:
limit_window_secondspercent_leftreset_at- bucket / feature name
Ventanas típicas:
|
|
Si tu script etiqueta las ventanas al revés, la visualización de cuota será engañosa.
07 Cómo ahorrar cuota
Para hacer que la cuota semanal dure más:
- Divide trabajos grandes en tareas más pequeñas.
- Prefiere tareas locales cuando sea posible.
- Indica a Codex las rutas relevantes para reducir escaneo innecesario.
- Evita volcar logs enormes, archivos largos o contexto no relacionado.
- Usa modelos mini más baratos para trabajo ligero.
- Pide un plan antes de empezar una tarea larga.
- Pide respuestas concisas cuando no necesites un informe largo.
Un modelo mental útil:
|
|
No es matemática exacta de facturación, pero explica la mayoría del comportamiento de límites de uso de Codex.