Claude Code: Límites en Hora Punta y Cómo Esquivarlos

Desde el 23 de marzo de 2026, Anthropic aplica multiplicadores de hora punta que aceleran el consumo de tu cuota en Claude Code. Este artículo explica qué ha cambiado, los bugs confirmados que inflan el gasto de tokens y los workarounds probados por la comunidad para estirar cada sesión. Si usas Claude Code a diario, necesitas conocer estos ajustes.

Qué ha cambiado: multiplicadores de hora punta en Claude Code

Entre el 23 y el 26 de marzo de 2026, Anthropic modificó cómo se consumen los límites de sesión en todos los planes de pago. La mecánica: durante las horas de mayor demanda, cada interacción consume una fracción mayor de tu cuota. Fuera de esas horas, rinde más.

La ventana punta va de 05:00 a 11:00 PT (13:00 a 19:00 GMT). Si trabajas desde España, coincide de lleno con tu jornada laboral. Thariq Shihipar, del equipo técnico de Anthropic, lo resumió así: "Aproximadamente un 7% de los usuarios notará límites de sesión que antes no alcanzaban". En la práctica, el impacto en usuarios de Claude Code es mayor, porque las sesiones agénticas consumen entre 10x y 100x más tokens que una conversación normal en claude.ai.

Un detalle clave: Anthropic no publica los umbrales exactos de tokens por plan. No hay un número fijo de mensajes ni una barra de progreso fiable. No sabes cuánto te queda hasta que recibes el aviso.

Cuánto cuesta cada plan (y por qué importa para los workarounds)

Para entender dónde aplicar cada workaround necesitas conocer los planes. Hemos analizado en detalle los costes reales de los AI IDEs en 2026, pero aquí va el resumen para Claude Code:

Plan	Precio	Multiplicador de uso	Claude Code incluido
Pro	20 €/mes	1x	Sí (cuota compartida con claude.ai)
Max 5x	100 €/mes	5x	Sí
Max 20x	200 €/mes	20x	Sí
Team (premium)	150 €/usuario/mes	Variable	Sí

Un punto crítico: Claude Code comparte cuota con claude.ai. Cada mensaje en la web, escritorio o móvil descuenta del mismo pool que tu CLI. Si usas ambos, la cuota desaparece el doble de rápido.

Bugs confirmados que inflan tu consumo de tokens

No todo es culpa de los multiplicadores. La comunidad ha documentado bugs que inflan el consumo de forma silenciosa:

Cache de prompts rota: Un usuario que hizo ingeniería inversa del binario de Claude Code encontró dos bugs independientes que rompen el prompt cache, inflando costes entre 10x y 20x. Un comando que debería costar 5.000 tokens acaba costando 50.000.
Bug de reanudación de sesión: Al usar claude --resume, el historial completo se recarga y se factura como tokens nuevos en lugar de contexto cacheado. Hasta que se corrija, cada reanudación es una factura sorpresa.
Desincronización del contador: El consumo que muestra /cost en la CLI no coincide con lo que muestra claude.ai. Si los valores difieren, estás viendo este bug en acción.

Anthropic lo ha reconocido: "La gente está alcanzando los límites de uso en Claude Code mucho más rápido de lo esperado. Lo estamos investigando, es la prioridad número uno del equipo". Un usuario del plan Max 5x (100 €/mes) reportó: "Gasté todo Max 5 en 1 hora de trabajo. Antes podía trabajar 8 horas". Otro, con Pro, explicó que la cuota "se agota cada lunes y se reinicia el sábado, solo puedo usar Claude 12 de cada 30 días".

Workarounds de sesión: la primera línea de defensa

Gestionar bien las sesiones es el ajuste con mayor impacto. Un developer que hace seis sprints de 25 minutos consume menos cuota que otro que hace una sesión maratón de 150 minutos, porque cada sprint arranca con un contexto limpio.

Usa /clear entre tareas diferentes. Cada mensaje arrastra todo el historial de la conversación. Cambiar de tarea sin limpiar es regalar tokens. Usa /rename antes de /clear si quieres conservar el historial.

Haz /compact al 50% de contexto. La recomendación habitual es al 70%, pero en la práctica, esperar tanto degrada la calidad de las respuestas. Un /compact temprano mantiene el foco y reduce el consumo acumulativo. Puedes personalizar qué se preserva: en tu CLAUDE.md añade instrucciones como "Al compactar, conserva siempre la lista de archivos modificados".

Usa /btw para preguntas rápidas. Este comando responde en un overlay sin añadir nada al historial de conversación. Para consultas puntuales ("¿cómo se llama este método?", "¿qué tipo devuelve esta función?"), es coste cero en contexto.

No reanudes sesiones con --resume. Hasta que Anthropic corrija el bug, reanudar sesiones puede costar más que empezar de cero. Si necesitas continuidad, pide a Claude un resumen de lo avanzado (500-1.500 tokens), cópialo, haz /clear y pega el resumen en la nueva sesión. Reemplaza 5.000-15.000 tokens de historial con una fracción.

Workarounds de contexto: reduce lo que Claude tiene que leer

El consumo de tokens depende directamente de cuánto tiene que leer Claude antes de actuar. Ya hemos cubierto estrategias avanzadas para reducir el coste de tokens en AI coding. Aquí van las que aplican directamente a la crisis de hora punta:

Crea un .claudeignore agresivo. Igual que .gitignore, pero para Claude Code. Excluye node_modules, builds, logs y cualquier directorio que no necesite escanear. Menos lectura, menos tokens.

Mantén CLAUDE.md por debajo de 200 líneas. Todo lo que escribas ahí se carga en cada mensaje de cada conversación. Mueve instrucciones específicas a skills, que solo se cargan cuando hacen falta.

Desactiva servidores MCP que no estés usando. Cada servidor activo añade sus definiciones de herramientas al contexto. Si tienes 15 servidores conectados, estás pagando por 15 descripciones en cada mensaje. Como vimos al reducir de 15 a 4 servidores MCP en uso real, menos es más.

Agrupa preguntas en un solo mensaje. Tres preguntas separadas envían tres veces el contexto completo. Una pregunta con tres puntos lo envía una vez. Hábito pequeño, ahorro acumulativo grande.

Workarounds de modelo y timing

Usa Sonnet por defecto, Opus solo cuando importa. Configura /model sonnet como base. Sonnet cubre el 80% de tareas de coding con buen rendimiento. Cambia a Opus para decisiones de arquitectura o refactorizaciones complejas. Para tareas triviales (formateo, comentarios, renaming), Haiku consume una fracción.

Trabaja fuera de hora punta. Las horas valle (antes de las 13:00 GMT o después de las 19:00 GMT entre semana, todo el día en fin de semana) estiran la misma cuota de forma notable. Un developer que reorganizó su trabajo alrededor de las horas valle reportó un 30-40% más de tiempo productivo con Claude Code por semana, sin cambiar de plan.

Plan mode antes de operaciones caras. Pulsa Shift+Tab dos veces para entrar en modo planificación. Claude esboza el enfoque antes de escribir código. Detectar un error de concepto en 200 tokens de plan es infinitamente más barato que en 20.000 tokens de implementación equivocada. Y si Claude va por mal camino, pulsa Escape inmediatamente: cada token de salida incorrecta es cuota perdida.

Alternativas cuando la cuota se agota

La estrategia más extendida entre developers experimentados es mantener 2-3 proveedores listos. No por acumular herramientas, sino porque ninguna cuota es infinita.

Gemini CLI es la alternativa más accesible. Open source, 1 millón de tokens de contexto y un free tier de 1.000 peticiones diarias con cualquier cuenta de Google. Si no lo has probado, tenemos una guía práctica de Gemini CLI desde cero.

Codex CLI de OpenAI ofrece 192K de contexto, ejecución en sandbox y agentes paralelos con worktrees de Git. Requiere suscripción de ChatGPT o créditos de API.

Aider es la opción BYOK (bring your own key): conecta cualquier modelo, sin markup, completamente open source. Ideal si ya tienes créditos de API en algún proveedor. Si quieres explorar más opciones, hemos comparado las principales alternativas a Cursor en 2026.

Herramienta	Free tier	Contexto	Mejor para
Gemini CLI	1.000 req/día	1M tokens	Sesiones largas, contexto amplio
Codex CLI	Con suscripción ChatGPT	192K tokens	Ejecución segura, agentes paralelos
Aider	BYOK (cualquier modelo)	Variable	Flexibilidad total, presupuesto ajustado

En Producción

Si usas Claude Code en un flujo de trabajo profesional, estos ajustes no son opcionales:

Monitorización activa: Usa /cost después de cada tarea significativa y /usage antes de empezar una sesión larga. La herramienta ccusage daily --breakdown da un desglose por modelo para detectar anomalías.
Presupuesto realista: Con el plan Pro (20 €/mes), espera entre 3 y 5 horas productivas al día en hora valle. Con Max 5x (100 €/mes), entre 6 y 8. Estas cifras varían según la complejidad del proyecto y el tamaño del contexto.
Flujo multi-herramienta: En equipos de producto, una combinación habitual es Claude Code para refactorizaciones complejas y Gemini CLI para exploración de codebases grandes. No es acumular herramientas, es asignar cada tarea a la que la resuelve con menos coste.
Cache de prompts: El cache tiene un TTL de 5 minutos. Si paras más de 5 minutos entre mensajes, el siguiente recarga todo el contexto y sale más caro. Las sesiones ininterrumpidas de 25 minutos son más eficientes que alternar entre Claude y otras tareas.
Precaución con /compact: Después de compactar, el agente puede olvidar reglas de acceso que estaban en el historial de conversación. Mueve toda instrucción de seguridad a CLAUDE.local.md, que se carga como system prompt y no se ve afectado por la compactación.

Errores comunes y depuración

Error: La cuota se agota en minutos, no en horas.
Causa: Bug de prompt cache roto o reanudación de sesión con --resume.
Solución: Verifica con /cost. Si el consumo no cuadra, prueba a hacer downgrade a la versión 2.1.34 de Claude Code y evita --resume.

Error: /cost muestra un valor diferente al de claude.ai.
Causa: Bug de desincronización del contador.
Solución: Confía en el valor de claude.ai como referencia. Reporta el bug en el repositorio de GitHub si lo reproduces de forma consistente.

Error: Claude Code factura como API en vez de usar tu suscripción.
Causa: Tienes una ANTHROPIC_API_KEY configurada en tu entorno, que tiene prioridad sobre la autenticación de suscripción.
Solución: Comprueba tus variables de entorno con env | grep ANTHROPIC. Si hay una key activa, elimínala o renómbrala cuando quieras usar tu cuota de suscripción.

Preguntas frecuentes

¿Cuándo son las horas punta de Claude Code?

De 05:00 a 11:00 PT (13:00 a 19:00 GMT) en días laborables. Los fines de semana no aplican multiplicadores. En España (CET/CEST), las horas punta son de 14:00 a 20:00 en horario de verano y de 14:00 a 20:00 en horario de invierno.

¿Merece la pena el plan Max 20x solo para Claude Code?

Para la mayoría de developers individuales, el Max 5x (100 €/mes) cubre las necesidades si aplicas los workarounds de este artículo. El Max 20x (200 €/mes) tiene sentido si trabajas 8+ horas al día exclusivamente con Claude Code y no puedes adaptar tu horario a las horas valle.

¿Gemini CLI puede reemplazar a Claude Code?

Para exploración de codebases y tareas de contexto amplio, sí. Para refactorizaciones multi-archivo complejas, Claude Code sigue siendo superior en la mayoría de benchmarks. La combinación de ambos, usando Gemini para explorar y Claude para ejecutar, es la estrategia más extendida entre developers experimentados.

Los multiplicadores de hora punta son la nueva normalidad en Claude Code. No van a desaparecer: reflejan un problema real de capacidad de GPU frente a una demanda que crece más rápido que la infraestructura. La buena noticia es que con sesiones limpias, contexto controlado y un plan B configurado, la cuota rinde más de lo que parece. ¿Has encontrado algún workaround que no esté aquí? Cuéntamelo en Twitter @sergiomarquezp_.