
Claude Code desperdicia 80% del contexto: cómo detectarlo
TL;DR
Claude Code en versiones anteriores a la 2.1.117 estaba desperdiciando hasta el 80% de la ventana de contexto de Opus 4.7. Antes de culpar al modelo cuando notes pérdida de calidad en sesiones largas, revisa tres cosas: versión del CLI, hábitos de sesión y diseño del workflow. Este checklist te ahorra tiempo y dinero en tokens.
El problema: Claude Code no usaba el contexto que pagabas
En foros de developers se repetía el mismo síntoma: Opus 4.7 olvidaba archivos cargados hace cinco mensajes, repetía preguntas ya respondidas y daba respuestas peores conforme avanzaba la sesión. La conclusión fácil era culpar al modelo. La causa real estaba en el harness.
Versiones de Claude Code anteriores a la 2.1.117 no estaban aprovechando bien la ventana extendida de Opus 4.7. Buena parte del contexto cargado se quedaba fuera del prompt efectivo enviado al modelo. El resultado: pagas tokens por archivos que el modelo nunca llegó a ver de forma útil.
Esto importa porque el coste operativo de Claude Code no está solo en el modelo, está en cómo el harness gestiona memoria, sesión y herramientas. Si el harness desperdicia contexto, no hay prompt que lo arregle.
¿Qué es la "ventana de contexto efectiva"?
La ventana de contexto efectiva es la cantidad de tokens que el modelo realmente procesa en un turno, no la que el cliente carga en memoria local. Un harness puede leer 200.000 tokens del repositorio y enviar solo 40.000 al modelo si el truncado o el resumen están mal configurados.
Esa diferencia entre lo cargado y lo enviado es donde vive el desperdicio. En la práctica se traduce en: respuestas inconsistentes, bucles donde el agente vuelve a leer archivos que ya tenía, y degradación de calidad pasados los 30-40 minutos de sesión.
Checklist: tres capas a revisar antes de culpar al modelo
1. Versión del CLI
Es el paso más rápido y el que más impacto tiene. Comprueba la versión instalada:
# Verifica versión actual de Claude Code
claude --version
# Si estás por debajo de 2.1.117, actualiza
npm install -g @anthropic-ai/claude-code@latest
Si vienes de una versión 2.0.x o 2.1.x temprana con Opus 4.7, la actualización por sí sola puede recuperar la mayor parte de la calidad perdida. Antes de tocar prompts, antes de cambiar de modelo, antes de reescribir tu CLAUDE.md: actualiza.
2. Hábitos de sesión
Un harness al día no compensa una sesión mal mantenida. Estas son las prácticas que más impacto tienen en uso real:
- Cierra sesiones largas: pasados 60-90 minutos o cuando cambies de tarea, abre sesión nueva. El contexto acumulado de tareas viejas degrada la calidad de las nuevas.
- Usa
/clearentre subtareas: si terminas un bug fix y vas a empezar una refactorización, no arrastres el contexto del bug. - Compactación manual: cuando notes que el modelo se ralentiza, pide un resumen del estado actual y arranca sesión fresca con ese resumen pegado.
3. Diseño del workflow
Aquí es donde un perfil senior puede sacar más partido. Tres ajustes que reducen consumo y mejoran consistencia:
| Ajuste | Impacto | Esfuerzo |
|---|---|---|
| CLAUDE.md mínimo y específico | Menos tokens fijos por turno | Bajo |
| Subagentes para tareas aisladas | Sesión principal limpia | Medio |
| Skills versionadas para tareas repetidas | Menos prompt manual, más consistencia | Medio |
| MCPs solo cuando los uses | Reduce tokens ocultos por turno | Bajo |
Si estás cargando MCPs que no usas, estás pagando por definiciones de herramientas en cada turno. Si tu CLAUDE.md tiene 400 líneas con normas de un proyecto que cerraste hace tres meses, lo mismo. La higiene de contexto importa más cuando las sesiones se alargan.
Cómo medir el desperdicio en tu propia sesión
Claude Code expone el consumo de tokens en la statusline si la tienes configurada. Si no, ejecuta este comando dentro de una sesión activa para ver el estado de contexto:
# Muestra uso de contexto y desglose por componente
/context
Lo que tienes que mirar:
- System prompt: si pasa de 5-7k tokens, revisa CLAUDE.md y reglas globales.
- Tools (MCPs): si pasa de 10k tokens, tienes MCPs que no usas cargados.
- Mensajes: si tu sesión lleva más de 100k tokens, considera compactar o cerrar.
Para profundizar en cómo organizar memoria y MCPs sin disparar el coste, esta guía sobre memoria, MCPs y mapa de repo cubre el setup base. Si tu CLAUDE.md está creciendo sin control, mira también las técnicas para eliminar el context drift.
En Producción
Llevar este checklist a un equipo o a un flujo serio implica un par de consideraciones extra:
- Coste operativo real: con Opus 4.7 a precios actuales, una sesión de 4 horas con contexto inflado puede costar entre 8 y 15€ extra por developer y día. En equipos de 5 personas, eso son 200-400€/mes en tokens evitables.
- Versionado del CLI por equipo: si trabajas con varios developers, fija la versión mínima de Claude Code en el README del proyecto. Una persona en versión vieja puede generar PRs de peor calidad sin saber por qué.
- Monitorización ligera: revisa el consumo de tokens semanal por developer. Picos sostenidos suelen indicar mala higiene de sesión más que carga real de trabajo.
- Fallback claro: si Opus 4.7 sigue dando problemas tras el upgrade, ten Sonnet 4.6 listo como modelo de respaldo para tareas donde la diferencia de calidad sea aceptable.
Para entender qué cambió realmente con Opus 4.7 en flujos diarios y dónde rinde mejor, revisa el análisis de Opus 4.7 en Claude Code. Y si sospechas que tus MCPs están consumiendo más de la cuenta, este post sobre los 18.000 tokens ocultos de MCP por turno da los números reales.
Errores Comunes y Depuración
- Error: "El modelo olvida archivos cargados al inicio" → Causa: versión del CLI antigua o sesión saturada → Solución: actualiza a 2.1.117+ y abre sesión nueva.
- Error: "Las respuestas de Opus 4.7 son peores que las de 4.6" → Causa: el desperdicio de contexto afectaba más a Opus 4.7 por su ventana extendida → Solución: actualiza el CLI antes de comparar modelos.
- Error: "El comando
/contextmuestra 50k+ tokens en tools" → Causa: MCPs cargados que no usas → Solución: edita.claude/settings.jsony deja solo los MCPs activos del proyecto. - Error: "Sesión lenta tras 30 minutos" → Causa: contexto sin compactar → Solución: pide resumen del estado, abre sesión nueva, pega el resumen.
Preguntas Frecuentes
¿Tengo que reinstalar Claude Code o basta con actualizar?
Basta con npm install -g @anthropic-ai/claude-code@latest. La configuración local en ~/.claude/ y los proyectos no se ven afectados. Reinicia las sesiones abiertas tras actualizar.
¿Este problema afecta también a Sonnet 4.6 o solo a Opus 4.7?
El bug se manifestaba con más fuerza en Opus 4.7 por su ventana de contexto extendida, pero la versión 2.1.117 mejora también la gestión de contexto en Sonnet 4.6 y modelos previos. Actualiza aunque uses solo Sonnet.
¿Cómo sé si mi CLAUDE.md está inflado?
Si pasa de 200 líneas o de 5.000 tokens en la sección de system prompt al ejecutar /context, está inflado. Una buena norma: si una regla no se aplica en cada sesión, no debería estar en CLAUDE.md global.
Cierre
El bug del 80% en Opus 4.7 deja una lección que vale más allá de esta versión concreta: cuando un agente de código baja de calidad, la culpa rara vez es solo del modelo. Versión del CLI, hábitos de sesión y diseño del workflow son tres capas que un developer controla y que mueven la aguja más que cambiar de modelo. Antes de migrar a otro proveedor o reescribir prompts, recorre el checklist en este orden, mide con /context y compara.
¿Has notado caídas de calidad en Opus 4.7 que se arreglaron solas tras actualizar? Cuéntamelo en Twitter @sergiomarquezp_ o en los comentarios. En el próximo post profundizamos en cómo construir evals ligeras para detectar regresiones de modelo sin esperar a que la comunidad lo descubra por ti.


