Claude Code /effort y Auto Mode: coste vs calidad en 2026

TL;DR

Claude Code v2.1.111 expone tres controles que antes iban ocultos: /effort (slider de razonamiento que incluye el nuevo xhigh), Auto Mode (elección automática de modelo según la tarea) y fijación explícita de modelo. Saber cuándo activar cada uno define la diferencia entre una sesión barata y rápida y otra que consume tu cuota sin aportar valor.

Qué es: tres palancas nuevas para controlar esfuerzo de razonamiento y selección de modelo desde el CLI.
Por qué importa: el coste por token y la latencia ya no son fijos, dependen de cómo configures el agente.
Qué aprenderás: reglas prácticas para elegir entre low, medium, high, xhigh y Auto, con ejemplos de cuándo cada uno es la opción correcta.

El problema: un prompt ya no decide todo

Hasta hace poco, la calidad del resultado de un agente de código dependía sobre todo del prompt y del CLAUDE.md. Con la release v2.1.111, Anthropic mueve parte de esa responsabilidad al plano de configuración: cuánto debe pensar el modelo, cuál modelo se selecciona y si dejas que el propio harness decida.

Esto importa por una razón directa: el coste de una sesión puede variar entre céntimos y varios euros según qué palanca toques. Y la latencia que percibes en tareas cortas cambia de segundos a más de un minuto si subes el esfuerzo sin necesidad.

¿Qué es el slider /effort?

El comando /effort permite ajustar cuánto razona el modelo antes de responder. Los niveles disponibles son low, medium, high y el nuevo xhigh.

Nivel	Uso típico	Coste relativo	Latencia
`low`	Edits pequeños, renombrado, correcciones triviales	Bajo	Rápida
`medium`	Features aisladas, tests unitarios	Medio	Media
`high`	Refactor multi-archivo, debugging con varios síntomas	Alto	Lenta
`xhigh`	Migraciones arquitectónicas, análisis profundo, código crítico	Muy alto	Muy lenta

En mi experiencia migrando servicios de Spring a FastAPI, xhigh es útil exactamente una vez por ticket: cuando planteas la estrategia. Después bajas a medium para la implementación iterativa. Dejarlo siempre en xhigh es la forma más rápida de agotar cuota sin mejorar el resultado final.

¿Qué es el Auto Mode?

Auto Mode deja que Claude Code elija el modelo apropiado en función de la tarea detectada. Para una edición trivial selecciona un modelo ligero; para un razonamiento complejo escala a Opus.

La lógica detrás es simple: clasificar la petición antes de ejecutarla y enrutar al modelo con mejor relación coste-beneficio. Funciona bien en sesiones mixtas donde alternas refactor largo con pequeños grep y ediciones rápidas.

Cuándo Auto Mode es la mejor opción:

Sesiones largas y heterogéneas (programas varias horas con tareas muy distintas).
No te preocupa la reproducibilidad exacta entre ejecuciones.
Priorizas optimizar coste sin micromanagement.

Cuándo no uses Auto Mode:

Benchmarks o evaluaciones donde necesitas el mismo modelo en cada corrida.
Tareas críticas donde un downgrade silencioso puede romper el flujo.
Equipos que comparten sesiones y necesitan comportamiento predecible.

Fijar el modelo manualmente

La tercera palanca es la más sencilla: fijar el modelo con /model. Útil cuando Auto Mode se queda corto o cuando necesitas reproducibilidad.

Un caso real: tras el lanzamiento de Opus 4.7 el 15/04/2026, parte de la comunidad reportó regresiones en tareas concretas respecto a 4.6. Sin la capacidad de fijar modelo, estás a merced del enrutamiento por defecto. Con /model opus-4-7 u opus-4-6 (si sigue disponible en tu plan), controlas qué motor mueve tu agente.

# Fijar modelo para toda la sesión y evitar cambios automáticos
claude-code --model claude-opus-4-7 --effort medium

Si trabajas con archivos CLAUDE.md bien definidos, fijar el modelo reduce aún más la varianza entre sesiones.

Reglas prácticas para decidir

Después de varias semanas mezclando estas palancas en proyectos reales, estas son las reglas que aplico:

Empieza siempre en medium. Es el default razonable para el 70% de las tareas.
Sube a high o xhigh solo cuando el problema involucra 3+ archivos o razonamiento causal complejo. Por ejemplo, rastrear un bug que cruza capas.
Baja a low para tareas mecánicas: renombrar variables, aplicar un linter, añadir docstrings.
Auto Mode para sesiones exploratorias, modelo fijo para entregas críticas.
Mide antes de cambiar: guarda una tarea de referencia y cronometra antes y después.

En Producción

Trasladar esto a un flujo de equipo requiere pensar en cuatro dimensiones.

Coste: xhigh puede multiplicar por 3-5 el consumo de tokens frente a medium. En un equipo pequeño con presupuesto de 20-50€/mes por dev en APIs, la diferencia entre un default medium y uno high se nota a fin de mes.

Latencia percibida: xhigh puede tardar más de un minuto en tareas que medium resolvería en 15 segundos. Si haces pair programming con el agente, la latencia mata el flujo.

Reproducibilidad: si tu equipo comparte skills y CLAUDE.md, combínalo con modelo fijo. Auto Mode rompe la reproducibilidad entre compañeros.

Degradación silenciosa: un cambio de modelo automático puede introducir regresiones sin aviso. Mantén una suite mínima de tareas de referencia para detectarlo.

Errores Comunes y Depuración

Error: El agente tarda minutos en tareas triviales → Causa: /effort dejado en xhigh tras una tarea compleja → Solución: vuelve a medium al terminar el bloque complejo.
Error: Resultados inconsistentes entre sesiones en el mismo repo → Causa: Auto Mode eligiendo modelos distintos → Solución: fija modelo con /model para trabajo crítico.
Error: Consumo disparado sin mejora visible → Causa: subir /effort pensando que más razonamiento siempre mejora el output → Solución: mide con una tarea conocida antes y después del cambio.
Error: /model no persiste entre sesiones → Causa: configuración no guardada en settings.json → Solución: fija el modelo en el archivo de configuración del proyecto.

Preguntas Frecuentes

¿Cuál es la diferencia real entre /effort high y xhigh?

El nivel xhigh activa un presupuesto de razonamiento extendido que prioriza análisis causal profundo y exploración de alternativas. En tareas donde high ya cubre el problema, xhigh añade latencia y coste sin beneficio medible. Úsalo para migraciones arquitectónicas o debugging de bugs con múltiples causas posibles.

¿Auto Mode funciona igual que un router de modelos manual?

Similar, pero con clasificación hecha por Claude Code en lugar de por ti. Auto Mode analiza la petición y enruta, igual que harías con un script que decide entre Haiku, Sonnet u Opus. La ventaja es cero configuración. La desventaja es que pierdes trazabilidad de qué modelo respondió qué.

¿Puedo combinar /effort con Auto Mode?

Sí. /effort afecta al razonamiento dentro del modelo elegido; Auto Mode decide qué modelo usar. Son ortogonales. Una configuración sensata es Auto Mode con /effort medium como default, escalando manualmente cuando detectas que la tarea lo merece.

Conclusión

La release v2.1.111 convierte la configuración del agente en una herramienta táctica, no solo estratégica. Dominar /effort, Auto Mode y la fijación de modelo te da control fino sobre el triángulo coste-latencia-calidad que antes era opaco. La clave está en empezar conservador con medium, escalar solo cuando la tarea lo exige y medir siempre antes de normalizar un cambio.

Si tu flujo incluye múltiples herramientas CLI, te recomiendo revisar también cómo GitHub CLI gestiona skills de Claude Code y cómo estos controles afectan a tareas largas comparadas con Codex CLI tras 60 días de uso real. Para equipos que acaban de adoptar el agente, vale la pena combinar esto con una estrategia sólida de skills y subagentes.

¿Has medido el impacto real de xhigh en tu flujo o prefieres Auto Mode para todo? Cuéntamelo en Twitter en @sergiomarquezp_. En el próximo post veremos cómo construir una suite de benchmarks propios para validar cambios de modelo antes de adoptarlos.