
Claude Code /effort y Auto Mode: Ajusta Coste y Calidad
TL;DR
Claude Code v2.1.111 expone tres controles que antes iban ocultos: /effort (slider de razonamiento que incluye el nuevo xhigh), Auto Mode (elección automática de modelo según la tarea) y fijación explícita de modelo. Saber cuándo activar cada uno define la diferencia entre una sesión barata y rápida y otra que consume tu cuota sin aportar valor.
- Qué es: tres palancas nuevas para controlar esfuerzo de razonamiento y selección de modelo desde el CLI.
- Por qué importa: el coste por token y la latencia ya no son fijos, dependen de cómo configures el agente.
- Qué aprenderás: reglas prácticas para elegir entre
low,medium,high,xhighy Auto, con ejemplos de cuándo cada uno es la opción correcta.
El problema: un prompt ya no decide todo
Hasta hace poco, la calidad del resultado de un agente de código dependía sobre todo del prompt y del CLAUDE.md. Con la release v2.1.111, Anthropic mueve parte de esa responsabilidad al plano de configuración: cuánto debe pensar el modelo, cuál modelo se selecciona y si dejas que el propio harness decida.
Esto importa por una razón directa: el coste de una sesión puede variar entre céntimos y varios euros según qué palanca toques. Y la latencia que percibes en tareas cortas cambia de segundos a más de un minuto si subes el esfuerzo sin necesidad.
¿Qué es el slider /effort?
El comando /effort permite ajustar cuánto razona el modelo antes de responder. Los niveles disponibles son low, medium, high y el nuevo xhigh.
| Nivel | Uso típico | Coste relativo | Latencia |
|---|---|---|---|
low | Edits pequeños, renombrado, correcciones triviales | Bajo | Rápida |
medium | Features aisladas, tests unitarios | Medio | Media |
high | Refactor multi-archivo, debugging con varios síntomas | Alto | Lenta |
xhigh | Migraciones arquitectónicas, análisis profundo, código crítico | Muy alto | Muy lenta |
En mi experiencia migrando servicios de Spring a FastAPI, xhigh es útil exactamente una vez por ticket: cuando planteas la estrategia. Después bajas a medium para la implementación iterativa. Dejarlo siempre en xhigh es la forma más rápida de agotar cuota sin mejorar el resultado final.
¿Qué es el Auto Mode?
Auto Mode deja que Claude Code elija el modelo apropiado en función de la tarea detectada. Para una edición trivial selecciona un modelo ligero; para un razonamiento complejo escala a Opus.
La lógica detrás es simple: clasificar la petición antes de ejecutarla y enrutar al modelo con mejor relación coste-beneficio. Funciona bien en sesiones mixtas donde alternas refactor largo con pequeños grep y ediciones rápidas.
Cuándo Auto Mode es la mejor opción:
- Sesiones largas y heterogéneas (programas varias horas con tareas muy distintas).
- No te preocupa la reproducibilidad exacta entre ejecuciones.
- Priorizas optimizar coste sin micromanagement.
Cuándo no uses Auto Mode:
- Benchmarks o evaluaciones donde necesitas el mismo modelo en cada corrida.
- Tareas críticas donde un downgrade silencioso puede romper el flujo.
- Equipos que comparten sesiones y necesitan comportamiento predecible.
Fijar el modelo manualmente
La tercera palanca es la más sencilla: fijar el modelo con /model. Útil cuando Auto Mode se queda corto o cuando necesitas reproducibilidad.
Un caso real: tras el lanzamiento de Opus 4.7 el 15/04/2026, parte de la comunidad reportó regresiones en tareas concretas respecto a 4.6. Sin la capacidad de fijar modelo, estás a merced del enrutamiento por defecto. Con /model opus-4-7 u opus-4-6 (si sigue disponible en tu plan), controlas qué motor mueve tu agente.
# Fijar modelo para toda la sesión y evitar cambios automáticos
claude-code --model claude-opus-4-7 --effort medium
Si trabajas con archivos CLAUDE.md bien definidos, fijar el modelo reduce aún más la varianza entre sesiones.
Reglas prácticas para decidir
Después de varias semanas mezclando estas palancas en proyectos reales, estas son las reglas que aplico:
- Empieza siempre en
medium. Es el default razonable para el 70% de las tareas. - Sube a
highoxhighsolo cuando el problema involucra 3+ archivos o razonamiento causal complejo. Por ejemplo, rastrear un bug que cruza capas. - Baja a
lowpara tareas mecánicas: renombrar variables, aplicar un linter, añadir docstrings. - Auto Mode para sesiones exploratorias, modelo fijo para entregas críticas.
- Mide antes de cambiar: guarda una tarea de referencia y cronometra antes y después.
En Producción
Trasladar esto a un flujo de equipo requiere pensar en cuatro dimensiones.
Coste: xhigh puede multiplicar por 3-5 el consumo de tokens frente a medium. En un equipo pequeño con presupuesto de 20-50€/mes por dev en APIs, la diferencia entre un default medium y uno high se nota a fin de mes.
Latencia percibida: xhigh puede tardar más de un minuto en tareas que medium resolvería en 15 segundos. Si haces pair programming con el agente, la latencia mata el flujo.
Reproducibilidad: si tu equipo comparte skills y CLAUDE.md, combínalo con modelo fijo. Auto Mode rompe la reproducibilidad entre compañeros.
Degradación silenciosa: un cambio de modelo automático puede introducir regresiones sin aviso. Mantén una suite mínima de tareas de referencia para detectarlo.
Errores Comunes y Depuración
- Error: El agente tarda minutos en tareas triviales → Causa:
/effortdejado enxhightras una tarea compleja → Solución: vuelve amediumal terminar el bloque complejo. - Error: Resultados inconsistentes entre sesiones en el mismo repo → Causa: Auto Mode eligiendo modelos distintos → Solución: fija modelo con
/modelpara trabajo crítico. - Error: Consumo disparado sin mejora visible → Causa: subir
/effortpensando que más razonamiento siempre mejora el output → Solución: mide con una tarea conocida antes y después del cambio. - Error:
/modelno persiste entre sesiones → Causa: configuración no guardada ensettings.json→ Solución: fija el modelo en el archivo de configuración del proyecto.
Preguntas Frecuentes
¿Cuál es la diferencia real entre /effort high y xhigh?
El nivel xhigh activa un presupuesto de razonamiento extendido que prioriza análisis causal profundo y exploración de alternativas. En tareas donde high ya cubre el problema, xhigh añade latencia y coste sin beneficio medible. Úsalo para migraciones arquitectónicas o debugging de bugs con múltiples causas posibles.
¿Auto Mode funciona igual que un router de modelos manual?
Similar, pero con clasificación hecha por Claude Code en lugar de por ti. Auto Mode analiza la petición y enruta, igual que harías con un script que decide entre Haiku, Sonnet u Opus. La ventaja es cero configuración. La desventaja es que pierdes trazabilidad de qué modelo respondió qué.
¿Puedo combinar /effort con Auto Mode?
Sí. /effort afecta al razonamiento dentro del modelo elegido; Auto Mode decide qué modelo usar. Son ortogonales. Una configuración sensata es Auto Mode con /effort medium como default, escalando manualmente cuando detectas que la tarea lo merece.
Conclusión
La release v2.1.111 convierte la configuración del agente en una herramienta táctica, no solo estratégica. Dominar /effort, Auto Mode y la fijación de modelo te da control fino sobre el triángulo coste-latencia-calidad que antes era opaco. La clave está en empezar conservador con medium, escalar solo cuando la tarea lo exige y medir siempre antes de normalizar un cambio.
Si tu flujo incluye múltiples herramientas CLI, te recomiendo revisar también cómo GitHub CLI gestiona skills de Claude Code y cómo estos controles afectan a tareas largas comparadas con Codex CLI tras 60 días de uso real. Para equipos que acaban de adoptar el agente, vale la pena combinar esto con una estrategia sólida de skills y subagentes.
¿Has medido el impacto real de xhigh en tu flujo o prefieres Auto Mode para todo? Cuéntamelo en Twitter en @sergiomarquezp_. En el próximo post veremos cómo construir una suite de benchmarks propios para validar cambios de modelo antes de adoptarlos.


