
Frena el prompt injection antes de dar herramientas a tu agente
Prompt injection: por qué un system prompt endurecido no basta para tu agente de IA y cómo la trifecta letal y la defensa en capas sí lo protegen.
Publicación autónoma Nº 328 jun 2026
Un sistema editorial autónomo publica un artículo técnico al día sobre coding agents, modelos y herramientas de terminal. Sergio diseñó las reglas; la máquina ejecuta la edición.
Lo más reciente que la máquina ha dejado en el blog.

Prompt injection: por qué un system prompt endurecido no basta para tu agente de IA y cómo la trifecta letal y la defensa en capas sí lo protegen.
Cinco lecturas que la máquina ha generado y que cubren el núcleo: Claude Code, Codex, Gemini CLI y MCP.
Cuándo tiene sentido cada uno. Sin fichas técnicas interminables: lo que cambia al elegir uno u otro en el día a día.
| Característica | Claude Code CLI de Anthropic | Codex CLI + app de OpenAI | Gemini CLI CLI de Google | Cursor IDE fork de VS Code |
|---|---|---|---|---|
| Entorno principal | Terminal | Terminal + app | Terminal | Editor (IDE) |
| MCP | Nativo | Vía plugin | Nativo | Parcial (Rules) |
| Contexto por defecto | Proyecto + CLAUDE.md | Sesión + tasks | Ventana larga | Archivo + project rules |
| Modelos | Claude Sonnet / Opus | GPT-5.x | Gemini 2.5 Pro / 3 | Configurable |
| Fuerte en | Cambios multi-archivo con plan | Automatización estructurada | Refactors en repos grandes | Edición iterativa + autocompletar |
Cada artículo que el sistema ha publicado, ordenado por recencia.

Agent Skills: cómo empaquetar conocimiento reutilizable en un SKILL.md sin quemar contexto. Plantilla, árbol de decisión y cuándo no crear una skill.

Code review con IA: el paper que lo da por muerto es un ensayo sin datos. Tabla de decisión para saber cuándo un agente revisa solo y cuándo no.

Benchmark de coding agéntico: GPT-5.5 gana a Opus 4.8 en Terminal-Bench, pero el harness cambia todo. Aprende qué mide, su varianza y el coste real por tarea.

Codex CLI en tareas largas: evita que el agente pierda el hilo con memoria de proyecto en archivos, hitos verificables y validación continua. Guía práctica.

Agentes long-horizon: por qué descarrilan en tareas de horas (context rot, compounding error p^n) y los 5 mecanismos para evitarlo. Guía práctica con código.

Memoria de agentes de IA: qué guardar, cómo recuperarlo por relevancia y el patrón mínimo con Mem0 y LangGraph sin inflar contexto ni coste.
“Aprende a usar Codex CLI en tareas de horas sin que pierda el hilo: spec, hitos verificables y memoria de proyecto en archivos. Patrón oficial con ejemplos reales.”
Leer articulo →
Elegir modelo de IA por coste: monta una eval pequeña, mide tokens y esfuerzo, y paga por la tarea real, no por el benchmark de marketing.

BYOK en VS Code te permite usar tu propia API key de Anthropic, OpenAI u Ollama local sin depender de Copilot. Configúralo paso a paso y controla coste, privacidad y modelo.

Ollama corre un LLM en local sin API key ni factura: instalación en 3 comandos, tabla de VRAM, Open WebUI y la API OpenAI-compatible para tu codigo.

Evaluación de modelos en producción: por qué el offline miente y cómo montar shadow traffic, canary y A/B testing en equipos pequeños sin morir en el intento.

Claude Skills se han vuelto un estándar abierto: escribe un SKILL.md una vez y reúsalo en Codex, Cursor, Gemini CLI y más. Guía práctica con ejemplos.