BYOK en VS Code: usa tu propia API key sin Copilot 2026

TL;DR: BYOK (bring your own key) en VS Code te deja conectar tu propia API key de Anthropic, OpenAI, Gemini, OpenRouter o un modelo local con Ollama directamente en el chat del editor, sin depender de la cuota cerrada de Copilot. El uso lo factura tu proveedor, no cuenta contra los límites de Copilot, y desde la versión 1.122 funciona sin iniciar sesión en GitHub. En este artículo verás cómo configurarlo paso a paso, cuándo compensa de verdad y qué vigilar antes de usarlo en el día a día.

El problema: pagas dos veces por lo mismo

Si ya gastas entre 10 y 50 euros al mes en la API de Anthropic u OpenAI para tus proyectos, pagar además la suscripción de Copilot para usar esos modelos dentro de VS Code es pagar dos veces. Y cuando llegas al límite de peticiones de tu plan, el editor te corta justo cuando estás en mitad de un refactor.

Hay un segundo problema, menos visible: la privacidad. Con la cuota cerrada de Copilot, tu código pasa por la infraestructura de GitHub. En proyectos con datos sensibles o cláusulas de confidencialidad, eso es una conversación incómoda con el equipo de seguridad.

BYOK en VS Code resuelve las dos cosas: usas el modelo que tú eliges, pagas solo lo que consumes y el tráfico va a tu proveedor (o a tu propia máquina si usas un modelo local). El cambio dejó de ser experimental: GitHub lo marcó como disponible de forma general el 22/04/2026.

¿Qué es BYOK (bring your own key)?

BYOK es la capacidad de VS Code de usar cualquier modelo de un proveedor compatible introduciendo tu propia API key, en lugar de los modelos integrados que vienen con Copilot. Una vez configurado, el modelo aparece en el selector del chat y funciona en cualquier sitio donde uses chat: el agente integrado y los agentes personalizados.

Dos detalles que marcan la diferencia frente a un tutorial genérico:

BYOK no aplica a las autocompletados de código (esos seguirán usando el modelo de Copilot). Solo afecta al chat y a los agentes.
El consumo lo factura tu proveedor y no descuenta de la cuota de peticiones de Copilot. Esto es justo lo que evita el doble coste.

Las claves se guardan localmente en tu equipo y no se comparten entre proveedores, según la documentación de VS Code. Si vienes del mundo de los modelos locales, el patrón te sonará a lo que ya cuento en correr un LLM en local con Ollama sin API key: control total a cambio de gestionar tú la infraestructura.

Implementación paso a paso

El punto de entrada es siempre el mismo comando. Abre la paleta de comandos (Ctrl/Cmd + Shift + P) y ejecuta Chat: Manage Language Models, o pulsa el icono del engranaje en el selector de modelos del chat.

Opción 1: proveedor integrado (la vía rápida)

VS Code trae una lista de proveedores listos para usar: Anthropic, Gemini, OpenAI, OpenRouter, Azure y, para modelos locales, Ollama y Foundry Local.

En el editor de modelos, pulsa Add Models y elige el proveedor (por ejemplo, Anthropic).
Introduce tu API key y, si el proveedor lo pide, el endpoint.
Selecciona qué modelos de ese proveedor quieres habilitar.
El modelo aparece en el selector del chat. Si no sale, reinicia VS Code.

Opción 2: endpoint OpenAI-compatible o configuración por JSON

Cuando tu proveedor no está en la lista o usas un gateway propio, configuras un endpoint manualmente. VS Code abre un archivo chatLanguageModels.json donde defines el modelo. Importante: tienes que indicar el tipo de API correcto, que puede ser Chat Completions, Responses o Messages según lo que soporte el modelo.

Este es el ejemplo oficial para un endpoint de Anthropic usando la API Messages. La clave nunca se escribe a fuego: usa una variable de entorno o el almacén de credenciales.

[
  {
    "name": "Anthropic",
    "vendor": "customendpoint",
    "apiKey": "YOUR_API_KEY",
    "apiType": "messages",
    "models": [
      {
        "id": "claude-sonnet-4-6",
        "name": "Claude Sonnet 4.6",
        "url": "https://api.anthropic.com/v1/messages",
        "toolCalling": true,
        "vision": true,
        "maxInputTokens": 200000,
        "maxOutputTokens": 64000
      }
    ]
  }
]

Fíjate en toolCalling: true: si lo dejas en falso, el modelo no podrá usar herramientas y los agentes se quedarán cojos. Es el error de configuración más habitual.

Opción 3: modelo local con Ollama (cero coste de API)

Para trabajar sin pagar ni API y con todo el tráfico en tu máquina, Ollama es la vía más directa. Requisitos: VS Code 1.113 o superior y la extensión de Copilot Chat 0.41.0 o superior.

Arranca Ollama y descarga un modelo de código (por ejemplo, uno de la familia Qwen para coding).
En Manage Language Models, pulsa Add Models y selecciona Ollama.
VS Code carga tus modelos locales; selecciónalos en el picker.

Un detalle reciente y útil: desde la versión 1.122, BYOK funciona sin iniciar sesión en GitHub y sin un plan de Copilot. Esto habilita un flujo totalmente offline con modelos locales, algo que antes obligaba a estar logueado.

Cuándo usar BYOK y cuándo no

BYOK no es siempre la mejor opción. Esta tabla resume el criterio que aplico antes de configurarlo en un equipo:

Cuándo usar BYOK	Cuándo evitarlo
Ya pagas la API de un proveedor y no quieres duplicar coste	Solo usas autocompletados (BYOK no los cubre)
Necesitas un modelo concreto que Copilot no ofrece	Quieres una factura única y predecible cada mes
Datos sensibles que deben ir a tu proveedor o quedarse en local	Tu organización tiene la política BYOK deshabilitada
Chocas contra los límites semanales de peticiones de tu plan	No quieres gestionar claves ni monitorizar tokens

El caso de uso más claro que veo en equipos de producto: un desarrollador que ya tiene presupuesto de API para su pipeline de procesamiento de documentos con LangChain y reutiliza esa misma clave para el chat del editor. Una clave, un proveedor, un solo sitio donde mirar el gasto.

En Producción

La diferencia entre el tutorial y el uso diario está en el control del gasto y los permisos. Esto es lo que cambia.

Coste y monitorización. BYOK traslada el control del gasto a ti. Sin la red de seguridad de la cuota de Copilot, una sesión larga con un modelo caro puede dispararse rápido. Revisa el panel de uso de tu proveedor a diario las primeras semanas y fija alertas de gasto. El razonamiento de coste por sesión es el mismo que detallo en por qué cruzar los 200k tokens vacía tu presupuesto: el contexto largo es lo que más cuesta.

Elección de modelo. No envíes el modelo top a cada petición por inercia. Para tareas repetitivas, un modelo de gama media suele dar el 90% de la calidad a una fracción del coste. Antes de fijar tu modelo por defecto, conviene medirlo con tus propias tareas, no fiarte de los benchmarks de coding agéntico genéricos.

Permisos y organización. En cuentas Copilot Business o Enterprise, la política "Bring Your Own Language Model Key in VS Code" la controla el administrador desde GitHub.com. Está activada por defecto, pero un admin puede desactivarla. Si BYOK no aparece, ese es el primer sitio donde mirar.

Límites de tasa. Pasas de los límites de Copilot a los de tu proveedor. Si compartes una sola clave en un equipo, los rate limits se agotan antes de lo que crees. Considera una clave por persona o por proyecto.

Errores comunes y depuración

Error: el modelo no aparece en el selector tras configurarlo. Causa: VS Code no recarga la lista al vuelo. Solución: reinicia el editor; la documentación lo indica explícitamente.
Error: los agentes no pueden usar herramientas con tu modelo. Causa: toolCalling está en falso o el modelo no soporta tool use. Solución: ponlo en true en el JSON y verifica que el modelo lo permite.
Error: respuestas con error 401 o de autenticación. Causa: API key inválida, expirada o sin saldo en el proveedor. Solución: regenera la clave y comprueba el crédito en el panel del proveedor.
Error: BYOK no aparece en una cuenta de empresa. Causa: el administrador desactivó la política. Solución: que el admin habilite la política en los ajustes de Copilot en GitHub.com.

Preguntas frecuentes

¿BYOK en VS Code cubre el autocompletado de código?

No. BYOK solo funciona en el chat y en los agentes, incluido el agente integrado y los personalizados. Los autocompletados en línea siguen usando el modelo de Copilot.

¿Necesito una suscripción de Copilot para usar BYOK?

No es obligatorio. Desde la versión 1.122 de VS Code, BYOK funciona sin iniciar sesión en GitHub y sin un plan de Copilot, lo que permite escenarios totalmente offline con modelos locales como Ollama.

¿El consumo de BYOK descuenta de mi cuota de Copilot?

No. El uso lo factura directamente tu proveedor (Anthropic, OpenAI, etc.) y no cuenta contra los límites de peticiones de GitHub Copilot. Por eso evita el doble coste si ya pagas la API.

Conclusión

Hemos visto cómo BYOK en VS Code te devuelve el control: eliges el modelo, pagas solo lo que consumes y decides por dónde viaja tu código. La clave está en configurarlo bien (tipo de API correcto, toolCalling activado) y en no perder de vista el gasto, porque pierdes la red de seguridad de la cuota cerrada de Copilot. Para empezar, lo más sensato es probarlo con un modelo local vía Ollama y, si ya pagas una API, reutilizar esa clave antes de duplicar suscripciones.

¿Has migrado tu chat de VS Code a tu propia API key o a un modelo local? Cuéntame qué proveedor y modelo te está funcionando mejor en los comentarios o en Twitter @sergiomarquezp_. En el próximo artículo entraré en cómo montar un mini-benchmark casero para decidir qué modelo enviar en cada tipo de tarea sin quemar presupuesto.