SpyBara
Go Premium

model-config.md 2026-06-16 21:57 UTC to 2026-06-17 17:02 UTC

151 added, 29 removed.

2026
Tue 23 00:59 Mon 22 23:59 Fri 19 22:58 Thu 18 22:00 Wed 17 17:02 Tue 16 21:57 Mon 15 23:02 Sat 13 21:59 Fri 12 22:00 Thu 11 23:01 Wed 10 23:57 Tue 9 06:34 Mon 8 06:52 Sat 6 06:24 Fri 5 06:45 Thu 4 06:52 Wed 3 06:53 Tue 2 06:51

Configuración del modelo

Aprenda sobre la configuración del modelo Claude Code, incluidos los alias de modelo como opusplan

Modelos disponibles

Para la configuración de model en Claude Code, puede configurar:

  • Un alias de modelo
  • Un nombre de modelo
    • API de Anthropic: Un nombre de modelo completo
    • Bedrock: un ARN de perfil de inferencia
    • Foundry: un nombre de implementación
    • Vertex: un nombre de versión

Alias de modelo

Los alias de modelo proporcionan una forma conveniente de seleccionar configuraciones de modelo sin necesidad de recordar números de versión exactos:

Alias de modelo Comportamiento
default Valor especial que borra cualquier anulación de modelo y revierte al modelo recomendado para su tipo de cuenta. No es en sí mismo un alias de modelo
best Utiliza Fable 5 donde su organización tiene acceso a él, de lo contrario el último modelo Opus
fable Utiliza Claude Fable 5 para sus tareas más difíciles y de mayor duración
sonnet Utiliza el último modelo Sonnet para tareas de codificación diaria
opus Utiliza el último modelo Opus para tareas de razonamiento complejo
haiku Utiliza el modelo Haiku rápido y eficiente para tareas simples
sonnet[1m] Utiliza Sonnet con una ventana de contexto de 1 millón de tokens para sesiones largas
opus[1m] Utiliza Opus con una ventana de contexto de 1 millón de tokens para sesiones largas
opusplan Modo especial que utiliza opus durante Plan Mode, luego cambia a sonnet para la ejecución

En la API de Anthropic, opus se resuelve a Opus 4.8 y sonnet se resuelve a Sonnet 4.6. En Claude Platform on AWS, opus se resuelve a Opus 4.7 y sonnet se resuelve a Sonnet 4.6. En Bedrock, Vertex y Foundry, opus se resuelve a Opus 4.6 y sonnet se resuelve a Sonnet 4.5; hay modelos más nuevos disponibles en esos proveedores seleccionando el nombre de modelo completo explícitamente o estableciendo ANTHROPIC_DEFAULT_OPUS_MODEL o ANTHROPIC_DEFAULT_SONNET_MODEL.

Los alias apuntan a la versión recomendada para su proveedor y se actualizan con el tiempo. Para fijar una versión específica, utilice el nombre de modelo completo (por ejemplo, claude-opus-4-8) o establezca la variable de entorno correspondiente como ANTHROPIC_DEFAULT_OPUS_MODEL.

Trabajar con Fable 5

Claude Fable 5 es el modelo más capaz en Claude Code, adecuado para tareas más grandes que una sola sesión. Sustenta sesiones largas autónomas, investiga antes de actuar y verifica su trabajo más a menudo que los modelos más pequeños.

Fable 5 no es el modelo predeterminado. Selecciónelo con /model fable. Las solicitudes que sus clasificadores de seguridad marcan, más a menudo en dominios de ciberseguridad y biología, activan alternancia automática de modelo.

Para aprovechar al máximo Fable 5:

  • Describa el resultado, no los pasos: entrégale el resultado que desea y déjelo planificar el camino. Para mantenerlo funcionando hasta que ese resultado se cumpla, establezca un objetivo.
  • Entrégale problemas ambiguos: las investigaciones de causa raíz, la depuración de interrupciones y las decisiones de arquitectura son donde la investigación y verificación adicionales se rentabilizan.
  • Omita los recordatorios de verificación: verifica su propio trabajo con menos indicaciones, por lo que los recordatorios para probar o verificar generalmente son innecesarios.
  • Dimensione tareas más grandes: entrégale trabajo que normalmente dividiría en partes. Mantiene sesiones largas sin perder el hilo.

Configurar su modelo

Puede configurar su modelo de varias formas, enumeradas en orden de prioridad:

  1. Durante la sesión - Utilice /model <alias|name> para cambiar inmediatamente, o ejecute /model sin argumentos para abrir el selector. El selector solicita confirmación cuando la conversación tiene salida anterior, ya que la siguiente respuesta relee el historial completo sin contexto en caché
  2. Al inicio - Inicie con claude --model <alias|name>
  3. Variable de entorno - Establezca ANTHROPIC_MODEL=<alias|name>
  4. Configuración - Configure permanentemente en su archivo de configuración utilizando el campo model.

A partir de v2.1.153, /model guarda su selección como predeterminada para nuevas sesiones escribiendo el campo model en su configuración de usuario. En el selector:

  • Enter: cambiar modelo y guardar como predeterminado
  • s: cambiar modelo solo para esta sesión

Escribir /model <name> directamente se comporta como Enter. La configuración del proyecto y administrada aún tiene prioridad y se reaplicará en el siguiente lanzamiento.

En v2.1.144 a v2.1.152, /model se aplicaba solo a la sesión actual y d en el selector guardaba un predeterminado.

La bandera --model y la variable de entorno ANTHROPIC_MODEL se aplican solo a la sesión que inicia con ellas. Para ejecutar diferentes modelos en diferentes terminales al mismo tiempo, inicie cada uno con su propia bandera --model en lugar de cambiar con /model.

Las sesiones reanudadas iniciadas con claude --resume, --continue, o el selector /resume mantienen el modelo que estaban usando cuando se guardó la transcripción, independientemente de la configuración actual de model. Si ese modelo ha sido retirado, la sesión cae en el orden de precedencia normal. Esto evita que la selección de /model de otra sesión cambie el modelo al reanudar.

Cuando el modelo activo al inicio proviene de la configuración del proyecto o administrada en lugar de su propia selección, el encabezado de inicio muestra qué archivo de configuración lo estableció. Ejecute /model para anular; la configuración del proyecto o administrada se reaplicará en el siguiente lanzamiento.

Ejemplo de uso:

# Iniciar con Opus
claude --model opus

# Cambiar a Sonnet durante la sesión
/model sonnet

Archivo de configuración de ejemplo:

{
    "permissions": {
        ...
    },
    "model": "opus"
}

Restringir la selección de modelo

Los administradores empresariales pueden utilizar availableModels en configuración administrada o de política para restringir qué modelos pueden seleccionar los usuarios.

Cuando se establece availableModels, la lista de permitidos se aplica en todas partes donde un usuario puede especificar un modelo:

  • Modelo de sesión principal: /model, la bandera --model, y la variable de entorno ANTHROPIC_MODEL
  • Resolución de alias: {/* min-version: 2.1.176 */}las variables de entorno ANTHROPIC_DEFAULT_OPUS_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL, y ANTHROPIC_DEFAULT_FABLE_MODEL no pueden redirigir un alias permitido a un modelo fuera de la lista
  • Modo rápido: {/* min-version: 2.1.176 */}/fast se niega a cambiar cuando cambiaría implícitamente a un modelo Opus fuera de la lista, con el mensaje "no está en los modelos permitidos de su organización"
  • Modelos de subagentes: el campo model en frontmatter de subagente, el parámetro model de la herramienta Agent, el selector de modelo en /agents, y CLAUDE_CODE_SUBAGENT_MODEL
  • Modelo de asesor: la configuración advisorModel configurada
  • Cadenas de reserva: los elementos de una cadena de modelo de reserva fuera de la lista se descartan

Cambiar a un modelo bloqueado con /model se rechaza con un error, mientras que una bandera --model bloqueada o un valor ANTHROPIC_MODEL se reemplaza al inicio con una advertencia que nombra tanto los modelos solicitados como los sustituidos, y la sesión comienza en el modelo predeterminado. Una anulación de subagente o asesor bloqueada vuelve al modelo heredado o predeterminado en lugar de fallar la solicitud.

{
  "availableModels": ["sonnet", "haiku"]
}

Comportamiento del modelo predeterminado

Por defecto, la opción Predeterminado en el selector de modelo no se ve afectada por availableModels. Siempre permanece disponible y representa el valor predeterminado de tiempo de ejecución del sistema basado en el nivel de suscripción del usuario.

Para extender la lista de permitidos a la opción Predeterminado, establezca enforceAvailableModels en true en configuración administrada o de política junto con una lista availableModels no vacía. Cuando el valor predeterminado del nivel no está en la lista de permitidos, Predeterminado se resuelve a la primera entrada permitida en lugar del valor predeterminado del nivel. Esto requiere Claude Code v2.1.175 o posterior.

Un array availableModels vacío nunca activa la aplicación. Incluso con availableModels: [], los usuarios aún pueden usar Claude Code con el modelo Predeterminado para su nivel independientemente de enforceAvailableModels.

Controlar el modelo en el que se ejecutan los usuarios

La configuración de model es una selección inicial, no una aplicación. Establece qué modelo está activo cuando comienza una sesión, pero los usuarios aún pueden abrir /model y elegir Predeterminado, que se resuelve al valor predeterminado del sistema para su nivel independientemente de lo que esté configurado en model.

Para controlar completamente la experiencia del modelo, combine estas configuraciones:

  • availableModels: restringe a qué modelos nombrados pueden cambiar los usuarios
  • enforceAvailableModels: extiende la lista de permitidos availableModels a la opción Predeterminado, de modo que Predeterminado no pueda resolverse a un modelo fuera de la lista
  • model: establece la selección de modelo inicial cuando comienza una sesión
  • ANTHROPIC_DEFAULT_SONNET_MODEL / ANTHROPIC_DEFAULT_OPUS_MODEL / ANTHROPIC_DEFAULT_HAIKU_MODEL / ANTHROPIC_DEFAULT_FABLE_MODEL: controlan a qué se resuelven la opción Predeterminado y los alias sonnet, opus, haiku y fable

Este ejemplo inicia a los usuarios en Sonnet 4.5, limita el selector a Sonnet y Haiku, y asegura que Predeterminado se resuelva a un modelo en la lista de permitidos en lugar del valor predeterminado del nivel:

{
  "model": "claude-sonnet-4-5",
  "availableModels": ["claude-sonnet-4-5", "haiku"],
  "enforceAvailableModels": true,
  "env": {
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
  }
}

Sin enforceAvailableModels o el bloque env, un usuario que seleccione Predeterminado en el selector obtendría la versión más reciente para su nivel, omitiendo la fijación de versión en model y availableModels. Las dos configuraciones cubren diferentes alcances: enforceAvailableModels hace que Predeterminado obedezca la lista de permitidos, mientras que el bloque env fija qué versión resuelve un alias permitido como sonnet. Use enforceAvailableModels solo cuando restringir familias de modelos sea suficiente; agregue el bloque env cuando también necesite fijar una versión específica.

Comportamiento de fusión

Cuando availableModels se establece en configuración de usuario, proyecto y local solamente, los arrays se fusionan y se desduplican en esos niveles.

Cuando availableModels se establece en configuración administrada o de política, el valor administrado o de política reemplaza completamente el resultado fusionado: las entradas agregadas en configuración de usuario o proyecto no pueden ampliarlo. La configuración administrada y de política reemplaza los valores de menor precedencia para enforceAvailableModels de la misma manera. A partir de Claude Code v2.1.175, esta es la única forma de aplicar una lista de permitidos estricta; las versiones anteriores fusionan la lista administrada con entradas de menor precedencia.

IDs de modelo Mantle

Cuando el punto final Bedrock Mantle está habilitado, las entradas en availableModels que comienzan con anthropic. se agregan al selector /model como opciones personalizadas y se enrutan al punto final Mantle. La configuración aún restringe el selector a las entradas enumeradas, así que incluya los alias estándar junto con cualquier ID de Mantle.

Comportamiento especial del modelo

Configuración del modelo `default`

El comportamiento de default depende del tipo de cuenta:

  • Max, Team Premium, Enterprise de pago por uso y API de Anthropic: por defecto Opus 4.8
  • Claude Platform en AWS: por defecto Opus 4.7
  • Pro, Team Standard y asientos de suscripción Enterprise: por defecto Sonnet 4.6
  • Bedrock, Vertex y Foundry: por defecto Sonnet 4.5

Enterprise de pago por uso significa una organización Enterprise facturada por uso en lugar de por asiento de suscripción.

Fable 5 no es el modelo predeterminado en ningún tipo de cuenta. Las sesiones utilizan Fable 5 solo después de que lo elija, con /model fable, una configuración de model, o el alias best donde Fable 5 está disponible. Elegirlo con /model lo guarda como el modelo seleccionado en su configuración de usuario, por lo que las sesiones posteriores comienzan en Fable 5 hasta que cambie de modelos.

Configuración del modelo `opusplan`

El alias de modelo opusplan proporciona un enfoque híbrido automatizado:

  • En Plan Mode - Utiliza opus para razonamiento complejo y decisiones de arquitectura
  • En Execution Mode - Cambia automáticamente a sonnet para generación de código e implementación

Esto le da lo mejor de ambos mundos: el razonamiento superior de Opus para la planificación y la eficiencia de Sonnet para la ejecución.

La fase Opus en Plan Mode utiliza la misma ventana de contexto que la configuración del modelo opus. En los niveles de suscripción donde Opus se actualiza automáticamente a contexto de 1M, opusplan recibe la actualización en Plan Mode también. Para forzar contexto de 1M para ambas fases cuando no está en un nivel de actualización automática, establezca el modelo en opusplan[1m].

Cuando availableModels excluye Opus, opusplan se mantiene en Sonnet en Plan Mode en lugar de cambiar. De manera similar, una sesión de Haiku que normalmente se actualizaría a Sonnet en Plan Mode se mantiene en Haiku cuando Sonnet se excluye.

Para un enfoque híbrido donde Claude decide a mitad de la tarea cuándo consultar un segundo modelo en lugar de cambiar en el límite del plan, consulte la herramienta advisor.

Cadenas de modelos de respaldo

Cuando el modelo principal está sobrecargado, no disponible o devuelve otro error de servidor no reintentable, Claude Code puede cambiar a un modelo de respaldo en lugar de fallar la solicitud. Los errores de autenticación, facturación, límite de velocidad, tamaño de solicitud y transporte nunca desencadenan un cambio; esos siguen su reintento normal y manejo de errores.

Configure uno o más modelos de respaldo y Claude Code los intenta en orden, mostrando un aviso cuando cambia. El cambio dura solo para el turno actual, por lo que su próximo mensaje intenta el modelo principal primero nuevamente. Las cadenas están limitadas a tres modelos después de la eliminación de duplicados, y las entradas adicionales se ignoran.

Establezca una cadena para una sesión con la bandera --fallback-model, que acepta una lista separada por comas:

claude --fallback-model sonnet,haiku

Para persistir una cadena entre sesiones, establezca fallbackModel en configuración como una matriz:

{
  "fallbackModel": ["claude-sonnet-4-6", "claude-haiku-4-5"]
}

La bandera --fallback-model tiene precedencia sobre la configuración fallbackModel. Cada elemento acepta un nombre de modelo o alias, y "default" se expande al modelo predeterminado.

Dos casos causan que un elemento se omita:

  • Modelo no disponible: un modelo que no se puede alcanzar, como un modelo retirado fijado en la configuración, se omite y Claude Code continúa con el siguiente elemento.
  • Fuera de la lista de permitidos: un elemento no permitido por availableModels se descarta cuando se lee la cadena y nunca se intenta.

Respaldo automático del modelo

Esta sección cubre el respaldo basado en contenido de Fable 5. Para respaldo basado en disponibilidad cuando un modelo está sobrecargado o no disponible, consulte Cadenas de modelos de respaldo.

Fable 5 se ejecuta con clasificadores de seguridad para contenido de ciberseguridad y biología. Cuando un clasificador marca una solicitud, Claude Code vuelve a ejecutar esa solicitud en el modelo Opus predeterminado y muestra un aviso en la transcripción: Opus 4.8 en la API de Anthropic y despliegues de puerta de enlace LLM, u Opus 4.7 en Claude Platform en AWS.

La sesión continúa en ese modelo Opus. Para volver a Fable 5, ejecute /model fable.

Verificar qué desencadenó el respaldo

El respaldo puede desencadenarse en la primera solicitud de una sesión, antes de que envíe algo inusual, porque la primera solicitud lleva contexto del espacio de trabajo como su contenido de CLAUDE.md y estado de git. Un repositorio que contiene material de seguridad o biología puede activar el clasificador solo en ese contexto.

Para verificar si las personalizaciones son el desencadenante, inicie una sesión con claude --safe-mode, que desactiva personalizaciones como CLAUDE.md, skills, servidores MCP y hooks. El estado de git y los nombres de directorios no son personalizaciones y aún se incluyen.

Preguntar antes de cambiar

Para decidir qué sucede cada vez que se marca una solicitud, en lugar de cambiar automáticamente, ejecute /config y desactive "cambiar modelos cuando se marca un mensaje". Una solicitud marcada pausa la sesión con dos opciones: cambiar al modelo Opus o editar el indicador e intentar nuevamente en Fable 5.

Algunos casos se comportan de manera diferente:

  • Si ambos modelos marcan la misma solicitud, puede editar el indicador e intentar nuevamente, o iniciar una nueva sesión.
  • En sesiones móviles de Claude Code en la web, no se admite edición y reintento. Cambie de modelos o continúe la sesión desde un navegador de escritorio o la aplicación de escritorio.
  • En modo no interactivo e integraciones de SDK que no pueden mostrar el indicador, una solicitud marcada termina el turno con un rechazo en su lugar.

Habilitar respaldo en Bedrock, Vertex AI y Foundry

En Amazon Bedrock, Google Vertex AI y Microsoft Foundry, los ID de modelo son específicos del proveedor, por lo que el respaldo automático solo funciona cuando Claude Code puede identificar ambos modelos involucrados:

  • Claude Code debe reconocer el modelo actual como Fable 5: el ID del modelo contiene claude-fable-5, coincide con el valor de ANTHROPIC_DEFAULT_FABLE_MODEL, o se asigna con modelOverrides.
  • El destino de respaldo debe resolverse en un modelo Opus: el valor de ANTHROPIC_DEFAULT_OPUS_MODEL si se establece, de lo contrario una entrada Opus 4.8 en la lista de modelos del proveedor.

Si no se puede identificar ninguno de los modelos, Claude Code no cambia automáticamente. La solicitud marcada termina con un mensaje de rechazo, y puede cambiar de modelos con /model e intentar nuevamente. Para habilitar el respaldo automático en estos proveedores, establezca ANTHROPIC_DEFAULT_FABLE_MODEL en su ID de modelo Fable 5 y ANTHROPIC_DEFAULT_OPUS_MODEL en su ID de modelo Opus 4.8.

Cargas de trabajo de investigación de seguridad y biología

Las cargas de trabajo en seguridad ofensiva o biología, incluidas pruebas de penetración, ejercicios Capture the Flag (CTF) y bases de código adyacentes a la biología, desencadenan respaldo frecuentemente, a menudo en la primera solicitud. Para trabajo de biología sustancial, espere que casi todas las solicitudes se redirijan.

Este es el enrutamiento esperado para estos dominios, no una bandera de cuenta. Si su organización necesita capacidad de clase Fable para este trabajo, pregunte a su equipo de cuenta de Anthropic sobre programas de acceso de confianza.

Ajustar el nivel de esfuerzo

Los niveles de esfuerzo controlan el razonamiento adaptativo, que permite que el modelo decida si y cuánto pensar en cada paso basado en la complejidad de la tarea. El esfuerzo menor es más rápido y económico para tareas directas, mientras que el esfuerzo mayor proporciona un razonamiento más profundo para problemas complejos.

Los niveles de esfuerzo disponibles dependen del modelo. Los modelos no listados aquí no admiten esfuerzo:

Modelo Niveles
Fable 5 low, medium, high, xhigh, max
Opus 4.8 y Opus 4.7 low, medium, high, xhigh, max
Opus 4.6 y Sonnet 4.6 low, medium, high, max

Si establece un nivel que el modelo activo no admite, Claude Code retrocede al nivel más alto admitido en o por debajo del que estableció. Por ejemplo, xhigh se ejecuta como high en Opus 4.6.

El esfuerzo predeterminado es high en Fable 5, Opus 4.8, Opus 4.6 y Sonnet 4.6, y xhigh en Opus 4.7.

Cuando ejecuta Fable 5, Opus 4.8 u Opus 4.7 por primera vez, Claude Code aplica el esfuerzo predeterminado de ese modelo incluso si estableció anteriormente un nivel diferente para otro modelo: high en Fable 5 y Opus 4.8, y xhigh en Opus 4.7. Ejecute /effort nuevamente para elegir un nivel diferente después de cambiar.

low, medium, high y xhigh persisten entre sesiones. max proporciona el razonamiento más profundo sin restricción en el gasto de tokens y se aplica solo a la sesión actual, excepto cuando se establece a través de la variable de entorno CLAUDE_CODE_EFFORT_LEVEL.

El menú /effort también ofrece ultracode. Ultracode es una configuración de Claude Code en lugar de un nivel de esfuerzo del modelo: envía xhigh al modelo y además tiene Claude orquestar flujos de trabajo dinámicos para tareas sustanciales. Se aplica solo a la sesión actual. Establézcalo a través de /effort, o pase "ultracode": true mediante --settings o una solicitud de control del SDK del Agente. No es parte de la configuración effortLevel, la bandera --effort o CLAUDE_CODE_EFFORT_LEVEL.

Elegir un nivel de esfuerzo

Cada nivel intercambia gasto de tokens contra capacidad. El predeterminado es adecuado para la mayoría de tareas de codificación; ajuste cuando desee un equilibrio diferente.

Nivel Cuándo usarlo
low Reserve para tareas cortas, limitadas y sensibles a la latencia que no son sensibles a la inteligencia
medium Reduce el uso de tokens para trabajo sensible a costos que puede intercambiar algo de inteligencia
high Equilibra el uso de tokens e inteligencia. Predeterminado en Fable 5, Opus 4.8, Opus 4.6 y Sonnet 4.6
xhigh Razonamiento más profundo con gasto de tokens más alto. Predeterminado en Opus 4.7
max Puede mejorar el rendimiento en tareas exigentes pero puede mostrar rendimientos decrecientes y es propenso a pensar demasiado. Pruebe antes de adoptar ampliamente
ultracode Una configuración de Claude Code que planifica un flujo de trabajo dinámico para cada tarea sustancial con razonamiento xhigh por mensaje. Solo de sesión

La escala de esfuerzo se calibra por modelo, por lo que el mismo nombre de nivel no representa el mismo valor subyacente en todos los modelos.

Utilizar ultrathink para razonamiento profundo único

Incluya ultrathink en cualquier lugar de su indicación para solicitar un razonamiento más profundo en ese turno sin cambiar su configuración de esfuerzo de sesión. Claude Code reconoce la palabra clave y añade una instrucción en contexto. El nivel de esfuerzo enviado a la API no cambia. Otras frases como "think", "think hard" y "think more" se pasan como texto de indicación ordinario y no se reconocen como palabras clave.

Establecer el nivel de esfuerzo

Puede cambiar el esfuerzo a través de cualquiera de los siguientes:

  • /effort: ejecute /effort sin argumentos para abrir un control deslizante interactivo, /effort seguido de un nombre de nivel para establecerlo directamente, o /effort auto para restablecer el predeterminado del modelo
  • En /model: utilice las teclas de flecha izquierda/derecha para ajustar el control deslizante de esfuerzo al seleccionar un modelo
  • Bandera --effort: pase un nombre de nivel para establecerlo para una única sesión al iniciar Claude Code
  • Variable de entorno: establezca CLAUDE_CODE_EFFORT_LEVEL en un nombre de nivel o auto
  • Configuración: establezca effortLevel en low, medium, high o xhigh en su archivo de configuración. max y ultracode son solo de sesión y no se aceptan aquí
  • Frontmatter de skill y subagent: establezca effort en un archivo markdown de skill o subagent para anular el nivel de esfuerzo cuando ese skill o subagent se ejecuta

La variable de entorno tiene precedencia sobre todos los demás métodos, luego su nivel configurado, luego el predeterminado del modelo. El esfuerzo de frontmatter se aplica cuando ese skill o subagent está activo, anulando el nivel de sesión pero no la variable de entorno.

El control deslizante de esfuerzo aparece en /model cuando se selecciona un modelo compatible. El nivel de esfuerzo actual también se muestra junto al logotipo y al indicador, por ejemplo "with low effort", para que pueda confirmar qué configuración está activa sin abrir /model.

Razonamiento adaptativo y presupuestos de pensamiento fijo

El razonamiento adaptativo hace que el pensamiento sea opcional en cada paso, por lo que Claude puede responder más rápido a indicaciones rutinarias y reservar un pensamiento más profundo para pasos que se benefician de él. Si desea que Claude piense más o menos a menudo de lo que produce el nivel actual, puede decirlo directamente en su indicación o en CLAUDE.md; el modelo responde a esa orientación dentro de su configuración de esfuerzo.

Opus 4.7 y posterior siempre utilizan razonamiento adaptativo, al igual que Fable 5. El modo de presupuesto de pensamiento fijo y CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING no se aplican a ellos.

En Opus 4.6 y Sonnet 4.6, puede establecer CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 para revertir al presupuesto de pensamiento fijo anterior controlado por MAX_THINKING_TOKENS. Consulte variables de entorno.

Pensamiento extendido

El pensamiento extendido es el razonamiento que Claude emite antes de responder. En modelos que admiten razonamiento adaptativo, el nivel de esfuerzo es el control principal de cuánto pensamiento ocurre; la configuración a continuación activa o desactiva el pensamiento y controla cómo se muestra.

Control Cómo configurarlo
Alternar para la sesión actual Presione Option+T en macOS o Alt+T en Windows y Linux
Establecer el predeterminado global Ejecute /config y alterne el modo de pensamiento. Se guarda como alwaysThinkingEnabled en ~/.claude/settings.json
Desactivar independientemente del esfuerzo Establezca MAX_THINKING_TOKENS=0, que desactiva el pensamiento en la API de Anthropic excepto en Fable 5. En proveedores de terceros esto omite el parámetro thinking en su lugar, y los modelos de razonamiento adaptativo aún pueden pensar. Otros valores se aplican solo con un presupuesto de pensamiento fijo

El pensamiento no se puede desactivar en Fable 5. El alternar de sesión, alwaysThinkingEnabled y MAX_THINKING_TOKENS=0 no tienen efecto allí, y Fable 5 decide por paso cuánto pensar basado en el nivel de esfuerzo.

La salida de pensamiento se colapsa de forma predeterminada. Presione Ctrl+O para alternar el modo detallado y ver el razonamiento como texto gris en cursiva. Las sesiones interactivas en la API de Anthropic reciben bloques de pensamiento redactados de forma predeterminada, por lo que establezca showThinkingSummaries: true en configuración si desea que los resúmenes completos estén disponibles cuando se expandan. Se le cobra por todos los tokens de pensamiento generados, incluso cuando se colapsan o se redactan.

Contexto extendido

Fable 5, Opus 4.6 y posterior, y Sonnet 4.6 admiten una ventana de contexto de 1 millón de tokens para sesiones largas con bases de código grandes.

La disponibilidad varía según el modelo y el plan. En los planes Max, Team y Enterprise, Opus se actualiza automáticamente a contexto de 1M sin configuración adicional. Esto se aplica tanto a los asientos de Team Standard como de Team Premium. En la API de Anthropic, Fable 5, Opus 4.8 y Opus 4.7 siempre se ejecutan con la ventana de 1M. Sonnet con contexto de 1M no es parte de la actualización automática y requiere créditos de uso en todos los planes de suscripción, incluido Max.

Plan Opus con contexto de 1M Sonnet con contexto de 1M
Max, Team y Enterprise Incluido en la suscripción Requiere créditos de uso
Pro Requiere créditos de uso Requiere créditos de uso
API y pago por uso Acceso completo Acceso completo

Para desactivar completamente el contexto de 1M, establezca CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Esto elimina variantes de modelo de 1M del selector de modelo. Consulte variables de entorno.

La ventana de contexto de 1M utiliza precios de modelo estándar sin prima para tokens más allá de 200K. Para planes donde el contexto extendido está incluido en su suscripción, el uso permanece cubierto por su suscripción. Para planes que acceden al contexto extendido a través de créditos de uso, los tokens se facturan a los créditos de uso.

Si su cuenta admite contexto de 1M, la opción aparece en el selector de modelo (/model) en las últimas versiones de Claude Code. Si no la ve, intente reiniciar su sesión.

También puede utilizar el sufijo [1m] con alias de modelo o nombres de modelo completos:

# Utilizar el alias opus[1m] o sonnet[1m]
/model opus[1m]
/model sonnet[1m]

# O añadir [1m] a un nombre de modelo completo
/model claude-opus-4-8[1m]

Verificar su modelo actual

Puede ver qué modelo está utilizando actualmente de varias formas:

  1. En línea de estado (si está configurada)
  2. En /status, que también muestra la información de su cuenta.

Agregar una opción de modelo personalizado

Utilice ANTHROPIC_CUSTOM_MODEL_OPTION para agregar una única entrada personalizada al selector /model sin reemplazar los alias integrados. Esto es útil para probar IDs de modelo que Claude Code no enumera de forma predeterminada. Para implementaciones de puerta de enlace LLM, Claude Code puede completar automáticamente el selector desde el punto final /v1/models de la puerta de enlace cuando se establece CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1, por lo que esta variable solo es necesaria cuando el descubrimiento está deshabilitado o no devuelve el modelo que desea. Consulte Selección de modelo de puerta de enlace LLM.

Este ejemplo establece las tres variables para hacer que una implementación de Opus enrutada por puerta de enlace sea seleccionable:

export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"

La entrada personalizada aparece en la parte inferior del selector /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME y ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION son opcionales. Si se omiten, el ID de modelo se utiliza como nombre y la descripción tiene como valor predeterminado Custom model (<model-id>).

Claude Code omite la validación para el ID de modelo establecido en ANTHROPIC_CUSTOM_MODEL_OPTION, por lo que puede utilizar cualquier cadena que su punto final de API acepte.

Variables de entorno

Puede utilizar las siguientes variables de entorno, que deben ser nombres de modelo completos (o equivalentes para su proveedor de API), para controlar los nombres de modelo a los que se asignan los alias.

Variable de entorno Descripción
ANTHROPIC_DEFAULT_FABLE_MODEL El modelo a utilizar para fable, y el ID de modelo que Claude Code reconoce como Fable 5 para alternancia automática de modelo en proveedores de terceros
ANTHROPIC_DEFAULT_OPUS_MODEL El modelo a utilizar para opus, o para opusplan cuando Plan Mode está activo.
ANTHROPIC_DEFAULT_SONNET_MODEL El modelo a utilizar para sonnet, o para opusplan cuando Plan Mode no está activo.
ANTHROPIC_DEFAULT_HAIKU_MODEL El modelo a utilizar para haiku, o funcionalidad de fondo
CLAUDE_CODE_SUBAGENT_MODEL El modelo a utilizar para todos los subagents y agent teams. Anula tanto el parámetro model por invocación como el frontmatter model de la definición del subagent. Establezca en inherit para utilizar la resolución de modelo normal en su lugar

Nota: ANTHROPIC_SMALL_FAST_MODEL está deprecado en favor de ANTHROPIC_DEFAULT_HAIKU_MODEL.

Fijar modelos para implementaciones de terceros

Al implementar Claude Code a través de Bedrock, Vertex AI, Foundry, o Claude Platform on AWS, fije versiones de modelo antes de implementar para usuarios.

Sin fijar, Claude Code utiliza alias de modelo como fable, opus, sonnet y haiku que se resuelven a un ID de modelo predeterminado integrado para cada proveedor. Ese predeterminado puede rezagarse con respecto a la versión más reciente de Anthropic, y el modelo al que apunta puede que aún no esté habilitado en la cuenta de un usuario. Cuando el predeterminado no está disponible, los usuarios de Bedrock y Vertex AI ven un aviso y retroceden a la versión anterior para esa sesión, mientras que los usuarios de Foundry ven errores porque Foundry no tiene ninguna verificación de inicio equivalente.

Utilice las siguientes variables de entorno con IDs de modelo específicos de versión para su proveedor:

Proveedor Ejemplo
Bedrock export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-8'
Vertex AI export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8'
Foundry export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8'

Aplique el mismo patrón para ANTHROPIC_DEFAULT_FABLE_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL y ANTHROPIC_DEFAULT_HAIKU_MODEL. Para IDs de modelo actuales y heredados en todos los proveedores, consulte Descripción general de modelos. Para actualizar usuarios a una nueva versión de modelo, actualice estas variables de entorno e implemente nuevamente.

Para habilitar contexto extendido para un modelo fijo, añada [1m] al ID de modelo en ANTHROPIC_DEFAULT_OPUS_MODEL o ANTHROPIC_DEFAULT_SONNET_MODEL:

export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8[1m]'

El sufijo [1m] aplica la ventana de contexto de 1M a todo el uso de los alias opus y sonnet, incluida la fase Opus de modo de plan de opusplan.

  • Claude Code elimina el sufijo antes de enviar el ID de modelo a su proveedor.
  • Solo añada [1m] cuando el modelo subyacente admita contexto de 1M.
  • El sufijo se lee por variable, no por modelo. En Bedrock, Vertex y Foundry, un ID de modelo sin [1m] en una variable utiliza contexto de 200K incluso si otra variable establece el mismo modelo con el sufijo.

Personalizar la visualización y capacidades del modelo fijo

Cuando fija un modelo en un proveedor de terceros, el ID específico del proveedor aparece tal cual en el selector /model y Claude Code puede no reconocer qué características admite el modelo. Puede anular el nombre de visualización y declarar capacidades con variables de entorno complementarias para cada modelo fijo.

Estas variables tienen efecto en proveedores de terceros como Bedrock, Vertex AI y Foundry. Las variables _NAME y _DESCRIPTION también tienen efecto cuando ANTHROPIC_BASE_URL apunta a una puerta de enlace LLM. No tienen efecto cuando se conecta directamente a api.anthropic.com.

Variable de entorno Descripción
ANTHROPIC_DEFAULT_OPUS_MODEL_NAME Nombre de visualización para el modelo Opus fijo en el selector /model. Por defecto al ID de modelo cuando no está configurado
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION Descripción de visualización para el modelo Opus fijo en el selector /model. Por defecto a Custom Opus model cuando no está configurado
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES Lista separada por comas de capacidades que admite el modelo Opus fijo

Los mismos sufijos _NAME, _DESCRIPTION y _SUPPORTED_CAPABILITIES están disponibles para ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL, ANTHROPIC_DEFAULT_FABLE_MODEL y ANTHROPIC_CUSTOM_MODEL_OPTION.

Claude Code habilita características como niveles de esfuerzo y pensamiento extendido haciendo coincidir el ID de modelo con patrones conocidos. Los IDs específicos del proveedor como ARNs de Bedrock o nombres de implementación personalizados a menudo no coinciden con estos patrones, dejando las características compatibles deshabilitadas. Establezca _SUPPORTED_CAPABILITIES para indicar a Claude Code qué características admite realmente el modelo:

Valor de capacidad Habilita
effort Niveles de esfuerzo y el comando /effort
xhigh_effort {/* min-version: 2.1.111 */}El nivel de esfuerzo xhigh
max_effort El nivel de esfuerzo max
thinking Pensamiento extendido
adaptive_thinking Razonamiento adaptativo que asigna dinámicamente el pensamiento basado en la complejidad de la tarea
interleaved_thinking Pensamiento entre llamadas de herramientas

Cuando se establece _SUPPORTED_CAPABILITIES, las capacidades enumeradas se habilitan y las capacidades no enumeradas se deshabilitan para el modelo fijo coincidente. Cuando la variable no está configurada, Claude Code vuelve a la detección integrada basada en el ID de modelo.

Este ejemplo fija Opus a un ARN de modelo personalizado de Bedrock, establece un nombre amigable y declara sus capacidades:

export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'

Anular IDs de modelo por versión

Las variables de entorno a nivel de familia anteriores configuran un ID de modelo por alias de familia. Si necesita asignar varias versiones dentro de la misma familia a IDs de proveedor distintos, utilice la configuración modelOverrides en su lugar.

modelOverrides asigna IDs de modelo individuales de Anthropic a las cadenas específicas del proveedor que Claude Code envía a la API de su proveedor. Cuando un usuario selecciona un modelo asignado en el selector /model, Claude Code utiliza su valor configurado en lugar del predeterminado integrado.

Esto permite a los administradores empresariales enrutar cada versión de modelo a un ARN de perfil de inferencia de Bedrock específico, nombre de versión de Vertex AI o nombre de implementación de Foundry para gobernanza, asignación de costos o enrutamiento regional.

Establezca modelOverrides en su archivo de configuración:

{
  "modelOverrides": {
    "claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
    "claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
    "claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
  }
}

Las claves deben ser IDs de modelo de Anthropic como se enumeran en la Descripción general de modelos. Para IDs de modelo con fecha, incluya el sufijo de fecha exactamente como aparece allí. Las claves desconocidas se ignoran.

Las anulaciones reemplazan los IDs de modelo integrados que respaldan cada entrada en el selector /model. En Bedrock, las anulaciones tienen precedencia sobre cualquier perfil de inferencia que Claude Code descubra automáticamente al inicio. Los valores que proporciona directamente a través de ANTHROPIC_MODEL, --model, o las variables de entorno ANTHROPIC_DEFAULT_*_MODEL se pasan al proveedor tal como están y no se transforman por modelOverrides.

modelOverrides funciona junto con availableModels. La lista de permitidos se evalúa contra el ID de modelo de Anthropic, no el valor de anulación, por lo que una entrada como "opus" en availableModels continúa coincidiendo incluso cuando las versiones de Opus se asignan a ARNs.

Configuración de almacenamiento en caché de indicaciones

Claude Code utiliza automáticamente almacenamiento en caché de indicaciones para optimizar el rendimiento y reducir costos. Puede desactivar el almacenamiento en caché de indicaciones globalmente o para niveles de modelo específicos:

Variable de entorno Descripción
DISABLE_PROMPT_CACHING Establezca en 1 para desactivar el almacenamiento en caché de indicaciones para todos los modelos. Tiene precedencia sobre la configuración por modelo
DISABLE_PROMPT_CACHING_HAIKU Establezca en 1 para desactivar el almacenamiento en caché de indicaciones solo para modelos Haiku
DISABLE_PROMPT_CACHING_SONNET Establezca en 1 para desactivar el almacenamiento en caché de indicaciones solo para modelos Sonnet
DISABLE_PROMPT_CACHING_OPUS Establezca en 1 para desactivar el almacenamiento en caché de indicaciones solo para modelos Opus
DISABLE_PROMPT_CACHING_FABLE Establezca en 1 para desactivar el almacenamiento en caché de indicaciones solo para modelos Fable

Para cambiar el TTL de caché u obtener más información sobre qué desencadena un error de caché, consulte Cómo Claude Code utiliza el almacenamiento en caché de indicaciones.