Configuración del modelo
Aprenda sobre la configuración del modelo Claude Code, incluidos los alias de modelo como
opusplan
Modelos disponibles
Para la configuración de model en Claude Code, puede configurar:
- Un alias de modelo
- Un nombre de modelo
- API de Anthropic: Un nombre de modelo completo
- Bedrock: un ARN de perfil de inferencia
- Foundry: un nombre de implementación
- Vertex: un nombre de versión
ANTHROPIC_BASE_URL cambia dónde se envían las solicitudes, no qué modelo las responde. Para enrutar Claude a través de una puerta de enlace LLM, consulte configuración de puerta de enlace LLM.
Alias de modelo
Los alias de modelo proporcionan una forma conveniente de seleccionar configuraciones de modelo sin necesidad de recordar números de versión exactos:
| Alias de modelo | Comportamiento |
|---|---|
default |
Valor especial que borra cualquier anulación de modelo y revierte al modelo recomendado para su tipo de cuenta. No es en sí mismo un alias de modelo |
best |
Utiliza Fable 5 donde su organización tiene acceso a él, de lo contrario el último modelo Opus |
fable |
Utiliza Claude Fable 5 para sus tareas más difíciles y de mayor duración |
sonnet |
Utiliza el último modelo Sonnet para tareas de codificación diaria |
opus |
Utiliza el último modelo Opus para tareas de razonamiento complejo |
haiku |
Utiliza el modelo Haiku rápido y eficiente para tareas simples |
sonnet[1m] |
Utiliza Sonnet con una ventana de contexto de 1 millón de tokens para sesiones largas |
opus[1m] |
Utiliza Opus con una ventana de contexto de 1 millón de tokens para sesiones largas |
opusplan |
Modo especial que utiliza opus durante Plan Mode, luego cambia a sonnet para la ejecución |
En la API de Anthropic, opus se resuelve a Opus 4.8 y sonnet se resuelve a Sonnet 4.6. En Claude Platform on AWS, opus se resuelve a Opus 4.7 y sonnet se resuelve a Sonnet 4.6. En Bedrock, Vertex y Foundry, opus se resuelve a Opus 4.6 y sonnet se resuelve a Sonnet 4.5; hay modelos más nuevos disponibles en esos proveedores seleccionando el nombre de modelo completo explícitamente o estableciendo ANTHROPIC_DEFAULT_OPUS_MODEL o ANTHROPIC_DEFAULT_SONNET_MODEL.
Los alias apuntan a la versión recomendada para su proveedor y se actualizan con el tiempo. Para fijar una versión específica, utilice el nombre de modelo completo (por ejemplo, claude-opus-4-8) o establezca la variable de entorno correspondiente como ANTHROPIC_DEFAULT_OPUS_MODEL.
Opus 4.8 requiere Claude Code v2.1.154 o posterior. Ejecute claude update para actualizar.
Trabajar con Fable 5
Claude Fable 5 es el modelo más capaz en Claude Code, adecuado para tareas más grandes que una sola sesión. Sustenta sesiones largas autónomas, investiga antes de actuar y verifica su trabajo más a menudo que los modelos más pequeños.
Fable 5 no es el modelo predeterminado. Selecciónelo con /model fable. Las solicitudes que sus clasificadores de seguridad marcan, más a menudo en dominios de ciberseguridad y biología, activan alternancia automática de modelo.
Para aprovechar al máximo Fable 5:
- Describa el resultado, no los pasos: entrégale el resultado que desea y déjelo planificar el camino. Para mantenerlo funcionando hasta que ese resultado se cumpla, establezca un objetivo.
- Entrégale problemas ambiguos: las investigaciones de causa raíz, la depuración de interrupciones y las decisiones de arquitectura son donde la investigación y verificación adicionales se rentabilizan.
- Omita los recordatorios de verificación: verifica su propio trabajo con menos indicaciones, por lo que los recordatorios para probar o verificar generalmente son innecesarios.
- Dimensione tareas más grandes: entrégale trabajo que normalmente dividiría en partes. Mantiene sesiones largas sin perder el hilo.
Fable 5 requiere Claude Code v2.1.170 o posterior. Las versiones anteriores no muestran Fable 5 en el selector de modelo y no pueden seleccionarlo. Ejecute claude update para actualizar. Fable 5 no está disponible bajo retención de datos cero, donde el selector /model lo omite o lo muestra deshabilitado.
Configurar su modelo
Puede configurar su modelo de varias formas, enumeradas en orden de prioridad:
- Durante la sesión - Utilice
/model <alias|name>para cambiar inmediatamente, o ejecute/modelsin argumentos para abrir el selector. El selector solicita confirmación cuando la conversación tiene salida anterior, ya que la siguiente respuesta relee el historial completo sin contexto en caché - Al inicio - Inicie con
claude --model <alias|name> - Variable de entorno - Establezca
ANTHROPIC_MODEL=<alias|name> - Configuración - Configure permanentemente en su archivo de configuración utilizando el campo
model.
A partir de v2.1.153, /model guarda su selección como predeterminada para nuevas sesiones escribiendo el campo model en su configuración de usuario. En el selector:
Enter: cambiar modelo y guardar como predeterminados: cambiar modelo solo para esta sesión
Escribir /model <name> directamente se comporta como Enter. La configuración del proyecto y administrada aún tiene prioridad y se reaplicará en el siguiente lanzamiento.
En v2.1.144 a v2.1.152, /model se aplicaba solo a la sesión actual y d en el selector guardaba un predeterminado.
La bandera --model y la variable de entorno ANTHROPIC_MODEL se aplican solo a la sesión que inicia con ellas. Para ejecutar diferentes modelos en diferentes terminales al mismo tiempo, inicie cada uno con su propia bandera --model en lugar de cambiar con /model.
Las sesiones reanudadas iniciadas con claude --resume, --continue, o el selector /resume mantienen el modelo que estaban usando cuando se guardó la transcripción, independientemente de la configuración actual de model. Si ese modelo ha sido retirado o es excluido por availableModels, la sesión cae en el orden de precedencia normal. Esto evita que la selección de /model de otra sesión cambie el modelo al reanudar.
Cuando el modelo activo al inicio proviene de la configuración del proyecto o administrada en lugar de su propia selección, el encabezado de inicio muestra qué archivo de configuración lo estableció. Ejecute /model para anular; la configuración del proyecto o administrada se reaplicará en el siguiente lanzamiento.
Cuando el modelo solicitado tiene una fecha de retiro programada o se remapea automáticamente a una versión más nueva, Claude Code muestra una advertencia que nombra el modelo solicitado. Las sesiones interactivas la muestran como un aviso de inicio. A partir de v2.1.182, la misma advertencia se escribe en stderr en modo no interactivo cuando se utiliza el formato de salida de texto predeterminado. La verificación también cubre un model establecido en frontmatter de subagentos. La advertencia de stderr se suprime para --output-format json y stream-json; lea el modelo real desde el campo modelUsage del mensaje de resultado en su lugar.
Ejemplo de uso:
# Iniciar con Opus
claude --model opus
# Cambiar a Sonnet durante la sesión
/model sonnet
Archivo de configuración de ejemplo:
{
"permissions": {
...
},
"model": "opus"
}
Restringir la selección de modelo
Los administradores empresariales pueden utilizar availableModels en configuración administrada o de política para restringir qué modelos pueden seleccionar los usuarios. Las entradas coinciden con una familia de modelos como sonnet, un prefijo de versión como claude-sonnet-4-5, o un ID de modelo completo como claude-sonnet-4-5-20250929.
Cuando se establece availableModels, la lista de permitidos se aplica en todas partes donde un usuario puede especificar un modelo:
- Modelo de sesión principal:
/model, la bandera--model, la variable de entornoANTHROPIC_MODEL, la configuraciónmodel, y el modelo restaurado cuando se reanuda una sesión - Resolución de alias: {/* min-version: 2.1.176 */}las variables de entorno
ANTHROPIC_DEFAULT_OPUS_MODEL,ANTHROPIC_DEFAULT_SONNET_MODEL,ANTHROPIC_DEFAULT_HAIKU_MODEL, yANTHROPIC_DEFAULT_FABLE_MODELno pueden redirigir un alias permitido a un modelo fuera de la lista - Modo rápido: {/* min-version: 2.1.176 */}
/fastse niega a cambiar cuando cambiaría implícitamente a un modelo Opus fuera de la lista, con el mensaje "no está en los modelos permitidos de su organización" - Modelos de subagentes: el campo
modelen frontmatter de subagente, el parámetromodelde la herramienta Agent, el selector de modelo en/agents, yCLAUDE_CODE_SUBAGENT_MODEL - Modelo de habilidad y comando: el frontmatter
modelen habilidades y comandos - Modelo de asesor: la configuración
advisorModelconfigurada y la bandera--advisor - Modelo de agente de fondo: el modelo seleccionado en el selector de envío
Cambiar a un modelo bloqueado con /model se rechaza con un error, mientras que una bandera --model bloqueada, ANTHROPIC_MODEL, o un valor de configuración model se reemplaza al inicio con una advertencia que nombra tanto los modelos solicitados como los sustituidos, y la sesión comienza en el modelo predeterminado. Una anulación de subagente, habilidad o comando bloqueada vuelve al modelo heredado o predeterminado en lugar de fallar la solicitud; una configuración advisorModel bloqueada desactiva el asesor para la sesión, mientras que una bandera --advisor bloqueada sale con un error al inicio. Los modelos excluidos se ocultan del selector /model.
Los cambios automáticos de modelo se verifican de la misma manera: los elementos de una cadena de modelo de reserva fuera de la lista de permitidos se descartan, una actualización de modo de plan como opusplan a un modelo excluido se omite para que la planificación continúe en el modelo de la sesión, y un fallback automático de modelo cuyo destino está excluido no se ejecuta, por lo que la solicitud marcada termina con un rechazo. Habilitar modo rápido se rechaza cuando el modelo en el que se ejecutaría la sesión después está fuera de la lista de permitidos.
{
"availableModels": ["sonnet", "haiku"]
}
Cobertura de superficie
Cada superficie aplica la lista de permitidos que recibe. El mecanismo de entrega que llega a cada superficie difiere:
| Mecanismo de entrega | CLI e IDE | Sesiones locales de escritorio | Sesiones web, móviles y en la nube | Agent SDK y no interactivo | Cowork |
|---|---|---|---|---|---|
| Configuración administrada por servidor desde la consola de administración | Aplicada | Aplicada | Aplicada | Aplicada | No entregada |
| MDM o archivos de configuración administrada | Aplicada | Aplicada | No entregada | Aplicada | Aplicada donde se implementa |
- Las sesiones en la nube, en Claude Code en la web o en la aplicación de escritorio, se ejecutan en máquinas virtuales administradas por Anthropic: la configuración implementada en su dispositivo no las alcanza, por lo que entregue la lista de permitidos a través de configuración administrada por servidor. Un cambio de modelo a mitad de sesión en una sesión en la nube se rechaza cuando el modelo solicitado está excluido por la lista de permitidos. El rechazo del lado del servidor en la creación de sesión se aplica a restricciones de modelo de organización, no a la clave de configuración
availableModels. - Cowork, la pestaña de trabajo agéntico en la aplicación Claude Desktop, no es una superficie de Claude Code y no recibe configuración administrada por servidor por diseño. Un archivo de configuración administrada se aplica a sesiones de Cowork cuando está presente donde se ejecuta la sesión; las sesiones remotas de Cowork se ejecutan en máquinas virtuales administradas por Anthropic, donde un archivo implementado en el dispositivo no está presente.
- Las sesiones en proveedores de terceros como Bedrock, Vertex AI, Foundry, y Claude Platform en AWS no reciben configuración administrada por servidor, por lo que entregue la lista de permitidos a través de MDM o archivos de configuración administrada allí.
- La entrega administrada por servidor también requiere que la sesión se autentique con un inicio de sesión de organización o una clave API configurada directamente. Las flotas que generan claves solo a través de un script
apiKeyHelperdeben entregar la lista de permitidos a través de MDM o archivos de configuración administrada. - La pestaña Código de escritorio también aloja sesiones SSH, que leen el archivo de configuración administrada del host remoto en el que se ejecutan. Consulte Configuración administrada de escritorio.
- Los selectores de modelo en claude.ai y en la aplicación de escritorio ocultan o atenúan los modelos excluidos por la lista de permitidos de su organización. El estado del selector es una conveniencia para los usuarios; la aplicación ocurre en la sesión.
Comportamiento del modelo predeterminado
La opción Predeterminado en el selector de modelo no se ve afectada por availableModels a menos que enforceAvailableModels también esté establecido. Por sí solo, availableModels deja Predeterminado disponible, resolviéndose al valor predeterminado de tiempo de ejecución del sistema basado en el nivel de suscripción del usuario. Si el valor predeterminado del nivel es un modelo que tiene la intención de restringir, establezca enforceAvailableModels también.
Un array availableModels vacío nunca activa la aplicación del modelo Predeterminado: con availableModels: [], las selecciones de modelo nombrado se bloquean pero el modelo Predeterminado para el tipo de cuenta permanece utilizable independientemente de enforceAvailableModels.
Aplicar la lista de permitidos para el modelo Predeterminado
Establezca enforceAvailableModels: true junto con una availableModels no vacía en configuración administrada para extender la lista de permitidos a la opción Predeterminado. Esto requiere Claude Code v2.1.175 o posterior.
{
"availableModels": ["sonnet", "haiku"],
"enforceAvailableModels": true
}
Cuando el modelo predeterminado para el tipo de cuenta del usuario no está en la lista de permitidos, la opción Predeterminado se resuelve a la primera entrada availableModels que nombra un modelo permitido y disponible, y la fila Predeterminado del selector /model muestra ese modelo. Esto se aplica en todas partes donde se alcanza el valor predeterminado: inicio de sesión, seleccionar Predeterminado en /model, la palabra clave "default" en cadenas de modelo de reserva, y el fallback utilizado cuando se descarta una selección excluida.
enforceAvailableModels no tiene efecto cuando availableModels no está establecido o está vacío: con availableModels: [], el modelo Predeterminado para el tipo de cuenta permanece utilizable, por lo que la configuración no puede bloquear a los usuarios de cada modelo. Cuando availableModels no está vacío pero ninguna entrada se resuelve a un modelo permitido y disponible, la aplicación se degrada y Predeterminado cae al valor predeterminado del tipo de cuenta, con una advertencia visible solo bajo --debug. Mantenga al menos una entrada garantizada disponible en la lista para evitar esto.
Implemente ambas claves en la fuente administrada de mayor precedencia: las fuentes administradas implementadas por el administrador no se fusionan, por lo que un par colocado en un archivo de configuración administrada se ignora cuando la consola de administración entrega cualquier configuración.
Controlar el modelo en el que se ejecutan los usuarios
La configuración model es una selección inicial, no una aplicación. Establece qué modelo está activo cuando comienza una sesión, pero los usuarios aún pueden abrir /model y elegir Predeterminado, que se resuelve al valor predeterminado del sistema para su nivel independientemente de lo que esté configurado en model, a menos que enforceAvailableModels lo redirija.
Para controlar completamente la experiencia del modelo, combine estas configuraciones:
availableModels: restringe a qué modelos nombrados pueden cambiar los usuariosenforceAvailableModels: extiende la lista de permitidosavailableModelsa la opción Predeterminado, de modo que Predeterminado no pueda resolverse a un modelo fuera de la listamodel: establece la selección de modelo inicial cuando comienza una sesiónANTHROPIC_DEFAULT_SONNET_MODEL/ANTHROPIC_DEFAULT_OPUS_MODEL/ANTHROPIC_DEFAULT_HAIKU_MODEL/ANTHROPIC_DEFAULT_FABLE_MODEL: controlan a qué se resuelven la opción Predeterminado y los aliassonnet,opus,haikuyfable
Este ejemplo inicia a los usuarios en Sonnet 4.5, limita el selector a Sonnet y Haiku, y asegura que Predeterminado se resuelva a un modelo en la lista de permitidos en lugar del valor predeterminado del nivel:
{
"model": "claude-sonnet-4-5",
"availableModels": ["claude-sonnet-4-5", "haiku"],
"enforceAvailableModels": true,
"env": {
"ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
}
}
Sin enforceAvailableModels o el bloque env, un usuario que seleccione Predeterminado en el selector obtendría la versión más reciente para su nivel, omitiendo la fijación de versión en model y availableModels. Las dos configuraciones cubren diferentes alcances: enforceAvailableModels hace que Predeterminado obedezca la lista de permitidos, mientras que el bloque env fija qué versión resuelve un alias permitido como sonnet. Use enforceAvailableModels solo cuando restringir familias de modelos sea suficiente; agregue el bloque env cuando también necesite fijar una versión específica.
Comportamiento de fusión
Cuando la fuente de configuración administrada de mayor precedencia define availableModels, esa lista sola se aplica: las entradas en configuración de usuario, proyecto o local no pueden extenderla, y las fuentes administradas implementadas por el administrador no se fusionan entre sí, por lo que una lista implementada en un archivo de configuración administrada se ignora cuando la configuración administrada por servidor entrega cualquier clave. De lo contrario, las listas de configuración de usuario, proyecto y local se concatenan y desduplican como otras configuraciones de array. {/* min-version: 2.1.175 */}A partir de Claude Code v2.1.175, la lista administrada reemplaza entradas de menor precedencia; las versiones anteriores las fusionan.
Dentro de la lista efectiva, una entrada que nombra un modelo específico en una familia, ya sea un prefijo de versión o un ID de modelo completo, desactiva la entrada comodín de esa familia: ["sonnet", "claude-sonnet-4-5"] permite solo versiones de Sonnet 4.5, no cada modelo de Sonnet.
IDs de modelo Mantle
Cuando el punto final Bedrock Mantle está habilitado, las entradas en availableModels que comienzan con anthropic. se agregan al selector /model como opciones personalizadas y se enrutan al punto final Mantle. Esta es una excepción a la coincidencia de alias descrita en Fijar modelos para implementaciones de terceros. La configuración aún restringe el selector a las entradas enumeradas, y un ID de Mantle incrusta un nombre de familia, por lo que cuenta como una entrada específica y desactiva el comodín de esa familia: junto con cualquier ID de Mantle, enumere los prefijos de versión o IDs completos que desea mantener seleccionables. Consulte Comportamiento de fusión.
Restricciones de modelo de organización
Utilice el botón de la consola en lugar de availableModels cuando sus miembros se autentiquen a través de la API de Anthropic y desee un único cambio en toda la organización sin implementar archivos de configuración. Los administradores de la organización restringen qué modelos pueden ejecutar los miembros deshabilitando modelos individuales en la consola de Claude. Esta restricción se entrega con los derechos de la cuenta cuando Claude Code se autentica, separada de cualquier lista availableModels en configuración, y el servidor aplica la misma restricción de forma independiente cuando se crea una sesión. Requiere Claude Code v2.1.187 o posterior.
Un modelo restringido se oculta del selector /model. Seleccionarlo por nombre con --model, la variable de entorno ANTHROPIC_MODEL, o la configuración model muestra el aviso Model "<name>" is restricted by your organization's settings. Using <model> instead. y la sesión comienza en un modelo permitido. Escribir /model <name> para un modelo restringido se rechaza con Model '<name>' is restricted by your organization's settings. Run /model to choose a different model. y la sesión mantiene su modelo actual.
Los dos mecanismos se componen: un modelo es seleccionable solo cuando está permitido por availableModels y no está restringido por la organización. Las restricciones de la organización se entregan a sesiones en la API de Anthropic y implementaciones de puerta de enlace LLM. Las sesiones en Bedrock, Vertex AI, Foundry, y Claude Platform en AWS no las reciben, por lo que use availableModels en esos proveedores en su lugar.
Comportamiento especial del modelo
Configuración del modelo `default`
El comportamiento de default depende del tipo de cuenta:
- Max, Team Premium, Enterprise de pago por uso y API de Anthropic: por defecto Opus 4.8
- Claude Platform en AWS: por defecto Opus 4.7
- Pro, Team Standard y asientos de suscripción Enterprise: por defecto Sonnet 4.6
- Bedrock, Vertex y Foundry: por defecto Sonnet 4.5
Enterprise de pago por uso significa una organización Enterprise facturada por uso en lugar de por asiento de suscripción.
Cuando la configuración administrada aplica la lista de permitidos para el modelo predeterminado y el predeterminado del tipo de cuenta no está en availableModels, default se resuelve al predeterminado aplicado en lugar del predeterminado del tipo de cuenta anterior.
Fable 5 no es el modelo predeterminado en ningún tipo de cuenta. Las sesiones utilizan Fable 5 solo después de que lo elija, con /model fable, una configuración de model, o el alias best donde Fable 5 está disponible. Elegirlo con /model lo guarda como el modelo seleccionado en su configuración de usuario, por lo que las sesiones posteriores comienzan en Fable 5 hasta que cambie de modelos.
Configuración del modelo `opusplan`
El alias de modelo opusplan proporciona un enfoque híbrido automatizado:
- En Plan Mode - Utiliza
opuspara razonamiento complejo y decisiones de arquitectura - En Execution Mode - Cambia automáticamente a
sonnetpara generación de código e implementación
Esto le da lo mejor de ambos mundos: el razonamiento superior de Opus para la planificación y la eficiencia de Sonnet para la ejecución.
La fase Opus en Plan Mode utiliza la misma ventana de contexto que la configuración del modelo opus. En los niveles de suscripción donde Opus se actualiza automáticamente a contexto de 1M, opusplan recibe la actualización en Plan Mode también. Para forzar contexto de 1M para ambas fases cuando no está en un nivel de actualización automática, establezca el modelo en opusplan[1m].
Cuando availableModels excluye Opus, opusplan se mantiene en Sonnet en Plan Mode en lugar de cambiar. De manera similar, una sesión de Haiku que normalmente se actualizaría a Sonnet en Plan Mode se mantiene en Haiku cuando Sonnet se excluye.
Para un enfoque híbrido donde Claude decide a mitad de la tarea cuándo consultar un segundo modelo en lugar de cambiar en el límite del plan, consulte la herramienta advisor.
Cadenas de modelos de respaldo
Cuando el modelo principal está sobrecargado, no disponible o devuelve otro error de servidor no reintentable, Claude Code puede cambiar a un modelo de respaldo en lugar de fallar la solicitud. Los errores de autenticación, facturación, límite de velocidad, tamaño de solicitud y transporte nunca desencadenan un cambio; esos siguen su reintento normal y manejo de errores.
Configure uno o más modelos de respaldo y Claude Code los intenta en orden, mostrando un aviso cuando cambia. El cambio dura solo para el turno actual, por lo que su próximo mensaje intenta el modelo principal primero nuevamente. Las cadenas están limitadas a tres modelos después de la eliminación de duplicados, y las entradas adicionales se ignoran.
Establezca una cadena para una sesión con la bandera --fallback-model, que acepta una lista separada por comas:
claude --fallback-model sonnet,haiku
Para persistir una cadena entre sesiones, establezca fallbackModel en configuración como una matriz:
{
"fallbackModel": ["claude-sonnet-4-6", "claude-haiku-4-5"]
}
La bandera --fallback-model tiene precedencia sobre la configuración fallbackModel. Cada elemento acepta un nombre de modelo o alias, y "default" se expande al modelo predeterminado.
Dos casos causan que un elemento se omita:
- Modelo no disponible: un modelo que no se puede alcanzar, como un modelo retirado fijado en la configuración, se omite y Claude Code continúa con el siguiente elemento.
- Fuera de la lista de permitidos: un elemento no permitido por
availableModelsse descarta cuando se lee la cadena y nunca se intenta.
Respaldo automático del modelo
Esta sección cubre el respaldo basado en contenido de Fable 5. Para respaldo basado en disponibilidad cuando un modelo está sobrecargado o no disponible, consulte Cadenas de modelos de respaldo.
Fable 5 se ejecuta con clasificadores de seguridad para contenido de ciberseguridad y biología. Cuando un clasificador marca una solicitud, Claude Code vuelve a ejecutar esa solicitud en el modelo Opus predeterminado y muestra un aviso en la transcripción: Opus 4.8 en la API de Anthropic y despliegues de puerta de enlace LLM, u Opus 4.7 en Claude Platform en AWS.
La sesión continúa en ese modelo Opus. Para volver a Fable 5, ejecute /model fable.
El destino de respaldo se verifica contra availableModels. Cuando está bloqueado, no ocurre respaldo. El rechazo aparece como un error normal y el modelo de la sesión no cambia.
Verificar qué desencadenó el respaldo
El respaldo puede desencadenarse en la primera solicitud de una sesión, antes de que envíe algo inusual, porque la primera solicitud lleva contexto del espacio de trabajo como su contenido de CLAUDE.md y estado de git. Un repositorio que contiene material de seguridad o biología puede activar el clasificador solo en ese contexto.
Para verificar si las personalizaciones son el desencadenante, inicie una sesión con claude --safe-mode, que desactiva personalizaciones como CLAUDE.md, skills, servidores MCP y hooks. El estado de git y los nombres de directorios no son personalizaciones y aún se incluyen.
Preguntar antes de cambiar
Para decidir qué sucede cada vez que se marca una solicitud, en lugar de cambiar automáticamente, ejecute /config y desactive "cambiar modelos cuando se marca un mensaje". Una solicitud marcada pausa la sesión con dos opciones: cambiar al modelo Opus o editar el indicador e intentar nuevamente en Fable 5.
Algunos casos se comportan de manera diferente:
- Si ambos modelos marcan la misma solicitud, puede editar el indicador e intentar nuevamente, o iniciar una nueva sesión.
- En sesiones móviles de Claude Code en la web, no se admite edición y reintento. Cambie de modelos o continúe la sesión desde un navegador de escritorio o la aplicación de escritorio.
- En modo no interactivo e integraciones de SDK que no pueden mostrar el indicador, una solicitud marcada termina el turno con un rechazo en su lugar.
- Cuando el destino de respaldo está bloqueado por
availableModels, el indicador no se muestra. La solicitud marcada termina con el rechazo, igual que el respaldo automático cuando el destino está bloqueado.
Habilitar respaldo en Bedrock, Vertex AI y Foundry
En Amazon Bedrock, Google Vertex AI y Microsoft Foundry, los ID de modelo son específicos del proveedor, por lo que el respaldo automático solo funciona cuando Claude Code puede identificar ambos modelos involucrados:
- Claude Code debe reconocer el modelo actual como Fable 5: el ID del modelo contiene
claude-fable-5, coincide con el valor deANTHROPIC_DEFAULT_FABLE_MODEL, o se asigna conmodelOverrides. - El destino de respaldo debe resolverse en un modelo Opus: el valor de
ANTHROPIC_DEFAULT_OPUS_MODELsi se establece, de lo contrario una entrada Opus 4.8 en la lista de modelos del proveedor.
Si no se puede identificar ninguno de los modelos, Claude Code no cambia automáticamente. La solicitud marcada termina con un mensaje de rechazo, y puede cambiar de modelos con /model e intentar nuevamente. Para habilitar el respaldo automático en estos proveedores, establezca ANTHROPIC_DEFAULT_FABLE_MODEL en su ID de modelo Fable 5 y ANTHROPIC_DEFAULT_OPUS_MODEL en su ID de modelo Opus 4.8.
Cargas de trabajo de investigación de seguridad y biología
Las cargas de trabajo en seguridad ofensiva o biología, incluidas pruebas de penetración, ejercicios Capture the Flag (CTF) y bases de código adyacentes a la biología, desencadenan respaldo frecuentemente, a menudo en la primera solicitud. Para trabajo de biología sustancial, espere que casi todas las solicitudes se redirijan.
Este es el enrutamiento esperado para estos dominios, no una bandera de cuenta. Si su organización necesita capacidad de clase Fable para este trabajo, pregunte a su equipo de cuenta de Anthropic sobre programas de acceso de confianza.
Ajustar el nivel de esfuerzo
Los niveles de esfuerzo controlan el razonamiento adaptativo, que permite que el modelo decida si y cuánto pensar en cada paso basado en la complejidad de la tarea. El esfuerzo menor es más rápido y económico para tareas directas, mientras que el esfuerzo mayor proporciona un razonamiento más profundo para problemas complejos.
Los niveles de esfuerzo disponibles dependen del modelo. Los modelos no listados aquí no admiten esfuerzo:
| Modelo | Niveles |
|---|---|
| Fable 5 | low, medium, high, xhigh, max |
| Opus 4.8 y Opus 4.7 | low, medium, high, xhigh, max |
| Opus 4.6 y Sonnet 4.6 | low, medium, high, max |
Si establece un nivel que el modelo activo no admite, Claude Code retrocede al nivel más alto admitido en o por debajo del que estableció. Por ejemplo, xhigh se ejecuta como high en Opus 4.6.
El esfuerzo predeterminado es high en Fable 5, Opus 4.8, Opus 4.6 y Sonnet 4.6, y xhigh en Opus 4.7.
Cuando ejecuta Fable 5, Opus 4.8 u Opus 4.7 por primera vez, Claude Code aplica el esfuerzo predeterminado de ese modelo incluso si estableció anteriormente un nivel diferente para otro modelo: high en Fable 5 y Opus 4.8, y xhigh en Opus 4.7. Ejecute /effort nuevamente para elegir un nivel diferente después de cambiar.
low, medium, high y xhigh persisten entre sesiones. max proporciona el razonamiento más profundo sin restricción en el gasto de tokens y se aplica solo a la sesión actual, excepto cuando se establece a través de la variable de entorno CLAUDE_CODE_EFFORT_LEVEL.
El menú /effort también ofrece ultracode. Ultracode es una configuración de Claude Code en lugar de un nivel de esfuerzo del modelo: envía xhigh al modelo y además tiene Claude orquestar flujos de trabajo dinámicos para tareas sustanciales. Se aplica solo a la sesión actual. Establézcalo a través de /effort, o pase "ultracode": true mediante --settings o una solicitud de control del SDK del Agente. No es parte de la configuración effortLevel, la bandera --effort o CLAUDE_CODE_EFFORT_LEVEL.
Elegir un nivel de esfuerzo
Cada nivel intercambia gasto de tokens contra capacidad. El predeterminado es adecuado para la mayoría de tareas de codificación; ajuste cuando desee un equilibrio diferente.
| Nivel | Cuándo usarlo |
|---|---|
low |
Reserve para tareas cortas, limitadas y sensibles a la latencia que no son sensibles a la inteligencia |
medium |
Reduce el uso de tokens para trabajo sensible a costos que puede intercambiar algo de inteligencia |
high |
Equilibra el uso de tokens e inteligencia. Predeterminado en Fable 5, Opus 4.8, Opus 4.6 y Sonnet 4.6 |
xhigh |
Razonamiento más profundo con gasto de tokens más alto. Predeterminado en Opus 4.7 |
max |
Puede mejorar el rendimiento en tareas exigentes pero puede mostrar rendimientos decrecientes y es propenso a pensar demasiado. Pruebe antes de adoptar ampliamente |
ultracode |
Una configuración de Claude Code que planifica un flujo de trabajo dinámico para cada tarea sustancial con razonamiento xhigh por mensaje. Solo de sesión |
La escala de esfuerzo se calibra por modelo, por lo que el mismo nombre de nivel no representa el mismo valor subyacente en todos los modelos.
Utilizar ultrathink para razonamiento profundo único
Incluya ultrathink en cualquier lugar de su indicación para solicitar un razonamiento más profundo en ese turno sin cambiar su configuración de esfuerzo de sesión. Claude Code reconoce la palabra clave y añade una instrucción en contexto. El nivel de esfuerzo enviado a la API no cambia. Otras frases como "think", "think hard" y "think more" se pasan como texto de indicación ordinario y no se reconocen como palabras clave.
Establecer el nivel de esfuerzo
Puede cambiar el esfuerzo a través de cualquiera de los siguientes:
/effort: ejecute/effortsin argumentos para abrir un control deslizante interactivo,/effortseguido de un nombre de nivel para establecerlo directamente, o/effort autopara restablecer el predeterminado del modelo- En
/model: utilice las teclas de flecha izquierda/derecha para ajustar el control deslizante de esfuerzo al seleccionar un modelo - Bandera
--effort: pase un nombre de nivel para establecerlo para una única sesión al iniciar Claude Code - Variable de entorno: establezca
CLAUDE_CODE_EFFORT_LEVELen un nombre de nivel oauto - Configuración: establezca
effortLevelenlow,medium,highoxhighen su archivo de configuración.maxyultracodeson solo de sesión y no se aceptan aquí - Frontmatter de skill y subagent: establezca
efforten un archivo markdown de skill o subagent para anular el nivel de esfuerzo cuando ese skill o subagent se ejecuta
La variable de entorno tiene precedencia sobre todos los demás métodos, luego su nivel configurado, luego el predeterminado del modelo. El esfuerzo de frontmatter se aplica cuando ese skill o subagent está activo, anulando el nivel de sesión pero no la variable de entorno.
El control deslizante de esfuerzo aparece en /model cuando se selecciona un modelo compatible. El nivel de esfuerzo actual también se muestra junto al logotipo y al indicador, por ejemplo "with low effort", para que pueda confirmar qué configuración está activa sin abrir /model.
Razonamiento adaptativo y presupuestos de pensamiento fijo
El razonamiento adaptativo hace que el pensamiento sea opcional en cada paso, por lo que Claude puede responder más rápido a indicaciones rutinarias y reservar un pensamiento más profundo para pasos que se benefician de él. Si desea que Claude piense más o menos a menudo de lo que produce el nivel actual, puede decirlo directamente en su indicación o en CLAUDE.md; el modelo responde a esa orientación dentro de su configuración de esfuerzo.
Opus 4.7 y posterior siempre utilizan razonamiento adaptativo, al igual que Fable 5. El modo de presupuesto de pensamiento fijo y CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING no se aplican a ellos.
En Opus 4.6 y Sonnet 4.6, puede establecer CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 para revertir al presupuesto de pensamiento fijo anterior controlado por MAX_THINKING_TOKENS. Consulte variables de entorno.
Pensamiento extendido
El pensamiento extendido es el razonamiento que Claude emite antes de responder. En modelos que admiten razonamiento adaptativo, el nivel de esfuerzo es el control principal de cuánto pensamiento ocurre; la configuración a continuación activa o desactiva el pensamiento y controla cómo se muestra.
| Control | Cómo configurarlo |
|---|---|
| Alternar para la sesión actual | Presione Option+T en macOS o Alt+T en Windows y Linux |
| Establecer el predeterminado global | Ejecute /config y alterne el modo de pensamiento. Se guarda como alwaysThinkingEnabled en ~/.claude/settings.json |
| Desactivar independientemente del esfuerzo | Establezca MAX_THINKING_TOKENS=0, que desactiva el pensamiento en la API de Anthropic excepto en Fable 5. En proveedores de terceros esto omite el parámetro thinking en su lugar, y los modelos de razonamiento adaptativo aún pueden pensar. Otros valores se aplican solo con un presupuesto de pensamiento fijo |
El pensamiento no se puede desactivar en Fable 5. El alternar de sesión, alwaysThinkingEnabled y MAX_THINKING_TOKENS=0 no tienen efecto allí, y Fable 5 decide por paso cuánto pensar basado en el nivel de esfuerzo.
La salida de pensamiento se colapsa de forma predeterminada. Presione Ctrl+O para alternar el modo detallado y ver el razonamiento como texto gris en cursiva. Las sesiones interactivas en la API de Anthropic reciben bloques de pensamiento redactados de forma predeterminada, por lo que establezca showThinkingSummaries: true en configuración si desea que los resúmenes completos estén disponibles cuando se expandan. Se le cobra por todos los tokens de pensamiento generados, incluso cuando se colapsan o se redactan.
Contexto extendido
Fable 5, Opus 4.6 y posterior, y Sonnet 4.6 admiten una ventana de contexto de 1 millón de tokens para sesiones largas con bases de código grandes.
La disponibilidad varía según el modelo y el plan. En los planes Max, Team y Enterprise, Opus se actualiza automáticamente a contexto de 1M sin configuración adicional. Esto se aplica tanto a los asientos de Team Standard como de Team Premium. En la API de Anthropic, Fable 5, Opus 4.8 y Opus 4.7 siempre se ejecutan con la ventana de 1M. Sonnet con contexto de 1M no es parte de la actualización automática y requiere créditos de uso en todos los planes de suscripción, incluido Max.
| Plan | Opus con contexto de 1M | Sonnet con contexto de 1M |
|---|---|---|
| Max, Team y Enterprise | Incluido en la suscripción | Requiere créditos de uso |
| Pro | Requiere créditos de uso | Requiere créditos de uso |
| API y pago por uso | Acceso completo | Acceso completo |
Para desactivar completamente el contexto de 1M, establezca CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Esto elimina variantes de modelo de 1M del selector de modelo. Consulte variables de entorno.
La ventana de contexto de 1M utiliza precios de modelo estándar sin prima para tokens más allá de 200K. Para planes donde el contexto extendido está incluido en su suscripción, el uso permanece cubierto por su suscripción. Para planes que acceden al contexto extendido a través de créditos de uso, los tokens se facturan a los créditos de uso.
Si su cuenta admite contexto de 1M, la opción aparece en el selector de modelo (/model) en las últimas versiones de Claude Code. Si no la ve, intente reiniciar su sesión.
También puede utilizar el sufijo [1m] con alias de modelo o nombres de modelo completos:
# Utilizar el alias opus[1m] o sonnet[1m]
/model opus[1m]
/model sonnet[1m]
# O añadir [1m] a un nombre de modelo completo
/model claude-opus-4-8[1m]
Verificar su modelo actual
Puede ver qué modelo está utilizando actualmente de varias formas:
- En línea de estado (si está configurada)
- En
/status, que también muestra la información de su cuenta.
Agregar una opción de modelo personalizado
Utilice ANTHROPIC_CUSTOM_MODEL_OPTION para agregar una única entrada personalizada al selector /model sin reemplazar los alias integrados. Esto es útil para probar IDs de modelo que Claude Code no enumera de forma predeterminada. Para implementaciones de puerta de enlace LLM, Claude Code puede completar automáticamente el selector desde el punto final /v1/models de la puerta de enlace cuando se establece CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1, por lo que esta variable solo es necesaria cuando el descubrimiento está deshabilitado o no devuelve el modelo que desea. Consulte Selección de modelo de puerta de enlace LLM.
Este ejemplo establece las tres variables para hacer que una implementación de Opus enrutada por puerta de enlace sea seleccionable:
export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"
La entrada personalizada aparece en la parte inferior del selector /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME y ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION son opcionales. Si se omiten, el ID de modelo se utiliza como nombre y la descripción tiene como valor predeterminado Custom model (<model-id>).
Claude Code omite la validación para el ID de modelo establecido en ANTHROPIC_CUSTOM_MODEL_OPTION, por lo que puede utilizar cualquier cadena que su punto final de API acepte. Cuando availableModels está establecido, incluya también el ID de modelo personalizado en la lista de permitidos: la entrada personalizada se filtra del selector y una selección de --model de la misma se rechaza como cualquier otro modelo excluido. Un ID personalizado que incrusta un nombre de familia, como my-gateway/claude-opus-4-7, cuenta como una entrada específica para esa familia y deshabilita su comodín, por lo que también debe enumerar las versiones que desea mantener seleccionables. Consulte Comportamiento de fusión.
Variables de entorno
Puede utilizar las siguientes variables de entorno, que deben ser nombres de modelo completos (o equivalentes para su proveedor de API), para controlar los nombres de modelo a los que se asignan los alias.
| Variable de entorno | Descripción |
|---|---|
ANTHROPIC_DEFAULT_FABLE_MODEL |
El modelo a utilizar para fable, y el ID de modelo que Claude Code reconoce como Fable 5 para alternancia automática de modelo en proveedores de terceros |
ANTHROPIC_DEFAULT_OPUS_MODEL |
El modelo a utilizar para opus, o para opusplan cuando Plan Mode está activo. |
ANTHROPIC_DEFAULT_SONNET_MODEL |
El modelo a utilizar para sonnet, o para opusplan cuando Plan Mode no está activo. |
ANTHROPIC_DEFAULT_HAIKU_MODEL |
El modelo a utilizar para haiku, o funcionalidad de fondo |
CLAUDE_CODE_SUBAGENT_MODEL |
El modelo a utilizar para todos los subagents y agent teams. Anula tanto el parámetro model por invocación como el frontmatter model de la definición del subagent. Establezca en inherit para utilizar la resolución de modelo normal en su lugar |
Nota: ANTHROPIC_SMALL_FAST_MODEL está deprecado en favor de ANTHROPIC_DEFAULT_HAIKU_MODEL.
Fijar modelos para implementaciones de terceros
Al implementar Claude Code a través de Bedrock, Vertex AI, Foundry, o Claude Platform on AWS, fije versiones de modelo antes de implementar para usuarios.
Sin fijar, Claude Code utiliza alias de modelo como fable, opus, sonnet y haiku que se resuelven a un ID de modelo predeterminado integrado para cada proveedor. Ese predeterminado puede rezagarse con respecto a la versión más reciente de Anthropic, y el modelo al que apunta puede que aún no esté habilitado en la cuenta de un usuario. Cuando el predeterminado no está disponible, los usuarios de Bedrock y Vertex AI ven un aviso y retroceden a la versión anterior para esa sesión, mientras que los usuarios de Foundry ven errores porque Foundry no tiene ninguna verificación de inicio equivalente.
Establezca las variables de entorno de modelo en IDs de versión específicos como parte de su configuración inicial. Fijar le permite controlar cuándo sus usuarios se mueven a un nuevo modelo.
Utilice las siguientes variables de entorno con IDs de modelo específicos de versión para su proveedor:
| Proveedor | Ejemplo |
|---|---|
| Bedrock | export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-8' |
| Vertex AI | export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8' |
| Foundry | export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8' |
Aplique el mismo patrón para ANTHROPIC_DEFAULT_FABLE_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL y ANTHROPIC_DEFAULT_HAIKU_MODEL. Para IDs de modelo actuales y heredados en todos los proveedores, consulte Descripción general de modelos. Para actualizar usuarios a una nueva versión de modelo, actualice estas variables de entorno e implemente nuevamente.
Para habilitar contexto extendido para un modelo fijo, añada [1m] al ID de modelo en ANTHROPIC_DEFAULT_OPUS_MODEL o ANTHROPIC_DEFAULT_SONNET_MODEL:
export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8[1m]'
El sufijo [1m] aplica la ventana de contexto de 1M a todo el uso de los alias opus y sonnet, incluida la fase Opus de modo de plan de opusplan.
- Claude Code elimina el sufijo antes de enviar el ID de modelo a su proveedor.
- Solo añada
[1m]cuando el modelo subyacente admita contexto de 1M. - El sufijo se lee por variable, no por modelo. En Bedrock, Vertex y Foundry, un ID de modelo sin
[1m]en una variable utiliza contexto de 200K incluso si otra variable establece el mismo modelo con el sufijo.
Una lista de permitidos availableModels entregada a través de MDM o un archivo de configuración administrado aún se aplica cuando se utilizan proveedores de terceros; la configuración administrada por servidor no se entrega allí. El filtrado coincide con un alias de modelo como opus, un prefijo de versión como claude-opus-4-8, o el ID de modelo completo en forma de proveedor. Los prefijos específicos del proveedor como us.anthropic. no se eliminan, por lo que para permitir un modelo específico, enumere el mismo ID en forma de proveedor que muestra el selector, o asígnelo a través de modelOverrides. Cualquier sufijo [1m] se elimina tanto de la entrada de la lista de permitidos como del modelo solicitado antes de coincidir.
Personalizar la visualización y capacidades del modelo fijo
Cuando fija un modelo en un proveedor de terceros, el ID específico del proveedor aparece tal cual en el selector /model y Claude Code puede no reconocer qué características admite el modelo. Puede anular el nombre de visualización y declarar capacidades con variables de entorno complementarias para cada modelo fijo.
Estas variables tienen efecto en proveedores de terceros como Bedrock, Vertex AI y Foundry. Las variables _NAME y _DESCRIPTION también tienen efecto cuando ANTHROPIC_BASE_URL apunta a una puerta de enlace LLM. No tienen efecto cuando se conecta directamente a api.anthropic.com.
| Variable de entorno | Descripción |
|---|---|
ANTHROPIC_DEFAULT_OPUS_MODEL_NAME |
Nombre de visualización para el modelo Opus fijo en el selector /model. Por defecto al ID de modelo cuando no está configurado |
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION |
Descripción de visualización para el modelo Opus fijo en el selector /model. Por defecto a Custom Opus model cuando no está configurado |
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES |
Lista separada por comas de capacidades que admite el modelo Opus fijo |
Los mismos sufijos _NAME, _DESCRIPTION y _SUPPORTED_CAPABILITIES están disponibles para ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL, ANTHROPIC_DEFAULT_FABLE_MODEL y ANTHROPIC_CUSTOM_MODEL_OPTION.
Claude Code habilita características como niveles de esfuerzo y pensamiento extendido haciendo coincidir el ID de modelo con patrones conocidos. Los IDs específicos del proveedor como ARNs de Bedrock o nombres de implementación personalizados a menudo no coinciden con estos patrones, dejando las características compatibles deshabilitadas. Establezca _SUPPORTED_CAPABILITIES para indicar a Claude Code qué características admite realmente el modelo:
| Valor de capacidad | Habilita |
|---|---|
effort |
Niveles de esfuerzo y el comando /effort |
xhigh_effort |
{/* min-version: 2.1.111 */}El nivel de esfuerzo xhigh |
max_effort |
El nivel de esfuerzo max |
thinking |
Pensamiento extendido |
adaptive_thinking |
Razonamiento adaptativo que asigna dinámicamente el pensamiento basado en la complejidad de la tarea |
interleaved_thinking |
Pensamiento entre llamadas de herramientas |
Cuando se establece _SUPPORTED_CAPABILITIES, las capacidades enumeradas se habilitan y las capacidades no enumeradas se deshabilitan para el modelo fijo coincidente. Cuando la variable no está configurada, Claude Code vuelve a la detección integrada basada en el ID de modelo.
Este ejemplo fija Opus a un ARN de modelo personalizado de Bedrock, establece un nombre amigable y declara sus capacidades:
export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'
Anular IDs de modelo por versión
Las variables de entorno a nivel de familia anteriores configuran un ID de modelo por alias de familia. Si necesita asignar varias versiones dentro de la misma familia a IDs de proveedor distintos, utilice la configuración modelOverrides en su lugar.
modelOverrides asigna IDs de modelo individuales de Anthropic a las cadenas específicas del proveedor que Claude Code envía a la API de su proveedor. Cuando un usuario selecciona un modelo asignado en el selector /model, Claude Code utiliza su valor configurado en lugar del predeterminado integrado.
Esto permite a los administradores empresariales enrutar cada versión de modelo a un ARN de perfil de inferencia de Bedrock específico, nombre de versión de Vertex AI o nombre de implementación de Foundry para gobernanza, asignación de costos o enrutamiento regional.
Establezca modelOverrides en su archivo de configuración:
{
"modelOverrides": {
"claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
"claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
"claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
}
}
Las claves deben ser IDs de modelo de Anthropic como se enumeran en la Descripción general de modelos. Para IDs de modelo con fecha, incluya el sufijo de fecha exactamente como aparece allí. Las claves desconocidas se ignoran.
Las anulaciones reemplazan los IDs de modelo integrados que respaldan cada entrada en el selector /model. En Bedrock, las anulaciones tienen precedencia sobre cualquier perfil de inferencia que Claude Code descubra automáticamente al inicio. Los valores que proporciona directamente a través de ANTHROPIC_MODEL, --model, o las variables de entorno ANTHROPIC_DEFAULT_*_MODEL se pasan al proveedor tal como están y no se transforman por modelOverrides.
modelOverrides funciona junto con availableModels. La lista de permitidos se evalúa contra el ID de modelo de Anthropic, no el valor de anulación, por lo que una entrada como "opus" en availableModels continúa coincidiendo incluso cuando las versiones de Opus se asignan a ARNs. Cuando enforceAvailableModels se establece en configuración administrada, el Predeterminado aplicado se resuelve a través de modelOverrides desde la fuente administrada de mayor precedencia únicamente. La asignación de un administrador, como una versión fijada a un ARN de perfil de inferencia, se respeta en el Predeterminado aplicado. Las anulaciones de configuración de usuario o proyecto no la afectan.
Configuración de almacenamiento en caché de indicaciones
Claude Code utiliza automáticamente almacenamiento en caché de indicaciones para optimizar el rendimiento y reducir costos. Puede desactivar el almacenamiento en caché de indicaciones globalmente o para niveles de modelo específicos:
| Variable de entorno | Descripción |
|---|---|
DISABLE_PROMPT_CACHING |
Establezca en 1 para desactivar el almacenamiento en caché de indicaciones para todos los modelos. Tiene precedencia sobre la configuración por modelo |
DISABLE_PROMPT_CACHING_HAIKU |
Establezca en 1 para desactivar el almacenamiento en caché de indicaciones solo para modelos Haiku |
DISABLE_PROMPT_CACHING_SONNET |
Establezca en 1 para desactivar el almacenamiento en caché de indicaciones solo para modelos Sonnet |
DISABLE_PROMPT_CACHING_OPUS |
Establezca en 1 para desactivar el almacenamiento en caché de indicaciones solo para modelos Opus |
DISABLE_PROMPT_CACHING_FABLE |
Establezca en 1 para desactivar el almacenamiento en caché de indicaciones solo para modelos Fable |
Para cambiar el TTL de caché u obtener más información sobre qué desencadena un error de caché, consulte Cómo Claude Code utiliza el almacenamiento en caché de indicaciones.