Configuración del modelo
Aprenda sobre la configuración del modelo Claude Code, incluidos los alias de modelo como
opusplan
Modelos disponibles
Para la configuración de model en Claude Code, puede configurar:
- Un alias de modelo
- Un nombre de modelo
- API de Anthropic: Un nombre de modelo completo
- Bedrock: un ARN de perfil de inferencia
- Foundry: un nombre de implementación
- Vertex: un nombre de versión
ANTHROPIC_BASE_URL cambia dónde se envían las solicitudes, no qué modelo las responde. Para enrutar Claude a través de una puerta de enlace LLM, consulte configuración de puerta de enlace LLM.
Alias de modelo
Los alias de modelo proporcionan una forma conveniente de seleccionar configuraciones de modelo sin necesidad de recordar números de versión exactos:
| Alias de modelo | Comportamiento |
|---|---|
default |
Valor especial que borra cualquier anulación de modelo y revierte al modelo recomendado para su tipo de cuenta. No es en sí mismo un alias de modelo |
best |
Utiliza Fable 5 donde su organización tiene acceso a él, de lo contrario el último modelo Opus |
fable |
Utiliza Claude Fable 5 para sus tareas más difíciles y de mayor duración |
sonnet |
Utiliza el último modelo Sonnet para tareas de codificación diaria |
opus |
Utiliza el último modelo Opus para tareas de razonamiento complejo |
haiku |
Utiliza el modelo Haiku rápido y eficiente para tareas simples |
sonnet[1m] |
Utiliza Sonnet con una ventana de contexto de 1 millón de tokens para sesiones largas |
opus[1m] |
Utiliza Opus con una ventana de contexto de 1 millón de tokens para sesiones largas |
opusplan |
Modo especial que utiliza opus durante Plan Mode, luego cambia a sonnet para la ejecución |
En la API de Anthropic, opus se resuelve a Opus 4.8 y sonnet se resuelve a Sonnet 4.6. En Claude Platform on AWS, opus se resuelve a Opus 4.7 y sonnet se resuelve a Sonnet 4.6. En Bedrock, Vertex y Foundry, opus se resuelve a Opus 4.6 y sonnet se resuelve a Sonnet 4.5; hay modelos más nuevos disponibles en esos proveedores seleccionando el nombre de modelo completo explícitamente o estableciendo ANTHROPIC_DEFAULT_OPUS_MODEL o ANTHROPIC_DEFAULT_SONNET_MODEL.
Los alias apuntan a la versión recomendada para su proveedor y se actualizan con el tiempo. Para fijar una versión específica, utilice el nombre de modelo completo (por ejemplo, claude-opus-4-8) o establezca la variable de entorno correspondiente como ANTHROPIC_DEFAULT_OPUS_MODEL.
Opus 4.8 requiere Claude Code v2.1.154 o posterior. Ejecute claude update para actualizar.
Trabajar con Fable 5
Claude Fable 5 es el modelo más capaz en Claude Code, adecuado para tareas más grandes que una sola sesión. Sustenta sesiones largas autónomas, investiga antes de actuar y verifica su trabajo más a menudo que los modelos más pequeños.
Fable 5 no es el modelo predeterminado. Selecciónelo con /model fable. Las solicitudes que sus clasificadores de seguridad marcan, más a menudo en dominios de ciberseguridad y biología, activan alternancia automática de modelo.
Para aprovechar al máximo Fable 5:
- Describa el resultado, no los pasos: entrégale el resultado que desea y déjelo planificar el camino. Para mantenerlo funcionando hasta que ese resultado se cumpla, establezca un objetivo.
- Entrégale problemas ambiguos: las investigaciones de causa raíz, la depuración de interrupciones y las decisiones de arquitectura son donde la investigación y verificación adicionales se rentabilizan.
- Omita los recordatorios de verificación: verifica su propio trabajo con menos indicaciones, por lo que los recordatorios para probar o verificar generalmente son innecesarios.
- Dimensione tareas más grandes: entrégale trabajo que normalmente dividiría en partes. Mantiene sesiones largas sin perder el hilo.
Fable 5 requiere Claude Code v2.1.170 o posterior. Las versiones anteriores no muestran Fable 5 en el selector de modelo y no pueden seleccionarlo. Ejecute claude update para actualizar. Fable 5 no está disponible bajo retención de datos cero, donde el selector /model lo omite o lo muestra deshabilitado.
Configurar su modelo
Puede configurar su modelo de varias formas, enumeradas en orden de prioridad:
- Durante la sesión - Utilice
/model <alias|name>para cambiar inmediatamente, o ejecute/modelsin argumentos para abrir el selector. El selector solicita confirmación cuando la conversación tiene salida anterior, ya que la siguiente respuesta relee el historial completo sin contexto en caché - Al inicio - Inicie con
claude --model <alias|name> - Variable de entorno - Establezca
ANTHROPIC_MODEL=<alias|name> - Configuración - Configure permanentemente en su archivo de configuración utilizando el campo
model.
A partir de v2.1.153, /model guarda su selección como predeterminada para nuevas sesiones escribiendo el campo model en su configuración de usuario. En el selector:
Enter: cambiar modelo y guardar como predeterminados: cambiar modelo solo para esta sesión
Escribir /model <name> directamente se comporta como Enter. La configuración del proyecto y administrada aún tiene prioridad y se reaplicará en el siguiente lanzamiento.
En v2.1.144 a v2.1.152, /model se aplicaba solo a la sesión actual y d en el selector guardaba un predeterminado.
La bandera --model y la variable de entorno ANTHROPIC_MODEL se aplican solo a la sesión que inicia con ellas. Para ejecutar diferentes modelos en diferentes terminales al mismo tiempo, inicie cada uno con su propia bandera --model en lugar de cambiar con /model.
Las sesiones reanudadas iniciadas con claude --resume, --continue, o el selector /resume mantienen el modelo que estaban usando cuando se guardó la transcripción, independientemente de la configuración actual de model. Si ese modelo ha sido retirado, la sesión cae en el orden de precedencia normal. Esto evita que la selección de /model de otra sesión cambie el modelo al reanudar.
Cuando el modelo activo al inicio proviene de la configuración del proyecto o administrada en lugar de su propia selección, el encabezado de inicio muestra qué archivo de configuración lo estableció. Ejecute /model para anular; la configuración del proyecto o administrada se reaplicará en el siguiente lanzamiento.
Ejemplo de uso:
# Iniciar con Opus
claude --model opus
# Cambiar a Sonnet durante la sesión
/model sonnet
Archivo de configuración de ejemplo:
{
"permissions": {
...
},
"model": "opus"
}
Restringir la selección de modelo
Los administradores empresariales pueden utilizar availableModels en configuración administrada o de política para restringir qué modelos pueden seleccionar los usuarios.
Cuando se establece availableModels, la lista de permitidos se aplica en todas partes donde un usuario puede especificar un modelo:
- Modelo de sesión principal:
/model, la bandera--model, y la variable de entornoANTHROPIC_MODEL - Resolución de alias: {/* min-version: 2.1.176 */}las variables de entorno
ANTHROPIC_DEFAULT_OPUS_MODEL,ANTHROPIC_DEFAULT_SONNET_MODEL,ANTHROPIC_DEFAULT_HAIKU_MODEL, yANTHROPIC_DEFAULT_FABLE_MODELno pueden redirigir un alias permitido a un modelo fuera de la lista - Modo rápido: {/* min-version: 2.1.176 */}
/fastse niega a cambiar cuando cambiaría implícitamente a un modelo Opus fuera de la lista, con el mensaje "no está en los modelos permitidos de su organización" - Modelos de subagentes: el campo
modelen frontmatter de subagente, el parámetromodelde la herramienta Agent, el selector de modelo en/agents, yCLAUDE_CODE_SUBAGENT_MODEL - Modelo de asesor: la configuración
advisorModelconfigurada - Cadenas de reserva: los elementos de una cadena de modelo de reserva fuera de la lista se descartan
Cambiar a un modelo bloqueado con /model se rechaza con un error, mientras que una bandera --model bloqueada o un valor ANTHROPIC_MODEL se reemplaza al inicio con una advertencia que nombra tanto los modelos solicitados como los sustituidos, y la sesión comienza en el modelo predeterminado. Una anulación de subagente o asesor bloqueada vuelve al modelo heredado o predeterminado en lugar de fallar la solicitud.
{
"availableModels": ["sonnet", "haiku"]
}
Comportamiento del modelo predeterminado
Por defecto, la opción Predeterminado en el selector de modelo no se ve afectada por availableModels. Siempre permanece disponible y representa el valor predeterminado de tiempo de ejecución del sistema basado en el nivel de suscripción del usuario.
Para extender la lista de permitidos a la opción Predeterminado, establezca enforceAvailableModels en true en configuración administrada o de política junto con una lista availableModels no vacía. Cuando el valor predeterminado del nivel no está en la lista de permitidos, Predeterminado se resuelve a la primera entrada permitida en lugar del valor predeterminado del nivel. Esto requiere Claude Code v2.1.175 o posterior.
Un array availableModels vacío nunca activa la aplicación. Incluso con availableModels: [], los usuarios aún pueden usar Claude Code con el modelo Predeterminado para su nivel independientemente de enforceAvailableModels.
Controlar el modelo en el que se ejecutan los usuarios
La configuración de model es una selección inicial, no una aplicación. Establece qué modelo está activo cuando comienza una sesión, pero los usuarios aún pueden abrir /model y elegir Predeterminado, que se resuelve al valor predeterminado del sistema para su nivel independientemente de lo que esté configurado en model.
Para controlar completamente la experiencia del modelo, combine estas configuraciones:
availableModels: restringe a qué modelos nombrados pueden cambiar los usuariosenforceAvailableModels: extiende la lista de permitidosavailableModelsa la opción Predeterminado, de modo que Predeterminado no pueda resolverse a un modelo fuera de la listamodel: establece la selección de modelo inicial cuando comienza una sesiónANTHROPIC_DEFAULT_SONNET_MODEL/ANTHROPIC_DEFAULT_OPUS_MODEL/ANTHROPIC_DEFAULT_HAIKU_MODEL/ANTHROPIC_DEFAULT_FABLE_MODEL: controlan a qué se resuelven la opción Predeterminado y los aliassonnet,opus,haikuyfable
Este ejemplo inicia a los usuarios en Sonnet 4.5, limita el selector a Sonnet y Haiku, y asegura que Predeterminado se resuelva a un modelo en la lista de permitidos en lugar del valor predeterminado del nivel:
{
"model": "claude-sonnet-4-5",
"availableModels": ["claude-sonnet-4-5", "haiku"],
"enforceAvailableModels": true,
"env": {
"ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
}
}
Sin enforceAvailableModels o el bloque env, un usuario que seleccione Predeterminado en el selector obtendría la versión más reciente para su nivel, omitiendo la fijación de versión en model y availableModels. Las dos configuraciones cubren diferentes alcances: enforceAvailableModels hace que Predeterminado obedezca la lista de permitidos, mientras que el bloque env fija qué versión resuelve un alias permitido como sonnet. Use enforceAvailableModels solo cuando restringir familias de modelos sea suficiente; agregue el bloque env cuando también necesite fijar una versión específica.
Comportamiento de fusión
Cuando availableModels se establece en configuración de usuario, proyecto y local solamente, los arrays se fusionan y se desduplican en esos niveles.
Cuando availableModels se establece en configuración administrada o de política, el valor administrado o de política reemplaza completamente el resultado fusionado: las entradas agregadas en configuración de usuario o proyecto no pueden ampliarlo. La configuración administrada y de política reemplaza los valores de menor precedencia para enforceAvailableModels de la misma manera. A partir de Claude Code v2.1.175, esta es la única forma de aplicar una lista de permitidos estricta; las versiones anteriores fusionan la lista administrada con entradas de menor precedencia.
IDs de modelo Mantle
Cuando el punto final Bedrock Mantle está habilitado, las entradas en availableModels que comienzan con anthropic. se agregan al selector /model como opciones personalizadas y se enrutan al punto final Mantle. La configuración aún restringe el selector a las entradas enumeradas, así que incluya los alias estándar junto con cualquier ID de Mantle.
Comportamiento especial del modelo
Configuración del modelo `default`
El comportamiento de default depende del tipo de cuenta:
- Max, Team Premium, Enterprise de pago por uso y API de Anthropic: por defecto Opus 4.8
- Claude Platform en AWS: por defecto Opus 4.7
- Pro, Team Standard y asientos de suscripción Enterprise: por defecto Sonnet 4.6
- Bedrock, Vertex y Foundry: por defecto Sonnet 4.5
Enterprise de pago por uso significa una organización Enterprise facturada por uso en lugar de por asiento de suscripción.
Fable 5 no es el modelo predeterminado en ningún tipo de cuenta. Las sesiones utilizan Fable 5 solo después de que lo elija, con /model fable, una configuración de model, o el alias best donde Fable 5 está disponible. Elegirlo con /model lo guarda como el modelo seleccionado en su configuración de usuario, por lo que las sesiones posteriores comienzan en Fable 5 hasta que cambie de modelos.
Configuración del modelo `opusplan`
El alias de modelo opusplan proporciona un enfoque híbrido automatizado:
- En Plan Mode - Utiliza
opuspara razonamiento complejo y decisiones de arquitectura - En Execution Mode - Cambia automáticamente a
sonnetpara generación de código e implementación
Esto le da lo mejor de ambos mundos: el razonamiento superior de Opus para la planificación y la eficiencia de Sonnet para la ejecución.
La fase Opus en Plan Mode utiliza la misma ventana de contexto que la configuración del modelo opus. En los niveles de suscripción donde Opus se actualiza automáticamente a contexto de 1M, opusplan recibe la actualización en Plan Mode también. Para forzar contexto de 1M para ambas fases cuando no está en un nivel de actualización automática, establezca el modelo en opusplan[1m].
Cuando availableModels excluye Opus, opusplan se mantiene en Sonnet en Plan Mode en lugar de cambiar. De manera similar, una sesión de Haiku que normalmente se actualizaría a Sonnet en Plan Mode se mantiene en Haiku cuando Sonnet se excluye.
Para un enfoque híbrido donde Claude decide a mitad de la tarea cuándo consultar un segundo modelo en lugar de cambiar en el límite del plan, consulte la herramienta advisor.
Cadenas de modelos de respaldo
Cuando el modelo principal está sobrecargado, no disponible o devuelve otro error de servidor no reintentable, Claude Code puede cambiar a un modelo de respaldo en lugar de fallar la solicitud. Los errores de autenticación, facturación, límite de velocidad, tamaño de solicitud y transporte nunca desencadenan un cambio; esos siguen su reintento normal y manejo de errores.
Configure uno o más modelos de respaldo y Claude Code los intenta en orden, mostrando un aviso cuando cambia. El cambio dura solo para el turno actual, por lo que su próximo mensaje intenta el modelo principal primero nuevamente. Las cadenas están limitadas a tres modelos después de la eliminación de duplicados, y las entradas adicionales se ignoran.
Establezca una cadena para una sesión con la bandera --fallback-model, que acepta una lista separada por comas:
claude --fallback-model sonnet,haiku
Para persistir una cadena entre sesiones, establezca fallbackModel en configuración como una matriz:
{
"fallbackModel": ["claude-sonnet-4-6", "claude-haiku-4-5"]
}
La bandera --fallback-model tiene precedencia sobre la configuración fallbackModel. Cada elemento acepta un nombre de modelo o alias, y "default" se expande al modelo predeterminado.
Dos casos causan que un elemento se omita:
- Modelo no disponible: un modelo que no se puede alcanzar, como un modelo retirado fijado en la configuración, se omite y Claude Code continúa con el siguiente elemento.
- Fuera de la lista de permitidos: un elemento no permitido por
availableModelsse descarta cuando se lee la cadena y nunca se intenta.
Respaldo automático del modelo
Esta sección cubre el respaldo basado en contenido de Fable 5. Para respaldo basado en disponibilidad cuando un modelo está sobrecargado o no disponible, consulte Cadenas de modelos de respaldo.
Fable 5 se ejecuta con clasificadores de seguridad para contenido de ciberseguridad y biología. Cuando un clasificador marca una solicitud, Claude Code vuelve a ejecutar esa solicitud en el modelo Opus predeterminado y muestra un aviso en la transcripción: Opus 4.8 en la API de Anthropic y despliegues de puerta de enlace LLM, u Opus 4.7 en Claude Platform en AWS.
La sesión continúa en ese modelo Opus. Para volver a Fable 5, ejecute /model fable.
Verificar qué desencadenó el respaldo
El respaldo puede desencadenarse en la primera solicitud de una sesión, antes de que envíe algo inusual, porque la primera solicitud lleva contexto del espacio de trabajo como su contenido de CLAUDE.md y estado de git. Un repositorio que contiene material de seguridad o biología puede activar el clasificador solo en ese contexto.
Para verificar si las personalizaciones son el desencadenante, inicie una sesión con claude --safe-mode, que desactiva personalizaciones como CLAUDE.md, skills, servidores MCP y hooks. El estado de git y los nombres de directorios no son personalizaciones y aún se incluyen.
Preguntar antes de cambiar
Para decidir qué sucede cada vez que se marca una solicitud, en lugar de cambiar automáticamente, ejecute /config y desactive "cambiar modelos cuando se marca un mensaje". Una solicitud marcada pausa la sesión con dos opciones: cambiar al modelo Opus o editar el indicador e intentar nuevamente en Fable 5.
Algunos casos se comportan de manera diferente:
- Si ambos modelos marcan la misma solicitud, puede editar el indicador e intentar nuevamente, o iniciar una nueva sesión.
- En sesiones móviles de Claude Code en la web, no se admite edición y reintento. Cambie de modelos o continúe la sesión desde un navegador de escritorio o la aplicación de escritorio.
- En modo no interactivo e integraciones de SDK que no pueden mostrar el indicador, una solicitud marcada termina el turno con un rechazo en su lugar.
Habilitar respaldo en Bedrock, Vertex AI y Foundry
En Amazon Bedrock, Google Vertex AI y Microsoft Foundry, los ID de modelo son específicos del proveedor, por lo que el respaldo automático solo funciona cuando Claude Code puede identificar ambos modelos involucrados:
- Claude Code debe reconocer el modelo actual como Fable 5: el ID del modelo contiene
claude-fable-5, coincide con el valor deANTHROPIC_DEFAULT_FABLE_MODEL, o se asigna conmodelOverrides. - El destino de respaldo debe resolverse en un modelo Opus: el valor de
ANTHROPIC_DEFAULT_OPUS_MODELsi se establece, de lo contrario una entrada Opus 4.8 en la lista de modelos del proveedor.
Si no se puede identificar ninguno de los modelos, Claude Code no cambia automáticamente. La solicitud marcada termina con un mensaje de rechazo, y puede cambiar de modelos con /model e intentar nuevamente. Para habilitar el respaldo automático en estos proveedores, establezca ANTHROPIC_DEFAULT_FABLE_MODEL en su ID de modelo Fable 5 y ANTHROPIC_DEFAULT_OPUS_MODEL en su ID de modelo Opus 4.8.
Cargas de trabajo de investigación de seguridad y biología
Las cargas de trabajo en seguridad ofensiva o biología, incluidas pruebas de penetración, ejercicios Capture the Flag (CTF) y bases de código adyacentes a la biología, desencadenan respaldo frecuentemente, a menudo en la primera solicitud. Para trabajo de biología sustancial, espere que casi todas las solicitudes se redirijan.
Este es el enrutamiento esperado para estos dominios, no una bandera de cuenta. Si su organización necesita capacidad de clase Fable para este trabajo, pregunte a su equipo de cuenta de Anthropic sobre programas de acceso de confianza.
Ajustar el nivel de esfuerzo
Los niveles de esfuerzo controlan el razonamiento adaptativo, que permite que el modelo decida si y cuánto pensar en cada paso basado en la complejidad de la tarea. El esfuerzo menor es más rápido y económico para tareas directas, mientras que el esfuerzo mayor proporciona un razonamiento más profundo para problemas complejos.
Los niveles de esfuerzo disponibles dependen del modelo. Los modelos no listados aquí no admiten esfuerzo:
| Modelo | Niveles |
|---|---|
| Fable 5 | low, medium, high, xhigh, max |
| Opus 4.8 y Opus 4.7 | low, medium, high, xhigh, max |
| Opus 4.6 y Sonnet 4.6 | low, medium, high, max |
Si establece un nivel que el modelo activo no admite, Claude Code retrocede al nivel más alto admitido en o por debajo del que estableció. Por ejemplo, xhigh se ejecuta como high en Opus 4.6.
El esfuerzo predeterminado es high en Fable 5, Opus 4.8, Opus 4.6 y Sonnet 4.6, y xhigh en Opus 4.7.
Cuando ejecuta Fable 5, Opus 4.8 u Opus 4.7 por primera vez, Claude Code aplica el esfuerzo predeterminado de ese modelo incluso si estableció anteriormente un nivel diferente para otro modelo: high en Fable 5 y Opus 4.8, y xhigh en Opus 4.7. Ejecute /effort nuevamente para elegir un nivel diferente después de cambiar.
low, medium, high y xhigh persisten entre sesiones. max proporciona el razonamiento más profundo sin restricción en el gasto de tokens y se aplica solo a la sesión actual, excepto cuando se establece a través de la variable de entorno CLAUDE_CODE_EFFORT_LEVEL.
El menú /effort también ofrece ultracode. Ultracode es una configuración de Claude Code en lugar de un nivel de esfuerzo del modelo: envía xhigh al modelo y además tiene Claude orquestar flujos de trabajo dinámicos para tareas sustanciales. Se aplica solo a la sesión actual. Establézcalo a través de /effort, o pase "ultracode": true mediante --settings o una solicitud de control del SDK del Agente. No es parte de la configuración effortLevel, la bandera --effort o CLAUDE_CODE_EFFORT_LEVEL.
Elegir un nivel de esfuerzo
Cada nivel intercambia gasto de tokens contra capacidad. El predeterminado es adecuado para la mayoría de tareas de codificación; ajuste cuando desee un equilibrio diferente.
| Nivel | Cuándo usarlo |
|---|---|
low |
Reserve para tareas cortas, limitadas y sensibles a la latencia que no son sensibles a la inteligencia |
medium |
Reduce el uso de tokens para trabajo sensible a costos que puede intercambiar algo de inteligencia |
high |
Equilibra el uso de tokens e inteligencia. Predeterminado en Fable 5, Opus 4.8, Opus 4.6 y Sonnet 4.6 |
xhigh |
Razonamiento más profundo con gasto de tokens más alto. Predeterminado en Opus 4.7 |
max |
Puede mejorar el rendimiento en tareas exigentes pero puede mostrar rendimientos decrecientes y es propenso a pensar demasiado. Pruebe antes de adoptar ampliamente |
ultracode |
Una configuración de Claude Code que planifica un flujo de trabajo dinámico para cada tarea sustancial con razonamiento xhigh por mensaje. Solo de sesión |
La escala de esfuerzo se calibra por modelo, por lo que el mismo nombre de nivel no representa el mismo valor subyacente en todos los modelos.
Utilizar ultrathink para razonamiento profundo único
Incluya ultrathink en cualquier lugar de su indicación para solicitar un razonamiento más profundo en ese turno sin cambiar su configuración de esfuerzo de sesión. Claude Code reconoce la palabra clave y añade una instrucción en contexto. El nivel de esfuerzo enviado a la API no cambia. Otras frases como "think", "think hard" y "think more" se pasan como texto de indicación ordinario y no se reconocen como palabras clave.
Establecer el nivel de esfuerzo
Puede cambiar el esfuerzo a través de cualquiera de los siguientes:
/effort: ejecute/effortsin argumentos para abrir un control deslizante interactivo,/effortseguido de un nombre de nivel para establecerlo directamente, o/effort autopara restablecer el predeterminado del modelo- En
/model: utilice las teclas de flecha izquierda/derecha para ajustar el control deslizante de esfuerzo al seleccionar un modelo - Bandera
--effort: pase un nombre de nivel para establecerlo para una única sesión al iniciar Claude Code - Variable de entorno: establezca
CLAUDE_CODE_EFFORT_LEVELen un nombre de nivel oauto - Configuración: establezca
effortLevelenlow,medium,highoxhighen su archivo de configuración.maxyultracodeson solo de sesión y no se aceptan aquí - Frontmatter de skill y subagent: establezca
efforten un archivo markdown de skill o subagent para anular el nivel de esfuerzo cuando ese skill o subagent se ejecuta
La variable de entorno tiene precedencia sobre todos los demás métodos, luego su nivel configurado, luego el predeterminado del modelo. El esfuerzo de frontmatter se aplica cuando ese skill o subagent está activo, anulando el nivel de sesión pero no la variable de entorno.
El control deslizante de esfuerzo aparece en /model cuando se selecciona un modelo compatible. El nivel de esfuerzo actual también se muestra junto al logotipo y al indicador, por ejemplo "with low effort", para que pueda confirmar qué configuración está activa sin abrir /model.
Razonamiento adaptativo y presupuestos de pensamiento fijo
El razonamiento adaptativo hace que el pensamiento sea opcional en cada paso, por lo que Claude puede responder más rápido a indicaciones rutinarias y reservar un pensamiento más profundo para pasos que se benefician de él. Si desea que Claude piense más o menos a menudo de lo que produce el nivel actual, puede decirlo directamente en su indicación o en CLAUDE.md; el modelo responde a esa orientación dentro de su configuración de esfuerzo.
Opus 4.7 y posterior siempre utilizan razonamiento adaptativo, al igual que Fable 5. El modo de presupuesto de pensamiento fijo y CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING no se aplican a ellos.
En Opus 4.6 y Sonnet 4.6, puede establecer CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 para revertir al presupuesto de pensamiento fijo anterior controlado por MAX_THINKING_TOKENS. Consulte variables de entorno.
Pensamiento extendido
El pensamiento extendido es el razonamiento que Claude emite antes de responder. En modelos que admiten razonamiento adaptativo, el nivel de esfuerzo es el control principal de cuánto pensamiento ocurre; la configuración a continuación activa o desactiva el pensamiento y controla cómo se muestra.
| Control | Cómo configurarlo |
|---|---|
| Alternar para la sesión actual | Presione Option+T en macOS o Alt+T en Windows y Linux |
| Establecer el predeterminado global | Ejecute /config y alterne el modo de pensamiento. Se guarda como alwaysThinkingEnabled en ~/.claude/settings.json |
| Desactivar independientemente del esfuerzo | Establezca MAX_THINKING_TOKENS=0, que desactiva el pensamiento en la API de Anthropic excepto en Fable 5. En proveedores de terceros esto omite el parámetro thinking en su lugar, y los modelos de razonamiento adaptativo aún pueden pensar. Otros valores se aplican solo con un presupuesto de pensamiento fijo |
El pensamiento no se puede desactivar en Fable 5. El alternar de sesión, alwaysThinkingEnabled y MAX_THINKING_TOKENS=0 no tienen efecto allí, y Fable 5 decide por paso cuánto pensar basado en el nivel de esfuerzo.
La salida de pensamiento se colapsa de forma predeterminada. Presione Ctrl+O para alternar el modo detallado y ver el razonamiento como texto gris en cursiva. Las sesiones interactivas en la API de Anthropic reciben bloques de pensamiento redactados de forma predeterminada, por lo que establezca showThinkingSummaries: true en configuración si desea que los resúmenes completos estén disponibles cuando se expandan. Se le cobra por todos los tokens de pensamiento generados, incluso cuando se colapsan o se redactan.
Contexto extendido
Fable 5, Opus 4.6 y posterior, y Sonnet 4.6 admiten una ventana de contexto de 1 millón de tokens para sesiones largas con bases de código grandes.
La disponibilidad varía según el modelo y el plan. En los planes Max, Team y Enterprise, Opus se actualiza automáticamente a contexto de 1M sin configuración adicional. Esto se aplica tanto a los asientos de Team Standard como de Team Premium. En la API de Anthropic, Fable 5, Opus 4.8 y Opus 4.7 siempre se ejecutan con la ventana de 1M. Sonnet con contexto de 1M no es parte de la actualización automática y requiere créditos de uso en todos los planes de suscripción, incluido Max.
| Plan | Opus con contexto de 1M | Sonnet con contexto de 1M |
|---|---|---|
| Max, Team y Enterprise | Incluido en la suscripción | Requiere créditos de uso |
| Pro | Requiere créditos de uso | Requiere créditos de uso |
| API y pago por uso | Acceso completo | Acceso completo |
Para desactivar completamente el contexto de 1M, establezca CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Esto elimina variantes de modelo de 1M del selector de modelo. Consulte variables de entorno.
La ventana de contexto de 1M utiliza precios de modelo estándar sin prima para tokens más allá de 200K. Para planes donde el contexto extendido está incluido en su suscripción, el uso permanece cubierto por su suscripción. Para planes que acceden al contexto extendido a través de créditos de uso, los tokens se facturan a los créditos de uso.
Si su cuenta admite contexto de 1M, la opción aparece en el selector de modelo (/model) en las últimas versiones de Claude Code. Si no la ve, intente reiniciar su sesión.
También puede utilizar el sufijo [1m] con alias de modelo o nombres de modelo completos:
# Utilizar el alias opus[1m] o sonnet[1m]
/model opus[1m]
/model sonnet[1m]
# O añadir [1m] a un nombre de modelo completo
/model claude-opus-4-8[1m]
Verificar su modelo actual
Puede ver qué modelo está utilizando actualmente de varias formas:
- En línea de estado (si está configurada)
- En
/status, que también muestra la información de su cuenta.
Agregar una opción de modelo personalizado
Utilice ANTHROPIC_CUSTOM_MODEL_OPTION para agregar una única entrada personalizada al selector /model sin reemplazar los alias integrados. Esto es útil para probar IDs de modelo que Claude Code no enumera de forma predeterminada. Para implementaciones de puerta de enlace LLM, Claude Code puede completar automáticamente el selector desde el punto final /v1/models de la puerta de enlace cuando se establece CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1, por lo que esta variable solo es necesaria cuando el descubrimiento está deshabilitado o no devuelve el modelo que desea. Consulte Selección de modelo de puerta de enlace LLM.
Este ejemplo establece las tres variables para hacer que una implementación de Opus enrutada por puerta de enlace sea seleccionable:
export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"
La entrada personalizada aparece en la parte inferior del selector /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME y ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION son opcionales. Si se omiten, el ID de modelo se utiliza como nombre y la descripción tiene como valor predeterminado Custom model (<model-id>).
Claude Code omite la validación para el ID de modelo establecido en ANTHROPIC_CUSTOM_MODEL_OPTION, por lo que puede utilizar cualquier cadena que su punto final de API acepte.
Variables de entorno
Puede utilizar las siguientes variables de entorno, que deben ser nombres de modelo completos (o equivalentes para su proveedor de API), para controlar los nombres de modelo a los que se asignan los alias.
| Variable de entorno | Descripción |
|---|---|
ANTHROPIC_DEFAULT_FABLE_MODEL |
El modelo a utilizar para fable, y el ID de modelo que Claude Code reconoce como Fable 5 para alternancia automática de modelo en proveedores de terceros |
ANTHROPIC_DEFAULT_OPUS_MODEL |
El modelo a utilizar para opus, o para opusplan cuando Plan Mode está activo. |
ANTHROPIC_DEFAULT_SONNET_MODEL |
El modelo a utilizar para sonnet, o para opusplan cuando Plan Mode no está activo. |
ANTHROPIC_DEFAULT_HAIKU_MODEL |
El modelo a utilizar para haiku, o funcionalidad de fondo |
CLAUDE_CODE_SUBAGENT_MODEL |
El modelo a utilizar para todos los subagents y agent teams. Anula tanto el parámetro model por invocación como el frontmatter model de la definición del subagent. Establezca en inherit para utilizar la resolución de modelo normal en su lugar |
Nota: ANTHROPIC_SMALL_FAST_MODEL está deprecado en favor de ANTHROPIC_DEFAULT_HAIKU_MODEL.
Fijar modelos para implementaciones de terceros
Al implementar Claude Code a través de Bedrock, Vertex AI, Foundry, o Claude Platform on AWS, fije versiones de modelo antes de implementar para usuarios.
Sin fijar, Claude Code utiliza alias de modelo como fable, opus, sonnet y haiku que se resuelven a un ID de modelo predeterminado integrado para cada proveedor. Ese predeterminado puede rezagarse con respecto a la versión más reciente de Anthropic, y el modelo al que apunta puede que aún no esté habilitado en la cuenta de un usuario. Cuando el predeterminado no está disponible, los usuarios de Bedrock y Vertex AI ven un aviso y retroceden a la versión anterior para esa sesión, mientras que los usuarios de Foundry ven errores porque Foundry no tiene ninguna verificación de inicio equivalente.
Establezca las variables de entorno de modelo en IDs de versión específicos como parte de su configuración inicial. Fijar le permite controlar cuándo sus usuarios se mueven a un nuevo modelo.
Utilice las siguientes variables de entorno con IDs de modelo específicos de versión para su proveedor:
| Proveedor | Ejemplo |
|---|---|
| Bedrock | export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-8' |
| Vertex AI | export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8' |
| Foundry | export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8' |
Aplique el mismo patrón para ANTHROPIC_DEFAULT_FABLE_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL y ANTHROPIC_DEFAULT_HAIKU_MODEL. Para IDs de modelo actuales y heredados en todos los proveedores, consulte Descripción general de modelos. Para actualizar usuarios a una nueva versión de modelo, actualice estas variables de entorno e implemente nuevamente.
Para habilitar contexto extendido para un modelo fijo, añada [1m] al ID de modelo en ANTHROPIC_DEFAULT_OPUS_MODEL o ANTHROPIC_DEFAULT_SONNET_MODEL:
export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8[1m]'
El sufijo [1m] aplica la ventana de contexto de 1M a todo el uso de los alias opus y sonnet, incluida la fase Opus de modo de plan de opusplan.
- Claude Code elimina el sufijo antes de enviar el ID de modelo a su proveedor.
- Solo añada
[1m]cuando el modelo subyacente admita contexto de 1M. - El sufijo se lee por variable, no por modelo. En Bedrock, Vertex y Foundry, un ID de modelo sin
[1m]en una variable utiliza contexto de 200K incluso si otra variable establece el mismo modelo con el sufijo.
La lista de permitidos settings.availableModels aún se aplica cuando se utilizan proveedores de terceros. El filtrado coincide con el alias de modelo como opus, el prefijo de versión como claude-opus-4-8, o el ID de modelo completo. Cualquier sufijo [1m] se elimina tanto de la entrada de la lista de permitidos como del modelo solicitado antes de coincidir, por lo que una entrada de claude-opus-4-8 permite tanto las filas Opus estándar como las de contexto de 1M. Los prefijos específicos del proveedor como us.anthropic. no se eliminan: enumere la misma forma en availableModels que muestra el selector, o asígnela a través de modelOverrides.
Personalizar la visualización y capacidades del modelo fijo
Cuando fija un modelo en un proveedor de terceros, el ID específico del proveedor aparece tal cual en el selector /model y Claude Code puede no reconocer qué características admite el modelo. Puede anular el nombre de visualización y declarar capacidades con variables de entorno complementarias para cada modelo fijo.
Estas variables tienen efecto en proveedores de terceros como Bedrock, Vertex AI y Foundry. Las variables _NAME y _DESCRIPTION también tienen efecto cuando ANTHROPIC_BASE_URL apunta a una puerta de enlace LLM. No tienen efecto cuando se conecta directamente a api.anthropic.com.
| Variable de entorno | Descripción |
|---|---|
ANTHROPIC_DEFAULT_OPUS_MODEL_NAME |
Nombre de visualización para el modelo Opus fijo en el selector /model. Por defecto al ID de modelo cuando no está configurado |
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION |
Descripción de visualización para el modelo Opus fijo en el selector /model. Por defecto a Custom Opus model cuando no está configurado |
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES |
Lista separada por comas de capacidades que admite el modelo Opus fijo |
Los mismos sufijos _NAME, _DESCRIPTION y _SUPPORTED_CAPABILITIES están disponibles para ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL, ANTHROPIC_DEFAULT_FABLE_MODEL y ANTHROPIC_CUSTOM_MODEL_OPTION.
Claude Code habilita características como niveles de esfuerzo y pensamiento extendido haciendo coincidir el ID de modelo con patrones conocidos. Los IDs específicos del proveedor como ARNs de Bedrock o nombres de implementación personalizados a menudo no coinciden con estos patrones, dejando las características compatibles deshabilitadas. Establezca _SUPPORTED_CAPABILITIES para indicar a Claude Code qué características admite realmente el modelo:
| Valor de capacidad | Habilita |
|---|---|
effort |
Niveles de esfuerzo y el comando /effort |
xhigh_effort |
{/* min-version: 2.1.111 */}El nivel de esfuerzo xhigh |
max_effort |
El nivel de esfuerzo max |
thinking |
Pensamiento extendido |
adaptive_thinking |
Razonamiento adaptativo que asigna dinámicamente el pensamiento basado en la complejidad de la tarea |
interleaved_thinking |
Pensamiento entre llamadas de herramientas |
Cuando se establece _SUPPORTED_CAPABILITIES, las capacidades enumeradas se habilitan y las capacidades no enumeradas se deshabilitan para el modelo fijo coincidente. Cuando la variable no está configurada, Claude Code vuelve a la detección integrada basada en el ID de modelo.
Este ejemplo fija Opus a un ARN de modelo personalizado de Bedrock, establece un nombre amigable y declara sus capacidades:
export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'
Anular IDs de modelo por versión
Las variables de entorno a nivel de familia anteriores configuran un ID de modelo por alias de familia. Si necesita asignar varias versiones dentro de la misma familia a IDs de proveedor distintos, utilice la configuración modelOverrides en su lugar.
modelOverrides asigna IDs de modelo individuales de Anthropic a las cadenas específicas del proveedor que Claude Code envía a la API de su proveedor. Cuando un usuario selecciona un modelo asignado en el selector /model, Claude Code utiliza su valor configurado en lugar del predeterminado integrado.
Esto permite a los administradores empresariales enrutar cada versión de modelo a un ARN de perfil de inferencia de Bedrock específico, nombre de versión de Vertex AI o nombre de implementación de Foundry para gobernanza, asignación de costos o enrutamiento regional.
Establezca modelOverrides en su archivo de configuración:
{
"modelOverrides": {
"claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
"claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
"claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
}
}
Las claves deben ser IDs de modelo de Anthropic como se enumeran en la Descripción general de modelos. Para IDs de modelo con fecha, incluya el sufijo de fecha exactamente como aparece allí. Las claves desconocidas se ignoran.
Las anulaciones reemplazan los IDs de modelo integrados que respaldan cada entrada en el selector /model. En Bedrock, las anulaciones tienen precedencia sobre cualquier perfil de inferencia que Claude Code descubra automáticamente al inicio. Los valores que proporciona directamente a través de ANTHROPIC_MODEL, --model, o las variables de entorno ANTHROPIC_DEFAULT_*_MODEL se pasan al proveedor tal como están y no se transforman por modelOverrides.
modelOverrides funciona junto con availableModels. La lista de permitidos se evalúa contra el ID de modelo de Anthropic, no el valor de anulación, por lo que una entrada como "opus" en availableModels continúa coincidiendo incluso cuando las versiones de Opus se asignan a ARNs.
Configuración de almacenamiento en caché de indicaciones
Claude Code utiliza automáticamente almacenamiento en caché de indicaciones para optimizar el rendimiento y reducir costos. Puede desactivar el almacenamiento en caché de indicaciones globalmente o para niveles de modelo específicos:
| Variable de entorno | Descripción |
|---|---|
DISABLE_PROMPT_CACHING |
Establezca en 1 para desactivar el almacenamiento en caché de indicaciones para todos los modelos. Tiene precedencia sobre la configuración por modelo |
DISABLE_PROMPT_CACHING_HAIKU |
Establezca en 1 para desactivar el almacenamiento en caché de indicaciones solo para modelos Haiku |
DISABLE_PROMPT_CACHING_SONNET |
Establezca en 1 para desactivar el almacenamiento en caché de indicaciones solo para modelos Sonnet |
DISABLE_PROMPT_CACHING_OPUS |
Establezca en 1 para desactivar el almacenamiento en caché de indicaciones solo para modelos Opus |
DISABLE_PROMPT_CACHING_FABLE |
Establezca en 1 para desactivar el almacenamiento en caché de indicaciones solo para modelos Fable |
Para cambiar el TTL de caché u obtener más información sobre qué desencadena un error de caché, consulte Cómo Claude Code utiliza el almacenamiento en caché de indicaciones.