Configuration du modèle

Découvrez la configuration du modèle Claude Code, y compris les alias de modèle comme opusplan

Modèles disponibles

Pour le paramètre model dans Claude Code, vous pouvez configurer l'un des éléments suivants :

Un alias de modèle
Un nom de modèle
- API Anthropic : un nom de modèle complet
- Bedrock : un ARN de profil d'inférence
- Foundry : un nom de déploiement
- Vertex : un nom de version

Alias de modèle

Les alias de modèle offrent un moyen pratique de sélectionner les paramètres du modèle sans avoir à mémoriser les numéros de version exacts :

Alias de modèle	Comportement
`default`	Valeur spéciale qui efface tout remplacement de modèle et revient au modèle recommandé pour votre type de compte. N'est pas en soi un alias de modèle
`best`	Utilise le modèle disponible le plus capable, actuellement équivalent à `opus`
`sonnet`	Utilise le dernier modèle Sonnet pour les tâches de codage quotidiennes
`opus`	Utilise le dernier modèle Opus pour les tâches de raisonnement complexe
`haiku`	Utilise le modèle Haiku rapide et efficace pour les tâches simples
`sonnet[1m]`	Utilise Sonnet avec une fenêtre de contexte de 1 million de tokens pour les sessions longues
`opus[1m]`	Utilise Opus avec une fenêtre de contexte de 1 million de tokens pour les sessions longues
`opusplan`	Mode spécial qui utilise `opus` pendant le mode plan, puis bascule vers `sonnet` pour l'exécution

Sur l'API Anthropic, opus se résout en Opus 4.7 et sonnet se résout en Sonnet 4.6. Sur Bedrock, Vertex et Foundry, opus se résout en Opus 4.6 et sonnet se résout en Sonnet 4.5 ; les modèles plus récents sont disponibles sur ces fournisseurs en sélectionnant le nom de modèle complet explicitement ou en définissant ANTHROPIC_DEFAULT_OPUS_MODEL ou ANTHROPIC_DEFAULT_SONNET_MODEL.

Les alias pointent vers la version recommandée pour votre fournisseur et se mettent à jour au fil du temps. Pour épingler une version spécifique, utilisez le nom de modèle complet (par exemple, claude-opus-4-7) ou définissez la variable d'environnement correspondante comme ANTHROPIC_DEFAULT_OPUS_MODEL.

Définir votre modèle

Vous pouvez configurer votre modèle de plusieurs façons, énumérées par ordre de priorité :

Pendant la session - Utilisez /model <alias|name> pour basculer immédiatement, ou exécutez /model sans argument pour ouvrir le sélecteur. Le sélecteur demande une confirmation lorsque la conversation a une sortie antérieure, car la réponse suivante relit l'historique complet sans contexte en cache
Au démarrage - Lancez avec claude --model <alias|name>
Variable d'environnement - Définissez ANTHROPIC_MODEL=<alias|name>
Paramètres - Configurez de manière permanente dans votre fichier de paramètres en utilisant le champ model.

Votre sélection /model est enregistrée dans les paramètres utilisateur et persiste entre les redémarrages. À partir de la v2.1.117, si le fichier .claude/settings.json du projet épingle un modèle différent, Claude Code écrit également votre choix dans .claude/settings.local.json afin qu'il continue à s'appliquer dans ce projet après un redémarrage. Les paramètres gérés ont la priorité et se réappliquent au prochain lancement.

Lorsque le modèle actif au démarrage provient des paramètres du projet ou gérés plutôt que de votre propre sélection, l'en-tête de démarrage indique quel fichier de paramètres l'a défini. Exécutez /model pour remplacer la sélection pour la session actuelle.

Exemple d'utilisation :

# Démarrer avec Opus
claude --model opus

# Basculer vers Sonnet pendant la session
/model sonnet

Exemple de fichier de paramètres :

{
    "permissions": {
        ...
    },
    "model": "opus"
}

Restreindre la sélection du modèle

Les administrateurs d'entreprise peuvent utiliser availableModels dans les paramètres gérés ou de politique pour restreindre les modèles que les utilisateurs peuvent sélectionner.

Lorsque availableModels est défini, les utilisateurs ne peuvent pas basculer vers des modèles ne figurant pas dans la liste via /model, le drapeau --model, ou la variable d'environnement ANTHROPIC_MODEL.

{
  "availableModels": ["sonnet", "haiku"]
}

Comportement du modèle par défaut

L'option Par défaut dans le sélecteur de modèle n'est pas affectée par availableModels. Elle reste toujours disponible et représente la valeur par défaut du système basée sur le niveau d'abonnement de l'utilisateur.

Même avec availableModels: [], les utilisateurs peuvent toujours utiliser Claude Code avec le modèle Par défaut pour leur niveau.

Contrôler le modèle sur lequel les utilisateurs s'exécutent

Le paramètre model est une sélection initiale, pas une application. Il définit quel modèle est actif au démarrage d'une session, mais les utilisateurs peuvent toujours ouvrir /model et choisir Par défaut, qui se résout au système par défaut pour leur niveau indépendamment de ce que model est défini.

Pour contrôler complètement l'expérience du modèle, combinez trois paramètres :

availableModels : restreint les modèles nommés vers lesquels les utilisateurs peuvent basculer
model : définit la sélection de modèle initiale au démarrage d'une session
ANTHROPIC_DEFAULT_SONNET_MODEL / ANTHROPIC_DEFAULT_OPUS_MODEL / ANTHROPIC_DEFAULT_HAIKU_MODEL : contrôlent ce vers quoi l'option Par défaut et les alias sonnet, opus et haiku se résolvent

Cet exemple démarre les utilisateurs sur Sonnet 4.5, limite le sélecteur à Sonnet et Haiku, et épingle Par défaut pour se résoudre à Sonnet 4.5 plutôt qu'à la dernière version :

{
  "model": "claude-sonnet-4-5",
  "availableModels": ["claude-sonnet-4-5", "haiku"],
  "env": {
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
  }
}

Sans le bloc env, un utilisateur qui sélectionne Par défaut dans le sélecteur obtiendrait la dernière version de Sonnet, contournant l'épinglage de version dans model et availableModels.

Comportement de fusion

Lorsque availableModels est défini à plusieurs niveaux, comme les paramètres utilisateur et les paramètres de projet, les tableaux sont fusionnés et dédupliqués. Pour appliquer une liste d'autorisation stricte, définissez availableModels dans les paramètres gérés ou de politique qui ont la priorité la plus élevée.

ID de modèle Mantle

Lorsque le point de terminaison Bedrock Mantle est activé, les entrées dans availableModels qui commencent par anthropic. sont ajoutées au sélecteur /model en tant qu'options personnalisées et acheminées vers le point de terminaison Mantle. Ceci est une exception à la correspondance d'alias uniquement décrite dans Épingler les modèles pour les déploiements tiers. Le paramètre restreint toujours le sélecteur aux entrées listées, donc incluez les alias standard aux côtés de tous les ID Mantle.

Comportement spécial du modèle

Paramètre de modèle `default`

Le comportement de default dépend de votre type de compte :

Max et Team Premium : par défaut Opus 4.7
Pro, Team Standard, Enterprise et API Anthropic : par défaut Sonnet 4.6
Bedrock, Vertex et Foundry : par défaut Sonnet 4.5

Claude Code peut automatiquement revenir à Sonnet si vous atteignez un seuil d'utilisation avec Opus.

Paramètre de modèle `opusplan`

L'alias de modèle opusplan fournit une approche hybride automatisée :

En mode plan - Utilise opus pour le raisonnement complexe et les décisions architecturales
En mode exécution - Bascule automatiquement vers sonnet pour la génération de code et l'implémentation

Cela vous donne le meilleur des deux mondes : le raisonnement supérieur d'Opus pour la planification et l'efficacité de Sonnet pour l'exécution.

La phase Opus en mode plan s'exécute avec la fenêtre de contexte standard de 200 K. La mise à niveau automatique 1M décrite dans Contexte étendu s'applique au paramètre de modèle opus et ne s'étend pas à opusplan.

Ajuster le niveau d'effort

Les niveaux d'effort contrôlent le raisonnement adaptatif, qui permet au modèle de décider si et combien réfléchir à chaque étape en fonction de la complexité de la tâche. Un effort inférieur est plus rapide et moins cher pour les tâches simples, tandis qu'un effort supérieur fournit un raisonnement plus profond pour les problèmes complexes.

L'effort est pris en charge sur Opus 4.7, Opus 4.6 et Sonnet 4.6. Les niveaux disponibles dépendent du modèle :

Modèle	Niveaux
Opus 4.7	`low`, `medium`, `high`, `xhigh`, `max`
Opus 4.6 et Sonnet 4.6	`low`, `medium`, `high`, `max`

Si vous définissez un niveau que le modèle actif ne prend pas en charge, Claude Code revient au niveau le plus élevé pris en charge au niveau ou en dessous de celui que vous avez défini. Par exemple, xhigh s'exécute comme high sur Opus 4.6.

À partir de la v2.1.117, l'effort par défaut est xhigh sur Opus 4.7 et high sur Opus 4.6 et Sonnet 4.6.

Lorsque vous exécutez Opus 4.7 pour la première fois, Claude Code applique xhigh même si vous aviez précédemment défini un niveau d'effort différent pour Opus 4.6 ou Sonnet 4.6. Exécutez /effort à nouveau pour choisir un niveau différent après le changement.

low, medium, high et xhigh persistent entre les sessions. max fournit le raisonnement le plus profond sans contrainte sur les dépenses en tokens et s'applique à la session actuelle uniquement, sauf lorsqu'il est défini via la variable d'environnement CLAUDE_CODE_EFFORT_LEVEL.

Choisir un niveau d'effort

Chaque niveau échange les dépenses en tokens contre la capacité. La valeur par défaut convient à la plupart des tâches de codage ; ajustez lorsque vous souhaitez un équilibre différent.

Niveau	Quand l'utiliser
`low`	Réservez aux tâches courtes, délimitées, sensibles à la latence qui ne sont pas sensibles à l'intelligence
`medium`	Réduit l'utilisation des tokens pour le travail sensible aux coûts qui peut faire des compromis sur l'intelligence
`high`	Équilibre l'utilisation des tokens et l'intelligence. Utilisez comme minimum pour le travail sensible à l'intelligence, ou pour réduire les dépenses en tokens par rapport à `xhigh`
`xhigh`	Meilleurs résultats pour la plupart des tâches de codage et d'agent. Défaut recommandé sur Opus 4.7
`max`	Peut améliorer les performances sur les tâches exigeantes mais peut montrer des rendements décroissants et est sujet à la surréflexion. Testez avant d'adopter largement

L'échelle d'effort est calibrée par modèle, donc le même nom de niveau ne représente pas la même valeur sous-jacente entre les modèles.

Utiliser ultrathink pour un raisonnement profond ponctuel

Incluez ultrathink n'importe où dans votre invite pour demander un raisonnement plus profond à ce tour sans modifier votre paramètre d'effort de session. Claude Code reconnaît le mot-clé et ajoute une instruction en contexte. Le niveau d'effort envoyé à l'API reste inchangé. D'autres phrases telles que « think », « think hard » et « think more » sont transmises comme du texte d'invite ordinaire et ne sont pas reconnues comme des mots-clés.

Définir le niveau d'effort

Vous pouvez modifier l'effort par l'une des méthodes suivantes :

/effort : exécutez /effort sans arguments pour ouvrir un curseur interactif, /effort suivi d'un nom de niveau pour le définir directement, ou /effort auto pour réinitialiser à la valeur par défaut du modèle
Dans /model : utilisez les touches fléchées gauche/droite pour ajuster le curseur d'effort lors de la sélection d'un modèle
Drapeau --effort : passez un nom de niveau pour le définir pour une seule session lors du lancement de Claude Code
Variable d'environnement : définissez CLAUDE_CODE_EFFORT_LEVEL sur un nom de niveau ou auto
Paramètres : définissez effortLevel dans votre fichier de paramètres
Frontmatter de skill et de subagent : définissez effort dans un fichier markdown de skill ou de subagent pour remplacer le niveau d'effort lorsque ce skill ou subagent s'exécute

La variable d'environnement prend la priorité sur toutes les autres méthodes, puis votre niveau configuré, puis la valeur par défaut du modèle. L'effort du frontmatter s'applique lorsque ce skill ou subagent est actif, remplaçant le niveau de session mais pas la variable d'environnement.

Le curseur d'effort apparaît dans /model lorsqu'un modèle pris en charge est sélectionné. Le niveau d'effort actuel est également affiché à côté du logo et du spinner, par exemple « with low effort », vous pouvez donc confirmer quel paramètre est actif sans ouvrir /model.

Raisonnement adaptatif et budgets de réflexion fixes

Le raisonnement adaptatif rend la réflexion optionnelle à chaque étape, donc Claude peut répondre plus rapidement aux invites de routine et réserver une réflexion plus profonde pour les étapes qui en bénéficient. Si vous souhaitez que Claude réfléchisse plus ou moins souvent que le niveau actuel ne le produit, vous pouvez le dire directement dans votre invite ou dans CLAUDE.md ; le modèle répond à cette orientation dans son paramètre d'effort.

Opus 4.7 utilise toujours le raisonnement adaptatif. Le mode de budget de réflexion fixe et CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING ne s'appliquent pas à lui.

Sur Opus 4.6 et Sonnet 4.6, vous pouvez définir CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 pour revenir au budget de réflexion fixe précédent contrôlé par MAX_THINKING_TOKENS. Voir variables d'environnement.

Réflexion étendue

La réflexion étendue est le raisonnement que Claude émet avant de répondre. Sur les modèles qui prennent en charge le raisonnement adaptatif, le niveau d'effort est le contrôle principal de la quantité de réflexion qui se produit ; les paramètres ci-dessous activent ou désactivent la réflexion et contrôlent son affichage.

Contrôle	Comment le définir
Basculer pour la session actuelle	Appuyez sur `Option+T` sur macOS ou `Alt+T` sur Windows et Linux
Définir la valeur par défaut globale	Exécutez `/config` et basculez le mode de réflexion. Enregistré en tant que `alwaysThinkingEnabled` dans `~/.claude/settings.json`
Désactiver indépendamment de l'effort	Définissez `MAX_THINKING_TOKENS=0`. D'autres valeurs s'appliquent uniquement avec un budget de réflexion fixe

La sortie de réflexion est réduite par défaut. Appuyez sur Ctrl+O pour basculer le mode verbeux et voir le raisonnement en tant que texte gris en italique. Les sessions interactives sur l'API Anthropic reçoivent des blocs de réflexion masqués par défaut, donc définissez showThinkingSummaries: true dans les paramètres si vous souhaitez que les résumés complets soient disponibles lorsque vous développez. Vous êtes facturé pour tous les tokens de réflexion générés, même lorsqu'ils sont réduits ou masqués.

Contexte étendu

Opus 4.7, Opus 4.6 et Sonnet 4.6 prennent en charge une fenêtre de contexte de 1 million de tokens pour les sessions longues avec de grandes bases de code.

La disponibilité varie selon le modèle et le plan. Sur les plans Max, Team et Enterprise, Opus est automatiquement mis à niveau vers un contexte 1M sans configuration supplémentaire. Cela s'applique aux sièges Team Standard et Team Premium.

Plan	Opus avec contexte 1M	Sonnet avec contexte 1M
Max, Team et Enterprise	Inclus dans l'abonnement	Nécessite une utilisation supplémentaire
Pro	Nécessite une utilisation supplémentaire	Nécessite une utilisation supplémentaire
API et paiement à l'utilisation	Accès complet	Accès complet

Pour désactiver complètement le contexte 1M, définissez CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Cela supprime les variantes de modèle 1M du sélecteur de modèle. Voir variables d'environnement.

La fenêtre de contexte 1M utilise la tarification standard du modèle sans prime pour les tokens au-delà de 200 K. Pour les plans où le contexte étendu est inclus dans votre abonnement, l'utilisation reste couverte par votre abonnement. Pour les plans qui accèdent au contexte étendu via une utilisation supplémentaire, les tokens sont facturés à l'utilisation supplémentaire.

Si votre compte prend en charge le contexte 1M, l'option apparaît dans le sélecteur de modèle (/model) dans les dernières versions de Claude Code. Si vous ne la voyez pas, essayez de redémarrer votre session.

Vous pouvez également utiliser le suffixe [1m] avec les alias de modèle ou les noms de modèle complets :

# Utiliser l'alias opus[1m] ou sonnet[1m]
/model opus[1m]
/model sonnet[1m]

# Ou ajouter [1m] à un nom de modèle complet
/model claude-opus-4-7[1m]

Vérifier votre modèle actuel

Vous pouvez voir quel modèle vous utilisez actuellement de plusieurs façons :

Dans la ligne d'état (si configurée)
Dans /status, qui affiche également vos informations de compte.

Ajouter une option de modèle personnalisé

Utilisez ANTHROPIC_CUSTOM_MODEL_OPTION pour ajouter une seule entrée personnalisée au sélecteur /model sans remplacer les alias intégrés. Ceci est utile pour tester les ID de modèle que Claude Code ne répertorie pas par défaut. Pour les déploiements de passerelle LLM, Claude Code peut remplir le sélecteur à partir du point de terminaison /v1/models de la passerelle lorsque CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 est défini, donc cette variable n'est nécessaire que lorsque la découverte est désactivée ou ne retourne pas le modèle que vous souhaitez. Voir Sélection du modèle de passerelle LLM.

Cet exemple définit les trois variables pour rendre un déploiement Opus acheminé par passerelle sélectionnable :

export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"

L'entrée personnalisée apparaît au bas du sélecteur /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME et ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION sont optionnels. S'ils sont omis, l'ID du modèle est utilisé comme nom et la description par défaut est Custom model (<model-id>).

Claude Code ignore la validation pour l'ID de modèle défini dans ANTHROPIC_CUSTOM_MODEL_OPTION, vous pouvez donc utiliser n'importe quelle chaîne que votre point de terminaison API accepte.

Variables d'environnement

Vous pouvez utiliser les variables d'environnement suivantes, qui doivent être des noms de modèle complets (ou équivalents pour votre fournisseur d'API), pour contrôler les noms de modèle auxquels les alias sont mappés.

Variable d'environnement	Description
`ANTHROPIC_DEFAULT_OPUS_MODEL`	Le modèle à utiliser pour `opus`, ou pour `opusplan` lorsque le mode Plan est actif.
`ANTHROPIC_DEFAULT_SONNET_MODEL`	Le modèle à utiliser pour `sonnet`, ou pour `opusplan` lorsque le mode Plan n'est pas actif.
`ANTHROPIC_DEFAULT_HAIKU_MODEL`	Le modèle à utiliser pour `haiku`, ou fonctionnalité d'arrière-plan
`CLAUDE_CODE_SUBAGENT_MODEL`	Le modèle à utiliser pour les subagents

Remarque : ANTHROPIC_SMALL_FAST_MODEL est déprécié au profit de ANTHROPIC_DEFAULT_HAIKU_MODEL.

Épingler les modèles pour les déploiements tiers

Lors du déploiement de Claude Code via Bedrock, Vertex AI ou Foundry, épinglez les versions de modèle avant de les déployer auprès des utilisateurs.

Sans épinglage, Claude Code utilise les alias de modèle (sonnet, opus, haiku) qui se résolvent à la dernière version. Lorsqu'Anthropic publie un nouveau modèle qui n'est pas encore activé dans le compte d'un utilisateur, les utilisateurs de Bedrock et Vertex AI voient un avis et reviennent à la version précédente pour cette session, tandis que les utilisateurs de Foundry voient des erreurs car Foundry n'a pas de vérification de démarrage équivalente.

Utilisez les variables d'environnement suivantes avec des ID de modèle spécifiques à la version pour votre fournisseur :

Fournisseur	Exemple
Bedrock	`export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-7'`
Vertex AI	`export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7'`
Foundry	`export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7'`

Appliquez le même modèle pour ANTHROPIC_DEFAULT_SONNET_MODEL et ANTHROPIC_DEFAULT_HAIKU_MODEL. Pour les ID de modèle actuels et hérités sur tous les fournisseurs, voir Aperçu des modèles. Pour mettre à niveau les utilisateurs vers une nouvelle version de modèle, mettez à jour ces variables d'environnement et redéployez.

Pour activer le contexte étendu pour un modèle épinglé, ajoutez [1m] à l'ID du modèle dans ANTHROPIC_DEFAULT_OPUS_MODEL ou ANTHROPIC_DEFAULT_SONNET_MODEL :

export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7[1m]'

Le suffixe [1m] applique la fenêtre de contexte 1M à toute utilisation de cet alias, y compris opusplan. Claude Code supprime le suffixe avant d'envoyer l'ID du modèle à votre fournisseur. N'ajoutez [1m] que lorsque le modèle sous-jacent prend en charge le contexte 1M, comme Opus 4.7 ou Sonnet 4.6.

Personnaliser l'affichage et les capacités du modèle épinglé

Lorsque vous épinglez un modèle sur un fournisseur tiers, l'ID spécifique au fournisseur apparaît tel quel dans le sélecteur /model et Claude Code peut ne pas reconnaître les fonctionnalités que le modèle prend en charge. Vous pouvez remplacer le nom d'affichage et déclarer les capacités avec des variables d'environnement complémentaires pour chaque modèle épinglé.

Ces variables prennent effet sur les fournisseurs tiers tels que Bedrock, Vertex AI et Foundry. Les variables _NAME et _DESCRIPTION prennent également effet lorsque ANTHROPIC_BASE_URL pointe vers une passerelle LLM. Elles n'ont aucun effet lors de la connexion directe à api.anthropic.com.

Variable d'environnement	Description
`ANTHROPIC_DEFAULT_OPUS_MODEL_NAME`	Nom d'affichage pour le modèle Opus épinglé dans le sélecteur `/model`. Par défaut, l'ID du modèle lorsqu'il n'est pas défini
`ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION`	Description d'affichage pour le modèle Opus épinglé dans le sélecteur `/model`. Par défaut, `Custom Opus model` lorsqu'il n'est pas défini
`ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES`	Liste séparée par des virgules des capacités que le modèle Opus épinglé prend en charge

Les mêmes suffixes _NAME, _DESCRIPTION et _SUPPORTED_CAPABILITIES sont disponibles pour ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL et ANTHROPIC_CUSTOM_MODEL_OPTION.

Claude Code active les fonctionnalités comme les niveaux d'effort et la réflexion étendue en faisant correspondre l'ID du modèle à des modèles connus. Les ID spécifiques au fournisseur tels que les ARN Bedrock ou les noms de déploiement personnalisés ne correspondent souvent pas à ces modèles, laissant les fonctionnalités prises en charge désactivées. Définissez _SUPPORTED_CAPABILITIES pour indiquer à Claude Code les fonctionnalités que le modèle prend réellement en charge :

Valeur de capacité	Active
`effort`	Niveaux d'effort et la commande `/effort`
`xhigh_effort`	{/* min-version: 2.1.111 */}Le niveau d'effort `xhigh`
`max_effort`	Le niveau d'effort `max`
`thinking`	Réflexion étendue
`adaptive_thinking`	Raisonnement adaptatif qui alloue dynamiquement la réflexion en fonction de la complexité de la tâche
`interleaved_thinking`	Réflexion entre les appels d'outils

Lorsque _SUPPORTED_CAPABILITIES est défini, les capacités listées sont activées et les capacités non listées sont désactivées pour le modèle épinglé correspondant. Lorsque la variable n'est pas définie, Claude Code revient à la détection intégrée basée sur l'ID du modèle.

Cet exemple épingle Opus à un ARN de modèle personnalisé Bedrock, définit un nom convivial et déclare ses capacités :

export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'

Remplacer les ID de modèle par version

Les variables d'environnement au niveau de la famille ci-dessus configurent un ID de modèle par alias de famille. Si vous devez mapper plusieurs versions au sein de la même famille à des ID de fournisseur distincts, utilisez plutôt le paramètre modelOverrides.

modelOverrides mappe les ID de modèle Anthropic individuels aux chaînes spécifiques au fournisseur que Claude Code envoie à l'API de votre fournisseur. Lorsqu'un utilisateur sélectionne un modèle mappé dans le sélecteur /model, Claude Code utilise votre valeur configurée au lieu de la valeur par défaut intégrée.

Cela permet aux administrateurs d'entreprise d'acheminer chaque version de modèle vers un ARN de profil d'inférence Bedrock spécifique, un nom de version Vertex AI ou un nom de déploiement Foundry pour la gouvernance, l'allocation des coûts ou l'acheminement régional.

Définissez modelOverrides dans votre fichier de paramètres :

{
  "modelOverrides": {
    "claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
    "claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
    "claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
  }
}

Les clés doivent être des ID de modèle Anthropic tels que listés dans l'Aperçu des modèles. Pour les ID de modèle datés, incluez le suffixe de date exactement tel qu'il apparaît là. Les clés inconnues sont ignorées.

Les remplacements remplacent les ID de modèle intégrés qui soutiennent chaque entrée dans le sélecteur /model. Sur Bedrock, les remplacements prennent la priorité sur tous les profils d'inférence que Claude Code découvre automatiquement au démarrage. Les valeurs que vous fournissez directement via ANTHROPIC_MODEL, --model ou les variables d'environnement ANTHROPIC_DEFAULT_*_MODEL sont transmises au fournisseur telles quelles et ne sont pas transformées par modelOverrides.

modelOverrides fonctionne aux côtés de availableModels. La liste d'autorisation est évaluée par rapport à l'ID de modèle Anthropic, et non à la valeur de remplacement, donc une entrée comme "opus" dans availableModels continue de correspondre même lorsque les versions d'Opus sont mappées à des ARN.

Configuration de la mise en cache des invites

Claude Code utilise automatiquement la mise en cache des invites pour optimiser les performances et réduire les coûts. Vous pouvez désactiver la mise en cache des invites globalement ou pour des niveaux de modèle spécifiques :

Variable d'environnement	Description
`DISABLE_PROMPT_CACHING`	Définissez sur `1` pour désactiver la mise en cache des invites pour tous les modèles (prend la priorité sur les paramètres par modèle)
`DISABLE_PROMPT_CACHING_HAIKU`	Définissez sur `1` pour désactiver la mise en cache des invites pour les modèles Haiku uniquement
`DISABLE_PROMPT_CACHING_SONNET`	Définissez sur `1` pour désactiver la mise en cache des invites pour les modèles Sonnet uniquement
`DISABLE_PROMPT_CACHING_OPUS`	Définissez sur `1` pour désactiver la mise en cache des invites pour les modèles Opus uniquement

Ces variables d'environnement vous donnent un contrôle granulaire sur le comportement de la mise en cache des invites. Le paramètre global DISABLE_PROMPT_CACHING prend la priorité sur les paramètres spécifiques au modèle, vous permettant de désactiver rapidement toute la mise en cache si nécessaire. Les paramètres par modèle sont utiles pour un contrôle sélectif, par exemple lors du débogage de modèles spécifiques ou du travail avec des fournisseurs cloud qui peuvent avoir des implémentations de mise en cache différentes.

model-config.md 2026-05-07 22:59 UTC to 2026-05-08 22:00 UTC

Configuration du modèle

Modèles disponibles

Alias de modèle

Définir votre modèle

Restreindre la sélection du modèle

Comportement du modèle par défaut

Contrôler le modèle sur lequel les utilisateurs s'exécutent

Comportement de fusion

ID de modèle Mantle

Comportement spécial du modèle

Paramètre de modèle `default`

Paramètre de modèle `opusplan`

Ajuster le niveau d'effort

Choisir un niveau d'effort

Utiliser ultrathink pour un raisonnement profond ponctuel

Définir le niveau d'effort

Raisonnement adaptatif et budgets de réflexion fixes

Réflexion étendue

Contexte étendu

Vérifier votre modèle actuel

Ajouter une option de modèle personnalisé

Variables d'environnement

Épingler les modèles pour les déploiements tiers

Personnaliser l'affichage et les capacités du modèle épinglé

Remplacer les ID de modèle par version

Configuration de la mise en cache des invites

model-config.md +4 −0

model-config.md 2026-05-07 22:59 UTC to 2026-05-08 22:00 UTC

Configuration du modèle

Modèles disponibles

Alias de modèle

Définir votre modèle

Restreindre la sélection du modèle

Comportement du modèle par défaut

Contrôler le modèle sur lequel les utilisateurs s'exécutent

Comportement de fusion

ID de modèle Mantle

Comportement spécial du modèle

Paramètre de modèle default

Paramètre de modèle opusplan

Ajuster le niveau d'effort

Choisir un niveau d'effort

Utiliser ultrathink pour un raisonnement profond ponctuel

Définir le niveau d'effort

Raisonnement adaptatif et budgets de réflexion fixes

Réflexion étendue

Contexte étendu

Vérifier votre modèle actuel

Ajouter une option de modèle personnalisé

Variables d'environnement

Épingler les modèles pour les déploiements tiers

Personnaliser l'affichage et les capacités du modèle épinglé

Remplacer les ID de modèle par version

Configuration de la mise en cache des invites

Paramètre de modèle `default`

Paramètre de modèle `opusplan`