Configuration du modèle
Découvrez la configuration du modèle Claude Code, y compris les alias de modèle comme
opusplan
Modèles disponibles
Pour le paramètre model dans Claude Code, vous pouvez configurer l'un des éléments suivants :
- Un alias de modèle
- Un nom de modèle
- API Anthropic : un nom de modèle complet
- Bedrock : un ARN de profil d'inférence
- Foundry : un nom de déploiement
- Vertex : un nom de version
ANTHROPIC_BASE_URL change l'endroit où les demandes sont envoyées, et non le modèle qui y répond. Pour acheminer Claude via une passerelle LLM, consultez la configuration de la passerelle LLM.
Alias de modèle
Les alias de modèle offrent un moyen pratique de sélectionner les paramètres du modèle sans avoir à mémoriser les numéros de version exacts :
| Alias de modèle | Comportement |
|---|---|
default |
Valeur spéciale qui efface tout remplacement de modèle et revient au modèle recommandé pour votre type de compte. N'est pas en soi un alias de modèle |
best |
Utilise Fable 5 où votre organisation y a accès, sinon le dernier modèle Opus |
fable |
Utilise Claude Fable 5 pour vos tâches les plus difficiles et les plus longues |
sonnet |
Utilise le dernier modèle Sonnet pour les tâches de codage quotidiennes |
opus |
Utilise le dernier modèle Opus pour les tâches de raisonnement complexe |
haiku |
Utilise le modèle Haiku rapide et efficace pour les tâches simples |
sonnet[1m] |
Utilise Sonnet avec une fenêtre de contexte de 1 million de tokens pour les sessions longues |
opus[1m] |
Utilise Opus avec une fenêtre de contexte de 1 million de tokens pour les sessions longues |
opusplan |
Mode spécial qui utilise opus pendant le mode plan, puis bascule vers sonnet pour l'exécution |
Sur l'API Anthropic, opus se résout en Opus 4.8 et sonnet se résout en Sonnet 4.6. Sur Claude Platform on AWS, opus se résout en Opus 4.7 et sonnet se résout en Sonnet 4.6. Sur Bedrock, Vertex et Foundry, opus se résout en Opus 4.6 et sonnet se résout en Sonnet 4.5 ; les modèles plus récents sont disponibles sur ces fournisseurs en sélectionnant le nom de modèle complet explicitement ou en définissant ANTHROPIC_DEFAULT_OPUS_MODEL ou ANTHROPIC_DEFAULT_SONNET_MODEL.
Les alias pointent vers la version recommandée pour votre fournisseur et se mettent à jour au fil du temps. Pour épingler une version spécifique, utilisez le nom de modèle complet (par exemple, claude-opus-4-8) ou définissez la variable d'environnement correspondante comme ANTHROPIC_DEFAULT_OPUS_MODEL.
Opus 4.8 nécessite Claude Code v2.1.154 ou version ultérieure. Exécutez claude update pour mettre à niveau.
Travailler avec Fable 5
Claude Fable 5 est le modèle le plus capable dans Claude Code, adapté aux tâches plus grandes qu'une seule séance. Il soutient les sessions autonomes longues, enquête avant d'agir et vérifie son travail plus souvent que les modèles plus petits.
Fable 5 n'est pas le modèle par défaut. Sélectionnez-le avec /model fable. Les demandes que ses classificateurs de sécurité signalent, le plus souvent dans les domaines de la cybersécurité et de la biologie, déclenchent un basculement automatique du modèle.
Pour tirer le meilleur parti de Fable 5 :
- Décrivez le résultat, pas les étapes : donnez-lui le résultat que vous voulez et laissez-le planifier le chemin. Pour le maintenir en fonctionnement jusqu'à ce que ce résultat soit atteint, définissez un objectif.
- Donnez-lui des problèmes ambigus : les enquêtes sur les causes profondes, le débogage des pannes et les décisions architecturales sont les endroits où l'enquête et la vérification supplémentaires sont payantes.
- Ignorez les rappels de vérification : il vérifie son propre travail avec moins d'invites, donc les rappels de tester ou de vérifier sont généralement inutiles.
- Dimensionnez les tâches plus grandes : donnez-lui du travail que vous diviseriez normalement en morceaux. Il maintient les sessions longues sans perdre le fil.
Fable 5 nécessite Claude Code v2.1.170 ou version ultérieure. Les versions antérieures n'affichent pas Fable 5 dans le sélecteur de modèle et ne peuvent pas le sélectionner. Exécutez claude update pour mettre à niveau. Fable 5 n'est pas disponible sous rétention de données zéro, où le sélecteur /model l'omet ou l'affiche désactivé.
Définir votre modèle
Vous pouvez configurer votre modèle de plusieurs façons, énumérées par ordre de priorité :
- Pendant la session - Utilisez
/model <alias|name>pour basculer immédiatement, ou exécutez/modelsans argument pour ouvrir le sélecteur. Le sélecteur demande une confirmation lorsque la conversation a une sortie antérieure, car la réponse suivante relit l'historique complet sans contexte en cache - Au démarrage - Lancez avec
claude --model <alias|name> - Variable d'environnement - Définissez
ANTHROPIC_MODEL=<alias|name> - Paramètres - Configurez de manière permanente dans votre fichier de paramètres en utilisant le champ
model.
À partir de la v2.1.153, /model enregistre votre choix comme valeur par défaut pour les nouvelles sessions en écrivant le champ model dans vos paramètres utilisateur. Dans le sélecteur :
Enter: basculer le modèle et enregistrer comme valeur par défauts: basculer le modèle pour cette session uniquement
Taper /model <name> directement se comporte comme Enter. Les paramètres du projet et gérés ont toujours la priorité et se réappliquent au prochain lancement.
Dans les versions v2.1.144 à v2.1.152, /model s'appliquait uniquement à la session actuelle et d dans le sélecteur enregistrait une valeur par défaut.
L'indicateur --model et la variable d'environnement ANTHROPIC_MODEL s'appliquent uniquement à la session que vous lancez avec eux. Pour exécuter différents modèles dans différents terminaux en même temps, lancez chacun avec son propre indicateur --model plutôt que de basculer avec /model.
Les sessions reprises démarrées avec claude --resume, --continue, ou le sélecteur /resume conservent le modèle qu'elles utilisaient lorsque la transcription a été enregistrée, indépendamment du paramètre model actuel. Si ce modèle a été retiré ou est exclu par availableModels, la session revient à l'ordre de priorité normal. Cela empêche le choix /model d'une autre session de modifier le modèle à la reprise.
Lorsque le modèle actif au démarrage provient des paramètres du projet ou gérés plutôt que de votre propre sélection, l'en-tête de démarrage indique quel fichier de paramètres l'a défini. Exécutez /model pour remplacer ; le paramètre du projet ou géré se réapplique au prochain lancement.
Lorsque le modèle demandé a une date de retrait programmée ou est automatiquement remappé à une version plus récente, Claude Code affiche un avertissement qui nomme le modèle demandé. Les sessions interactives l'affichent comme un avis de démarrage. À partir de la v2.1.182, le même avertissement est écrit dans stderr en mode non interactif lors de l'utilisation du format de sortie texte par défaut. La vérification couvre également un model défini dans frontmatter de sous-agent. L'avertissement stderr est supprimé pour --output-format json et stream-json ; lisez le modèle réel à partir du champ modelUsage du message de résultat à la place.
Exemple d'utilisation :
# Démarrer avec Opus
claude --model opus
# Basculer vers Sonnet pendant la session
/model sonnet
Exemple de fichier de paramètres :
{
"permissions": {
...
},
"model": "opus"
}
Restreindre la sélection du modèle
Les administrateurs d'entreprise peuvent utiliser availableModels dans les paramètres gérés ou de politique pour restreindre les modèles que les utilisateurs peuvent sélectionner. Les entrées correspondent à une famille de modèles telle que sonnet, un préfixe de version tel que claude-sonnet-4-5, ou un ID de modèle complet tel que claude-sonnet-4-5-20250929.
Lorsque availableModels est défini, la liste d'autorisation s'applique à chaque surface où un utilisateur peut nommer un modèle :
- Modèle de session principale :
/model, le drapeau--model, la variable d'environnementANTHROPIC_MODEL, le paramètremodel, et le modèle restauré lors de la reprise d'une session - Résolution d'alias : {/* min-version: 2.1.176 */}les variables d'environnement
ANTHROPIC_DEFAULT_OPUS_MODEL,ANTHROPIC_DEFAULT_SONNET_MODEL,ANTHROPIC_DEFAULT_HAIKU_MODEL, etANTHROPIC_DEFAULT_FABLE_MODELne peuvent pas rediriger un alias autorisé vers un modèle en dehors de la liste - Mode rapide : {/* min-version: 2.1.176 */}
/fastrefuse de basculer lorsque cela changerait implicitement vers un modèle Opus en dehors de la liste, avec le message « is not in your organization's allowed models » - Modèles de sous-agent : le champ
modeldans le frontmatter du sous-agent, le paramètremodelde l'outil Agent, le sélecteur de modèle dans/agents, etCLAUDE_CODE_SUBAGENT_MODEL - Modèles de compétence et de commande : le frontmatter
modeldans les compétences et commandes - Modèle de conseiller : le paramètre
advisorModelconfiguré et le drapeau--advisor - Modèle d'agent d'arrière-plan : le modèle sélectionné dans le sélecteur de dispatch
Le basculement vers un modèle bloqué avec /model est rejeté avec une erreur, tandis qu'un drapeau --model bloqué, une valeur ANTHROPIC_MODEL, ou une valeur de paramètre model est remplacée au démarrage par un avertissement nommant à la fois les modèles demandés et substitués, et la session démarre sur le modèle par défaut. Un remplacement de sous-agent, de compétence ou de commande bloqué revient au modèle hérité ou par défaut plutôt que d'échouer la demande ; un paramètre advisorModel bloqué désactive le conseiller pour la session, tandis qu'une valeur de drapeau --advisor bloquée quitte avec une erreur au lancement. Les modèles exclus sont masqués du sélecteur /model.
Les changements de modèle automatiques sont vérifiés de la même manière : les éléments d'une chaîne de modèle de secours en dehors de la liste d'autorisation sont supprimés, une mise à niveau en mode plan telle que opusplan vers un modèle exclu est ignorée afin que la planification continue sur le modèle de la session, et un repli automatique de modèle dont la cible est exclue ne s'exécute pas, de sorte que la demande signalée se termine par un refus. L'activation du mode rapide est refusée lorsque le modèle sur lequel la session s'exécuterait ensuite est en dehors de la liste d'autorisation.
{
"availableModels": ["sonnet", "haiku"]
}
Couverture de surface
Chaque surface applique la liste d'autorisation qu'elle reçoit. Le mécanisme de livraison qui atteint chaque surface diffère :
| Mécanisme de livraison | CLI et IDE | Sessions locales de bureau | Sessions web, mobile et cloud | Agent SDK et non-interactif | Cowork |
|---|---|---|---|---|---|
| Paramètres gérés par le serveur depuis la console d'administration | Appliqué | Appliqué | Appliqué | Appliqué | Non livré |
| Fichiers de paramètres gérés ou MDM | Appliqué | Appliqué | Non livré | Appliqué | Appliqué où déployé |
- Les sessions cloud, sur Claude Code sur le web ou dans l'application de bureau, s'exécutent sur des machines virtuelles gérées par Anthropic : les paramètres déployés sur votre appareil ne les atteignent pas, donc livrez la liste d'autorisation via les paramètres gérés par le serveur. Un changement de modèle en milieu de session dans une session cloud est rejeté lorsque le modèle demandé est exclu par la liste d'autorisation. Le rejet côté serveur à la création de session s'applique aux restrictions de modèle d'organisation, pas à la clé de paramètres
availableModels. - Cowork, l'onglet de travail agentique dans l'application Claude Desktop, n'est pas une surface Claude Code et ne reçoit pas les paramètres gérés par le serveur par conception. Un fichier de paramètres gérés s'applique aux sessions Cowork lorsqu'il est présent où la session s'exécute ; les sessions Cowork distantes s'exécutent sur des machines virtuelles gérées par Anthropic, où un fichier déployé sur l'appareil n'est pas présent.
- Les sessions sur les fournisseurs tiers tels que Bedrock, Vertex AI, Foundry, et Claude Platform sur AWS ne reçoivent pas les paramètres gérés par le serveur, donc livrez la liste d'autorisation via MDM ou des fichiers de paramètres gérés là-bas.
- La livraison gérée par le serveur nécessite également que la session s'authentifie avec une connexion d'organisation ou une clé API directement configurée. Les flottes qui génèrent des clés uniquement via un script
apiKeyHelperdoivent livrer la liste d'autorisation via MDM ou des fichiers de paramètres gérés. - L'onglet Code de bureau héberge également les sessions SSH, qui lisent le fichier de paramètres gérés depuis l'hôte distant sur lequel elles s'exécutent. Voir Paramètres gérés de bureau.
- Les sélecteurs de modèle sur claude.ai et dans l'application de bureau masquent ou grisent les modèles exclus par la liste d'autorisation de votre organisation. L'état du sélecteur est une commodité pour les utilisateurs ; l'application se fait dans la session.
Comportement du modèle par défaut
L'option Par défaut dans le sélecteur de modèle n'est pas affectée par availableModels sauf si enforceAvailableModels est également défini. En soi, availableModels laisse Par défaut disponible, se résolvant au système par défaut d'exécution basé sur le niveau d'abonnement de l'utilisateur. Si la valeur par défaut du niveau est un modèle que vous avez l'intention de restreindre, définissez également enforceAvailableModels.
Un tableau availableModels vide n'engage jamais l'application du modèle par défaut : avec availableModels: [], les sélections de modèle nommées sont bloquées mais le modèle Par défaut pour le type de compte reste utilisable indépendamment de enforceAvailableModels.
Appliquer la liste d'autorisation au modèle par défaut
Définissez enforceAvailableModels: true aux côtés d'une liste availableModels non vide dans les paramètres gérés pour étendre la liste d'autorisation à l'option Par défaut. Cela nécessite Claude Code v2.1.175 ou ultérieur.
{
"availableModels": ["sonnet", "haiku"],
"enforceAvailableModels": true
}
Lorsque le modèle par défaut pour le type de compte de l'utilisateur n'est pas dans la liste d'autorisation, l'option Par défaut se résout à la première entrée availableModels qui nomme un modèle autorisé et disponible, et la ligne Par défaut du sélecteur /model affiche ce modèle. Cela s'applique partout où la valeur par défaut est atteinte : démarrage de session, sélection de Par défaut dans /model, le mot-clé "default" dans les chaînes de modèle de secours, et le repli utilisé lorsqu'une sélection exclue est supprimée.
enforceAvailableModels n'a aucun effet lorsque availableModels n'est pas défini ou vide : avec availableModels: [], le modèle Par défaut pour le type de compte reste utilisable, de sorte que le paramètre ne peut pas verrouiller les utilisateurs hors de chaque modèle. Lorsque availableModels est non vide mais qu'aucune entrée ne se résout à un modèle autorisé et disponible, l'application se dégrade et Par défaut revient à la valeur par défaut du type de compte, avec un avertissement visible uniquement sous --debug. Conservez au moins une entrée garantie disponible dans la liste pour éviter cela.
Déployez les deux clés dans la source gérée de plus haute priorité : les sources gérées déployées par l'administrateur ne fusionnent pas, de sorte qu'une paire placée dans un fichier de paramètres gérés est ignorée lorsque la console d'administration livre des paramètres.
Contrôler le modèle sur lequel les utilisateurs s'exécutent
Le paramètre model est une sélection initiale, pas une application. Il définit quel modèle est actif au démarrage d'une session, mais les utilisateurs peuvent toujours ouvrir /model et choisir Par défaut, qui se résout au système par défaut pour leur niveau indépendamment de ce que model est défini, sauf si enforceAvailableModels le redirige.
Pour contrôler complètement l'expérience du modèle, combinez ces paramètres :
availableModels: restreint les modèles nommés vers lesquels les utilisateurs peuvent basculerenforceAvailableModels: étend la liste d'autorisationavailableModelsà l'option Par défaut, de sorte que Par défaut ne peut pas se résoudre à un modèle en dehors de la listemodel: définit la sélection de modèle initiale au démarrage d'une sessionANTHROPIC_DEFAULT_SONNET_MODEL/ANTHROPIC_DEFAULT_OPUS_MODEL/ANTHROPIC_DEFAULT_HAIKU_MODEL/ANTHROPIC_DEFAULT_FABLE_MODEL: contrôlent ce vers quoi l'option Par défaut et les aliassonnet,opus,haikuetfablese résolvent
Cet exemple démarre les utilisateurs sur Sonnet 4.5, limite le sélecteur à Sonnet et Haiku, et garantit que Par défaut se résout à un modèle sur la liste d'autorisation plutôt qu'à la valeur par défaut du niveau :
{
"model": "claude-sonnet-4-5",
"availableModels": ["claude-sonnet-4-5", "haiku"],
"enforceAvailableModels": true,
"env": {
"ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
}
}
Sans enforceAvailableModels ou le bloc env, un utilisateur qui sélectionne Par défaut dans le sélecteur obtiendrait la dernière version pour son niveau, contournant l'épinglage de version dans model et availableModels. Les deux paramètres couvrent des portées différentes : enforceAvailableModels fait que Par défaut obéit à la liste d'autorisation, tandis que le bloc env épingle la version à laquelle un alias autorisé tel que sonnet se résout. Utilisez enforceAvailableModels seul lorsque restreindre les familles de modèles est suffisant ; ajoutez le bloc env lorsque vous devez également épingler une version spécifique.
Comportement de fusion
Lorsque la source de paramètres gérés de plus haute priorité définit availableModels, cette liste seule s'applique : les entrées dans les paramètres utilisateur, projet ou local ne peuvent pas l'étendre, et les sources gérées déployées par l'administrateur ne fusionnent pas les unes avec les autres, de sorte qu'une liste déployée dans un fichier de paramètres gérés est ignorée lorsque les paramètres gérés par le serveur livrent des clés. Sinon, les listes des paramètres utilisateur, projet et local sont concaténées et dédupliquées comme d'autres paramètres de tableau. {/* min-version: 2.1.175 */}À partir de Claude Code v2.1.175, la liste gérée remplace les entrées de priorité inférieure ; les versions antérieures les fusionnent.
Dans la liste effective, une entrée nommant un modèle spécifique dans une famille, qu'il s'agisse d'un préfixe de version ou d'un ID de modèle complet, désactive l'entrée générique de cette famille : ["sonnet", "claude-sonnet-4-5"] permet uniquement les versions Sonnet 4.5, pas tous les modèles Sonnet.
ID de modèle Mantle
Lorsque le point de terminaison Bedrock Mantle est activé, les entrées dans availableModels qui commencent par anthropic. sont ajoutées au sélecteur /model en tant qu'options personnalisées et acheminées vers le point de terminaison Mantle. Ceci est une exception à la correspondance d'alias décrite dans Épingler les modèles pour les déploiements tiers. Le paramètre restreint toujours le sélecteur aux entrées listées, et un ID Mantle intègre un nom de famille, de sorte qu'il compte comme une entrée spécifique et désactive la générique de cette famille : aux côtés de tous les ID Mantle, listez les préfixes de version ou les ID complets que vous voulez garder sélectionnables. Voir Comportement de fusion.
Restrictions de modèle d'organisation
Utilisez le bouton bascule de la Console au lieu de availableModels lorsque vos membres s'authentifient via l'API Anthropic et que vous voulez un commutateur à l'échelle de l'organisation sans déployer de fichiers de paramètres. Les administrateurs d'organisation restreignent les modèles que les membres peuvent exécuter en désactivant les modèles individuels dans la Console Claude. Cette restriction est livrée avec les droits du compte lorsque Claude Code s'authentifie, séparée de toute liste availableModels dans les paramètres, et le serveur applique la même restriction indépendamment lorsqu'une session est créée. Nécessite Claude Code v2.1.187 ou ultérieur.
Un modèle restreint est masqué du sélecteur /model. Le sélectionner par nom avec --model, la variable d'environnement ANTHROPIC_MODEL, ou le paramètre model affiche l'avis Model "<name>" is restricted by your organization's settings. Using <model> instead. et la session démarre sur un modèle autorisé. Taper /model <name> pour un modèle restreint est rejeté avec Model '<name>' is restricted by your organization's settings. Run /model to choose a different model. et la session conserve son modèle actuel.
Les deux mécanismes se composent : un modèle est sélectionnable uniquement lorsqu'il est autorisé par availableModels et non restreint par l'organisation. Les restrictions d'organisation sont livrées aux sessions sur l'API Anthropic et les déploiements de passerelle LLM. Les sessions sur Bedrock, Vertex AI, Foundry, et Claude Platform sur AWS ne les reçoivent pas, de sorte qu'utilisez availableModels sur ces fournisseurs à la place.
Comportement spécial du modèle
Paramètre de modèle `default`
Le comportement de default dépend de votre type de compte :
- Max, Team Premium, Enterprise pay-as-you-go, et API Anthropic : par défaut Opus 4.8
- Claude Platform sur AWS : par défaut Opus 4.7
- Pro, Team Standard, et sièges d'abonnement Enterprise : par défaut Sonnet 4.6
- Bedrock, Vertex, et Foundry : par défaut Sonnet 4.5
Enterprise pay-as-you-go signifie une organisation Enterprise facturée à l'utilisation plutôt que par siège d'abonnement.
Lorsque les paramètres gérés appliquent la liste d'autorisation pour le modèle par défaut et que le modèle par défaut du type de compte n'est pas dans availableModels, default se résout vers le modèle par défaut appliqué au lieu du modèle par défaut du type de compte ci-dessus.
Fable 5 n'est le modèle par défaut sur aucun type de compte. Les sessions utilisent Fable 5 uniquement après que vous l'ayez choisi, avec /model fable, un paramètre model, ou l'alias best où Fable 5 est disponible. Le choisir avec /model l'enregistre comme modèle sélectionné dans vos paramètres utilisateur, de sorte que les sessions ultérieures commencent sur Fable 5 jusqu'à ce que vous changiez de modèles.
Paramètre de modèle `opusplan`
L'alias de modèle opusplan fournit une approche hybride automatisée :
- En mode plan - Utilise
opuspour le raisonnement complexe et les décisions architecturales - En mode exécution - Bascule automatiquement vers
sonnetpour la génération de code et l'implémentation
Cela vous donne le meilleur des deux mondes : le raisonnement supérieur d'Opus pour la planification et l'efficacité de Sonnet pour l'exécution.
La phase Opus en mode plan utilise la même fenêtre de contexte que le paramètre de modèle opus. Sur les niveaux d'abonnement où Opus est automatiquement mis à niveau vers un contexte 1M, opusplan reçoit la mise à niveau en mode plan également. Pour forcer un contexte 1M pour les deux phases lorsque vous n'êtes pas sur un niveau de mise à niveau automatique, définissez le modèle sur opusplan[1m].
Lorsque availableModels exclut Opus, opusplan reste sur Sonnet en mode plan au lieu de basculer. De même, une session Haiku qui se mettrait normalement à niveau vers Sonnet en mode plan reste sur Haiku lorsque Sonnet est exclu.
Pour une approche hybride où Claude décide en cours de tâche quand consulter un deuxième modèle plutôt que de basculer à la limite du plan, voir l'outil advisor.
Chaînes de modèles de secours
Lorsque le modèle principal est surchargé, indisponible ou retourne une autre erreur serveur non renouvelable, Claude Code peut basculer vers un modèle de secours au lieu d'échouer la demande. Les erreurs d'authentification, de facturation, de limite de débit, de taille de demande et de transport ne déclenchent jamais un basculement ; celles-ci suivent leur gestion normale des tentatives et des erreurs.
Configurez un ou plusieurs modèles de secours et Claude Code les essaie dans l'ordre, affichant un avis lors du basculement. Le basculement dure uniquement pour le tour actuel, de sorte que votre message suivant essaie d'abord le modèle principal à nouveau. Les chaînes sont limitées à trois modèles après suppression des doublons, et les entrées supplémentaires sont ignorées.
Définissez une chaîne pour une session avec le drapeau --fallback-model, qui accepte une liste séparée par des virgules :
claude --fallback-model sonnet,haiku
Pour persister une chaîne entre les sessions, définissez fallbackModel dans paramètres comme un tableau :
{
"fallbackModel": ["claude-sonnet-4-6", "claude-haiku-4-5"]
}
Le drapeau --fallback-model prend la priorité sur le paramètre fallbackModel. Chaque élément accepte un nom de modèle ou un alias, et "default" se développe vers le modèle par défaut.
Deux cas entraînent le saut d'un élément :
- Modèle indisponible : un modèle qui ne peut pas être atteint, comme un modèle retiré épinglé dans les paramètres, est ignoré et Claude Code continue vers l'élément suivant.
- En dehors de la liste d'autorisation : un élément non autorisé par
availableModelsest supprimé lors de la lecture de la chaîne et n'est jamais essayé.
Basculement automatique du modèle
Cette section couvre le basculement basé sur le contenu de Fable 5. Pour le basculement basé sur la disponibilité lorsqu'un modèle est surchargé ou indisponible, voir Chaînes de modèles de secours.
Fable 5 s'exécute avec des classificateurs de sécurité pour le contenu de cybersécurité et de biologie. Lorsqu'un classificateur signale une demande, Claude Code réexécute cette demande sur le modèle Opus par défaut et affiche un avis dans la transcription : Opus 4.8 sur l'API Anthropic et les déploiements de passerelle LLM, ou Opus 4.7 sur Claude Platform sur AWS.
La session continue ensuite sur ce modèle Opus. Pour revenir à Fable 5, exécutez /model fable.
La cible de basculement est vérifiée par rapport à availableModels. Lorsqu'elle est bloquée, aucun basculement ne se produit. Le refus apparaît comme une erreur normale et le modèle de la session reste inchangé.
Vérifier ce qui a déclenché le basculement
Le basculement peut se déclencher sur la première demande d'une session, avant que vous n'envoyiez quelque chose d'inhabituel, car la première demande porte le contexte de l'espace de travail tel que votre contenu CLAUDE.md et l'état git. Un référentiel qui contient du matériel de sécurité ou de biologie peut déclencher le classificateur sur ce contexte seul.
Pour vérifier si les personnalisations sont le déclencheur, démarrez une session avec claude --safe-mode, qui désactive les personnalisations telles que CLAUDE.md, les skills, les serveurs MCP et les hooks. L'état git et les noms de répertoires ne sont pas des personnalisations et sont toujours inclus.
Demander avant de basculer
Pour décider ce qui se passe chaque fois qu'une demande est signalée, plutôt que de basculer automatiquement, exécutez /config et désactivez « switch models when a message is flagged ». Une demande signalée met alors la session en pause avec deux options : basculer vers le modèle Opus, ou modifier l'invite et réessayer sur Fable 5.
Certains cas se comportent différemment :
- Si les deux modèles signalent la même demande, vous pouvez modifier l'invite et réessayer, ou démarrer une nouvelle session.
- Sur les sessions mobiles Claude Code sur le web, la modification et la nouvelle tentative ne sont pas prises en charge. Basculez les modèles, ou continuez la session à partir d'un navigateur de bureau ou de l'application de bureau.
- En mode non interactif et les intégrations SDK qui ne peuvent pas afficher l'invite, une demande signalée termine le tour avec un refus à la place.
- Lorsque la cible de basculement est bloquée par
availableModels, l'invite n'est pas affichée. La demande signalée se termine par le refus, de la même manière que le basculement automatique lorsque la cible est bloquée.
Activer le basculement sur Bedrock, Vertex AI et Foundry
Sur Amazon Bedrock, Google Vertex AI et Microsoft Foundry, les ID de modèle sont spécifiques au fournisseur, de sorte que le basculement automatique ne fonctionne que lorsque Claude Code peut identifier les deux modèles impliqués :
- Claude Code doit reconnaître le modèle actuel comme Fable 5 : l'ID de modèle contient
claude-fable-5, correspond à la valeur deANTHROPIC_DEFAULT_FABLE_MODEL, ou est mappé avecmodelOverrides. - La cible de basculement doit se résoudre en un modèle Opus : la valeur de
ANTHROPIC_DEFAULT_OPUS_MODELsi définie, sinon une entrée Opus 4.8 dans la liste des modèles du fournisseur.
Si l'un ou l'autre modèle ne peut pas être identifié, Claude Code ne bascule pas automatiquement. La demande signalée se termine par un message de refus, et vous pouvez basculer les modèles avec /model et réessayer. Pour activer le basculement automatique sur ces fournisseurs, définissez ANTHROPIC_DEFAULT_FABLE_MODEL sur votre ID de modèle Fable 5 et ANTHROPIC_DEFAULT_OPUS_MODEL sur votre ID de modèle Opus 4.8.
Charges de travail de recherche en sécurité et de biologie
Les charges de travail en sécurité offensive ou en biologie, y compris les tests de pénétration, les exercices Capture the Flag (CTF) et les bases de code adjacentes à la biologie, déclenchent fréquemment le basculement, souvent sur la première demande. Pour un travail de biologie substantiel, attendez-vous à ce que presque toutes les demandes soient réacheminées.
C'est le routage attendu pour ces domaines, pas un drapeau de compte. Si votre organisation a besoin de la capacité de classe Fable pour ce travail, demandez à votre équipe de compte Anthropic les programmes d'accès de confiance.
Ajuster le niveau d'effort
Les niveaux d'effort contrôlent le raisonnement adaptatif, qui permet au modèle de décider si et combien réfléchir à chaque étape en fonction de la complexité de la tâche. Un effort inférieur est plus rapide et moins cher pour les tâches simples, tandis qu'un effort supérieur fournit un raisonnement plus profond pour les problèmes complexes.
Les niveaux d'effort disponibles dépendent du modèle. Les modèles non listés ici ne prennent pas en charge l'effort :
| Modèle | Niveaux |
|---|---|
| Fable 5 | low, medium, high, xhigh, max |
| Opus 4.8 et Opus 4.7 | low, medium, high, xhigh, max |
| Opus 4.6 et Sonnet 4.6 | low, medium, high, max |
Si vous définissez un niveau que le modèle actif ne prend pas en charge, Claude Code revient au niveau le plus élevé pris en charge au niveau ou en dessous de celui que vous avez défini. Par exemple, xhigh s'exécute comme high sur Opus 4.6.
L'effort par défaut est high sur Fable 5, Opus 4.8, Opus 4.6 et Sonnet 4.6, et xhigh sur Opus 4.7.
Lorsque vous exécutez Fable 5, Opus 4.8 ou Opus 4.7 pour la première fois, Claude Code applique l'effort par défaut de ce modèle même si vous aviez précédemment défini un niveau différent pour un autre modèle : high sur Fable 5 et Opus 4.8, et xhigh sur Opus 4.7. Exécutez /effort à nouveau pour choisir un niveau différent après le changement.
low, medium, high et xhigh persistent entre les sessions. max fournit le raisonnement le plus profond sans contrainte sur les dépenses en tokens et s'applique à la session actuelle uniquement, sauf lorsqu'il est défini via la variable d'environnement CLAUDE_CODE_EFFORT_LEVEL.
Le menu /effort offre également ultracode. Ultracode est un paramètre de Claude Code plutôt qu'un niveau d'effort du modèle : il envoie xhigh au modèle et a également Claude orchestrer les flux de travail dynamiques pour les tâches substantielles. Il s'applique à la session actuelle uniquement. Définissez-le via /effort, ou passez "ultracode": true via --settings ou une demande de contrôle du SDK Agent. Il ne fait pas partie du paramètre effortLevel, du drapeau --effort ou de CLAUDE_CODE_EFFORT_LEVEL.
Choisir un niveau d'effort
Chaque niveau échange les dépenses en tokens contre la capacité. La valeur par défaut convient à la plupart des tâches de codage ; ajustez lorsque vous souhaitez un équilibre différent.
| Niveau | Quand l'utiliser |
|---|---|
low |
Réservez aux tâches courtes, délimitées, sensibles à la latence qui ne sont pas sensibles à l'intelligence |
medium |
Réduit l'utilisation des tokens pour le travail sensible aux coûts qui peut faire des compromis sur l'intelligence |
high |
Équilibre l'utilisation des tokens et l'intelligence. Par défaut sur Fable 5, Opus 4.8, Opus 4.6 et Sonnet 4.6 |
xhigh |
Raisonnement plus profond avec dépenses en tokens plus élevées. Par défaut sur Opus 4.7 |
max |
Peut améliorer les performances sur les tâches exigeantes mais peut montrer des rendements décroissants et est sujet à la surréflexion. Testez avant d'adopter largement |
ultracode |
Un paramètre de Claude Code qui planifie un flux de travail dynamique pour chaque tâche substantielle avec un raisonnement xhigh par message. Session uniquement |
L'échelle d'effort est calibrée par modèle, donc le même nom de niveau ne représente pas la même valeur sous-jacente entre les modèles.
Utiliser ultrathink pour un raisonnement profond ponctuel
Incluez ultrathink n'importe où dans votre invite pour demander un raisonnement plus profond à ce tour sans modifier votre paramètre d'effort de session. Claude Code reconnaît le mot-clé et ajoute une instruction en contexte. Le niveau d'effort envoyé à l'API reste inchangé. D'autres phrases telles que « think », « think hard » et « think more » sont transmises comme du texte d'invite ordinaire et ne sont pas reconnues comme des mots-clés.
Définir le niveau d'effort
Vous pouvez modifier l'effort par l'une des méthodes suivantes :
/effort: exécutez/effortsans arguments pour ouvrir un curseur interactif,/effortsuivi d'un nom de niveau pour le définir directement, ou/effort autopour réinitialiser à la valeur par défaut du modèle- Dans
/model: utilisez les touches fléchées gauche/droite pour ajuster le curseur d'effort lors de la sélection d'un modèle - Drapeau
--effort: passez un nom de niveau pour le définir pour une seule session lors du lancement de Claude Code - Variable d'environnement : définissez
CLAUDE_CODE_EFFORT_LEVELsur un nom de niveau ouauto - Paramètres : définissez
effortLevelsurlow,medium,highouxhighdans votre fichier de paramètres.maxetultracodesont session uniquement et ne sont pas acceptés ici - Frontmatter de skill et de subagent : définissez
effortdans un fichier markdown de skill ou de subagent pour remplacer le niveau d'effort lorsque ce skill ou subagent s'exécute
La variable d'environnement prend la priorité sur toutes les autres méthodes, puis votre niveau configuré, puis la valeur par défaut du modèle. L'effort du frontmatter s'applique lorsque ce skill ou subagent est actif, remplaçant le niveau de session mais pas la variable d'environnement.
Le curseur d'effort apparaît dans /model lorsqu'un modèle pris en charge est sélectionné. Le niveau d'effort actuel est également affiché à côté du logo et du spinner, par exemple « with low effort », vous pouvez donc confirmer quel paramètre est actif sans ouvrir /model.
Raisonnement adaptatif et budgets de réflexion fixes
Le raisonnement adaptatif rend la réflexion optionnelle à chaque étape, donc Claude peut répondre plus rapidement aux invites de routine et réserver une réflexion plus profonde pour les étapes qui en bénéficient. Si vous souhaitez que Claude réfléchisse plus ou moins souvent que le niveau actuel ne le produit, vous pouvez le dire directement dans votre invite ou dans CLAUDE.md ; le modèle répond à cette orientation dans son paramètre d'effort.
Opus 4.7 et versions ultérieures utilisent toujours le raisonnement adaptatif, tout comme Fable 5. Le mode de budget de réflexion fixe et CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING ne s'appliquent pas à eux.
Sur Opus 4.6 et Sonnet 4.6, vous pouvez définir CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 pour revenir au budget de réflexion fixe précédent contrôlé par MAX_THINKING_TOKENS. Voir variables d'environnement.
Réflexion étendue
La réflexion étendue est le raisonnement que Claude émet avant de répondre. Sur les modèles qui prennent en charge le raisonnement adaptatif, le niveau d'effort est le contrôle principal de la quantité de réflexion qui se produit ; les paramètres ci-dessous activent ou désactivent la réflexion et contrôlent son affichage.
| Contrôle | Comment le définir |
|---|---|
| Basculer pour la session actuelle | Appuyez sur Option+T sur macOS ou Alt+T sur Windows et Linux |
| Définir la valeur par défaut globale | Exécutez /config et basculez le mode de réflexion. Enregistré en tant que alwaysThinkingEnabled dans ~/.claude/settings.json |
| Désactiver indépendamment de l'effort | Définissez MAX_THINKING_TOKENS=0, qui désactive la réflexion sur l'API Anthropic sauf sur Fable 5. Sur les fournisseurs tiers cela omet le paramètre thinking à la place, et les modèles de raisonnement adaptatif peuvent toujours réfléchir. D'autres valeurs s'appliquent uniquement avec un budget de réflexion fixe |
La réflexion ne peut pas être désactivée sur Fable 5. Le basculement de session, alwaysThinkingEnabled et MAX_THINKING_TOKENS=0 n'ont aucun effet là, et Fable 5 décide à chaque étape combien réfléchir en fonction du niveau d'effort.
La sortie de réflexion est réduite par défaut. Appuyez sur Ctrl+O pour basculer le mode verbeux et voir le raisonnement en tant que texte gris en italique. Les sessions interactives sur l'API Anthropic reçoivent des blocs de réflexion masqués par défaut, donc définissez showThinkingSummaries: true dans les paramètres si vous souhaitez que les résumés complets soient disponibles lorsque vous développez. Vous êtes facturé pour tous les tokens de réflexion générés, même lorsqu'ils sont réduits ou masqués.
Contexte étendu
Fable 5, Opus 4.6 et versions ultérieures, et Sonnet 4.6, prennent en charge une fenêtre de contexte de 1 million de tokens pour les sessions longues avec de grandes bases de code.
La disponibilité varie selon le modèle et le plan. Sur les plans Max, Team et Enterprise, Opus est automatiquement mis à niveau vers un contexte 1M sans configuration supplémentaire. Cela s'applique aux sièges Team Standard et Team Premium. Sur l'API Anthropic, Fable 5, Opus 4.8 et Opus 4.7 s'exécutent toujours avec la fenêtre 1M. Sonnet avec contexte 1M ne fait pas partie de la mise à niveau automatique et nécessite des crédits d'utilisation sur tous les plans d'abonnement, y compris Max.
| Plan | Opus avec contexte 1M | Sonnet avec contexte 1M |
|---|---|---|
| Max, Team et Enterprise | Inclus dans l'abonnement | Nécessite des crédits d'utilisation |
| Pro | Nécessite des crédits d'utilisation | Nécessite des crédits d'utilisation |
| API et pay-as-you-go | Accès complet | Accès complet |
Pour désactiver complètement le contexte 1M, définissez CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Cela supprime les variantes de modèle 1M du sélecteur de modèle. Voir variables d'environnement.
La fenêtre de contexte 1M utilise la tarification standard du modèle sans prime pour les tokens au-delà de 200 K. Pour les plans où le contexte étendu est inclus dans votre abonnement, l'utilisation reste couverte par votre abonnement. Pour les plans qui accèdent au contexte étendu via des crédits d'utilisation, les tokens sont facturés aux crédits d'utilisation.
Si votre compte prend en charge le contexte 1M, l'option apparaît dans le sélecteur de modèle (/model) dans les dernières versions de Claude Code. Si vous ne la voyez pas, essayez de redémarrer votre session.
Vous pouvez également utiliser le suffixe [1m] avec les alias de modèle ou les noms de modèle complets :
# Utiliser l'alias opus[1m] ou sonnet[1m]
/model opus[1m]
/model sonnet[1m]
# Ou ajouter [1m] à un nom de modèle complet
/model claude-opus-4-8[1m]
Vérifier votre modèle actuel
Vous pouvez voir quel modèle vous utilisez actuellement de plusieurs façons :
- Dans la ligne d'état (si configurée)
- Dans
/status, qui affiche également vos informations de compte.
Ajouter une option de modèle personnalisé
Utilisez ANTHROPIC_CUSTOM_MODEL_OPTION pour ajouter une seule entrée personnalisée au sélecteur /model sans remplacer les alias intégrés. Ceci est utile pour tester les ID de modèle que Claude Code ne répertorie pas par défaut. Pour les déploiements de passerelle LLM, Claude Code peut remplir le sélecteur à partir du point de terminaison /v1/models de la passerelle lorsque CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 est défini, donc cette variable n'est nécessaire que lorsque la découverte est désactivée ou ne retourne pas le modèle que vous souhaitez. Voir Sélection du modèle de passerelle LLM.
Cet exemple définit les trois variables pour rendre un déploiement Opus acheminé par passerelle sélectionnable :
export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"
L'entrée personnalisée apparaît au bas du sélecteur /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME et ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION sont optionnels. S'ils sont omis, l'ID du modèle est utilisé comme nom et la description par défaut est Custom model (<model-id>).
Claude Code ignore la validation pour l'ID de modèle défini dans ANTHROPIC_CUSTOM_MODEL_OPTION, vous pouvez donc utiliser n'importe quelle chaîne que votre point de terminaison API accepte. Lorsque availableModels est défini, incluez également l'ID de modèle personnalisé dans la liste d'autorisation : l'entrée personnalisée est filtrée du sélecteur et une sélection --model de celui-ci est rejetée comme tout autre modèle exclu. Un ID personnalisé qui intègre un nom de famille, tel que my-gateway/claude-opus-4-7, compte comme une entrée spécifique pour cette famille et désactive son caractère générique, donc listez également les versions que vous avez l'intention de garder sélectionnables. Voir Comportement de fusion.
Variables d'environnement
Vous pouvez utiliser les variables d'environnement suivantes, qui doivent être des noms de modèle complets (ou équivalents pour votre fournisseur d'API), pour contrôler les noms de modèle auxquels les alias sont mappés.
| Variable d'environnement | Description |
|---|---|
ANTHROPIC_DEFAULT_FABLE_MODEL |
Le modèle à utiliser pour fable, et l'ID de modèle que Claude Code reconnaît comme Fable 5 pour le basculement automatique du modèle sur les fournisseurs tiers |
ANTHROPIC_DEFAULT_OPUS_MODEL |
Le modèle à utiliser pour opus, ou pour opusplan lorsque le mode Plan est actif. |
ANTHROPIC_DEFAULT_SONNET_MODEL |
Le modèle à utiliser pour sonnet, ou pour opusplan lorsque le mode Plan n'est pas actif. |
ANTHROPIC_DEFAULT_HAIKU_MODEL |
Le modèle à utiliser pour haiku, ou fonctionnalité d'arrière-plan |
CLAUDE_CODE_SUBAGENT_MODEL |
Le modèle à utiliser pour tous les subagents et les équipes d'agents. Remplace à la fois le paramètre model par invocation et le frontmatter model de la définition du subagent. Définissez sur inherit pour utiliser la résolution de modèle normale à la place |
Remarque : ANTHROPIC_SMALL_FAST_MODEL est déprécié au profit de ANTHROPIC_DEFAULT_HAIKU_MODEL.
Épingler les modèles pour les déploiements tiers
Lors du déploiement de Claude Code via Bedrock, Vertex AI, Foundry ou Claude Platform on AWS, épinglez les versions de modèle avant de les déployer auprès des utilisateurs.
Sans épinglage, Claude Code utilise les alias de modèle tels que fable, opus, sonnet et haiku qui se résolvent à un ID de modèle par défaut intégré pour chaque fournisseur. Ce défaut peut être en retard par rapport à la dernière version d'Anthropic, et le modèle auquel il pointe peut ne pas encore être activé dans le compte d'un utilisateur. Lorsque le défaut n'est pas disponible, les utilisateurs de Bedrock et Vertex AI voient un avis et reviennent à la version précédente pour cette session, tandis que les utilisateurs de Foundry voient des erreurs car Foundry n'a pas de vérification de démarrage équivalente.
Définissez les variables d'environnement de modèle sur des ID de version spécifiques dans le cadre de votre configuration initiale. L'épinglage vous permet de contrôler quand vos utilisateurs passent à un nouveau modèle.
Utilisez les variables d'environnement suivantes avec des ID de modèle spécifiques à la version pour votre fournisseur :
| Fournisseur | Exemple |
|---|---|
| Bedrock | export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-8' |
| Vertex AI | export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8' |
| Foundry | export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8' |
Appliquez le même modèle pour ANTHROPIC_DEFAULT_FABLE_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL et ANTHROPIC_DEFAULT_HAIKU_MODEL. Pour les ID de modèle actuels et hérités sur tous les fournisseurs, voir Aperçu des modèles. Pour mettre à niveau les utilisateurs vers une nouvelle version de modèle, mettez à jour ces variables d'environnement et redéployez.
Pour activer le contexte étendu pour un modèle épinglé, ajoutez [1m] à l'ID du modèle dans ANTHROPIC_DEFAULT_OPUS_MODEL ou ANTHROPIC_DEFAULT_SONNET_MODEL :
export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8[1m]'
Le suffixe [1m] applique la fenêtre de contexte 1M à toute utilisation des alias opus et sonnet, y compris la phase Opus en mode plan de opusplan.
- Claude Code supprime le suffixe avant d'envoyer l'ID du modèle à votre fournisseur.
- N'ajoutez
[1m]que lorsque le modèle sous-jacent prend en charge le contexte 1M. - Le suffixe est lu par variable, et non par modèle. Sur Bedrock, Vertex et Foundry, un ID de modèle sans
[1m]dans une variable utilise le contexte 200K même si une autre variable définit le même modèle avec le suffixe.
Une liste d'autorisation availableModels livrée via MDM ou un fichier de paramètres gérés s'applique toujours lors de l'utilisation de fournisseurs tiers ; les paramètres gérés par le serveur ne sont pas livrés là. Le filtrage correspond à un alias de modèle tel que opus, un préfixe de version tel que claude-opus-4-8, ou l'ID de modèle complet spécifique au fournisseur. Les préfixes spécifiques au fournisseur tels que us.anthropic. ne sont pas supprimés, donc pour autoriser un modèle spécifique, listez le même ID spécifique au fournisseur que le sélecteur affiche, ou mappez-le via modelOverrides. Tout suffixe [1m] est supprimé de l'entrée de la liste d'autorisation et du modèle demandé avant la correspondance.
Personnaliser l'affichage et les capacités du modèle épinglé
Lorsque vous épinglez un modèle sur un fournisseur tiers, l'ID spécifique au fournisseur apparaît tel quel dans le sélecteur /model et Claude Code peut ne pas reconnaître les fonctionnalités que le modèle prend en charge. Vous pouvez remplacer le nom d'affichage et déclarer les capacités avec des variables d'environnement complémentaires pour chaque modèle épinglé.
Ces variables prennent effet sur les fournisseurs tiers tels que Bedrock, Vertex AI et Foundry. Les variables _NAME et _DESCRIPTION prennent également effet lorsque ANTHROPIC_BASE_URL pointe vers une passerelle LLM. Elles n'ont aucun effet lors de la connexion directe à api.anthropic.com.
| Variable d'environnement | Description |
|---|---|
ANTHROPIC_DEFAULT_OPUS_MODEL_NAME |
Nom d'affichage pour le modèle Opus épinglé dans le sélecteur /model. Par défaut, l'ID du modèle lorsqu'il n'est pas défini |
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION |
Description d'affichage pour le modèle Opus épinglé dans le sélecteur /model. Par défaut, Custom Opus model lorsqu'il n'est pas défini |
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES |
Liste séparée par des virgules des capacités que le modèle Opus épinglé prend en charge |
Les mêmes suffixes _NAME, _DESCRIPTION et _SUPPORTED_CAPABILITIES sont disponibles pour ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL, ANTHROPIC_DEFAULT_FABLE_MODEL et ANTHROPIC_CUSTOM_MODEL_OPTION.
Claude Code active les fonctionnalités comme les niveaux d'effort et la réflexion étendue en faisant correspondre l'ID du modèle à des modèles connus. Les ID spécifiques au fournisseur tels que les ARN Bedrock ou les noms de déploiement personnalisés ne correspondent souvent pas à ces modèles, laissant les fonctionnalités prises en charge désactivées. Définissez _SUPPORTED_CAPABILITIES pour indiquer à Claude Code les fonctionnalités que le modèle prend réellement en charge :
| Valeur de capacité | Active |
|---|---|
effort |
Niveaux d'effort et la commande /effort |
xhigh_effort |
{/* min-version: 2.1.111 */}Le niveau d'effort xhigh |
max_effort |
Le niveau d'effort max |
thinking |
Réflexion étendue |
adaptive_thinking |
Raisonnement adaptatif qui alloue dynamiquement la réflexion en fonction de la complexité de la tâche |
interleaved_thinking |
Réflexion entre les appels d'outils |
Lorsque _SUPPORTED_CAPABILITIES est défini, les capacités listées sont activées et les capacités non listées sont désactivées pour le modèle épinglé correspondant. Lorsque la variable n'est pas définie, Claude Code revient à la détection intégrée basée sur l'ID du modèle.
Cet exemple épingle Opus à un ARN de modèle personnalisé Bedrock, définit un nom convivial et déclare ses capacités :
export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'
Remplacer les ID de modèle par version
Les variables d'environnement au niveau de la famille ci-dessus configurent un ID de modèle par alias de famille. Si vous devez mapper plusieurs versions au sein de la même famille à des ID de fournisseur distincts, utilisez plutôt le paramètre modelOverrides.
modelOverrides mappe les ID de modèle Anthropic individuels aux chaînes spécifiques au fournisseur que Claude Code envoie à l'API de votre fournisseur. Lorsqu'un utilisateur sélectionne un modèle mappé dans le sélecteur /model, Claude Code utilise votre valeur configurée au lieu de la valeur par défaut intégrée.
Cela permet aux administrateurs d'entreprise d'acheminer chaque version de modèle vers un ARN de profil d'inférence Bedrock spécifique, un nom de version Vertex AI ou un nom de déploiement Foundry pour la gouvernance, l'allocation des coûts ou l'acheminement régional.
Définissez modelOverrides dans votre fichier de paramètres :
{
"modelOverrides": {
"claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
"claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
"claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
}
}
Les clés doivent être des ID de modèle Anthropic tels que listés dans l'Aperçu des modèles. Pour les ID de modèle datés, incluez le suffixe de date exactement tel qu'il apparaît là. Les clés inconnues sont ignorées.
Les remplacements remplacent les ID de modèle intégrés qui soutiennent chaque entrée dans le sélecteur /model. Sur Bedrock, les remplacements prennent la priorité sur tous les profils d'inférence que Claude Code découvre automatiquement au démarrage. Les valeurs que vous fournissez directement via ANTHROPIC_MODEL, --model ou les variables d'environnement ANTHROPIC_DEFAULT_*_MODEL sont transmises au fournisseur telles quelles et ne sont pas transformées par modelOverrides.
modelOverrides fonctionne aux côtés de availableModels. La liste d'autorisation est évaluée par rapport à l'ID de modèle Anthropic, et non à la valeur de remplacement, donc une entrée comme "opus" dans availableModels continue de correspondre même lorsque les versions d'Opus sont mappées à des ARN. Lorsque enforceAvailableModels est défini dans les paramètres gérés, la valeur par défaut appliquée se résout via modelOverrides à partir de la source gérée de plus haute priorité uniquement. Le mappage d'un administrateur, tel qu'une version épinglée à un ARN de profil d'inférence, est honoré dans la valeur par défaut appliquée. Les remplacements des paramètres utilisateur ou projet ne l'affectent pas.
Configuration de la mise en cache des invites
Claude Code utilise automatiquement la mise en cache des invites pour optimiser les performances et réduire les coûts. Vous pouvez désactiver la mise en cache des invites globalement ou pour des niveaux de modèle spécifiques :
| Variable d'environnement | Description |
|---|---|
DISABLE_PROMPT_CACHING |
Définissez sur 1 pour désactiver la mise en cache des invites pour tous les modèles. Prend la priorité sur les paramètres par modèle |
DISABLE_PROMPT_CACHING_HAIKU |
Définissez sur 1 pour désactiver la mise en cache des invites pour les modèles Haiku uniquement |
DISABLE_PROMPT_CACHING_SONNET |
Définissez sur 1 pour désactiver la mise en cache des invites pour les modèles Sonnet uniquement |
DISABLE_PROMPT_CACHING_OPUS |
Définissez sur 1 pour désactiver la mise en cache des invites pour les modèles Opus uniquement |
DISABLE_PROMPT_CACHING_FABLE |
Définissez sur 1 pour désactiver la mise en cache des invites pour les modèles Fable uniquement |
Pour modifier le TTL du cache ou découvrir ce qui déclenche un échec du cache, voir Comment Claude Code utilise la mise en cache des invites.