Configuration du modèle
Découvrez la configuration du modèle Claude Code, y compris les alias de modèle comme
opusplan
Modèles disponibles
Pour le paramètre model dans Claude Code, vous pouvez configurer l'un des éléments suivants :
- Un alias de modèle
- Un nom de modèle
- API Anthropic : un nom de modèle complet
- Bedrock : un ARN de profil d'inférence
- Foundry : un nom de déploiement
- Vertex : un nom de version
ANTHROPIC_BASE_URL change l'endroit où les demandes sont envoyées, et non le modèle qui y répond. Pour acheminer Claude via une passerelle LLM, consultez la configuration de la passerelle LLM.
Alias de modèle
Les alias de modèle offrent un moyen pratique de sélectionner les paramètres du modèle sans avoir à mémoriser les numéros de version exacts :
| Alias de modèle | Comportement |
|---|---|
default |
Valeur spéciale qui efface tout remplacement de modèle et revient au modèle recommandé pour votre type de compte. N'est pas en soi un alias de modèle |
best |
Utilise Fable 5 où votre organisation y a accès, sinon le dernier modèle Opus |
fable |
Utilise Claude Fable 5 pour vos tâches les plus difficiles et les plus longues |
sonnet |
Utilise le dernier modèle Sonnet pour les tâches de codage quotidiennes |
opus |
Utilise le dernier modèle Opus pour les tâches de raisonnement complexe |
haiku |
Utilise le modèle Haiku rapide et efficace pour les tâches simples |
sonnet[1m] |
Utilise Sonnet avec une fenêtre de contexte de 1 million de tokens pour les sessions longues |
opus[1m] |
Utilise Opus avec une fenêtre de contexte de 1 million de tokens pour les sessions longues |
opusplan |
Mode spécial qui utilise opus pendant le mode plan, puis bascule vers sonnet pour l'exécution |
Sur l'API Anthropic, opus se résout en Opus 4.8 et sonnet se résout en Sonnet 4.6. Sur Claude Platform on AWS, opus se résout en Opus 4.7 et sonnet se résout en Sonnet 4.6. Sur Bedrock, Vertex et Foundry, opus se résout en Opus 4.6 et sonnet se résout en Sonnet 4.5 ; les modèles plus récents sont disponibles sur ces fournisseurs en sélectionnant le nom de modèle complet explicitement ou en définissant ANTHROPIC_DEFAULT_OPUS_MODEL ou ANTHROPIC_DEFAULT_SONNET_MODEL.
Les alias pointent vers la version recommandée pour votre fournisseur et se mettent à jour au fil du temps. Pour épingler une version spécifique, utilisez le nom de modèle complet (par exemple, claude-opus-4-8) ou définissez la variable d'environnement correspondante comme ANTHROPIC_DEFAULT_OPUS_MODEL.
Opus 4.8 nécessite Claude Code v2.1.154 ou version ultérieure. Exécutez claude update pour mettre à niveau.
Travailler avec Fable 5
Claude Fable 5 est le modèle le plus capable dans Claude Code, adapté aux tâches plus grandes qu'une seule séance. Il soutient les sessions autonomes longues, enquête avant d'agir et vérifie son travail plus souvent que les modèles plus petits.
Fable 5 n'est pas le modèle par défaut. Sélectionnez-le avec /model fable. Les demandes que ses classificateurs de sécurité signalent, le plus souvent dans les domaines de la cybersécurité et de la biologie, déclenchent un basculement automatique du modèle.
Pour tirer le meilleur parti de Fable 5 :
- Décrivez le résultat, pas les étapes : donnez-lui le résultat que vous voulez et laissez-le planifier le chemin. Pour le maintenir en fonctionnement jusqu'à ce que ce résultat soit atteint, définissez un objectif.
- Donnez-lui des problèmes ambigus : les enquêtes sur les causes profondes, le débogage des pannes et les décisions architecturales sont les endroits où l'enquête et la vérification supplémentaires sont payantes.
- Ignorez les rappels de vérification : il vérifie son propre travail avec moins d'invites, donc les rappels de tester ou de vérifier sont généralement inutiles.
- Dimensionnez les tâches plus grandes : donnez-lui du travail que vous diviseriez normalement en morceaux. Il maintient les sessions longues sans perdre le fil.
Fable 5 nécessite Claude Code v2.1.170 ou version ultérieure. Les versions antérieures n'affichent pas Fable 5 dans le sélecteur de modèle et ne peuvent pas le sélectionner. Exécutez claude update pour mettre à niveau. Fable 5 n'est pas disponible sous rétention de données zéro, où le sélecteur /model l'omet ou l'affiche désactivé.
Définir votre modèle
Vous pouvez configurer votre modèle de plusieurs façons, énumérées par ordre de priorité :
- Pendant la session - Utilisez
/model <alias|name>pour basculer immédiatement, ou exécutez/modelsans argument pour ouvrir le sélecteur. Le sélecteur demande une confirmation lorsque la conversation a une sortie antérieure, car la réponse suivante relit l'historique complet sans contexte en cache - Au démarrage - Lancez avec
claude --model <alias|name> - Variable d'environnement - Définissez
ANTHROPIC_MODEL=<alias|name> - Paramètres - Configurez de manière permanente dans votre fichier de paramètres en utilisant le champ
model.
À partir de la v2.1.153, /model enregistre votre choix comme valeur par défaut pour les nouvelles sessions en écrivant le champ model dans vos paramètres utilisateur. Dans le sélecteur :
Enter: basculer le modèle et enregistrer comme valeur par défauts: basculer le modèle pour cette session uniquement
Taper /model <name> directement se comporte comme Enter. Les paramètres du projet et gérés ont toujours la priorité et se réappliquent au prochain lancement.
Dans les versions v2.1.144 à v2.1.152, /model s'appliquait uniquement à la session actuelle et d dans le sélecteur enregistrait une valeur par défaut.
L'indicateur --model et la variable d'environnement ANTHROPIC_MODEL s'appliquent uniquement à la session que vous lancez avec eux. Pour exécuter différents modèles dans différents terminaux en même temps, lancez chacun avec son propre indicateur --model plutôt que de basculer avec /model.
Les sessions reprises démarrées avec claude --resume, --continue, ou le sélecteur /resume conservent le modèle qu'elles utilisaient lorsque la transcription a été enregistrée, indépendamment du paramètre model actuel. Si ce modèle a été retiré, la session revient à l'ordre de priorité normal. Cela empêche le choix /model d'une autre session de modifier le modèle à la reprise.
Lorsque le modèle actif au démarrage provient des paramètres du projet ou gérés plutôt que de votre propre sélection, l'en-tête de démarrage indique quel fichier de paramètres l'a défini. Exécutez /model pour remplacer ; le paramètre du projet ou géré se réapplique au prochain lancement.
Lorsque le modèle demandé a une date de retrait programmée ou est automatiquement remappé à une version plus récente, Claude Code affiche un avertissement qui nomme le modèle demandé. Les sessions interactives l'affichent comme un avis de démarrage. À partir de la v2.1.182, le même avertissement est écrit dans stderr en mode non interactif lors de l'utilisation du format de sortie texte par défaut. La vérification couvre également un model défini dans frontmatter de sous-agent. L'avertissement stderr est supprimé pour --output-format json et stream-json ; lisez le modèle réel à partir du champ modelUsage du message de résultat à la place.
Exemple d'utilisation :
# Démarrer avec Opus
claude --model opus
# Basculer vers Sonnet pendant la session
/model sonnet
Exemple de fichier de paramètres :
{
"permissions": {
...
},
"model": "opus"
}
Restreindre la sélection du modèle
Les administrateurs d'entreprise peuvent utiliser availableModels dans les paramètres gérés ou de politique pour restreindre les modèles que les utilisateurs peuvent sélectionner.
Lorsque availableModels est défini, la liste d'autorisation s'applique à chaque surface où un utilisateur peut nommer un modèle :
- Modèle de session principale :
/model, le drapeau--model, et la variable d'environnementANTHROPIC_MODEL - Résolution d'alias : {/* min-version: 2.1.176 */}les variables d'environnement
ANTHROPIC_DEFAULT_OPUS_MODEL,ANTHROPIC_DEFAULT_SONNET_MODEL,ANTHROPIC_DEFAULT_HAIKU_MODEL, etANTHROPIC_DEFAULT_FABLE_MODELne peuvent pas rediriger un alias autorisé vers un modèle en dehors de la liste - Mode rapide : {/* min-version: 2.1.176 */}
/fastrefuse de basculer lorsque cela changerait implicitement vers un modèle Opus en dehors de la liste, avec le message « is not in your organization's allowed models » - Modèles de sous-agent : le champ
modeldans le frontmatter du sous-agent, le paramètremodelde l'outil Agent, le sélecteur de modèle dans/agents, etCLAUDE_CODE_SUBAGENT_MODEL - Modèle de conseiller : le paramètre
advisorModelconfiguré - Chaînes de secours : les éléments d'une chaîne de modèle de secours en dehors de la liste sont supprimés
Le basculement vers un modèle bloqué avec /model est rejeté avec une erreur, tandis qu'un drapeau --model bloqué ou une valeur ANTHROPIC_MODEL est remplacée au démarrage par un avertissement nommant à la fois les modèles demandés et substitués, et la session démarre sur le modèle par défaut. Un remplacement de sous-agent ou de conseiller bloqué revient au modèle hérité ou par défaut plutôt que d'échouer la demande.
{
"availableModels": ["sonnet", "haiku"]
}
Comportement du modèle par défaut
Par défaut, l'option Par défaut dans le sélecteur de modèle n'est pas affectée par availableModels. Elle reste disponible et représente la valeur par défaut du système basée sur le niveau d'abonnement de l'utilisateur.
Pour étendre la liste d'autorisation à l'option Par défaut, définissez enforceAvailableModels sur true dans les paramètres gérés ou de politique aux côtés d'une liste availableModels non vide. Lorsque la valeur par défaut du niveau n'est pas dans la liste d'autorisation, Par défaut se résout à la première entrée autorisée au lieu de la valeur par défaut du niveau. Cela nécessite Claude Code v2.1.175 ou ultérieur.
Un tableau availableModels vide n'engage jamais l'application. Même avec availableModels: [], les utilisateurs peuvent toujours utiliser Claude Code avec le modèle Par défaut pour leur niveau indépendamment de enforceAvailableModels.
Contrôler le modèle sur lequel les utilisateurs s'exécutent
Le paramètre model est une sélection initiale, pas une application. Il définit quel modèle est actif au démarrage d'une session, mais les utilisateurs peuvent toujours ouvrir /model et choisir Par défaut, qui se résout au système par défaut pour leur niveau indépendamment de ce que model est défini.
Pour contrôler complètement l'expérience du modèle, combinez ces paramètres :
availableModels: restreint les modèles nommés vers lesquels les utilisateurs peuvent basculerenforceAvailableModels: étend la liste d'autorisationavailableModelsà l'option Par défaut, de sorte que Par défaut ne peut pas se résoudre à un modèle en dehors de la listemodel: définit la sélection de modèle initiale au démarrage d'une sessionANTHROPIC_DEFAULT_SONNET_MODEL/ANTHROPIC_DEFAULT_OPUS_MODEL/ANTHROPIC_DEFAULT_HAIKU_MODEL/ANTHROPIC_DEFAULT_FABLE_MODEL: contrôlent ce vers quoi l'option Par défaut et les aliassonnet,opus,haikuetfablese résolvent
Cet exemple démarre les utilisateurs sur Sonnet 4.5, limite le sélecteur à Sonnet et Haiku, et garantit que Par défaut se résout à un modèle sur la liste d'autorisation plutôt qu'à la valeur par défaut du niveau :
{
"model": "claude-sonnet-4-5",
"availableModels": ["claude-sonnet-4-5", "haiku"],
"enforceAvailableModels": true,
"env": {
"ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
}
}
Sans enforceAvailableModels ou le bloc env, un utilisateur qui sélectionne Par défaut dans le sélecteur obtiendrait la dernière version pour son niveau, contournant l'épinglage de version dans model et availableModels. Les deux paramètres couvrent des portées différentes : enforceAvailableModels fait que Par défaut obéit à la liste d'autorisation, tandis que le bloc env épingle la version à laquelle un alias autorisé tel que sonnet se résout. Utilisez enforceAvailableModels seul lorsque restreindre les familles de modèles est suffisant ; ajoutez le bloc env lorsque vous devez également épingler une version spécifique.
Comportement de fusion
Lorsque availableModels est défini dans les paramètres utilisateur, projet et local uniquement, les tableaux sont fusionnés et dédupliqués à travers ces niveaux.
Lorsque availableModels est défini dans les paramètres gérés ou de politique, la valeur gérée ou de politique remplace entièrement le résultat fusionné : les entrées ajoutées dans les paramètres utilisateur ou projet ne peuvent pas l'élargir. Les paramètres gérés et de politique remplacent les valeurs de priorité inférieure pour enforceAvailableModels de la même manière. À partir de Claude Code v2.1.175, c'est la seule façon d'appliquer une liste d'autorisation stricte ; les versions antérieures fusionnent la liste gérée avec les entrées de priorité inférieure.
ID de modèle Mantle
Lorsque le point de terminaison Bedrock Mantle est activé, les entrées dans availableModels qui commencent par anthropic. sont ajoutées au sélecteur /model en tant qu'options personnalisées et acheminées vers le point de terminaison Mantle. Le paramètre restreint toujours le sélecteur aux entrées listées, donc incluez les alias standard aux côtés de tous les ID Mantle.
Comportement spécial du modèle
Paramètre de modèle `default`
Le comportement de default dépend de votre type de compte :
- Max, Team Premium, Enterprise pay-as-you-go, et API Anthropic : par défaut Opus 4.8
- Claude Platform sur AWS : par défaut Opus 4.7
- Pro, Team Standard, et sièges d'abonnement Enterprise : par défaut Sonnet 4.6
- Bedrock, Vertex, et Foundry : par défaut Sonnet 4.5
Enterprise pay-as-you-go signifie une organisation Enterprise facturée à l'utilisation plutôt que par siège d'abonnement.
Fable 5 n'est le modèle par défaut sur aucun type de compte. Les sessions utilisent Fable 5 uniquement après que vous l'ayez choisi, avec /model fable, un paramètre model, ou l'alias best où Fable 5 est disponible. Le choisir avec /model l'enregistre comme modèle sélectionné dans vos paramètres utilisateur, de sorte que les sessions ultérieures commencent sur Fable 5 jusqu'à ce que vous changiez de modèles.
Paramètre de modèle `opusplan`
L'alias de modèle opusplan fournit une approche hybride automatisée :
- En mode plan - Utilise
opuspour le raisonnement complexe et les décisions architecturales - En mode exécution - Bascule automatiquement vers
sonnetpour la génération de code et l'implémentation
Cela vous donne le meilleur des deux mondes : le raisonnement supérieur d'Opus pour la planification et l'efficacité de Sonnet pour l'exécution.
La phase Opus en mode plan utilise la même fenêtre de contexte que le paramètre de modèle opus. Sur les niveaux d'abonnement où Opus est automatiquement mis à niveau vers un contexte 1M, opusplan reçoit la mise à niveau en mode plan également. Pour forcer un contexte 1M pour les deux phases lorsque vous n'êtes pas sur un niveau de mise à niveau automatique, définissez le modèle sur opusplan[1m].
Lorsque availableModels exclut Opus, opusplan reste sur Sonnet en mode plan au lieu de basculer. De même, une session Haiku qui se mettrait normalement à niveau vers Sonnet en mode plan reste sur Haiku lorsque Sonnet est exclu.
Pour une approche hybride où Claude décide en cours de tâche quand consulter un deuxième modèle plutôt que de basculer à la limite du plan, voir l'outil advisor.
Chaînes de modèles de secours
Lorsque le modèle principal est surchargé, indisponible ou retourne une autre erreur serveur non renouvelable, Claude Code peut basculer vers un modèle de secours au lieu d'échouer la demande. Les erreurs d'authentification, de facturation, de limite de débit, de taille de demande et de transport ne déclenchent jamais un basculement ; celles-ci suivent leur gestion normale des tentatives et des erreurs.
Configurez un ou plusieurs modèles de secours et Claude Code les essaie dans l'ordre, affichant un avis lors du basculement. Le basculement dure uniquement pour le tour actuel, de sorte que votre message suivant essaie d'abord le modèle principal à nouveau. Les chaînes sont limitées à trois modèles après suppression des doublons, et les entrées supplémentaires sont ignorées.
Définissez une chaîne pour une session avec le drapeau --fallback-model, qui accepte une liste séparée par des virgules :
claude --fallback-model sonnet,haiku
Pour persister une chaîne entre les sessions, définissez fallbackModel dans paramètres comme un tableau :
{
"fallbackModel": ["claude-sonnet-4-6", "claude-haiku-4-5"]
}
Le drapeau --fallback-model prend la priorité sur le paramètre fallbackModel. Chaque élément accepte un nom de modèle ou un alias, et "default" se développe vers le modèle par défaut.
Deux cas entraînent le saut d'un élément :
- Modèle indisponible : un modèle qui ne peut pas être atteint, comme un modèle retiré épinglé dans les paramètres, est ignoré et Claude Code continue vers l'élément suivant.
- En dehors de la liste d'autorisation : un élément non autorisé par
availableModelsest supprimé lors de la lecture de la chaîne et n'est jamais essayé.
Basculement automatique du modèle
Cette section couvre le basculement basé sur le contenu de Fable 5. Pour le basculement basé sur la disponibilité lorsqu'un modèle est surchargé ou indisponible, voir Chaînes de modèles de secours.
Fable 5 s'exécute avec des classificateurs de sécurité pour le contenu de cybersécurité et de biologie. Lorsqu'un classificateur signale une demande, Claude Code réexécute cette demande sur le modèle Opus par défaut et affiche un avis dans la transcription : Opus 4.8 sur l'API Anthropic et les déploiements de passerelle LLM, ou Opus 4.7 sur Claude Platform sur AWS.
La session continue ensuite sur ce modèle Opus. Pour revenir à Fable 5, exécutez /model fable.
Vérifier ce qui a déclenché le basculement
Le basculement peut se déclencher sur la première demande d'une session, avant que vous n'envoyiez quelque chose d'inhabituel, car la première demande porte le contexte de l'espace de travail tel que votre contenu CLAUDE.md et l'état git. Un référentiel qui contient du matériel de sécurité ou de biologie peut déclencher le classificateur sur ce contexte seul.
Pour vérifier si les personnalisations sont le déclencheur, démarrez une session avec claude --safe-mode, qui désactive les personnalisations telles que CLAUDE.md, les skills, les serveurs MCP et les hooks. L'état git et les noms de répertoires ne sont pas des personnalisations et sont toujours inclus.
Demander avant de basculer
Pour décider ce qui se passe chaque fois qu'une demande est signalée, plutôt que de basculer automatiquement, exécutez /config et désactivez « switch models when a message is flagged ». Une demande signalée met alors la session en pause avec deux options : basculer vers le modèle Opus, ou modifier l'invite et réessayer sur Fable 5.
Certains cas se comportent différemment :
- Si les deux modèles signalent la même demande, vous pouvez modifier l'invite et réessayer, ou démarrer une nouvelle session.
- Sur les sessions mobiles Claude Code sur le web, la modification et la nouvelle tentative ne sont pas prises en charge. Basculez les modèles, ou continuez la session à partir d'un navigateur de bureau ou de l'application de bureau.
- En mode non interactif et les intégrations SDK qui ne peuvent pas afficher l'invite, une demande signalée termine le tour avec un refus à la place.
Activer le basculement sur Bedrock, Vertex AI et Foundry
Sur Amazon Bedrock, Google Vertex AI et Microsoft Foundry, les ID de modèle sont spécifiques au fournisseur, de sorte que le basculement automatique ne fonctionne que lorsque Claude Code peut identifier les deux modèles impliqués :
- Claude Code doit reconnaître le modèle actuel comme Fable 5 : l'ID de modèle contient
claude-fable-5, correspond à la valeur deANTHROPIC_DEFAULT_FABLE_MODEL, ou est mappé avecmodelOverrides. - La cible de basculement doit se résoudre en un modèle Opus : la valeur de
ANTHROPIC_DEFAULT_OPUS_MODELsi définie, sinon une entrée Opus 4.8 dans la liste des modèles du fournisseur.
Si l'un ou l'autre modèle ne peut pas être identifié, Claude Code ne bascule pas automatiquement. La demande signalée se termine par un message de refus, et vous pouvez basculer les modèles avec /model et réessayer. Pour activer le basculement automatique sur ces fournisseurs, définissez ANTHROPIC_DEFAULT_FABLE_MODEL sur votre ID de modèle Fable 5 et ANTHROPIC_DEFAULT_OPUS_MODEL sur votre ID de modèle Opus 4.8.
Charges de travail de recherche en sécurité et de biologie
Les charges de travail en sécurité offensive ou en biologie, y compris les tests de pénétration, les exercices Capture the Flag (CTF) et les bases de code adjacentes à la biologie, déclenchent fréquemment le basculement, souvent sur la première demande. Pour un travail de biologie substantiel, attendez-vous à ce que presque toutes les demandes soient réacheminées.
C'est le routage attendu pour ces domaines, pas un drapeau de compte. Si votre organisation a besoin de la capacité de classe Fable pour ce travail, demandez à votre équipe de compte Anthropic les programmes d'accès de confiance.
Ajuster le niveau d'effort
Les niveaux d'effort contrôlent le raisonnement adaptatif, qui permet au modèle de décider si et combien réfléchir à chaque étape en fonction de la complexité de la tâche. Un effort inférieur est plus rapide et moins cher pour les tâches simples, tandis qu'un effort supérieur fournit un raisonnement plus profond pour les problèmes complexes.
Les niveaux d'effort disponibles dépendent du modèle. Les modèles non listés ici ne prennent pas en charge l'effort :
| Modèle | Niveaux |
|---|---|
| Fable 5 | low, medium, high, xhigh, max |
| Opus 4.8 et Opus 4.7 | low, medium, high, xhigh, max |
| Opus 4.6 et Sonnet 4.6 | low, medium, high, max |
Si vous définissez un niveau que le modèle actif ne prend pas en charge, Claude Code revient au niveau le plus élevé pris en charge au niveau ou en dessous de celui que vous avez défini. Par exemple, xhigh s'exécute comme high sur Opus 4.6.
L'effort par défaut est high sur Fable 5, Opus 4.8, Opus 4.6 et Sonnet 4.6, et xhigh sur Opus 4.7.
Lorsque vous exécutez Fable 5, Opus 4.8 ou Opus 4.7 pour la première fois, Claude Code applique l'effort par défaut de ce modèle même si vous aviez précédemment défini un niveau différent pour un autre modèle : high sur Fable 5 et Opus 4.8, et xhigh sur Opus 4.7. Exécutez /effort à nouveau pour choisir un niveau différent après le changement.
low, medium, high et xhigh persistent entre les sessions. max fournit le raisonnement le plus profond sans contrainte sur les dépenses en tokens et s'applique à la session actuelle uniquement, sauf lorsqu'il est défini via la variable d'environnement CLAUDE_CODE_EFFORT_LEVEL.
Le menu /effort offre également ultracode. Ultracode est un paramètre de Claude Code plutôt qu'un niveau d'effort du modèle : il envoie xhigh au modèle et a également Claude orchestrer les flux de travail dynamiques pour les tâches substantielles. Il s'applique à la session actuelle uniquement. Définissez-le via /effort, ou passez "ultracode": true via --settings ou une demande de contrôle du SDK Agent. Il ne fait pas partie du paramètre effortLevel, du drapeau --effort ou de CLAUDE_CODE_EFFORT_LEVEL.
Choisir un niveau d'effort
Chaque niveau échange les dépenses en tokens contre la capacité. La valeur par défaut convient à la plupart des tâches de codage ; ajustez lorsque vous souhaitez un équilibre différent.
| Niveau | Quand l'utiliser |
|---|---|
low |
Réservez aux tâches courtes, délimitées, sensibles à la latence qui ne sont pas sensibles à l'intelligence |
medium |
Réduit l'utilisation des tokens pour le travail sensible aux coûts qui peut faire des compromis sur l'intelligence |
high |
Équilibre l'utilisation des tokens et l'intelligence. Par défaut sur Fable 5, Opus 4.8, Opus 4.6 et Sonnet 4.6 |
xhigh |
Raisonnement plus profond avec dépenses en tokens plus élevées. Par défaut sur Opus 4.7 |
max |
Peut améliorer les performances sur les tâches exigeantes mais peut montrer des rendements décroissants et est sujet à la surréflexion. Testez avant d'adopter largement |
ultracode |
Un paramètre de Claude Code qui planifie un flux de travail dynamique pour chaque tâche substantielle avec un raisonnement xhigh par message. Session uniquement |
L'échelle d'effort est calibrée par modèle, donc le même nom de niveau ne représente pas la même valeur sous-jacente entre les modèles.
Utiliser ultrathink pour un raisonnement profond ponctuel
Incluez ultrathink n'importe où dans votre invite pour demander un raisonnement plus profond à ce tour sans modifier votre paramètre d'effort de session. Claude Code reconnaît le mot-clé et ajoute une instruction en contexte. Le niveau d'effort envoyé à l'API reste inchangé. D'autres phrases telles que « think », « think hard » et « think more » sont transmises comme du texte d'invite ordinaire et ne sont pas reconnues comme des mots-clés.
Définir le niveau d'effort
Vous pouvez modifier l'effort par l'une des méthodes suivantes :
/effort: exécutez/effortsans arguments pour ouvrir un curseur interactif,/effortsuivi d'un nom de niveau pour le définir directement, ou/effort autopour réinitialiser à la valeur par défaut du modèle- Dans
/model: utilisez les touches fléchées gauche/droite pour ajuster le curseur d'effort lors de la sélection d'un modèle - Drapeau
--effort: passez un nom de niveau pour le définir pour une seule session lors du lancement de Claude Code - Variable d'environnement : définissez
CLAUDE_CODE_EFFORT_LEVELsur un nom de niveau ouauto - Paramètres : définissez
effortLevelsurlow,medium,highouxhighdans votre fichier de paramètres.maxetultracodesont session uniquement et ne sont pas acceptés ici - Frontmatter de skill et de subagent : définissez
effortdans un fichier markdown de skill ou de subagent pour remplacer le niveau d'effort lorsque ce skill ou subagent s'exécute
La variable d'environnement prend la priorité sur toutes les autres méthodes, puis votre niveau configuré, puis la valeur par défaut du modèle. L'effort du frontmatter s'applique lorsque ce skill ou subagent est actif, remplaçant le niveau de session mais pas la variable d'environnement.
Le curseur d'effort apparaît dans /model lorsqu'un modèle pris en charge est sélectionné. Le niveau d'effort actuel est également affiché à côté du logo et du spinner, par exemple « with low effort », vous pouvez donc confirmer quel paramètre est actif sans ouvrir /model.
Raisonnement adaptatif et budgets de réflexion fixes
Le raisonnement adaptatif rend la réflexion optionnelle à chaque étape, donc Claude peut répondre plus rapidement aux invites de routine et réserver une réflexion plus profonde pour les étapes qui en bénéficient. Si vous souhaitez que Claude réfléchisse plus ou moins souvent que le niveau actuel ne le produit, vous pouvez le dire directement dans votre invite ou dans CLAUDE.md ; le modèle répond à cette orientation dans son paramètre d'effort.
Opus 4.7 et versions ultérieures utilisent toujours le raisonnement adaptatif, tout comme Fable 5. Le mode de budget de réflexion fixe et CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING ne s'appliquent pas à eux.
Sur Opus 4.6 et Sonnet 4.6, vous pouvez définir CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 pour revenir au budget de réflexion fixe précédent contrôlé par MAX_THINKING_TOKENS. Voir variables d'environnement.
Réflexion étendue
La réflexion étendue est le raisonnement que Claude émet avant de répondre. Sur les modèles qui prennent en charge le raisonnement adaptatif, le niveau d'effort est le contrôle principal de la quantité de réflexion qui se produit ; les paramètres ci-dessous activent ou désactivent la réflexion et contrôlent son affichage.
| Contrôle | Comment le définir |
|---|---|
| Basculer pour la session actuelle | Appuyez sur Option+T sur macOS ou Alt+T sur Windows et Linux |
| Définir la valeur par défaut globale | Exécutez /config et basculez le mode de réflexion. Enregistré en tant que alwaysThinkingEnabled dans ~/.claude/settings.json |
| Désactiver indépendamment de l'effort | Définissez MAX_THINKING_TOKENS=0, qui désactive la réflexion sur l'API Anthropic sauf sur Fable 5. Sur les fournisseurs tiers cela omet le paramètre thinking à la place, et les modèles de raisonnement adaptatif peuvent toujours réfléchir. D'autres valeurs s'appliquent uniquement avec un budget de réflexion fixe |
La réflexion ne peut pas être désactivée sur Fable 5. Le basculement de session, alwaysThinkingEnabled et MAX_THINKING_TOKENS=0 n'ont aucun effet là, et Fable 5 décide à chaque étape combien réfléchir en fonction du niveau d'effort.
La sortie de réflexion est réduite par défaut. Appuyez sur Ctrl+O pour basculer le mode verbeux et voir le raisonnement en tant que texte gris en italique. Les sessions interactives sur l'API Anthropic reçoivent des blocs de réflexion masqués par défaut, donc définissez showThinkingSummaries: true dans les paramètres si vous souhaitez que les résumés complets soient disponibles lorsque vous développez. Vous êtes facturé pour tous les tokens de réflexion générés, même lorsqu'ils sont réduits ou masqués.
Contexte étendu
Fable 5, Opus 4.6 et versions ultérieures, et Sonnet 4.6, prennent en charge une fenêtre de contexte de 1 million de tokens pour les sessions longues avec de grandes bases de code.
La disponibilité varie selon le modèle et le plan. Sur les plans Max, Team et Enterprise, Opus est automatiquement mis à niveau vers un contexte 1M sans configuration supplémentaire. Cela s'applique aux sièges Team Standard et Team Premium. Sur l'API Anthropic, Fable 5, Opus 4.8 et Opus 4.7 s'exécutent toujours avec la fenêtre 1M. Sonnet avec contexte 1M ne fait pas partie de la mise à niveau automatique et nécessite des crédits d'utilisation sur tous les plans d'abonnement, y compris Max.
| Plan | Opus avec contexte 1M | Sonnet avec contexte 1M |
|---|---|---|
| Max, Team et Enterprise | Inclus dans l'abonnement | Nécessite des crédits d'utilisation |
| Pro | Nécessite des crédits d'utilisation | Nécessite des crédits d'utilisation |
| API et pay-as-you-go | Accès complet | Accès complet |
Pour désactiver complètement le contexte 1M, définissez CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Cela supprime les variantes de modèle 1M du sélecteur de modèle. Voir variables d'environnement.
La fenêtre de contexte 1M utilise la tarification standard du modèle sans prime pour les tokens au-delà de 200 K. Pour les plans où le contexte étendu est inclus dans votre abonnement, l'utilisation reste couverte par votre abonnement. Pour les plans qui accèdent au contexte étendu via des crédits d'utilisation, les tokens sont facturés aux crédits d'utilisation.
Si votre compte prend en charge le contexte 1M, l'option apparaît dans le sélecteur de modèle (/model) dans les dernières versions de Claude Code. Si vous ne la voyez pas, essayez de redémarrer votre session.
Vous pouvez également utiliser le suffixe [1m] avec les alias de modèle ou les noms de modèle complets :
# Utiliser l'alias opus[1m] ou sonnet[1m]
/model opus[1m]
/model sonnet[1m]
# Ou ajouter [1m] à un nom de modèle complet
/model claude-opus-4-8[1m]
Vérifier votre modèle actuel
Vous pouvez voir quel modèle vous utilisez actuellement de plusieurs façons :
- Dans la ligne d'état (si configurée)
- Dans
/status, qui affiche également vos informations de compte.
Ajouter une option de modèle personnalisé
Utilisez ANTHROPIC_CUSTOM_MODEL_OPTION pour ajouter une seule entrée personnalisée au sélecteur /model sans remplacer les alias intégrés. Ceci est utile pour tester les ID de modèle que Claude Code ne répertorie pas par défaut. Pour les déploiements de passerelle LLM, Claude Code peut remplir le sélecteur à partir du point de terminaison /v1/models de la passerelle lorsque CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 est défini, donc cette variable n'est nécessaire que lorsque la découverte est désactivée ou ne retourne pas le modèle que vous souhaitez. Voir Sélection du modèle de passerelle LLM.
Cet exemple définit les trois variables pour rendre un déploiement Opus acheminé par passerelle sélectionnable :
export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"
L'entrée personnalisée apparaît au bas du sélecteur /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME et ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION sont optionnels. S'ils sont omis, l'ID du modèle est utilisé comme nom et la description par défaut est Custom model (<model-id>).
Claude Code ignore la validation pour l'ID de modèle défini dans ANTHROPIC_CUSTOM_MODEL_OPTION, vous pouvez donc utiliser n'importe quelle chaîne que votre point de terminaison API accepte.
Variables d'environnement
Vous pouvez utiliser les variables d'environnement suivantes, qui doivent être des noms de modèle complets (ou équivalents pour votre fournisseur d'API), pour contrôler les noms de modèle auxquels les alias sont mappés.
| Variable d'environnement | Description |
|---|---|
ANTHROPIC_DEFAULT_FABLE_MODEL |
Le modèle à utiliser pour fable, et l'ID de modèle que Claude Code reconnaît comme Fable 5 pour le basculement automatique du modèle sur les fournisseurs tiers |
ANTHROPIC_DEFAULT_OPUS_MODEL |
Le modèle à utiliser pour opus, ou pour opusplan lorsque le mode Plan est actif. |
ANTHROPIC_DEFAULT_SONNET_MODEL |
Le modèle à utiliser pour sonnet, ou pour opusplan lorsque le mode Plan n'est pas actif. |
ANTHROPIC_DEFAULT_HAIKU_MODEL |
Le modèle à utiliser pour haiku, ou fonctionnalité d'arrière-plan |
CLAUDE_CODE_SUBAGENT_MODEL |
Le modèle à utiliser pour tous les subagents et les équipes d'agents. Remplace à la fois le paramètre model par invocation et le frontmatter model de la définition du subagent. Définissez sur inherit pour utiliser la résolution de modèle normale à la place |
Remarque : ANTHROPIC_SMALL_FAST_MODEL est déprécié au profit de ANTHROPIC_DEFAULT_HAIKU_MODEL.
Épingler les modèles pour les déploiements tiers
Lors du déploiement de Claude Code via Bedrock, Vertex AI, Foundry ou Claude Platform on AWS, épinglez les versions de modèle avant de les déployer auprès des utilisateurs.
Sans épinglage, Claude Code utilise les alias de modèle tels que fable, opus, sonnet et haiku qui se résolvent à un ID de modèle par défaut intégré pour chaque fournisseur. Ce défaut peut être en retard par rapport à la dernière version d'Anthropic, et le modèle auquel il pointe peut ne pas encore être activé dans le compte d'un utilisateur. Lorsque le défaut n'est pas disponible, les utilisateurs de Bedrock et Vertex AI voient un avis et reviennent à la version précédente pour cette session, tandis que les utilisateurs de Foundry voient des erreurs car Foundry n'a pas de vérification de démarrage équivalente.
Définissez les variables d'environnement de modèle sur des ID de version spécifiques dans le cadre de votre configuration initiale. L'épinglage vous permet de contrôler quand vos utilisateurs passent à un nouveau modèle.
Utilisez les variables d'environnement suivantes avec des ID de modèle spécifiques à la version pour votre fournisseur :
| Fournisseur | Exemple |
|---|---|
| Bedrock | export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-8' |
| Vertex AI | export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8' |
| Foundry | export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8' |
Appliquez le même modèle pour ANTHROPIC_DEFAULT_FABLE_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL et ANTHROPIC_DEFAULT_HAIKU_MODEL. Pour les ID de modèle actuels et hérités sur tous les fournisseurs, voir Aperçu des modèles. Pour mettre à niveau les utilisateurs vers une nouvelle version de modèle, mettez à jour ces variables d'environnement et redéployez.
Pour activer le contexte étendu pour un modèle épinglé, ajoutez [1m] à l'ID du modèle dans ANTHROPIC_DEFAULT_OPUS_MODEL ou ANTHROPIC_DEFAULT_SONNET_MODEL :
export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8[1m]'
Le suffixe [1m] applique la fenêtre de contexte 1M à toute utilisation des alias opus et sonnet, y compris la phase Opus en mode plan de opusplan.
- Claude Code supprime le suffixe avant d'envoyer l'ID du modèle à votre fournisseur.
- N'ajoutez
[1m]que lorsque le modèle sous-jacent prend en charge le contexte 1M. - Le suffixe est lu par variable, et non par modèle. Sur Bedrock, Vertex et Foundry, un ID de modèle sans
[1m]dans une variable utilise le contexte 200K même si une autre variable définit le même modèle avec le suffixe.
La liste d'autorisation settings.availableModels s'applique toujours lors de l'utilisation de fournisseurs tiers. Le filtrage correspond à l'alias de modèle tel que opus, le préfixe de version tel que claude-opus-4-8, ou l'ID de modèle complet. Tout suffixe [1m] est supprimé de l'entrée de la liste d'autorisation et du modèle demandé avant la correspondance, donc une entrée de claude-opus-4-8 permet à la fois les lignes Opus standard et 1M-contexte. Les préfixes spécifiques au fournisseur tels que us.anthropic. ne sont pas supprimés : listez la même forme dans availableModels que le sélecteur affiche, ou mappez-la via modelOverrides.
Personnaliser l'affichage et les capacités du modèle épinglé
Lorsque vous épinglez un modèle sur un fournisseur tiers, l'ID spécifique au fournisseur apparaît tel quel dans le sélecteur /model et Claude Code peut ne pas reconnaître les fonctionnalités que le modèle prend en charge. Vous pouvez remplacer le nom d'affichage et déclarer les capacités avec des variables d'environnement complémentaires pour chaque modèle épinglé.
Ces variables prennent effet sur les fournisseurs tiers tels que Bedrock, Vertex AI et Foundry. Les variables _NAME et _DESCRIPTION prennent également effet lorsque ANTHROPIC_BASE_URL pointe vers une passerelle LLM. Elles n'ont aucun effet lors de la connexion directe à api.anthropic.com.
| Variable d'environnement | Description |
|---|---|
ANTHROPIC_DEFAULT_OPUS_MODEL_NAME |
Nom d'affichage pour le modèle Opus épinglé dans le sélecteur /model. Par défaut, l'ID du modèle lorsqu'il n'est pas défini |
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION |
Description d'affichage pour le modèle Opus épinglé dans le sélecteur /model. Par défaut, Custom Opus model lorsqu'il n'est pas défini |
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES |
Liste séparée par des virgules des capacités que le modèle Opus épinglé prend en charge |
Les mêmes suffixes _NAME, _DESCRIPTION et _SUPPORTED_CAPABILITIES sont disponibles pour ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL, ANTHROPIC_DEFAULT_FABLE_MODEL et ANTHROPIC_CUSTOM_MODEL_OPTION.
Claude Code active les fonctionnalités comme les niveaux d'effort et la réflexion étendue en faisant correspondre l'ID du modèle à des modèles connus. Les ID spécifiques au fournisseur tels que les ARN Bedrock ou les noms de déploiement personnalisés ne correspondent souvent pas à ces modèles, laissant les fonctionnalités prises en charge désactivées. Définissez _SUPPORTED_CAPABILITIES pour indiquer à Claude Code les fonctionnalités que le modèle prend réellement en charge :
| Valeur de capacité | Active |
|---|---|
effort |
Niveaux d'effort et la commande /effort |
xhigh_effort |
{/* min-version: 2.1.111 */}Le niveau d'effort xhigh |
max_effort |
Le niveau d'effort max |
thinking |
Réflexion étendue |
adaptive_thinking |
Raisonnement adaptatif qui alloue dynamiquement la réflexion en fonction de la complexité de la tâche |
interleaved_thinking |
Réflexion entre les appels d'outils |
Lorsque _SUPPORTED_CAPABILITIES est défini, les capacités listées sont activées et les capacités non listées sont désactivées pour le modèle épinglé correspondant. Lorsque la variable n'est pas définie, Claude Code revient à la détection intégrée basée sur l'ID du modèle.
Cet exemple épingle Opus à un ARN de modèle personnalisé Bedrock, définit un nom convivial et déclare ses capacités :
export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'
Remplacer les ID de modèle par version
Les variables d'environnement au niveau de la famille ci-dessus configurent un ID de modèle par alias de famille. Si vous devez mapper plusieurs versions au sein de la même famille à des ID de fournisseur distincts, utilisez plutôt le paramètre modelOverrides.
modelOverrides mappe les ID de modèle Anthropic individuels aux chaînes spécifiques au fournisseur que Claude Code envoie à l'API de votre fournisseur. Lorsqu'un utilisateur sélectionne un modèle mappé dans le sélecteur /model, Claude Code utilise votre valeur configurée au lieu de la valeur par défaut intégrée.
Cela permet aux administrateurs d'entreprise d'acheminer chaque version de modèle vers un ARN de profil d'inférence Bedrock spécifique, un nom de version Vertex AI ou un nom de déploiement Foundry pour la gouvernance, l'allocation des coûts ou l'acheminement régional.
Définissez modelOverrides dans votre fichier de paramètres :
{
"modelOverrides": {
"claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
"claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
"claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
}
}
Les clés doivent être des ID de modèle Anthropic tels que listés dans l'Aperçu des modèles. Pour les ID de modèle datés, incluez le suffixe de date exactement tel qu'il apparaît là. Les clés inconnues sont ignorées.
Les remplacements remplacent les ID de modèle intégrés qui soutiennent chaque entrée dans le sélecteur /model. Sur Bedrock, les remplacements prennent la priorité sur tous les profils d'inférence que Claude Code découvre automatiquement au démarrage. Les valeurs que vous fournissez directement via ANTHROPIC_MODEL, --model ou les variables d'environnement ANTHROPIC_DEFAULT_*_MODEL sont transmises au fournisseur telles quelles et ne sont pas transformées par modelOverrides.
modelOverrides fonctionne aux côtés de availableModels. La liste d'autorisation est évaluée par rapport à l'ID de modèle Anthropic, et non à la valeur de remplacement, donc une entrée comme "opus" dans availableModels continue de correspondre même lorsque les versions d'Opus sont mappées à des ARN.
Configuration de la mise en cache des invites
Claude Code utilise automatiquement la mise en cache des invites pour optimiser les performances et réduire les coûts. Vous pouvez désactiver la mise en cache des invites globalement ou pour des niveaux de modèle spécifiques :
| Variable d'environnement | Description |
|---|---|
DISABLE_PROMPT_CACHING |
Définissez sur 1 pour désactiver la mise en cache des invites pour tous les modèles. Prend la priorité sur les paramètres par modèle |
DISABLE_PROMPT_CACHING_HAIKU |
Définissez sur 1 pour désactiver la mise en cache des invites pour les modèles Haiku uniquement |
DISABLE_PROMPT_CACHING_SONNET |
Définissez sur 1 pour désactiver la mise en cache des invites pour les modèles Sonnet uniquement |
DISABLE_PROMPT_CACHING_OPUS |
Définissez sur 1 pour désactiver la mise en cache des invites pour les modèles Opus uniquement |
DISABLE_PROMPT_CACHING_FABLE |
Définissez sur 1 pour désactiver la mise en cache des invites pour les modèles Fable uniquement |
Pour modifier le TTL du cache ou découvrir ce qui déclenche un échec du cache, voir Comment Claude Code utilise la mise en cache des invites.