SpyBara
Go Premium

model-config.md 2026-06-09 06:34 UTC to 2026-06-10 23:57 UTC

133 added, 66 removed.

2026
Sat 27 01:01 Fri 26 23:00 Thu 25 23:58 Wed 24 22:02 Tue 23 22:00 Mon 22 23:59 Fri 19 22:58 Thu 18 22:00 Wed 17 17:02 Tue 16 21:57 Mon 15 23:02 Sat 13 21:59 Fri 12 22:00 Thu 11 23:01 Wed 10 23:57 Tue 9 06:34 Mon 8 06:52 Sat 6 06:24 Fri 5 06:45 Thu 4 06:52 Wed 3 06:53 Tue 2 06:51

Configurazione del modello

Scopri la configurazione del modello Claude Code, inclusi gli alias dei modelli come opusplan

Modelli disponibili

Per l'impostazione model in Claude Code, è possibile configurare:

  • Un alias del modello
  • Un nome del modello
    • API Anthropic: un nome del modello completo
    • Bedrock: un ARN del profilo di inferenza
    • Foundry: un nome di distribuzione
    • Vertex: un nome di versione

Alias dei modelli

Gli alias dei modelli forniscono un modo conveniente per selezionare le impostazioni del modello senza dover ricordare i numeri di versione esatti:

Alias del modello Comportamento
default Valore speciale che cancella qualsiasi override del modello e ripristina il modello consigliato per il tipo di account. Non è di per sé un alias del modello
best Utilizza il modello più capace disponibile, attualmente equivalente a opus
sonnet Utilizza il modello Sonnet più recente per le attività di codifica quotidiane
opus Utilizza il modello Opus più recente per attività di ragionamento complesso
haiku Utilizza il modello Haiku veloce ed efficiente per attività semplici
sonnet[1m] Utilizza Sonnet con una finestra di contesto di 1 milione di token per sessioni lunghe
opus[1m] Utilizza Opus con una finestra di contesto di 1 milione di token per sessioni lunghe
opusplan Modalità speciale che utilizza opus durante Plan Mode, quindi passa a sonnet per l'esecuzione

Su API Anthropic, opus si risolve in Opus 4.8 e sonnet si risolve in Sonnet 4.6. Su Claude Platform on AWS, opus si risolve in Opus 4.7 e sonnet si risolve in Sonnet 4.6. Su Bedrock, Vertex e Foundry, opus si risolve in Opus 4.6 e sonnet si risolve in Sonnet 4.5; modelli più recenti sono disponibili su questi provider selezionando il nome del modello completo esplicitamente o impostando ANTHROPIC_DEFAULT_OPUS_MODEL o ANTHROPIC_DEFAULT_SONNET_MODEL.

Gli alias puntano alla versione consigliata per il provider e si aggiornano nel tempo. Per fissare una versione specifica, utilizzare il nome del modello completo (ad esempio, claude-opus-4-8) o impostare la variabile di ambiente corrispondente come ANTHROPIC_DEFAULT_OPUS_MODEL.

Impostazione del modello

È possibile configurare il modello in diversi modi, elencati in ordine di priorità:

  1. Durante la sessione - Utilizzare /model <alias|name> per cambiare immediatamente, oppure eseguire /model senza argomenti per aprire il selettore. Il selettore chiede conferma quando la conversazione ha output precedente, poiché la risposta successiva rilegge la cronologia completa senza contesto memorizzato nella cache
  2. All'avvio - Avviare con claude --model <alias|name>
  3. Variabile di ambiente - Impostare ANTHROPIC_MODEL=<alias|name>
  4. Impostazioni - Configurare in modo permanente nel file delle impostazioni utilizzando il campo model.

A partire dalla v2.1.153, /model salva la scelta come predefinita per le nuove sessioni scrivendo il campo model nelle impostazioni utente. Nel selettore:

  • Enter: cambia modello e salva come predefinito
  • s: cambia modello solo per questa sessione

Digitare /model <name> direttamente si comporta come Enter. Le impostazioni del progetto e gestite hanno ancora la precedenza e si riapplicano al prossimo avvio.

Nella v2.1.144 fino alla v2.1.152, /model si applicava solo alla sessione corrente e d nel selettore salvava un predefinito.

Il flag --model e la variabile di ambiente ANTHROPIC_MODEL si applicano solo alla sessione che avviate con essi. Per eseguire modelli diversi in terminali diversi contemporaneamente, avviate ciascuno con il proprio flag --model piuttosto che passare con /model.

Le sessioni riprese avviate con claude --resume, --continue, o il selettore /resume mantengono il modello che stavano utilizzando quando la trascrizione è stata salvata, indipendentemente dall'impostazione model corrente. Se quel modello è stato ritirato, la sessione ricade nell'ordine di precedenza normale. Questo impedisce che la scelta /model di un'altra sessione cambi il modello al ripristino.

Quando il modello attivo all'avvio proviene dalle impostazioni del progetto o gestite piuttosto che dalla propria selezione, l'intestazione di avvio mostra quale file di impostazioni lo ha impostato. Eseguire /model per eseguire l'override; l'impostazione del progetto o gestita si riapplica al prossimo avvio.

Esempio di utilizzo:

# Avviare con Opus
claude --model opus

# Passare a Sonnet durante la sessione
/model sonnet

File delle impostazioni di esempio:

{
    "permissions": {
        ...
    },
    "model": "opus"
}

Limitare la selezione del modello

Gli amministratori aziendali possono utilizzare availableModels nelle impostazioni gestite o di policy per limitare quali modelli gli utenti possono selezionare.

Quando availableModels è impostato, gli utenti non possono passare a modelli non presenti nell'elenco tramite /model, il flag --model, o la variabile di ambiente ANTHROPIC_MODEL.

{
  "availableModels": ["sonnet", "haiku"]
}

Comportamento del modello predefinito

L'opzione Predefinito nel selettore di modelli non è interessata da availableModels. Rimane sempre disponibile e rappresenta il valore predefinito di runtime del sistema in base al livello di sottoscrizione dell'utente.

Anche con availableModels: [], gli utenti possono comunque utilizzare Claude Code con il modello Predefinito per il loro livello.

Controllare il modello su cui gli utenti eseguono

L'impostazione model è una selezione iniziale, non un'applicazione. Imposta quale modello è attivo quando una sessione inizia, ma gli utenti possono comunque aprire /model e scegliere Predefinito, che si risolve nel valore predefinito del sistema per il loro livello indipendentemente da ciò che model è impostato.

Per controllare completamente l'esperienza del modello, combinare tre impostazioni:

  • availableModels: limita a quali modelli denominati gli utenti possono passare
  • model: imposta la selezione del modello iniziale quando una sessione inizia
  • ANTHROPIC_DEFAULT_SONNET_MODEL / ANTHROPIC_DEFAULT_OPUS_MODEL / ANTHROPIC_DEFAULT_HAIKU_MODEL: controllano a cosa si risolvono l'opzione Predefinito e gli alias sonnet, opus e haiku

Questo esempio avvia gli utenti su Sonnet 4.5, limita il selettore a Sonnet e Haiku, e fissa Predefinito per risolversi a Sonnet 4.5 piuttosto che alla versione più recente:

{
  "model": "claude-sonnet-4-5",
  "availableModels": ["claude-sonnet-4-5", "haiku"],
  "env": {
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
  }
}

Senza il blocco env, un utente che seleziona Predefinito nel selettore otterrebbe la versione Sonnet più recente, bypassando il pin di versione in model e availableModels.

Comportamento di unione

Quando availableModels è impostato a più livelli, come nelle impostazioni utente e nelle impostazioni del progetto, gli array vengono uniti e deduplicati. Per applicare un elenco di autorizzazione rigoroso, impostare availableModels nelle impostazioni gestite o di policy che hanno la priorità più alta.

ID di modello Mantle

Quando l'endpoint Bedrock Mantle è abilitato, le voci in availableModels che iniziano con anthropic. vengono aggiunte al selettore /model come opzioni personalizzate e instradate all'endpoint Mantle. Questa è un'eccezione alla corrispondenza solo alias descritta in Fissare i modelli per distribuzioni di terze parti. L'impostazione limita comunque il selettore alle voci elencate, quindi includere gli alias standard insieme a qualsiasi ID Mantle.

Comportamento speciale del modello

Impostazione del modello `default`

Il comportamento di default dipende dal tipo di account:

  • Max, Team Premium, Enterprise pay-as-you-go e API Anthropic: per impostazione predefinita Opus 4.8
  • Claude Platform su AWS: per impostazione predefinita Opus 4.7
  • Pro, Team Standard e posti di abbonamento Enterprise: per impostazione predefinita Sonnet 4.6
  • Bedrock, Vertex e Foundry: per impostazione predefinita Sonnet 4.5

Enterprise pay-as-you-go significa un'organizzazione Enterprise fatturata per utilizzo piuttosto che per posto di abbonamento.

Claude Code potrebbe eseguire automaticamente il fallback a Sonnet se si raggiunge una soglia di utilizzo con Opus.

Impostazione del modello `opusplan`

L'alias del modello opusplan fornisce un approccio ibrido automatizzato:

  • In Plan Mode - Utilizza opus per il ragionamento complesso e le decisioni architettoniche
  • In modalità esecuzione - Passa automaticamente a sonnet per la generazione di codice e l'implementazione

Questo ti dà il meglio di entrambi i mondi: il ragionamento superiore di Opus per la pianificazione e l'efficienza di Sonnet per l'esecuzione.

La fase Opus in Plan Mode viene eseguita con la finestra di contesto standard di 200K. L'aggiornamento automatico 1M descritto in Contesto esteso si applica all'impostazione del modello opus e non si estende a opusplan.

Regolare il livello di sforzo

I livelli di sforzo controllano il ragionamento adattivo, che consente al modello di decidere se e quanto pensare ad ogni passo in base alla complessità dell'attività. Lo sforzo inferiore è più veloce ed economico per attività semplici, mentre lo sforzo superiore fornisce un ragionamento più profondo per problemi complessi.

I livelli di sforzo disponibili dipendono dal modello. I modelli non elencati qui non supportano lo sforzo:

Modello Livelli
Opus 4.8 e Opus 4.7 low, medium, high, xhigh, max
Opus 4.6 e Sonnet 4.6 low, medium, high, max

Se imposti un livello che il modello attivo non supporta, Claude Code ricade al livello supportato più alto pari o inferiore a quello impostato. Ad esempio, xhigh viene eseguito come high su Opus 4.6.

Lo sforzo predefinito è high su Opus 4.8, Opus 4.6 e Sonnet 4.6, e xhigh su Opus 4.7.

Quando esegui Opus 4.8 o Opus 4.7 per la prima volta, Claude Code applica lo sforzo predefinito di quel modello anche se hai precedentemente impostato un livello diverso per un altro modello: high su Opus 4.8 e xhigh su Opus 4.7. Esegui /effort di nuovo per scegliere un livello diverso dopo il passaggio.

low, medium, high e xhigh persistono tra le sessioni. max fornisce il ragionamento più profondo senza vincoli sulla spesa di token e si applica solo alla sessione corrente, tranne quando impostato tramite la variabile di ambiente CLAUDE_CODE_EFFORT_LEVEL.

Il menu /effort offre anche ultracode. Ultracode è un'impostazione di Claude Code piuttosto che un livello di sforzo del modello: invia xhigh al modello e inoltre ha Claude orchestrare flussi di lavoro dinamici per attività sostanziali. Si applica solo alla sessione corrente. Impostalo tramite /effort, o passa "ultracode": true tramite --settings o una richiesta di controllo Agent SDK. Non fa parte dell'impostazione effortLevel, del flag --effort o di CLAUDE_CODE_EFFORT_LEVEL.

Scegliere un livello di sforzo

Ogni livello scambia la spesa di token rispetto alla capacità. Il valore predefinito è adatto alla maggior parte delle attività di codifica; regola quando desideri un equilibrio diverso.

Livello Quando utilizzarlo
low Riservare per attività brevi, limitate e sensibili alla latenza che non sono sensibili all'intelligenza
medium Riduce l'utilizzo di token per il lavoro sensibile ai costi che può scambiare un po' di intelligenza
high Bilancia l'utilizzo di token e l'intelligenza. Valore predefinito su Opus 4.8, Opus 4.6 e Sonnet 4.6
xhigh Ragionamento più profondo con spesa di token più elevata. Valore predefinito su Opus 4.7
max Può migliorare le prestazioni su attività impegnative ma potrebbe mostrare rendimenti decrescenti ed è soggetto a pensiero eccessivo. Testare prima di adottare ampiamente
ultracode Un'impostazione di Claude Code che pianifica un flusso di lavoro dinamico per ogni attività sostanziale con ragionamento xhigh per messaggio. Solo sessione

La scala dello sforzo è calibrata per modello, quindi lo stesso nome di livello non rappresenta lo stesso valore sottostante tra i modelli.

Utilizzare ultrathink per il ragionamento profondo una tantum

Includi ultrathink in qualsiasi punto del prompt per richiedere un ragionamento più profondo su quel turno senza modificare l'impostazione dello sforzo della sessione. Claude Code riconosce la parola chiave e aggiunge un'istruzione in contesto. Il livello di sforzo inviato all'API rimane invariato. Altre frasi come "think", "think hard" e "think more" vengono passate come testo ordinario del prompt e non vengono riconosciute come parole chiave.

Impostare il livello di sforzo

È possibile modificare lo sforzo attraverso uno dei seguenti:

  • /effort: eseguire /effort senza argomenti per aprire un cursore interattivo, /effort seguito da un nome di livello per impostarlo direttamente, o /effort auto per ripristinare il valore predefinito del modello
  • In /model: utilizzare i tasti freccia sinistra/destra per regolare il cursore dello sforzo quando si seleziona un modello
  • Flag --effort: passare un nome di livello per impostarlo per una singola sessione quando si avvia Claude Code
  • Variabile di ambiente: impostare CLAUDE_CODE_EFFORT_LEVEL su un nome di livello o auto
  • Impostazioni: impostare effortLevel su low, medium, high o xhigh nel file delle impostazioni. max e ultracode sono solo per la sessione e non sono accettati qui
  • Frontmatter di skill e subagent: impostare effort in un file markdown di skill o subagent per sovrascrivere il livello di sforzo quando quella skill o subagent viene eseguita

La variabile di ambiente ha la precedenza su tutti gli altri metodi, quindi il livello configurato, quindi il valore predefinito del modello. Lo sforzo del frontmatter si applica quando quella skill o subagent è attiva, sovrascrivendo il livello della sessione ma non la variabile di ambiente.

Il cursore dello sforzo appare in /model quando è selezionato un modello supportato. Il livello di sforzo corrente viene visualizzato anche accanto al logo e al spinner, ad esempio "with low effort", in modo da poter confermare quale impostazione è attiva senza aprire /model.

Ragionamento adattivo e budget di pensiero fissi

Il ragionamento adattivo rende il pensiero facoltativo ad ogni passo, quindi Claude può rispondere più velocemente ai prompt di routine e riservare un pensiero più profondo per i passi che ne traggono vantaggio. Se desideri che Claude pensi più o meno spesso di quanto il livello corrente produce, puoi dirlo direttamente nel prompt o in CLAUDE.md; il modello risponde a quella guida entro l'impostazione dello sforzo.

Opus 4.7 e versioni successive utilizzano sempre il ragionamento adattivo. La modalità budget di pensiero fisso e CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING non si applicano ad essi.

Su Opus 4.6 e Sonnet 4.6, è possibile impostare CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 per ripristinare il budget di pensiero fisso precedente controllato da MAX_THINKING_TOKENS. Vedere variabili di ambiente.

Pensiero esteso

Il pensiero esteso è il ragionamento che Claude emette prima di rispondere. Sui modelli che supportano il ragionamento adattivo, il livello di sforzo è il controllo principale per la quantità di pensiero che si verifica; le impostazioni seguenti attivano o disattivano il pensiero e controllano come viene visualizzato.

Controllo Come impostarlo
Attiva/disattiva per la sessione corrente Premere Option+T su macOS o Alt+T su Windows e Linux
Impostare il valore predefinito globale Eseguire /config e attivare/disattivare la modalità di pensiero. Salvato come alwaysThinkingEnabled in ~/.claude/settings.json
Disabilitare indipendentemente dallo sforzo Impostare MAX_THINKING_TOKENS=0. Altri valori si applicano solo con un budget di pensiero fisso

L'output del pensiero è compresso per impostazione predefinita. Premere Ctrl+O per attivare/disattivare la modalità dettagliata e visualizzare il ragionamento come testo grigio in corsivo. Le sessioni interattive sull'API Anthropic ricevono blocchi di pensiero redatti per impostazione predefinita, quindi impostare showThinkingSummaries: true nelle impostazioni se desideri che i riepiloghi completi siano disponibili quando li espandi. Viene addebitato il costo di tutti i token di pensiero generati, anche quando compressi o redatti.

Contesto esteso

Opus 4.6 e versioni successive, e Sonnet 4.6, supportano una finestra di contesto di 1 milione di token per sessioni lunghe con basi di codice di grandi dimensioni.

La disponibilità varia in base al modello e al piano. Nei piani Max, Team ed Enterprise, Opus viene automaticamente aggiornato al contesto 1M senza configurazione aggiuntiva. Questo si applica sia ai posti Team Standard che Team Premium. Sonnet con contesto 1M non fa parte dell'aggiornamento automatico e richiede crediti di utilizzo su ogni piano di abbonamento, incluso Max.

Piano Opus con contesto 1M Sonnet con contesto 1M
Max, Team ed Enterprise Incluso nell'abbonamento Richiede crediti di utilizzo
Pro Richiede crediti di utilizzo Richiede crediti di utilizzo
API e pagamento in base al consumo Accesso completo Accesso completo

Per disabilitare completamente il contesto 1M, impostare CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Questo rimuove le varianti di modello 1M dal selettore di modelli. Vedere variabili di ambiente.

La finestra di contesto 1M utilizza i prezzi standard del modello senza premio per i token oltre 200K. Per i piani in cui il contesto esteso è incluso nell'abbonamento, l'utilizzo rimane coperto dall'abbonamento. Per i piani che accedono al contesto esteso tramite crediti di utilizzo, i token vengono fatturati ai crediti di utilizzo.

Se l'account supporta il contesto 1M, l'opzione appare nel selettore di modelli (/model) nelle versioni più recenti di Claude Code. Se non la vedi, prova a riavviare la sessione.

È anche possibile utilizzare il suffisso [1m] con alias di modelli o nomi di modelli completi:

# Utilizzare l'alias opus[1m] o sonnet[1m]
/model opus[1m]
/model sonnet[1m]

# O aggiungere [1m] a un nome di modello completo
/model claude-opus-4-8[1m]

Verifica del modello corrente

È possibile vedere quale modello stai utilizzando attualmente in diversi modi:

  1. Nella riga di stato (se configurata)
  2. In /status, che visualizza anche le informazioni dell'account.

Aggiungere un'opzione di modello personalizzato

Utilizzare ANTHROPIC_CUSTOM_MODEL_OPTION per aggiungere una singola voce personalizzata al selettore /model senza sostituire gli alias incorporati. Questo è utile per testare ID di modello che Claude Code non elenca per impostazione predefinita. Per le distribuzioni di gateway LLM, Claude Code può popolare il selettore dall'endpoint /v1/models del gateway quando CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 è impostato, quindi questa variabile è necessaria solo quando la scoperta è disabilitata o non restituisce il modello desiderato. Vedere Selezione del modello del gateway LLM.

Questo esempio imposta tutte e tre le variabili per rendere selezionabile una distribuzione Opus instradata tramite gateway:

export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"

La voce personalizzata appare in fondo al selettore /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME e ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION sono facoltativi. Se omessi, l'ID del modello viene utilizzato come nome e la descrizione per impostazione predefinita è Custom model (<model-id>).

Claude Code salta la convalida per l'ID del modello impostato in ANTHROPIC_CUSTOM_MODEL_OPTION, quindi è possibile utilizzare qualsiasi stringa che l'endpoint API accetta.

Variabili di ambiente

È possibile utilizzare le seguenti variabili di ambiente, che devono essere nomi di modelli completi (o equivalenti per il provider API), per controllare i nomi dei modelli a cui gli alias si mappano.

Variabile di ambiente Descrizione
ANTHROPIC_DEFAULT_OPUS_MODEL Il modello da utilizzare per opus, o per opusplan quando Plan Mode è attivo.
ANTHROPIC_DEFAULT_SONNET_MODEL Il modello da utilizzare per sonnet, o per opusplan quando Plan Mode non è attivo.
ANTHROPIC_DEFAULT_HAIKU_MODEL Il modello da utilizzare per haiku, o funzionalità in background
CLAUDE_CODE_SUBAGENT_MODEL Il modello da utilizzare per tutti i subagents e i team di agenti. Sostituisce sia il parametro model per invocazione che il frontmatter model della definizione del subagent. Impostare su inherit per utilizzare la risoluzione del modello normale invece

Nota: ANTHROPIC_SMALL_FAST_MODEL è deprecato a favore di ANTHROPIC_DEFAULT_HAIKU_MODEL.

Fissare i modelli per distribuzioni di terze parti

Quando si distribuisce Claude Code tramite Bedrock, Vertex AI, Foundry, o Claude Platform on AWS, fissare le versioni dei modelli prima di distribuire agli utenti.

Senza fissaggio, Claude Code utilizza alias di modelli (sonnet, opus, haiku) che si risolvono nella versione più recente. Quando Anthropic rilascia un nuovo modello che non è ancora abilitato nell'account di un utente, gli utenti Bedrock e Vertex AI vedono un avviso e ricadono nella versione precedente per quella sessione, mentre gli utenti Foundry vedono errori perché Foundry non ha alcun controllo di avvio equivalente.

Utilizzare le seguenti variabili di ambiente con ID di modello specifici della versione per il provider:

Provider Esempio
Bedrock export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-8'
Vertex AI export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8'
Foundry export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8'

Applicare lo stesso modello per ANTHROPIC_DEFAULT_SONNET_MODEL e ANTHROPIC_DEFAULT_HAIKU_MODEL. Per gli ID di modello attuali e legacy su tutti i provider, vedere Panoramica dei modelli. Per aggiornare gli utenti a una nuova versione del modello, aggiornare queste variabili di ambiente e ridistribuire.

Per abilitare il contesto esteso per un modello fissato, aggiungere [1m] all'ID del modello in ANTHROPIC_DEFAULT_OPUS_MODEL o ANTHROPIC_DEFAULT_SONNET_MODEL:

export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8[1m]'

Il suffisso [1m] applica la finestra di contesto 1M a tutto l'utilizzo degli alias opus e sonnet. Non estende la fase Opus in modalità piano di opusplan, che rimane limitata a 200K.

  • Claude Code rimuove il suffisso prima di inviare l'ID del modello al provider.
  • Aggiungere [1m] solo quando il modello sottostante supporta il contesto 1M.
  • Il suffisso viene letto per variabile, non per modello. Su Bedrock, Vertex e Foundry, un ID di modello senza [1m] in una variabile utilizza il contesto 200K anche se un'altra variabile imposta lo stesso modello con il suffisso.

Personalizzare la visualizzazione e le capacità del modello fissato

Quando si fissa un modello su un provider di terze parti, l'ID specifico del provider appare così com'è nel selettore /model e Claude Code potrebbe non riconoscere quali funzionalità il modello supporta. È possibile sovrascrivere il nome di visualizzazione e dichiarare le capacità con variabili di ambiente complementari per ogni modello fissato.

Queste variabili hanno effetto su provider di terze parti come Bedrock, Vertex AI e Foundry. Le variabili _NAME e _DESCRIPTION hanno effetto anche quando ANTHROPIC_BASE_URL punta a un gateway LLM. Non hanno effetto quando si effettua la connessione direttamente a api.anthropic.com.

Variabile di ambiente Descrizione
ANTHROPIC_DEFAULT_OPUS_MODEL_NAME Nome di visualizzazione per il modello Opus fissato nel selettore /model. Per impostazione predefinita l'ID del modello quando non impostato
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION Descrizione di visualizzazione per il modello Opus fissato nel selettore /model. Per impostazione predefinita Custom Opus model quando non impostato
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES Elenco separato da virgole delle capacità che il modello Opus fissato supporta

Gli stessi suffissi _NAME, _DESCRIPTION e _SUPPORTED_CAPABILITIES sono disponibili per ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL e ANTHROPIC_CUSTOM_MODEL_OPTION.

Claude Code abilita funzionalità come livelli di sforzo e extended thinking abbinando l'ID del modello rispetto a modelli noti. Gli ID specifici del provider come ARN Bedrock o nomi di distribuzione personalizzati spesso non corrispondono a questi modelli, lasciando le funzionalità supportate disabilitate. Impostare _SUPPORTED_CAPABILITIES per dire a Claude Code quali funzionalità il modello effettivamente supporta:

Valore di capacità Abilita
effort Livelli di sforzo e il comando /effort
xhigh_effort {/* min-version: 2.1.111 */}Il livello di sforzo xhigh
max_effort Il livello di sforzo max
thinking Extended thinking
adaptive_thinking Ragionamento adattivo che alloca dinamicamente il pensiero in base alla complessità dell'attività
interleaved_thinking Pensiero tra le chiamate di strumento

Quando _SUPPORTED_CAPABILITIES è impostato, le capacità elencate sono abilitate e le capacità non elencate sono disabilitate per il modello fissato corrispondente. Quando la variabile non è impostata, Claude Code ricade sulla rilevazione incorporata basata sull'ID del modello.

Questo esempio fissa Opus a un ARN di modello personalizzato Bedrock, imposta un nome amichevole e dichiara le sue capacità:

export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'

Eseguire l'override degli ID di modello per versione

Le variabili di ambiente a livello di famiglia sopra configurano un ID di modello per alias di famiglia. Se è necessario mappare diverse versioni all'interno della stessa famiglia a ID di provider distinti, utilizzare invece l'impostazione modelOverrides.

modelOverrides mappa i singoli ID di modello Anthropic alle stringhe specifiche del provider che Claude Code invia all'API del provider. Quando un utente seleziona un modello mappato nel selettore /model, Claude Code utilizza il valore configurato invece del valore predefinito incorporato.

Questo consente agli amministratori aziendali di instradare ogni versione del modello a un ARN di profilo di inferenza Bedrock specifico, a un nome di versione Vertex AI o a un nome di distribuzione Foundry per governance, allocazione dei costi o instradamento regionale.

Impostare modelOverrides nel file delle impostazioni:

{
  "modelOverrides": {
    "claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
    "claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
    "claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
  }
}

Le chiavi devono essere ID di modello Anthropic come elencati nella Panoramica dei modelli. Per gli ID di modello datati, includere il suffisso della data esattamente come appare lì. Le chiavi sconosciute vengono ignorate.

Gli override sostituiscono gli ID di modello incorporati che supportano ogni voce nel selettore /model. Su Bedrock, gli override hanno la precedenza su qualsiasi profilo di inferenza che Claude Code scopre automaticamente all'avvio. I valori forniti direttamente tramite ANTHROPIC_MODEL, --model o le variabili di ambiente ANTHROPIC_DEFAULT_*_MODEL vengono passati al provider così come sono e non vengono trasformati da modelOverrides.

modelOverrides funziona insieme a availableModels. L'elenco di autorizzazione viene valutato rispetto all'ID di modello Anthropic, non al valore di override, quindi una voce come "opus" in availableModels continua a corrispondere anche quando le versioni di Opus sono mappate a ARN.

Configurazione della prompt caching

Claude Code utilizza automaticamente la prompt caching per ottimizzare le prestazioni e ridurre i costi. È possibile disabilitare la prompt caching globalmente o per livelli di modello specifici:

Variabile di ambiente Descrizione
DISABLE_PROMPT_CACHING Impostare su 1 per disabilitare la prompt caching per tutti i modelli. Ha la precedenza sulle impostazioni per modello
DISABLE_PROMPT_CACHING_HAIKU Impostare su 1 per disabilitare la prompt caching solo per i modelli Haiku
DISABLE_PROMPT_CACHING_SONNET Impostare su 1 per disabilitare la prompt caching solo per i modelli Sonnet
DISABLE_PROMPT_CACHING_OPUS Impostare su 1 per disabilitare la prompt caching solo per i modelli Opus

Per modificare il TTL della cache o scoprire cosa attiva un cache miss, vedere Come Claude Code utilizza la prompt caching.