SpyBara
Go Premium

model-config.md 2026-06-16 21:57 UTC to 2026-06-17 17:02 UTC

162 added, 40 removed.

2026
Fri 19 22:58 Thu 18 22:00 Wed 17 17:02 Tue 16 21:57 Mon 15 23:02 Sat 13 21:59 Fri 12 22:00 Thu 11 23:01 Wed 10 23:57 Tue 9 06:34 Mon 8 06:52 Sat 6 06:24 Fri 5 06:45 Thu 4 06:52 Wed 3 06:53 Tue 2 06:51

Configurazione del modello

Scopri la configurazione del modello Claude Code, inclusi gli alias dei modelli come opusplan

Modelli disponibili

Per l'impostazione model in Claude Code, è possibile configurare:

  • Un alias del modello
  • Un nome del modello
    • API Anthropic: un nome del modello completo
    • Bedrock: un ARN del profilo di inferenza
    • Foundry: un nome di distribuzione
    • Vertex: un nome di versione

Alias dei modelli

Gli alias dei modelli forniscono un modo conveniente per selezionare le impostazioni del modello senza dover ricordare i numeri di versione esatti:

Alias del modello Comportamento
default Valore speciale che cancella qualsiasi override del modello e ripristina il modello consigliato per il tipo di account. Non è di per sé un alias del modello
best Utilizza Fable 5 dove la vostra organizzazione ha accesso, altrimenti il modello Opus più recente
fable Utilizza Claude Fable 5 per i vostri compiti più difficili e di lunga durata
sonnet Utilizza il modello Sonnet più recente per le attività di codifica quotidiane
opus Utilizza il modello Opus più recente per attività di ragionamento complesso
haiku Utilizza il modello Haiku veloce ed efficiente per attività semplici
sonnet[1m] Utilizza Sonnet con una finestra di contesto di 1 milione di token per sessioni lunghe
opus[1m] Utilizza Opus con una finestra di contesto di 1 milione di token per sessioni lunghe
opusplan Modalità speciale che utilizza opus durante Plan Mode, quindi passa a sonnet per l'esecuzione

Su API Anthropic, opus si risolve in Opus 4.8 e sonnet si risolve in Sonnet 4.6. Su Claude Platform on AWS, opus si risolve in Opus 4.7 e sonnet si risolve in Sonnet 4.6. Su Bedrock, Vertex e Foundry, opus si risolve in Opus 4.6 e sonnet si risolve in Sonnet 4.5; modelli più recenti sono disponibili su questi provider selezionando il nome del modello completo esplicitamente o impostando ANTHROPIC_DEFAULT_OPUS_MODEL o ANTHROPIC_DEFAULT_SONNET_MODEL.

Gli alias puntano alla versione consigliata per il provider e si aggiornano nel tempo. Per fissare una versione specifica, utilizzare il nome del modello completo (ad esempio, claude-opus-4-8) o impostare la variabile di ambiente corrispondente come ANTHROPIC_DEFAULT_OPUS_MODEL.

Lavorare con Fable 5

Claude Fable 5 è il modello più capace in Claude Code, adatto a compiti più grandi di una singola sessione. Sostiene lunghe sessioni autonome, indaga prima di agire e verifica il suo lavoro più spesso rispetto ai modelli più piccoli.

Fable 5 non è il modello predefinito. Selezionatelo con /model fable. Le richieste che i suoi classificatori di sicurezza contrassegnano, il più delle volte nei domini della sicurezza informatica e della biologia, attivano il fallback automatico del modello.

Per ottenere il massimo da Fable 5:

  • Descrivete il risultato, non i passaggi: dategli il risultato che desiderate e lasciate che pianifichi il percorso. Per mantenerlo al lavoro fino a quando quel risultato non si verifica, impostate un obiettivo.
  • Dategli problemi ambigui: le indagini sulla causa principale, il debug dei disservizi e le decisioni architettoniche sono dove l'indagine e la verifica aggiuntive ripagano.
  • Saltate i promemoria di verifica: verifica il suo lavoro con meno sollecitazioni, quindi i promemoria per testare o controllare sono solitamente non necessari.
  • Dimensionate compiti più grandi: dategli lavoro che normalmente dividereste in pezzi. Sostiene lunghe sessioni senza perdere il filo.

Impostazione del modello

È possibile configurare il modello in diversi modi, elencati in ordine di priorità:

  1. Durante la sessione - Utilizzare /model <alias|name> per cambiare immediatamente, oppure eseguire /model senza argomenti per aprire il selettore. Il selettore chiede conferma quando la conversazione ha output precedente, poiché la risposta successiva rilegge la cronologia completa senza contesto memorizzato nella cache
  2. All'avvio - Avviare con claude --model <alias|name>
  3. Variabile di ambiente - Impostare ANTHROPIC_MODEL=<alias|name>
  4. Impostazioni - Configurare in modo permanente nel file delle impostazioni utilizzando il campo model.

A partire dalla v2.1.153, /model salva la scelta come predefinita per le nuove sessioni scrivendo il campo model nelle impostazioni utente. Nel selettore:

  • Enter: cambia modello e salva come predefinito
  • s: cambia modello solo per questa sessione

Digitare /model <name> direttamente si comporta come Enter. Le impostazioni del progetto e gestite hanno ancora la precedenza e si riapplicano al prossimo avvio.

Nella v2.1.144 fino alla v2.1.152, /model si applicava solo alla sessione corrente e d nel selettore salvava un predefinito.

Il flag --model e la variabile di ambiente ANTHROPIC_MODEL si applicano solo alla sessione che avviate con essi. Per eseguire modelli diversi in terminali diversi contemporaneamente, avviate ciascuno con il proprio flag --model piuttosto che passare con /model.

Le sessioni riprese avviate con claude --resume, --continue, o il selettore /resume mantengono il modello che stavano utilizzando quando la trascrizione è stata salvata, indipendentemente dall'impostazione model corrente. Se quel modello è stato ritirato, la sessione ricade nell'ordine di precedenza normale. Questo impedisce che la scelta /model di un'altra sessione cambi il modello al ripristino.

Quando il modello attivo all'avvio proviene dalle impostazioni del progetto o gestite piuttosto che dalla propria selezione, l'intestazione di avvio mostra quale file di impostazioni lo ha impostato. Eseguire /model per eseguire l'override; l'impostazione del progetto o gestita si riapplica al prossimo avvio.

Esempio di utilizzo:

# Avviare con Opus
claude --model opus

# Passare a Sonnet durante la sessione
/model sonnet

File delle impostazioni di esempio:

{
    "permissions": {
        ...
    },
    "model": "opus"
}

Limitare la selezione del modello

Gli amministratori aziendali possono utilizzare availableModels nelle impostazioni gestite o di policy per limitare quali modelli gli utenti possono selezionare.

Quando availableModels è impostato, l'elenco di autorizzazione si applica ovunque un utente possa specificare un modello:

  • Modello della sessione principale: /model, il flag --model e la variabile di ambiente ANTHROPIC_MODEL
  • Risoluzione alias: {/* min-version: 2.1.176 */}le variabili di ambiente ANTHROPIC_DEFAULT_OPUS_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL e ANTHROPIC_DEFAULT_FABLE_MODEL non possono reindirizzare un alias consentito a un modello al di fuori dell'elenco
  • Modalità veloce: {/* min-version: 2.1.176 */}/fast rifiuta di attivare/disattivare quando comporterebbe un passaggio implicito a un modello Opus al di fuori dell'elenco, con il messaggio "is not in your organization's allowed models"
  • Modelli dei subagent: il campo model nel frontmatter del subagent, il parametro model dello strumento Agent, il selettore di modelli in /agents e CLAUDE_CODE_SUBAGENT_MODEL
  • Modello Advisor: l'impostazione advisorModel configurata
  • Catene di fallback: gli elementi di una catena di modelli di fallback al di fuori dell'elenco vengono eliminati

Il passaggio a un modello bloccato con /model viene rifiutato con un errore, mentre un flag --model bloccato o un valore ANTHROPIC_MODEL viene sostituito all'avvio con un avviso che nomina sia i modelli richiesti che quelli sostituiti, e la sessione inizia sul modello predefinito. Un override di subagent o advisor bloccato ritorna al modello ereditato o predefinito piuttosto che non riuscire nella richiesta.

{
  "availableModels": ["sonnet", "haiku"]
}

Comportamento del modello predefinito

Per impostazione predefinita, l'opzione Predefinito nel selettore di modelli non è interessata da availableModels. Rimane disponibile e rappresenta il valore predefinito di runtime del sistema in base al livello di sottoscrizione dell'utente.

Per estendere l'elenco di autorizzazione all'opzione Predefinito, impostare enforceAvailableModels su true nelle impostazioni gestite o di policy insieme a un elenco availableModels non vuoto. Quando il valore predefinito del livello non è nell'elenco di autorizzazione, Predefinito si risolve nella prima voce consentita invece del valore predefinito del livello. Questo richiede Claude Code v2.1.175 o successivo.

Un array availableModels vuoto non attiva mai l'applicazione. Anche con availableModels: [], gli utenti possono comunque utilizzare Claude Code con il modello Predefinito per il loro livello indipendentemente da enforceAvailableModels.

Controllare il modello su cui gli utenti eseguono

L'impostazione model è una selezione iniziale, non un'applicazione. Imposta quale modello è attivo quando una sessione inizia, ma gli utenti possono comunque aprire /model e scegliere Predefinito, che si risolve nel valore predefinito del sistema per il loro livello indipendentemente da ciò che model è impostato.

Per controllare completamente l'esperienza del modello, combinare queste impostazioni:

  • availableModels: limita a quali modelli denominati gli utenti possono passare
  • enforceAvailableModels: estende l'elenco di autorizzazione availableModels all'opzione Predefinito, quindi Predefinito non può risolversi a un modello al di fuori dell'elenco
  • model: imposta la selezione del modello iniziale quando una sessione inizia
  • ANTHROPIC_DEFAULT_SONNET_MODEL / ANTHROPIC_DEFAULT_OPUS_MODEL / ANTHROPIC_DEFAULT_HAIKU_MODEL / ANTHROPIC_DEFAULT_FABLE_MODEL: controllano a cosa si risolvono l'opzione Predefinito e gli alias sonnet, opus, haiku e fable

Questo esempio avvia gli utenti su Sonnet 4.5, limita il selettore a Sonnet e Haiku, e assicura che Predefinito si risolva a un modello nell'elenco di autorizzazione piuttosto che al valore predefinito del livello:

{
  "model": "claude-sonnet-4-5",
  "availableModels": ["claude-sonnet-4-5", "haiku"],
  "enforceAvailableModels": true,
  "env": {
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
  }
}

Senza enforceAvailableModels o il blocco env, un utente che seleziona Predefinito nel selettore otterrebbe la versione più recente per il suo livello, bypassando il pin di versione in model e availableModels. Le due impostazioni coprono ambiti diversi: enforceAvailableModels fa sì che Predefinito obbedisca all'elenco di autorizzazione, mentre il blocco env fissa quale versione un alias consentito come sonnet si risolve. Utilizzare enforceAvailableModels da solo quando limitare le famiglie di modelli è sufficiente; aggiungere il blocco env quando è necessario anche fissare una versione specifica.

Comportamento di unione

Quando availableModels è impostato nelle impostazioni utente, progetto e locali solamente, gli array vengono uniti e deduplicati su questi livelli.

Quando availableModels è impostato nelle impostazioni gestite o di policy, il valore gestito o di policy sostituisce completamente il risultato unito: le voci aggiunte nelle impostazioni utente o progetto non possono ampliarlo. Le impostazioni gestite e di policy sostituiscono i valori di precedenza inferiore per enforceAvailableModels allo stesso modo. A partire da Claude Code v2.1.175, questo è l'unico modo per applicare un elenco di autorizzazione rigoroso; le versioni precedenti uniscono l'elenco gestito con le voci di precedenza inferiore.

ID di modello Mantle

Quando l'endpoint Bedrock Mantle è abilitato, le voci in availableModels che iniziano con anthropic. vengono aggiunte al selettore /model come opzioni personalizzate e instradate all'endpoint Mantle. L'impostazione limita comunque il selettore alle voci elencate, quindi includere gli alias standard insieme a qualsiasi ID Mantle.

Comportamento speciale del modello

Impostazione del modello `default`

Il comportamento di default dipende dal tipo di account:

  • Max, Team Premium, Enterprise pay-as-you-go e API Anthropic: per impostazione predefinita Opus 4.8
  • Claude Platform su AWS: per impostazione predefinita Opus 4.7
  • Pro, Team Standard e posti di abbonamento Enterprise: per impostazione predefinita Sonnet 4.6
  • Bedrock, Vertex e Foundry: per impostazione predefinita Sonnet 4.5

Enterprise pay-as-you-go significa un'organizzazione Enterprise fatturata per utilizzo piuttosto che per posto di abbonamento.

Fable 5 non è il modello predefinito su alcun tipo di account. Le sessioni utilizzano Fable 5 solo dopo che lo scegliete, con /model fable, un'impostazione model, o l'alias best dove Fable 5 è disponibile. Sceglierlo con /model lo salva come modello selezionato nelle impostazioni utente, quindi le sessioni successive iniziano su Fable 5 fino a quando non cambiate modello.

Impostazione del modello `opusplan`

L'alias del modello opusplan fornisce un approccio ibrido automatizzato:

  • In Plan Mode - Utilizza opus per il ragionamento complesso e le decisioni architettoniche
  • In modalità esecuzione - Passa automaticamente a sonnet per la generazione di codice e l'implementazione

Questo vi dà il meglio di entrambi i mondi: il ragionamento superiore di Opus per la pianificazione e l'efficienza di Sonnet per l'esecuzione.

La fase Opus in Plan Mode utilizza la stessa finestra di contesto dell'impostazione del modello opus. Sui livelli di abbonamento in cui Opus viene automaticamente aggiornato a contesto 1M, opusplan riceve l'aggiornamento anche in Plan Mode. Per forzare il contesto 1M per entrambe le fasi quando non siete su un livello di aggiornamento automatico, impostare il modello su opusplan[1m].

Quando availableModels esclude Opus, opusplan rimane su Sonnet in Plan Mode invece di passare. Allo stesso modo, una sessione Haiku che normalmente si aggiornerebbe a Sonnet in Plan Mode rimane su Haiku quando Sonnet è escluso.

Per un approccio ibrido in cui Claude decide a metà attività quando consultare un secondo modello piuttosto che passare al confine del piano, vedere lo strumento advisor.

Catene di modelli di fallback

Quando il modello primario è sovraccarico, non disponibile o restituisce un altro errore del server non ripetibile, Claude Code può passare a un modello di fallback invece di non riuscire nella richiesta. Gli errori di autenticazione, fatturazione, limite di velocità, dimensione della richiesta e trasporto non attivano mai un passaggio; quelli seguono il loro normale retry e gestione degli errori.

Configurate uno o più modelli di fallback e Claude Code li prova in ordine, mostrando un avviso quando passa. Il passaggio dura solo il turno corrente, quindi il vostro prossimo messaggio prova prima il modello primario di nuovo. Le catene sono limitate a tre modelli dopo la rimozione dei duplicati e le voci extra vengono ignorate.

Impostare una catena per una sessione con il flag --fallback-model, che accetta un elenco separato da virgole:

claude --fallback-model sonnet,haiku

Per mantenere una catena tra le sessioni, impostare fallbackModel in impostazioni come array:

{
  "fallbackModel": ["claude-sonnet-4-6", "claude-haiku-4-5"]
}

Il flag --fallback-model ha la precedenza sull'impostazione fallbackModel. Ogni elemento accetta un nome di modello o un alias, e "default" si espande al modello predefinito.

Due casi causano il salto di un elemento:

  • Modello non disponibile: un modello che non può essere raggiunto, come un modello ritirato bloccato nelle impostazioni, viene saltato e Claude Code continua all'elemento successivo.
  • Fuori dall'elenco consentito: un elemento non consentito da availableModels viene eliminato quando la catena viene letta e non viene mai provato.

Fallback automatico del modello

Questa sezione copre il fallback basato sul contenuto da Fable 5. Per il fallback basato sulla disponibilità quando un modello è sovraccarico o non disponibile, vedere Catene di modelli di fallback.

Fable 5 viene eseguito con classificatori di sicurezza per il contenuto di sicurezza informatica e biologia. Quando un classificatore contrassegna una richiesta, Claude Code riesegue quella richiesta sul modello Opus predefinito e mostra un avviso nella trascrizione: Opus 4.8 su API Anthropic e distribuzioni gateway LLM, oppure Opus 4.7 su Claude Platform su AWS.

La sessione continua quindi su quel modello Opus. Per tornare a Fable 5, eseguire /model fable.

Verificare cosa ha attivato il fallback

Il fallback può attivarsi sulla prima richiesta di una sessione, prima di inviare qualcosa di insolito, perché la prima richiesta contiene il contesto dell'area di lavoro come il contenuto di CLAUDE.md e lo stato di git. Un repository che contiene materiale di sicurezza o biologia può attivare il classificatore solo su quel contesto.

Per verificare se le personalizzazioni sono il trigger, avviare una sessione con claude --safe-mode, che disabilita le personalizzazioni come CLAUDE.md, skills, server MCP e hooks. Lo stato di git e i nomi delle directory non sono personalizzazioni e sono ancora inclusi.

Chiedere prima di passare

Per decidere cosa accade ogni volta che una richiesta viene contrassegnata, piuttosto che passare automaticamente, eseguire /config e disattivare "switch models when a message is flagged". Una richiesta contrassegnata mette quindi in pausa la sessione con due opzioni: passare al modello Opus o modificare il prompt e riprovare su Fable 5.

Alcuni casi si comportano diversamente:

  • Se entrambi i modelli contrassegnano la stessa richiesta, potete modificare il prompt e riprovare, o avviare una nuova sessione.
  • Su sessioni mobili Claude Code sul web, la modifica e il nuovo tentativo non sono supportati. Passate i modelli o continuate la sessione da un browser desktop o dall'app desktop.
  • In modalità non interattiva e integrazioni SDK che non possono mostrare il prompt, una richiesta contrassegnata termina il turno con un rifiuto.

Abilitare il fallback su Bedrock, Vertex AI e Foundry

Su Amazon Bedrock, Google Vertex AI e Microsoft Foundry, gli ID modello sono specifici del provider, quindi il fallback automatico funziona solo quando Claude Code può identificare entrambi i modelli coinvolti:

  • Claude Code deve riconoscere il modello corrente come Fable 5: l'ID modello contiene claude-fable-5, corrisponde al valore di ANTHROPIC_DEFAULT_FABLE_MODEL, o è mappato con modelOverrides.
  • Il target di fallback deve risolvere a un modello Opus: il valore di ANTHROPIC_DEFAULT_OPUS_MODEL se impostato, altrimenti una voce Opus 4.8 nell'elenco dei modelli del provider.

Se uno dei modelli non può essere identificato, Claude Code non passa automaticamente. La richiesta contrassegnata termina con un messaggio di rifiuto e potete passare i modelli con /model e riprovare. Per abilitare il fallback automatico su questi provider, impostare ANTHROPIC_DEFAULT_FABLE_MODEL al vostro ID modello Fable 5 e ANTHROPIC_DEFAULT_OPUS_MODEL al vostro ID modello Opus 4.8.

Carichi di lavoro di ricerca sulla sicurezza e biologia

I carichi di lavoro in sicurezza offensiva o biologia, inclusi test di penetrazione, esercizi Capture the Flag (CTF) e basi di codice adiacenti alla biologia, attivano il fallback frequentemente, spesso sulla prima richiesta. Per il lavoro sostanziale di biologia, aspettatevi che quasi tutte le richieste vengano reindirizzate.

Questo è il routing previsto per questi domini, non un flag di account. Se la vostra organizzazione ha bisogno di capacità di classe Fable per questo lavoro, chiedete al vostro team di account Anthropic riguardo ai programmi di accesso affidabile.

Regolare il livello di sforzo

I livelli di sforzo controllano il ragionamento adattivo, che consente al modello di decidere se e quanto pensare ad ogni passo in base alla complessità dell'attività. Lo sforzo inferiore è più veloce ed economico per attività semplici, mentre lo sforzo superiore fornisce un ragionamento più profondo per problemi complessi.

I livelli di sforzo disponibili dipendono dal modello. I modelli non elencati qui non supportano lo sforzo:

Modello Livelli
Fable 5 low, medium, high, xhigh, max
Opus 4.8 e Opus 4.7 low, medium, high, xhigh, max
Opus 4.6 e Sonnet 4.6 low, medium, high, max

Se impostate un livello che il modello attivo non supporta, Claude Code ricade al livello supportato più alto pari o inferiore a quello impostato. Ad esempio, xhigh viene eseguito come high su Opus 4.6.

Lo sforzo predefinito è high su Fable 5, Opus 4.8, Opus 4.6 e Sonnet 4.6, e xhigh su Opus 4.7.

Quando eseguite Fable 5, Opus 4.8 o Opus 4.7 per la prima volta, Claude Code applica lo sforzo predefinito di quel modello anche se avete precedentemente impostato un livello diverso per un altro modello: high su Fable 5 e Opus 4.8, e xhigh su Opus 4.7. Eseguite /effort di nuovo per scegliere un livello diverso dopo il passaggio.

low, medium, high e xhigh persistono tra le sessioni. max fornisce il ragionamento più profondo senza vincoli sulla spesa di token e si applica solo alla sessione corrente, tranne quando impostato tramite la variabile di ambiente CLAUDE_CODE_EFFORT_LEVEL.

Il menu /effort offre anche ultracode. Ultracode è un'impostazione di Claude Code piuttosto che un livello di sforzo del modello: invia xhigh al modello e inoltre ha Claude orchestrare flussi di lavoro dinamici per attività sostanziali. Si applica solo alla sessione corrente. Impostatelo tramite /effort, o passate "ultracode": true tramite --settings o una richiesta di controllo Agent SDK. Non fa parte dell'impostazione effortLevel, del flag --effort o di CLAUDE_CODE_EFFORT_LEVEL.

Scegliere un livello di sforzo

Ogni livello scambia la spesa di token rispetto alla capacità. Il valore predefinito è adatto alla maggior parte delle attività di codifica; regolate quando desiderate un equilibrio diverso.

Livello Quando utilizzarlo
low Riservare per attività brevi, limitate e sensibili alla latenza che non sono sensibili all'intelligenza
medium Riduce l'utilizzo di token per il lavoro sensibile ai costi che può scambiare un po' di intelligenza
high Bilancia l'utilizzo di token e l'intelligenza. Valore predefinito su Fable 5, Opus 4.8, Opus 4.6 e Sonnet 4.6
xhigh Ragionamento più profondo con spesa di token più elevata. Valore predefinito su Opus 4.7
max Può migliorare le prestazioni su attività impegnative ma potrebbe mostrare rendimenti decrescenti ed è soggetto a pensiero eccessivo. Testare prima di adottare ampiamente
ultracode Un'impostazione di Claude Code che pianifica un flusso di lavoro dinamico per ogni attività sostanziale con ragionamento xhigh per messaggio. Solo sessione

La scala dello sforzo è calibrata per modello, quindi lo stesso nome di livello non rappresenta lo stesso valore sottostante tra i modelli.

Utilizzare ultrathink per il ragionamento profondo una tantum

Includete ultrathink in qualsiasi punto del prompt per richiedere un ragionamento più profondo su quel turno senza modificare l'impostazione dello sforzo della sessione. Claude Code riconosce la parola chiave e aggiunge un'istruzione in contesto. Il livello di sforzo inviato all'API rimane invariato. Altre frasi come "think", "think hard" e "think more" vengono passate come testo ordinario del prompt e non vengono riconosciute come parole chiave.

Impostare il livello di sforzo

Potete modificare lo sforzo attraverso uno dei seguenti:

  • /effort: eseguire /effort senza argomenti per aprire un cursore interattivo, /effort seguito da un nome di livello per impostarlo direttamente, o /effort auto per ripristinare il valore predefinito del modello
  • In /model: utilizzare i tasti freccia sinistra/destra per regolare il cursore dello sforzo quando si seleziona un modello
  • Flag --effort: passare un nome di livello per impostarlo per una singola sessione quando si avvia Claude Code
  • Variabile di ambiente: impostare CLAUDE_CODE_EFFORT_LEVEL su un nome di livello o auto
  • Impostazioni: impostare effortLevel su low, medium, high o xhigh nel file delle impostazioni. max e ultracode sono solo per la sessione e non sono accettati qui
  • Frontmatter di skill e subagent: impostare effort in un file markdown di skill o subagent per sovrascrivere il livello di sforzo quando quella skill o subagent viene eseguita

La variabile di ambiente ha la precedenza su tutti gli altri metodi, quindi il livello configurato, quindi il valore predefinito del modello. Lo sforzo del frontmatter si applica quando quella skill o subagent è attiva, sovrascrivendo il livello della sessione ma non la variabile di ambiente.

Il cursore dello sforzo appare in /model quando è selezionato un modello supportato. Il livello di sforzo corrente viene visualizzato anche accanto al logo e al spinner, ad esempio "with low effort", in modo da poter confermare quale impostazione è attiva senza aprire /model.

Ragionamento adattivo e budget di pensiero fissi

Il ragionamento adattivo rende il pensiero facoltativo ad ogni passo, quindi Claude può rispondere più velocemente ai prompt di routine e riservare un pensiero più profondo per i passi che ne traggono vantaggio. Se desiderate che Claude pensi più o meno spesso di quanto il livello corrente produce, potete dirlo direttamente nel prompt o in CLAUDE.md; il modello risponde a quella guida entro l'impostazione dello sforzo.

Opus 4.7 e versioni successive utilizzano sempre il ragionamento adattivo, così come Fable 5. La modalità budget di pensiero fisso e CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING non si applicano ad essi.

Su Opus 4.6 e Sonnet 4.6, potete impostare CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 per ripristinare il budget di pensiero fisso precedente controllato da MAX_THINKING_TOKENS. Vedere variabili di ambiente.

Pensiero esteso

Il pensiero esteso è il ragionamento che Claude emette prima di rispondere. Sui modelli che supportano il ragionamento adattivo, il livello di sforzo è il controllo principale per la quantità di pensiero che si verifica; le impostazioni seguenti attivano o disattivano il pensiero e controllano come viene visualizzato.

Controllo Come impostarlo
Attiva/disattiva per la sessione corrente Premere Option+T su macOS o Alt+T su Windows e Linux
Impostare il valore predefinito globale Eseguire /config e attivare/disattivare la modalità di pensiero. Salvato come alwaysThinkingEnabled in ~/.claude/settings.json
Disabilitare indipendentemente dallo sforzo Impostare MAX_THINKING_TOKENS=0, che disattiva il pensiero su API Anthropic tranne su Fable 5. Su provider di terze parti questo omette il parametro thinking invece, e i modelli di ragionamento adattivo potrebbero comunque pensare. Altri valori si applicano solo con un budget di pensiero fisso

Il pensiero non può essere disattivato su Fable 5. L'attivazione/disattivazione della sessione, alwaysThinkingEnabled e MAX_THINKING_TOKENS=0 non hanno effetto lì, e Fable 5 decide per ogni passo quanto pensare in base al livello di sforzo.

L'output del pensiero è compresso per impostazione predefinita. Premere Ctrl+O per attivare/disattivare la modalità dettagliata e visualizzare il ragionamento come testo grigio in corsivo. Le sessioni interattive su API Anthropic ricevono blocchi di pensiero redatti per impostazione predefinita, quindi impostare showThinkingSummaries: true nelle impostazioni se desiderate che i riepiloghi completi siano disponibili quando li espandete. Viene addebitato il costo di tutti i token di pensiero generati, anche quando compressi o redatti.

Contesto esteso

Fable 5, Opus 4.6 e versioni successive, e Sonnet 4.6 supportano una finestra di contesto di 1 milione di token per sessioni lunghe con basi di codice di grandi dimensioni.

La disponibilità varia in base al modello e al piano. Nei piani Max, Team ed Enterprise, Opus viene automaticamente aggiornato al contesto 1M senza configurazione aggiuntiva. Questo si applica sia ai posti Team Standard che Team Premium. Su API Anthropic, Fable 5, Opus 4.8 e Opus 4.7 vengono sempre eseguiti con la finestra 1M. Sonnet con contesto 1M non fa parte dell'aggiornamento automatico e richiede crediti di utilizzo su ogni piano di abbonamento, incluso Max.

Piano Opus con contesto 1M Sonnet con contesto 1M
Max, Team ed Enterprise Incluso nell'abbonamento Richiede crediti di utilizzo
Pro Richiede crediti di utilizzo Richiede crediti di utilizzo
API e pagamento in base al consumo Accesso completo Accesso completo

Per disabilitare completamente il contesto 1M, impostare CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Questo rimuove le varianti di modello 1M dal selettore di modelli. Vedere variabili di ambiente.

La finestra di contesto 1M utilizza i prezzi standard del modello senza premio per i token oltre 200K. Per i piani in cui il contesto esteso è incluso nell'abbonamento, l'utilizzo rimane coperto dall'abbonamento. Per i piani che accedono al contesto esteso tramite crediti di utilizzo, i token vengono fatturati ai crediti di utilizzo.

Se l'account supporta il contesto 1M, l'opzione appare nel selettore di modelli (/model) nelle versioni più recenti di Claude Code. Se non la vedete, provate a riavviare la sessione.

Potete anche utilizzare il suffisso [1m] con alias di modelli o nomi di modelli completi:

# Utilizzare l'alias opus[1m] o sonnet[1m]
/model opus[1m]
/model sonnet[1m]

# O aggiungere [1m] a un nome di modello completo
/model claude-opus-4-8[1m]

Verifica del modello corrente

È possibile vedere quale modello stai utilizzando attualmente in diversi modi:

  1. Nella riga di stato (se configurata)
  2. In /status, che visualizza anche le informazioni dell'account.

Aggiungere un'opzione di modello personalizzato

Utilizzare ANTHROPIC_CUSTOM_MODEL_OPTION per aggiungere una singola voce personalizzata al selettore /model senza sostituire gli alias incorporati. Questo è utile per testare ID di modello che Claude Code non elenca per impostazione predefinita. Per le distribuzioni di gateway LLM, Claude Code può popolare il selettore dall'endpoint /v1/models del gateway quando CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 è impostato, quindi questa variabile è necessaria solo quando la scoperta è disabilitata o non restituisce il modello desiderato. Vedere Selezione del modello del gateway LLM.

Questo esempio imposta tutte e tre le variabili per rendere selezionabile una distribuzione Opus instradata tramite gateway:

export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"

La voce personalizzata appare in fondo al selettore /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME e ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION sono facoltativi. Se omessi, l'ID del modello viene utilizzato come nome e la descrizione per impostazione predefinita è Custom model (<model-id>).

Claude Code salta la convalida per l'ID del modello impostato in ANTHROPIC_CUSTOM_MODEL_OPTION, quindi è possibile utilizzare qualsiasi stringa che l'endpoint API accetta.

Variabili di ambiente

È possibile utilizzare le seguenti variabili di ambiente, che devono essere nomi di modelli completi (o equivalenti per il provider API), per controllare i nomi dei modelli a cui gli alias si mappano.

Variabile di ambiente Descrizione
ANTHROPIC_DEFAULT_FABLE_MODEL Il modello da utilizzare per fable, e l'ID del modello che Claude Code riconosce come Fable 5 per il fallback automatico del modello su provider di terze parti
ANTHROPIC_DEFAULT_OPUS_MODEL Il modello da utilizzare per opus, o per opusplan quando Plan Mode è attivo.
ANTHROPIC_DEFAULT_SONNET_MODEL Il modello da utilizzare per sonnet, o per opusplan quando Plan Mode non è attivo.
ANTHROPIC_DEFAULT_HAIKU_MODEL Il modello da utilizzare per haiku, o funzionalità in background
CLAUDE_CODE_SUBAGENT_MODEL Il modello da utilizzare per tutti i subagents e i team di agenti. Sostituisce sia il parametro model per invocazione che il frontmatter model della definizione del subagent. Impostare su inherit per utilizzare la risoluzione del modello normale invece

Nota: ANTHROPIC_SMALL_FAST_MODEL è deprecato a favore di ANTHROPIC_DEFAULT_HAIKU_MODEL.

Fissare i modelli per distribuzioni di terze parti

Quando si distribuisce Claude Code tramite Bedrock, Vertex AI, Foundry, o Claude Platform on AWS, fissare le versioni dei modelli prima di distribuire agli utenti.

Senza fissaggio, Claude Code utilizza alias di modelli come fable, opus, sonnet e haiku che si risolvono in un ID di modello predefinito incorporato per ogni provider. Tale impostazione predefinita può rimanere indietro rispetto alla versione più recente di Anthropic, e il modello a cui punta potrebbe non essere ancora abilitato nell'account di un utente. Quando l'impostazione predefinita non è disponibile, gli utenti Bedrock e Vertex AI vedono un avviso e ricadono nella versione precedente per quella sessione, mentre gli utenti Foundry vedono errori perché Foundry non ha alcun controllo di avvio equivalente.

Utilizzare le seguenti variabili di ambiente con ID di modello specifici della versione per il provider:

Provider Esempio
Bedrock export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-8'
Vertex AI export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8'
Foundry export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8'

Applicare lo stesso modello per ANTHROPIC_DEFAULT_FABLE_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL e ANTHROPIC_DEFAULT_HAIKU_MODEL. Per gli ID di modello attuali e legacy su tutti i provider, vedere Panoramica dei modelli. Per aggiornare gli utenti a una nuova versione del modello, aggiornare queste variabili di ambiente e ridistribuire.

Per abilitare il contesto esteso per un modello fissato, aggiungere [1m] all'ID del modello in ANTHROPIC_DEFAULT_OPUS_MODEL o ANTHROPIC_DEFAULT_SONNET_MODEL:

export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8[1m]'

Il suffisso [1m] applica la finestra di contesto 1M a tutto l'utilizzo degli alias opus e sonnet, inclusa la fase Opus in modalità piano di opusplan.

  • Claude Code rimuove il suffisso prima di inviare l'ID del modello al provider.
  • Aggiungere [1m] solo quando il modello sottostante supporta il contesto 1M.
  • Il suffisso viene letto per variabile, non per modello. Su Bedrock, Vertex e Foundry, un ID di modello senza [1m] in una variabile utilizza il contesto 200K anche se un'altra variabile imposta lo stesso modello con il suffisso.

Personalizzare la visualizzazione e le capacità del modello fissato

Quando si fissa un modello su un provider di terze parti, l'ID specifico del provider appare così com'è nel selettore /model e Claude Code potrebbe non riconoscere quali funzionalità il modello supporta. È possibile sovrascrivere il nome di visualizzazione e dichiarare le capacità con variabili di ambiente complementari per ogni modello fissato.

Queste variabili hanno effetto su provider di terze parti come Bedrock, Vertex AI e Foundry. Le variabili _NAME e _DESCRIPTION hanno effetto anche quando ANTHROPIC_BASE_URL punta a un gateway LLM. Non hanno effetto quando si effettua la connessione direttamente a api.anthropic.com.

Variabile di ambiente Descrizione
ANTHROPIC_DEFAULT_OPUS_MODEL_NAME Nome di visualizzazione per il modello Opus fissato nel selettore /model. Per impostazione predefinita l'ID del modello quando non impostato
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION Descrizione di visualizzazione per il modello Opus fissato nel selettore /model. Per impostazione predefinita Custom Opus model quando non impostato
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES Elenco separato da virgole delle capacità che il modello Opus fissato supporta

Gli stessi suffissi _NAME, _DESCRIPTION e _SUPPORTED_CAPABILITIES sono disponibili per ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL, ANTHROPIC_DEFAULT_FABLE_MODEL e ANTHROPIC_CUSTOM_MODEL_OPTION.

Claude Code abilita funzionalità come livelli di sforzo e extended thinking abbinando l'ID del modello rispetto a modelli noti. Gli ID specifici del provider come ARN Bedrock o nomi di distribuzione personalizzati spesso non corrispondono a questi modelli, lasciando le funzionalità supportate disabilitate. Impostare _SUPPORTED_CAPABILITIES per dire a Claude Code quali funzionalità il modello effettivamente supporta:

Valore di capacità Abilita
effort Livelli di sforzo e il comando /effort
xhigh_effort {/* min-version: 2.1.111 */}Il livello di sforzo xhigh
max_effort Il livello di sforzo max
thinking Extended thinking
adaptive_thinking Ragionamento adattivo che alloca dinamicamente il pensiero in base alla complessità dell'attività
interleaved_thinking Pensiero tra le chiamate di strumento

Quando _SUPPORTED_CAPABILITIES è impostato, le capacità elencate sono abilitate e le capacità non elencate sono disabilitate per il modello fissato corrispondente. Quando la variabile non è impostata, Claude Code ricade sulla rilevazione incorporata basata sull'ID del modello.

Questo esempio fissa Opus a un ARN di modello personalizzato Bedrock, imposta un nome amichevole e dichiara le sue capacità:

export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'

Eseguire l'override degli ID di modello per versione

Le variabili di ambiente a livello di famiglia sopra configurano un ID di modello per alias di famiglia. Se è necessario mappare diverse versioni all'interno della stessa famiglia a ID di provider distinti, utilizzare invece l'impostazione modelOverrides.

modelOverrides mappa i singoli ID di modello Anthropic alle stringhe specifiche del provider che Claude Code invia all'API del provider. Quando un utente seleziona un modello mappato nel selettore /model, Claude Code utilizza il valore configurato invece del valore predefinito incorporato.

Questo consente agli amministratori aziendali di instradare ogni versione del modello a un ARN di profilo di inferenza Bedrock specifico, a un nome di versione Vertex AI o a un nome di distribuzione Foundry per governance, allocazione dei costi o instradamento regionale.

Impostare modelOverrides nel file delle impostazioni:

{
  "modelOverrides": {
    "claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
    "claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
    "claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
  }
}

Le chiavi devono essere ID di modello Anthropic come elencati nella Panoramica dei modelli. Per gli ID di modello datati, includere il suffisso della data esattamente come appare lì. Le chiavi sconosciute vengono ignorate.

Gli override sostituiscono gli ID di modello incorporati che supportano ogni voce nel selettore /model. Su Bedrock, gli override hanno la precedenza su qualsiasi profilo di inferenza che Claude Code scopre automaticamente all'avvio. I valori forniti direttamente tramite ANTHROPIC_MODEL, --model o le variabili di ambiente ANTHROPIC_DEFAULT_*_MODEL vengono passati al provider così come sono e non vengono trasformati da modelOverrides.

modelOverrides funziona insieme a availableModels. L'elenco di autorizzazione viene valutato rispetto all'ID di modello Anthropic, non al valore di override, quindi una voce come "opus" in availableModels continua a corrispondere anche quando le versioni di Opus sono mappate a ARN.

Configurazione della prompt caching

Claude Code utilizza automaticamente la prompt caching per ottimizzare le prestazioni e ridurre i costi. È possibile disabilitare la prompt caching globalmente o per livelli di modello specifici:

Variabile di ambiente Descrizione
DISABLE_PROMPT_CACHING Impostare su 1 per disabilitare la prompt caching per tutti i modelli. Ha la precedenza sulle impostazioni per modello
DISABLE_PROMPT_CACHING_HAIKU Impostare su 1 per disabilitare la prompt caching solo per i modelli Haiku
DISABLE_PROMPT_CACHING_SONNET Impostare su 1 per disabilitare la prompt caching solo per i modelli Sonnet
DISABLE_PROMPT_CACHING_OPUS Impostare su 1 per disabilitare la prompt caching solo per i modelli Opus
DISABLE_PROMPT_CACHING_FABLE Impostare su 1 per disabilitare la prompt caching solo per i modelli Fable

Per modificare il TTL della cache o scoprire cosa attiva un cache miss, vedere Come Claude Code utilizza la prompt caching.