Configurazione del modello
Scopri la configurazione del modello Claude Code, inclusi gli alias dei modelli come
opusplan
Modelli disponibili
Per l'impostazione model in Claude Code, è possibile configurare:
- Un alias del modello
- Un nome del modello
- API Anthropic: un nome del modello completo
- Bedrock: un ARN del profilo di inferenza
- Foundry: un nome di distribuzione
- Vertex: un nome di versione
ANTHROPIC_BASE_URL cambia dove vengono inviate le richieste, non quale modello le risponde. Per instradare Claude attraverso un gateway LLM, vedere configurazione del gateway LLM.
Alias dei modelli
Gli alias dei modelli forniscono un modo conveniente per selezionare le impostazioni del modello senza dover ricordare i numeri di versione esatti:
| Alias del modello | Comportamento |
|---|---|
default |
Valore speciale che cancella qualsiasi override del modello e ripristina il modello consigliato per il tipo di account. Non è di per sé un alias del modello |
best |
Utilizza Fable 5 dove la vostra organizzazione ha accesso, altrimenti il modello Opus più recente |
fable |
Utilizza Claude Fable 5 per i vostri compiti più difficili e di lunga durata |
sonnet |
Utilizza il modello Sonnet più recente per le attività di codifica quotidiane |
opus |
Utilizza il modello Opus più recente per attività di ragionamento complesso |
haiku |
Utilizza il modello Haiku veloce ed efficiente per attività semplici |
sonnet[1m] |
Utilizza Sonnet con una finestra di contesto di 1 milione di token per sessioni lunghe |
opus[1m] |
Utilizza Opus con una finestra di contesto di 1 milione di token per sessioni lunghe |
opusplan |
Modalità speciale che utilizza opus durante Plan Mode, quindi passa a sonnet per l'esecuzione |
Su API Anthropic, opus si risolve in Opus 4.8 e sonnet si risolve in Sonnet 4.6. Su Claude Platform on AWS, opus si risolve in Opus 4.7 e sonnet si risolve in Sonnet 4.6. Su Bedrock, Vertex e Foundry, opus si risolve in Opus 4.6 e sonnet si risolve in Sonnet 4.5; modelli più recenti sono disponibili su questi provider selezionando il nome del modello completo esplicitamente o impostando ANTHROPIC_DEFAULT_OPUS_MODEL o ANTHROPIC_DEFAULT_SONNET_MODEL.
Gli alias puntano alla versione consigliata per il provider e si aggiornano nel tempo. Per fissare una versione specifica, utilizzare il nome del modello completo (ad esempio, claude-opus-4-8) o impostare la variabile di ambiente corrispondente come ANTHROPIC_DEFAULT_OPUS_MODEL.
Opus 4.8 richiede Claude Code v2.1.154 o successivo. Eseguire claude update per aggiornare.
Lavorare con Fable 5
Claude Fable 5 è il modello più capace in Claude Code, adatto a compiti più grandi di una singola sessione. Sostiene lunghe sessioni autonome, indaga prima di agire e verifica il suo lavoro più spesso rispetto ai modelli più piccoli.
Fable 5 non è il modello predefinito. Selezionatelo con /model fable. Le richieste che i suoi classificatori di sicurezza contrassegnano, il più delle volte nei domini della sicurezza informatica e della biologia, attivano il fallback automatico del modello.
Per ottenere il massimo da Fable 5:
- Descrivete il risultato, non i passaggi: dategli il risultato che desiderate e lasciate che pianifichi il percorso. Per mantenerlo al lavoro fino a quando quel risultato non si verifica, impostate un obiettivo.
- Dategli problemi ambigui: le indagini sulla causa principale, il debug dei disservizi e le decisioni architettoniche sono dove l'indagine e la verifica aggiuntive ripagano.
- Saltate i promemoria di verifica: verifica il suo lavoro con meno sollecitazioni, quindi i promemoria per testare o controllare sono solitamente non necessari.
- Dimensionate compiti più grandi: dategli lavoro che normalmente dividereste in pezzi. Sostiene lunghe sessioni senza perdere il filo.
Fable 5 richiede Claude Code v2.1.170 o successivo. Le versioni precedenti non mostrano Fable 5 nel selettore di modelli e non possono selezionarlo. Eseguire claude update per aggiornare. Fable 5 non è disponibile con zero data retention, dove il selettore /model lo omette o lo mostra disabilitato.
Impostazione del modello
È possibile configurare il modello in diversi modi, elencati in ordine di priorità:
- Durante la sessione - Utilizzare
/model <alias|name>per cambiare immediatamente, oppure eseguire/modelsenza argomenti per aprire il selettore. Il selettore chiede conferma quando la conversazione ha output precedente, poiché la risposta successiva rilegge la cronologia completa senza contesto memorizzato nella cache - All'avvio - Avviare con
claude --model <alias|name> - Variabile di ambiente - Impostare
ANTHROPIC_MODEL=<alias|name> - Impostazioni - Configurare in modo permanente nel file delle impostazioni utilizzando il campo
model.
A partire dalla v2.1.153, /model salva la scelta come predefinita per le nuove sessioni scrivendo il campo model nelle impostazioni utente. Nel selettore:
Enter: cambia modello e salva come predefinitos: cambia modello solo per questa sessione
Digitare /model <name> direttamente si comporta come Enter. Le impostazioni del progetto e gestite hanno ancora la precedenza e si riapplicano al prossimo avvio.
Nella v2.1.144 fino alla v2.1.152, /model si applicava solo alla sessione corrente e d nel selettore salvava un predefinito.
Il flag --model e la variabile di ambiente ANTHROPIC_MODEL si applicano solo alla sessione che avviate con essi. Per eseguire modelli diversi in terminali diversi contemporaneamente, avviate ciascuno con il proprio flag --model piuttosto che passare con /model.
Le sessioni riprese avviate con claude --resume, --continue, o il selettore /resume mantengono il modello che stavano utilizzando quando la trascrizione è stata salvata, indipendentemente dall'impostazione model corrente. Se quel modello è stato ritirato, la sessione ricade nell'ordine di precedenza normale. Questo impedisce che la scelta /model di un'altra sessione cambi il modello al ripristino.
Quando il modello attivo all'avvio proviene dalle impostazioni del progetto o gestite piuttosto che dalla propria selezione, l'intestazione di avvio mostra quale file di impostazioni lo ha impostato. Eseguire /model per eseguire l'override; l'impostazione del progetto o gestita si riapplica al prossimo avvio.
Esempio di utilizzo:
# Avviare con Opus
claude --model opus
# Passare a Sonnet durante la sessione
/model sonnet
File delle impostazioni di esempio:
{
"permissions": {
...
},
"model": "opus"
}
Limitare la selezione del modello
Gli amministratori aziendali possono utilizzare availableModels nelle impostazioni gestite o di policy per limitare quali modelli gli utenti possono selezionare.
Quando availableModels è impostato, l'elenco di autorizzazione si applica ovunque un utente possa specificare un modello:
- Modello della sessione principale:
/model, il flag--modele la variabile di ambienteANTHROPIC_MODEL - Risoluzione alias: {/* min-version: 2.1.176 */}le variabili di ambiente
ANTHROPIC_DEFAULT_OPUS_MODEL,ANTHROPIC_DEFAULT_SONNET_MODEL,ANTHROPIC_DEFAULT_HAIKU_MODELeANTHROPIC_DEFAULT_FABLE_MODELnon possono reindirizzare un alias consentito a un modello al di fuori dell'elenco - Modalità veloce: {/* min-version: 2.1.176 */}
/fastrifiuta di attivare/disattivare quando comporterebbe un passaggio implicito a un modello Opus al di fuori dell'elenco, con il messaggio "is not in your organization's allowed models" - Modelli dei subagent: il campo
modelnel frontmatter del subagent, il parametromodeldello strumento Agent, il selettore di modelli in/agentseCLAUDE_CODE_SUBAGENT_MODEL - Modello Advisor: l'impostazione
advisorModelconfigurata - Catene di fallback: gli elementi di una catena di modelli di fallback al di fuori dell'elenco vengono eliminati
Il passaggio a un modello bloccato con /model viene rifiutato con un errore, mentre un flag --model bloccato o un valore ANTHROPIC_MODEL viene sostituito all'avvio con un avviso che nomina sia i modelli richiesti che quelli sostituiti, e la sessione inizia sul modello predefinito. Un override di subagent o advisor bloccato ritorna al modello ereditato o predefinito piuttosto che non riuscire nella richiesta.
{
"availableModels": ["sonnet", "haiku"]
}
Comportamento del modello predefinito
Per impostazione predefinita, l'opzione Predefinito nel selettore di modelli non è interessata da availableModels. Rimane disponibile e rappresenta il valore predefinito di runtime del sistema in base al livello di sottoscrizione dell'utente.
Per estendere l'elenco di autorizzazione all'opzione Predefinito, impostare enforceAvailableModels su true nelle impostazioni gestite o di policy insieme a un elenco availableModels non vuoto. Quando il valore predefinito del livello non è nell'elenco di autorizzazione, Predefinito si risolve nella prima voce consentita invece del valore predefinito del livello. Questo richiede Claude Code v2.1.175 o successivo.
Un array availableModels vuoto non attiva mai l'applicazione. Anche con availableModels: [], gli utenti possono comunque utilizzare Claude Code con il modello Predefinito per il loro livello indipendentemente da enforceAvailableModels.
Controllare il modello su cui gli utenti eseguono
L'impostazione model è una selezione iniziale, non un'applicazione. Imposta quale modello è attivo quando una sessione inizia, ma gli utenti possono comunque aprire /model e scegliere Predefinito, che si risolve nel valore predefinito del sistema per il loro livello indipendentemente da ciò che model è impostato.
Per controllare completamente l'esperienza del modello, combinare queste impostazioni:
availableModels: limita a quali modelli denominati gli utenti possono passareenforceAvailableModels: estende l'elenco di autorizzazioneavailableModelsall'opzione Predefinito, quindi Predefinito non può risolversi a un modello al di fuori dell'elencomodel: imposta la selezione del modello iniziale quando una sessione iniziaANTHROPIC_DEFAULT_SONNET_MODEL/ANTHROPIC_DEFAULT_OPUS_MODEL/ANTHROPIC_DEFAULT_HAIKU_MODEL/ANTHROPIC_DEFAULT_FABLE_MODEL: controllano a cosa si risolvono l'opzione Predefinito e gli aliassonnet,opus,haikuefable
Questo esempio avvia gli utenti su Sonnet 4.5, limita il selettore a Sonnet e Haiku, e assicura che Predefinito si risolva a un modello nell'elenco di autorizzazione piuttosto che al valore predefinito del livello:
{
"model": "claude-sonnet-4-5",
"availableModels": ["claude-sonnet-4-5", "haiku"],
"enforceAvailableModels": true,
"env": {
"ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
}
}
Senza enforceAvailableModels o il blocco env, un utente che seleziona Predefinito nel selettore otterrebbe la versione più recente per il suo livello, bypassando il pin di versione in model e availableModels. Le due impostazioni coprono ambiti diversi: enforceAvailableModels fa sì che Predefinito obbedisca all'elenco di autorizzazione, mentre il blocco env fissa quale versione un alias consentito come sonnet si risolve. Utilizzare enforceAvailableModels da solo quando limitare le famiglie di modelli è sufficiente; aggiungere il blocco env quando è necessario anche fissare una versione specifica.
Comportamento di unione
Quando availableModels è impostato nelle impostazioni utente, progetto e locali solamente, gli array vengono uniti e deduplicati su questi livelli.
Quando availableModels è impostato nelle impostazioni gestite o di policy, il valore gestito o di policy sostituisce completamente il risultato unito: le voci aggiunte nelle impostazioni utente o progetto non possono ampliarlo. Le impostazioni gestite e di policy sostituiscono i valori di precedenza inferiore per enforceAvailableModels allo stesso modo. A partire da Claude Code v2.1.175, questo è l'unico modo per applicare un elenco di autorizzazione rigoroso; le versioni precedenti uniscono l'elenco gestito con le voci di precedenza inferiore.
ID di modello Mantle
Quando l'endpoint Bedrock Mantle è abilitato, le voci in availableModels che iniziano con anthropic. vengono aggiunte al selettore /model come opzioni personalizzate e instradate all'endpoint Mantle. L'impostazione limita comunque il selettore alle voci elencate, quindi includere gli alias standard insieme a qualsiasi ID Mantle.
Comportamento speciale del modello
Impostazione del modello `default`
Il comportamento di default dipende dal tipo di account:
- Max, Team Premium, Enterprise pay-as-you-go e API Anthropic: per impostazione predefinita Opus 4.8
- Claude Platform su AWS: per impostazione predefinita Opus 4.7
- Pro, Team Standard e posti di abbonamento Enterprise: per impostazione predefinita Sonnet 4.6
- Bedrock, Vertex e Foundry: per impostazione predefinita Sonnet 4.5
Enterprise pay-as-you-go significa un'organizzazione Enterprise fatturata per utilizzo piuttosto che per posto di abbonamento.
Fable 5 non è il modello predefinito su alcun tipo di account. Le sessioni utilizzano Fable 5 solo dopo che lo scegliete, con /model fable, un'impostazione model, o l'alias best dove Fable 5 è disponibile. Sceglierlo con /model lo salva come modello selezionato nelle impostazioni utente, quindi le sessioni successive iniziano su Fable 5 fino a quando non cambiate modello.
Impostazione del modello `opusplan`
L'alias del modello opusplan fornisce un approccio ibrido automatizzato:
- In Plan Mode - Utilizza
opusper il ragionamento complesso e le decisioni architettoniche - In modalità esecuzione - Passa automaticamente a
sonnetper la generazione di codice e l'implementazione
Questo vi dà il meglio di entrambi i mondi: il ragionamento superiore di Opus per la pianificazione e l'efficienza di Sonnet per l'esecuzione.
La fase Opus in Plan Mode utilizza la stessa finestra di contesto dell'impostazione del modello opus. Sui livelli di abbonamento in cui Opus viene automaticamente aggiornato a contesto 1M, opusplan riceve l'aggiornamento anche in Plan Mode. Per forzare il contesto 1M per entrambe le fasi quando non siete su un livello di aggiornamento automatico, impostare il modello su opusplan[1m].
Quando availableModels esclude Opus, opusplan rimane su Sonnet in Plan Mode invece di passare. Allo stesso modo, una sessione Haiku che normalmente si aggiornerebbe a Sonnet in Plan Mode rimane su Haiku quando Sonnet è escluso.
Per un approccio ibrido in cui Claude decide a metà attività quando consultare un secondo modello piuttosto che passare al confine del piano, vedere lo strumento advisor.
Catene di modelli di fallback
Quando il modello primario è sovraccarico, non disponibile o restituisce un altro errore del server non ripetibile, Claude Code può passare a un modello di fallback invece di non riuscire nella richiesta. Gli errori di autenticazione, fatturazione, limite di velocità, dimensione della richiesta e trasporto non attivano mai un passaggio; quelli seguono il loro normale retry e gestione degli errori.
Configurate uno o più modelli di fallback e Claude Code li prova in ordine, mostrando un avviso quando passa. Il passaggio dura solo il turno corrente, quindi il vostro prossimo messaggio prova prima il modello primario di nuovo. Le catene sono limitate a tre modelli dopo la rimozione dei duplicati e le voci extra vengono ignorate.
Impostare una catena per una sessione con il flag --fallback-model, che accetta un elenco separato da virgole:
claude --fallback-model sonnet,haiku
Per mantenere una catena tra le sessioni, impostare fallbackModel in impostazioni come array:
{
"fallbackModel": ["claude-sonnet-4-6", "claude-haiku-4-5"]
}
Il flag --fallback-model ha la precedenza sull'impostazione fallbackModel. Ogni elemento accetta un nome di modello o un alias, e "default" si espande al modello predefinito.
Due casi causano il salto di un elemento:
- Modello non disponibile: un modello che non può essere raggiunto, come un modello ritirato bloccato nelle impostazioni, viene saltato e Claude Code continua all'elemento successivo.
- Fuori dall'elenco consentito: un elemento non consentito da
availableModelsviene eliminato quando la catena viene letta e non viene mai provato.
Fallback automatico del modello
Questa sezione copre il fallback basato sul contenuto da Fable 5. Per il fallback basato sulla disponibilità quando un modello è sovraccarico o non disponibile, vedere Catene di modelli di fallback.
Fable 5 viene eseguito con classificatori di sicurezza per il contenuto di sicurezza informatica e biologia. Quando un classificatore contrassegna una richiesta, Claude Code riesegue quella richiesta sul modello Opus predefinito e mostra un avviso nella trascrizione: Opus 4.8 su API Anthropic e distribuzioni gateway LLM, oppure Opus 4.7 su Claude Platform su AWS.
La sessione continua quindi su quel modello Opus. Per tornare a Fable 5, eseguire /model fable.
Verificare cosa ha attivato il fallback
Il fallback può attivarsi sulla prima richiesta di una sessione, prima di inviare qualcosa di insolito, perché la prima richiesta contiene il contesto dell'area di lavoro come il contenuto di CLAUDE.md e lo stato di git. Un repository che contiene materiale di sicurezza o biologia può attivare il classificatore solo su quel contesto.
Per verificare se le personalizzazioni sono il trigger, avviare una sessione con claude --safe-mode, che disabilita le personalizzazioni come CLAUDE.md, skills, server MCP e hooks. Lo stato di git e i nomi delle directory non sono personalizzazioni e sono ancora inclusi.
Chiedere prima di passare
Per decidere cosa accade ogni volta che una richiesta viene contrassegnata, piuttosto che passare automaticamente, eseguire /config e disattivare "switch models when a message is flagged". Una richiesta contrassegnata mette quindi in pausa la sessione con due opzioni: passare al modello Opus o modificare il prompt e riprovare su Fable 5.
Alcuni casi si comportano diversamente:
- Se entrambi i modelli contrassegnano la stessa richiesta, potete modificare il prompt e riprovare, o avviare una nuova sessione.
- Su sessioni mobili Claude Code sul web, la modifica e il nuovo tentativo non sono supportati. Passate i modelli o continuate la sessione da un browser desktop o dall'app desktop.
- In modalità non interattiva e integrazioni SDK che non possono mostrare il prompt, una richiesta contrassegnata termina il turno con un rifiuto.
Abilitare il fallback su Bedrock, Vertex AI e Foundry
Su Amazon Bedrock, Google Vertex AI e Microsoft Foundry, gli ID modello sono specifici del provider, quindi il fallback automatico funziona solo quando Claude Code può identificare entrambi i modelli coinvolti:
- Claude Code deve riconoscere il modello corrente come Fable 5: l'ID modello contiene
claude-fable-5, corrisponde al valore diANTHROPIC_DEFAULT_FABLE_MODEL, o è mappato conmodelOverrides. - Il target di fallback deve risolvere a un modello Opus: il valore di
ANTHROPIC_DEFAULT_OPUS_MODELse impostato, altrimenti una voce Opus 4.8 nell'elenco dei modelli del provider.
Se uno dei modelli non può essere identificato, Claude Code non passa automaticamente. La richiesta contrassegnata termina con un messaggio di rifiuto e potete passare i modelli con /model e riprovare. Per abilitare il fallback automatico su questi provider, impostare ANTHROPIC_DEFAULT_FABLE_MODEL al vostro ID modello Fable 5 e ANTHROPIC_DEFAULT_OPUS_MODEL al vostro ID modello Opus 4.8.
Carichi di lavoro di ricerca sulla sicurezza e biologia
I carichi di lavoro in sicurezza offensiva o biologia, inclusi test di penetrazione, esercizi Capture the Flag (CTF) e basi di codice adiacenti alla biologia, attivano il fallback frequentemente, spesso sulla prima richiesta. Per il lavoro sostanziale di biologia, aspettatevi che quasi tutte le richieste vengano reindirizzate.
Questo è il routing previsto per questi domini, non un flag di account. Se la vostra organizzazione ha bisogno di capacità di classe Fable per questo lavoro, chiedete al vostro team di account Anthropic riguardo ai programmi di accesso affidabile.
Regolare il livello di sforzo
I livelli di sforzo controllano il ragionamento adattivo, che consente al modello di decidere se e quanto pensare ad ogni passo in base alla complessità dell'attività. Lo sforzo inferiore è più veloce ed economico per attività semplici, mentre lo sforzo superiore fornisce un ragionamento più profondo per problemi complessi.
I livelli di sforzo disponibili dipendono dal modello. I modelli non elencati qui non supportano lo sforzo:
| Modello | Livelli |
|---|---|
| Fable 5 | low, medium, high, xhigh, max |
| Opus 4.8 e Opus 4.7 | low, medium, high, xhigh, max |
| Opus 4.6 e Sonnet 4.6 | low, medium, high, max |
Se impostate un livello che il modello attivo non supporta, Claude Code ricade al livello supportato più alto pari o inferiore a quello impostato. Ad esempio, xhigh viene eseguito come high su Opus 4.6.
Lo sforzo predefinito è high su Fable 5, Opus 4.8, Opus 4.6 e Sonnet 4.6, e xhigh su Opus 4.7.
Quando eseguite Fable 5, Opus 4.8 o Opus 4.7 per la prima volta, Claude Code applica lo sforzo predefinito di quel modello anche se avete precedentemente impostato un livello diverso per un altro modello: high su Fable 5 e Opus 4.8, e xhigh su Opus 4.7. Eseguite /effort di nuovo per scegliere un livello diverso dopo il passaggio.
low, medium, high e xhigh persistono tra le sessioni. max fornisce il ragionamento più profondo senza vincoli sulla spesa di token e si applica solo alla sessione corrente, tranne quando impostato tramite la variabile di ambiente CLAUDE_CODE_EFFORT_LEVEL.
Il menu /effort offre anche ultracode. Ultracode è un'impostazione di Claude Code piuttosto che un livello di sforzo del modello: invia xhigh al modello e inoltre ha Claude orchestrare flussi di lavoro dinamici per attività sostanziali. Si applica solo alla sessione corrente. Impostatelo tramite /effort, o passate "ultracode": true tramite --settings o una richiesta di controllo Agent SDK. Non fa parte dell'impostazione effortLevel, del flag --effort o di CLAUDE_CODE_EFFORT_LEVEL.
Scegliere un livello di sforzo
Ogni livello scambia la spesa di token rispetto alla capacità. Il valore predefinito è adatto alla maggior parte delle attività di codifica; regolate quando desiderate un equilibrio diverso.
| Livello | Quando utilizzarlo |
|---|---|
low |
Riservare per attività brevi, limitate e sensibili alla latenza che non sono sensibili all'intelligenza |
medium |
Riduce l'utilizzo di token per il lavoro sensibile ai costi che può scambiare un po' di intelligenza |
high |
Bilancia l'utilizzo di token e l'intelligenza. Valore predefinito su Fable 5, Opus 4.8, Opus 4.6 e Sonnet 4.6 |
xhigh |
Ragionamento più profondo con spesa di token più elevata. Valore predefinito su Opus 4.7 |
max |
Può migliorare le prestazioni su attività impegnative ma potrebbe mostrare rendimenti decrescenti ed è soggetto a pensiero eccessivo. Testare prima di adottare ampiamente |
ultracode |
Un'impostazione di Claude Code che pianifica un flusso di lavoro dinamico per ogni attività sostanziale con ragionamento xhigh per messaggio. Solo sessione |
La scala dello sforzo è calibrata per modello, quindi lo stesso nome di livello non rappresenta lo stesso valore sottostante tra i modelli.
Utilizzare ultrathink per il ragionamento profondo una tantum
Includete ultrathink in qualsiasi punto del prompt per richiedere un ragionamento più profondo su quel turno senza modificare l'impostazione dello sforzo della sessione. Claude Code riconosce la parola chiave e aggiunge un'istruzione in contesto. Il livello di sforzo inviato all'API rimane invariato. Altre frasi come "think", "think hard" e "think more" vengono passate come testo ordinario del prompt e non vengono riconosciute come parole chiave.
Impostare il livello di sforzo
Potete modificare lo sforzo attraverso uno dei seguenti:
/effort: eseguire/effortsenza argomenti per aprire un cursore interattivo,/effortseguito da un nome di livello per impostarlo direttamente, o/effort autoper ripristinare il valore predefinito del modello- In
/model: utilizzare i tasti freccia sinistra/destra per regolare il cursore dello sforzo quando si seleziona un modello - Flag
--effort: passare un nome di livello per impostarlo per una singola sessione quando si avvia Claude Code - Variabile di ambiente: impostare
CLAUDE_CODE_EFFORT_LEVELsu un nome di livello oauto - Impostazioni: impostare
effortLevelsulow,medium,highoxhighnel file delle impostazioni.maxeultracodesono solo per la sessione e non sono accettati qui - Frontmatter di skill e subagent: impostare
effortin un file markdown di skill o subagent per sovrascrivere il livello di sforzo quando quella skill o subagent viene eseguita
La variabile di ambiente ha la precedenza su tutti gli altri metodi, quindi il livello configurato, quindi il valore predefinito del modello. Lo sforzo del frontmatter si applica quando quella skill o subagent è attiva, sovrascrivendo il livello della sessione ma non la variabile di ambiente.
Il cursore dello sforzo appare in /model quando è selezionato un modello supportato. Il livello di sforzo corrente viene visualizzato anche accanto al logo e al spinner, ad esempio "with low effort", in modo da poter confermare quale impostazione è attiva senza aprire /model.
Ragionamento adattivo e budget di pensiero fissi
Il ragionamento adattivo rende il pensiero facoltativo ad ogni passo, quindi Claude può rispondere più velocemente ai prompt di routine e riservare un pensiero più profondo per i passi che ne traggono vantaggio. Se desiderate che Claude pensi più o meno spesso di quanto il livello corrente produce, potete dirlo direttamente nel prompt o in CLAUDE.md; il modello risponde a quella guida entro l'impostazione dello sforzo.
Opus 4.7 e versioni successive utilizzano sempre il ragionamento adattivo, così come Fable 5. La modalità budget di pensiero fisso e CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING non si applicano ad essi.
Su Opus 4.6 e Sonnet 4.6, potete impostare CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 per ripristinare il budget di pensiero fisso precedente controllato da MAX_THINKING_TOKENS. Vedere variabili di ambiente.
Pensiero esteso
Il pensiero esteso è il ragionamento che Claude emette prima di rispondere. Sui modelli che supportano il ragionamento adattivo, il livello di sforzo è il controllo principale per la quantità di pensiero che si verifica; le impostazioni seguenti attivano o disattivano il pensiero e controllano come viene visualizzato.
| Controllo | Come impostarlo |
|---|---|
| Attiva/disattiva per la sessione corrente | Premere Option+T su macOS o Alt+T su Windows e Linux |
| Impostare il valore predefinito globale | Eseguire /config e attivare/disattivare la modalità di pensiero. Salvato come alwaysThinkingEnabled in ~/.claude/settings.json |
| Disabilitare indipendentemente dallo sforzo | Impostare MAX_THINKING_TOKENS=0, che disattiva il pensiero su API Anthropic tranne su Fable 5. Su provider di terze parti questo omette il parametro thinking invece, e i modelli di ragionamento adattivo potrebbero comunque pensare. Altri valori si applicano solo con un budget di pensiero fisso |
Il pensiero non può essere disattivato su Fable 5. L'attivazione/disattivazione della sessione, alwaysThinkingEnabled e MAX_THINKING_TOKENS=0 non hanno effetto lì, e Fable 5 decide per ogni passo quanto pensare in base al livello di sforzo.
L'output del pensiero è compresso per impostazione predefinita. Premere Ctrl+O per attivare/disattivare la modalità dettagliata e visualizzare il ragionamento come testo grigio in corsivo. Le sessioni interattive su API Anthropic ricevono blocchi di pensiero redatti per impostazione predefinita, quindi impostare showThinkingSummaries: true nelle impostazioni se desiderate che i riepiloghi completi siano disponibili quando li espandete. Viene addebitato il costo di tutti i token di pensiero generati, anche quando compressi o redatti.
Contesto esteso
Fable 5, Opus 4.6 e versioni successive, e Sonnet 4.6 supportano una finestra di contesto di 1 milione di token per sessioni lunghe con basi di codice di grandi dimensioni.
La disponibilità varia in base al modello e al piano. Nei piani Max, Team ed Enterprise, Opus viene automaticamente aggiornato al contesto 1M senza configurazione aggiuntiva. Questo si applica sia ai posti Team Standard che Team Premium. Su API Anthropic, Fable 5, Opus 4.8 e Opus 4.7 vengono sempre eseguiti con la finestra 1M. Sonnet con contesto 1M non fa parte dell'aggiornamento automatico e richiede crediti di utilizzo su ogni piano di abbonamento, incluso Max.
| Piano | Opus con contesto 1M | Sonnet con contesto 1M |
|---|---|---|
| Max, Team ed Enterprise | Incluso nell'abbonamento | Richiede crediti di utilizzo |
| Pro | Richiede crediti di utilizzo | Richiede crediti di utilizzo |
| API e pagamento in base al consumo | Accesso completo | Accesso completo |
Per disabilitare completamente il contesto 1M, impostare CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Questo rimuove le varianti di modello 1M dal selettore di modelli. Vedere variabili di ambiente.
La finestra di contesto 1M utilizza i prezzi standard del modello senza premio per i token oltre 200K. Per i piani in cui il contesto esteso è incluso nell'abbonamento, l'utilizzo rimane coperto dall'abbonamento. Per i piani che accedono al contesto esteso tramite crediti di utilizzo, i token vengono fatturati ai crediti di utilizzo.
Se l'account supporta il contesto 1M, l'opzione appare nel selettore di modelli (/model) nelle versioni più recenti di Claude Code. Se non la vedete, provate a riavviare la sessione.
Potete anche utilizzare il suffisso [1m] con alias di modelli o nomi di modelli completi:
# Utilizzare l'alias opus[1m] o sonnet[1m]
/model opus[1m]
/model sonnet[1m]
# O aggiungere [1m] a un nome di modello completo
/model claude-opus-4-8[1m]
Verifica del modello corrente
È possibile vedere quale modello stai utilizzando attualmente in diversi modi:
- Nella riga di stato (se configurata)
- In
/status, che visualizza anche le informazioni dell'account.
Aggiungere un'opzione di modello personalizzato
Utilizzare ANTHROPIC_CUSTOM_MODEL_OPTION per aggiungere una singola voce personalizzata al selettore /model senza sostituire gli alias incorporati. Questo è utile per testare ID di modello che Claude Code non elenca per impostazione predefinita. Per le distribuzioni di gateway LLM, Claude Code può popolare il selettore dall'endpoint /v1/models del gateway quando CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 è impostato, quindi questa variabile è necessaria solo quando la scoperta è disabilitata o non restituisce il modello desiderato. Vedere Selezione del modello del gateway LLM.
Questo esempio imposta tutte e tre le variabili per rendere selezionabile una distribuzione Opus instradata tramite gateway:
export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"
La voce personalizzata appare in fondo al selettore /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME e ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION sono facoltativi. Se omessi, l'ID del modello viene utilizzato come nome e la descrizione per impostazione predefinita è Custom model (<model-id>).
Claude Code salta la convalida per l'ID del modello impostato in ANTHROPIC_CUSTOM_MODEL_OPTION, quindi è possibile utilizzare qualsiasi stringa che l'endpoint API accetta.
Variabili di ambiente
È possibile utilizzare le seguenti variabili di ambiente, che devono essere nomi di modelli completi (o equivalenti per il provider API), per controllare i nomi dei modelli a cui gli alias si mappano.
| Variabile di ambiente | Descrizione |
|---|---|
ANTHROPIC_DEFAULT_FABLE_MODEL |
Il modello da utilizzare per fable, e l'ID del modello che Claude Code riconosce come Fable 5 per il fallback automatico del modello su provider di terze parti |
ANTHROPIC_DEFAULT_OPUS_MODEL |
Il modello da utilizzare per opus, o per opusplan quando Plan Mode è attivo. |
ANTHROPIC_DEFAULT_SONNET_MODEL |
Il modello da utilizzare per sonnet, o per opusplan quando Plan Mode non è attivo. |
ANTHROPIC_DEFAULT_HAIKU_MODEL |
Il modello da utilizzare per haiku, o funzionalità in background |
CLAUDE_CODE_SUBAGENT_MODEL |
Il modello da utilizzare per tutti i subagents e i team di agenti. Sostituisce sia il parametro model per invocazione che il frontmatter model della definizione del subagent. Impostare su inherit per utilizzare la risoluzione del modello normale invece |
Nota: ANTHROPIC_SMALL_FAST_MODEL è deprecato a favore di ANTHROPIC_DEFAULT_HAIKU_MODEL.
Fissare i modelli per distribuzioni di terze parti
Quando si distribuisce Claude Code tramite Bedrock, Vertex AI, Foundry, o Claude Platform on AWS, fissare le versioni dei modelli prima di distribuire agli utenti.
Senza fissaggio, Claude Code utilizza alias di modelli come fable, opus, sonnet e haiku che si risolvono in un ID di modello predefinito incorporato per ogni provider. Tale impostazione predefinita può rimanere indietro rispetto alla versione più recente di Anthropic, e il modello a cui punta potrebbe non essere ancora abilitato nell'account di un utente. Quando l'impostazione predefinita non è disponibile, gli utenti Bedrock e Vertex AI vedono un avviso e ricadono nella versione precedente per quella sessione, mentre gli utenti Foundry vedono errori perché Foundry non ha alcun controllo di avvio equivalente.
Impostare le variabili di ambiente del modello su ID di versione specifici come parte della configurazione iniziale. Il fissaggio consente di controllare quando i vostri utenti passano a un nuovo modello.
Utilizzare le seguenti variabili di ambiente con ID di modello specifici della versione per il provider:
| Provider | Esempio |
|---|---|
| Bedrock | export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-8' |
| Vertex AI | export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8' |
| Foundry | export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8' |
Applicare lo stesso modello per ANTHROPIC_DEFAULT_FABLE_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL e ANTHROPIC_DEFAULT_HAIKU_MODEL. Per gli ID di modello attuali e legacy su tutti i provider, vedere Panoramica dei modelli. Per aggiornare gli utenti a una nuova versione del modello, aggiornare queste variabili di ambiente e ridistribuire.
Per abilitare il contesto esteso per un modello fissato, aggiungere [1m] all'ID del modello in ANTHROPIC_DEFAULT_OPUS_MODEL o ANTHROPIC_DEFAULT_SONNET_MODEL:
export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8[1m]'
Il suffisso [1m] applica la finestra di contesto 1M a tutto l'utilizzo degli alias opus e sonnet, inclusa la fase Opus in modalità piano di opusplan.
- Claude Code rimuove il suffisso prima di inviare l'ID del modello al provider.
- Aggiungere
[1m]solo quando il modello sottostante supporta il contesto 1M. - Il suffisso viene letto per variabile, non per modello. Su Bedrock, Vertex e Foundry, un ID di modello senza
[1m]in una variabile utilizza il contesto 200K anche se un'altra variabile imposta lo stesso modello con il suffisso.
L'elenco di autorizzazione settings.availableModels si applica comunque quando si utilizzano provider di terze parti. Il filtraggio corrisponde all'alias del modello come opus, al prefisso della versione come claude-opus-4-8, o all'ID del modello completo. Qualsiasi suffisso [1m] viene rimosso sia dalla voce dell'elenco di autorizzazione che dal modello richiesto prima della corrispondenza, quindi una voce di claude-opus-4-8 consente sia le righe Opus standard che quelle con contesto 1M. I prefissi specifici del provider come us.anthropic. non vengono rimossi: elencare la stessa forma in availableModels che il selettore mostra, o mapparla tramite modelOverrides.
Personalizzare la visualizzazione e le capacità del modello fissato
Quando si fissa un modello su un provider di terze parti, l'ID specifico del provider appare così com'è nel selettore /model e Claude Code potrebbe non riconoscere quali funzionalità il modello supporta. È possibile sovrascrivere il nome di visualizzazione e dichiarare le capacità con variabili di ambiente complementari per ogni modello fissato.
Queste variabili hanno effetto su provider di terze parti come Bedrock, Vertex AI e Foundry. Le variabili _NAME e _DESCRIPTION hanno effetto anche quando ANTHROPIC_BASE_URL punta a un gateway LLM. Non hanno effetto quando si effettua la connessione direttamente a api.anthropic.com.
| Variabile di ambiente | Descrizione |
|---|---|
ANTHROPIC_DEFAULT_OPUS_MODEL_NAME |
Nome di visualizzazione per il modello Opus fissato nel selettore /model. Per impostazione predefinita l'ID del modello quando non impostato |
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION |
Descrizione di visualizzazione per il modello Opus fissato nel selettore /model. Per impostazione predefinita Custom Opus model quando non impostato |
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES |
Elenco separato da virgole delle capacità che il modello Opus fissato supporta |
Gli stessi suffissi _NAME, _DESCRIPTION e _SUPPORTED_CAPABILITIES sono disponibili per ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL, ANTHROPIC_DEFAULT_FABLE_MODEL e ANTHROPIC_CUSTOM_MODEL_OPTION.
Claude Code abilita funzionalità come livelli di sforzo e extended thinking abbinando l'ID del modello rispetto a modelli noti. Gli ID specifici del provider come ARN Bedrock o nomi di distribuzione personalizzati spesso non corrispondono a questi modelli, lasciando le funzionalità supportate disabilitate. Impostare _SUPPORTED_CAPABILITIES per dire a Claude Code quali funzionalità il modello effettivamente supporta:
| Valore di capacità | Abilita |
|---|---|
effort |
Livelli di sforzo e il comando /effort |
xhigh_effort |
{/* min-version: 2.1.111 */}Il livello di sforzo xhigh |
max_effort |
Il livello di sforzo max |
thinking |
Extended thinking |
adaptive_thinking |
Ragionamento adattivo che alloca dinamicamente il pensiero in base alla complessità dell'attività |
interleaved_thinking |
Pensiero tra le chiamate di strumento |
Quando _SUPPORTED_CAPABILITIES è impostato, le capacità elencate sono abilitate e le capacità non elencate sono disabilitate per il modello fissato corrispondente. Quando la variabile non è impostata, Claude Code ricade sulla rilevazione incorporata basata sull'ID del modello.
Questo esempio fissa Opus a un ARN di modello personalizzato Bedrock, imposta un nome amichevole e dichiara le sue capacità:
export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'
Eseguire l'override degli ID di modello per versione
Le variabili di ambiente a livello di famiglia sopra configurano un ID di modello per alias di famiglia. Se è necessario mappare diverse versioni all'interno della stessa famiglia a ID di provider distinti, utilizzare invece l'impostazione modelOverrides.
modelOverrides mappa i singoli ID di modello Anthropic alle stringhe specifiche del provider che Claude Code invia all'API del provider. Quando un utente seleziona un modello mappato nel selettore /model, Claude Code utilizza il valore configurato invece del valore predefinito incorporato.
Questo consente agli amministratori aziendali di instradare ogni versione del modello a un ARN di profilo di inferenza Bedrock specifico, a un nome di versione Vertex AI o a un nome di distribuzione Foundry per governance, allocazione dei costi o instradamento regionale.
Impostare modelOverrides nel file delle impostazioni:
{
"modelOverrides": {
"claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
"claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
"claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
}
}
Le chiavi devono essere ID di modello Anthropic come elencati nella Panoramica dei modelli. Per gli ID di modello datati, includere il suffisso della data esattamente come appare lì. Le chiavi sconosciute vengono ignorate.
Gli override sostituiscono gli ID di modello incorporati che supportano ogni voce nel selettore /model. Su Bedrock, gli override hanno la precedenza su qualsiasi profilo di inferenza che Claude Code scopre automaticamente all'avvio. I valori forniti direttamente tramite ANTHROPIC_MODEL, --model o le variabili di ambiente ANTHROPIC_DEFAULT_*_MODEL vengono passati al provider così come sono e non vengono trasformati da modelOverrides.
modelOverrides funziona insieme a availableModels. L'elenco di autorizzazione viene valutato rispetto all'ID di modello Anthropic, non al valore di override, quindi una voce come "opus" in availableModels continua a corrispondere anche quando le versioni di Opus sono mappate a ARN.
Configurazione della prompt caching
Claude Code utilizza automaticamente la prompt caching per ottimizzare le prestazioni e ridurre i costi. È possibile disabilitare la prompt caching globalmente o per livelli di modello specifici:
| Variabile di ambiente | Descrizione |
|---|---|
DISABLE_PROMPT_CACHING |
Impostare su 1 per disabilitare la prompt caching per tutti i modelli. Ha la precedenza sulle impostazioni per modello |
DISABLE_PROMPT_CACHING_HAIKU |
Impostare su 1 per disabilitare la prompt caching solo per i modelli Haiku |
DISABLE_PROMPT_CACHING_SONNET |
Impostare su 1 per disabilitare la prompt caching solo per i modelli Sonnet |
DISABLE_PROMPT_CACHING_OPUS |
Impostare su 1 per disabilitare la prompt caching solo per i modelli Opus |
DISABLE_PROMPT_CACHING_FABLE |
Impostare su 1 per disabilitare la prompt caching solo per i modelli Fable |
Per modificare il TTL della cache o scoprire cosa attiva un cache miss, vedere Come Claude Code utilizza la prompt caching.