SpyBara
Go Premium

model-config.md 2026-06-16 21:57 UTC to 2026-06-17 17:02 UTC

149 added, 27 removed.

2026
Tue 23 22:00 Mon 22 23:59 Fri 19 22:58 Thu 18 22:00 Wed 17 17:02 Tue 16 21:57 Mon 15 23:02 Sat 13 21:59 Fri 12 22:00 Thu 11 23:01 Wed 10 23:57 Tue 9 06:34 Mon 8 06:52 Sat 6 06:24 Fri 5 06:45 Thu 4 06:52 Wed 3 06:53 Tue 2 06:51

Configuração de modelo

Saiba mais sobre a configuração do modelo Claude Code, incluindo aliases de modelo como opusplan

Modelos disponíveis

Para a configuração model no Claude Code, você pode configurar:

  • Um alias de modelo
  • Um nome de modelo
    • API Anthropic: Um nome de modelo completo
    • Bedrock: um ARN de perfil de inferência
    • Foundry: um nome de implantação
    • Vertex: um nome de versão

Aliases de modelo

Os aliases de modelo fornecem uma maneira conveniente de selecionar configurações de modelo sem precisar lembrar dos números exatos da versão:

Alias de modelo Comportamento
default Valor especial que limpa qualquer substituição de modelo e reverte para o modelo recomendado para seu tipo de conta. Não é em si um alias de modelo
best Usa Fable 5 onde sua organização tem acesso a ele, caso contrário o modelo Opus mais recente
fable Usa Claude Fable 5 para suas tarefas mais difíceis e de longa duração
sonnet Usa o modelo Sonnet mais recente para tarefas de codificação diária
opus Usa o modelo Opus mais recente para tarefas de raciocínio complexo
haiku Usa o modelo Haiku rápido e eficiente para tarefas simples
sonnet[1m] Usa Sonnet com uma janela de contexto de 1 milhão de tokens para sessões longas
opus[1m] Usa Opus com uma janela de contexto de 1 milhão de tokens para sessões longas
opusplan Modo especial que usa opus durante Plan Mode, depois muda para sonnet para execução

Na API Anthropic, opus se resolve para Opus 4.8 e sonnet se resolve para Sonnet 4.6. Na Claude Platform on AWS, opus se resolve para Opus 4.7 e sonnet se resolve para Sonnet 4.6. No Bedrock, Vertex e Foundry, opus se resolve para Opus 4.6 e sonnet se resolve para Sonnet 4.5; modelos mais recentes estão disponíveis nesses provedores selecionando o nome completo do modelo explicitamente ou definindo ANTHROPIC_DEFAULT_OPUS_MODEL ou ANTHROPIC_DEFAULT_SONNET_MODEL.

Os aliases apontam para a versão recomendada para seu provedor e são atualizados ao longo do tempo. Para fixar uma versão específica, use o nome completo do modelo (por exemplo, claude-opus-4-8) ou defina a variável de ambiente correspondente como ANTHROPIC_DEFAULT_OPUS_MODEL.

Trabalhar com Fable 5

Claude Fable 5 é o modelo mais capaz no Claude Code, adequado para tarefas maiores que uma única sessão. Ele sustenta sessões autônomas longas, investiga antes de agir e verifica seu trabalho com mais frequência do que modelos menores.

Fable 5 não é o modelo padrão. Selecione-o com /model fable. Solicitações que seus classificadores de segurança sinalizam, mais frequentemente em domínios de cibersegurança e biologia, acionam fallback automático de modelo.

Para aproveitar ao máximo o Fable 5:

  • Descreva o resultado, não as etapas: entregue-lhe o resultado que você deseja e deixe-o planejar o caminho. Para mantê-lo funcionando até que esse resultado se mantenha, defina uma meta.
  • Entregue-lhe problemas ambíguos: investigações de causa raiz, depuração de interrupções e decisões de arquitetura são onde a investigação e verificação extras compensam.
  • Pule os lembretes de verificação: ele verifica seu próprio trabalho com menos solicitação, portanto lembretes para testar ou verificar geralmente são desnecessários.
  • Dimensione tarefas maiores: dê-lhe trabalho que você normalmente dividiria em pedaços. Ele mantém sessões longas sem perder o fio.

Configurando seu modelo

Você pode configurar seu modelo de várias maneiras, listadas em ordem de prioridade:

  1. Durante a sessão - Use /model <alias|name> para alternar imediatamente, ou execute /model sem argumentos para abrir o seletor. O seletor pede confirmação quando a conversa tem saída anterior, pois a próxima resposta relê o histórico completo sem contexto em cache
  2. Na inicialização - Inicie com claude --model <alias|name>
  3. Variável de ambiente - Defina ANTHROPIC_MODEL=<alias|name>
  4. Configurações - Configure permanentemente em seu arquivo de configurações usando o campo model.

A partir da v2.1.153, /model salva sua escolha como padrão para novas sessões escrevendo o campo model em suas configurações de usuário. No seletor:

  • Enter: alternar modelo e salvar como seu padrão
  • s: alternar modelo apenas para esta sessão

Digitar /model <name> diretamente se comporta como Enter. As configurações de projeto e gerenciadas ainda têm precedência e são reaplicadas no próximo lançamento.

Na v2.1.144 até v2.1.152, /model se aplicava apenas à sessão atual e d no seletor salvava um padrão.

O sinalizador --model e a variável de ambiente ANTHROPIC_MODEL se aplicam apenas à sessão que você inicia com eles. Para executar modelos diferentes em terminais diferentes ao mesmo tempo, inicie cada um com seu próprio sinalizador --model em vez de alternar com /model.

As sessões retomadas iniciadas com claude --resume, --continue ou o seletor /resume mantêm o modelo que estavam usando quando a transcrição foi salva, independentemente da configuração model atual. Se esse modelo foi descontinuado, a sessão cai para a ordem de precedência normal. Isso evita que a escolha /model de outra sessão altere o modelo ao retomar.

Quando o modelo ativo na inicialização vem das configurações do projeto ou gerenciadas em vez de sua própria seleção, o cabeçalho de inicialização mostra qual arquivo de configurações o definiu. Execute /model para substituir; a configuração do projeto ou gerenciada reaplicada no próximo lançamento.

Exemplo de uso:

# Iniciar com Opus
claude --model opus

# Alternar para Sonnet durante a sessão
/model sonnet

Exemplo de arquivo de configurações:

{
    "permissions": {
        ...
    },
    "model": "opus"
}

Restringir seleção de modelo

Os administradores corporativos podem usar availableModels em configurações gerenciadas ou de política para restringir quais modelos os usuários podem selecionar.

Quando availableModels é definido, a lista de permissões se aplica em todos os lugares onde um usuário pode especificar um modelo:

  • Modelo de sessão principal: /model, o sinalizador --model e a variável de ambiente ANTHROPIC_MODEL
  • Resolução de alias: {/* min-version: 2.1.176 */}as variáveis de ambiente ANTHROPIC_DEFAULT_OPUS_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL e ANTHROPIC_DEFAULT_FABLE_MODEL não podem redirecionar um alias permitido para um modelo fora da lista
  • Modo rápido: {/* min-version: 2.1.176 */}/fast recusa alternar quando isso implicaria mudar implicitamente para um modelo Opus fora da lista, com a mensagem "não está nos modelos permitidos da sua organização"
  • Modelos de subagente: o campo model em subagente frontmatter, o parâmetro model da ferramenta Agent, o seletor de modelo em /agents e CLAUDE_CODE_SUBAGENT_MODEL
  • Modelo de advisor: a configuração advisorModel configurada
  • Cadeias de fallback: elementos de uma cadeia de modelo de fallback fora da lista são descartados

Alternar para um modelo bloqueado com /model é rejeitado com um erro, enquanto um sinalizador --model bloqueado ou valor ANTHROPIC_MODEL é substituído na inicialização com um aviso nomeando tanto o modelo solicitado quanto o substituído, e a sessão é iniciada no modelo padrão. Uma substituição de subagente ou advisor bloqueada volta para o modelo herdado ou padrão em vez de falhar na solicitação.

{
  "availableModels": ["sonnet", "haiku"]
}

Comportamento do modelo padrão

Por padrão, a opção Padrão no seletor de modelo não é afetada por availableModels. Ela permanece disponível e representa o padrão de tempo de execução do sistema baseado no nível de assinatura do usuário.

Para estender a lista de permissões à opção Padrão, defina enforceAvailableModels como true em configurações gerenciadas ou de política junto com uma lista availableModels não vazia. Quando o padrão do nível não está na lista de permissões, Padrão se resolve para a primeira entrada permitida em vez do padrão do nível. Isso requer Claude Code v2.1.175 ou posterior.

Um array availableModels vazio nunca ativa a imposição. Mesmo com availableModels: [], os usuários ainda podem usar Claude Code com o modelo Padrão para seu nível, independentemente de enforceAvailableModels.

Controlar o modelo em que os usuários executam

A configuração model é uma seleção inicial, não uma imposição. Ela define qual modelo está ativo quando uma sessão é iniciada, mas os usuários ainda podem abrir /model e escolher Padrão, que se resolve para o padrão do sistema para seu nível, independentemente do que model está definido.

Para controlar totalmente a experiência do modelo, combine estas configurações:

  • availableModels: restringe para quais modelos nomeados os usuários podem alternar
  • enforceAvailableModels: estende a lista de permissões availableModels à opção Padrão, para que Padrão não possa se resolver para um modelo fora da lista
  • model: define a seleção de modelo inicial quando uma sessão é iniciada
  • ANTHROPIC_DEFAULT_SONNET_MODEL / ANTHROPIC_DEFAULT_OPUS_MODEL / ANTHROPIC_DEFAULT_HAIKU_MODEL / ANTHROPIC_DEFAULT_FABLE_MODEL: controlam para o que a opção Padrão e os aliases sonnet, opus, haiku e fable se resolvem

Este exemplo inicia os usuários em Sonnet 4.5, limita o seletor a Sonnet e Haiku, e garante que Padrão se resolve para um modelo na lista de permissões em vez do padrão do nível:

{
  "model": "claude-sonnet-4-5",
  "availableModels": ["claude-sonnet-4-5", "haiku"],
  "enforceAvailableModels": true,
  "env": {
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
  }
}

Sem enforceAvailableModels ou o bloco env, um usuário que seleciona Padrão no seletor obteria a versão mais recente para seu nível, contornando a fixação de versão em model e availableModels. As duas configurações cobrem escopos diferentes: enforceAvailableModels faz Padrão obedecer à lista de permissões, enquanto o bloco env fixa qual versão um alias permitido como sonnet se resolve. Use enforceAvailableModels sozinho quando restringir famílias de modelo é suficiente; adicione o bloco env quando você também precisar fixar uma versão específica.

Comportamento de mesclagem

Quando availableModels é definido em configurações de usuário, projeto e local apenas, os arrays são mesclados e desduplicados entre esses níveis.

Quando availableModels é definido em configurações gerenciadas ou de política, o valor gerenciado ou de política substitui completamente o resultado mesclado: entradas adicionadas em configurações de usuário ou projeto não podem ampliá-lo. Configurações gerenciadas e de política substituem valores de menor precedência para enforceAvailableModels da mesma forma. A partir de Claude Code v2.1.175, esta é a única maneira de impor uma lista de permissões rigorosa; versões anteriores mesclam a lista gerenciada com entradas de menor precedência.

IDs de modelo Mantle

Quando o endpoint Bedrock Mantle está habilitado, entradas em availableModels que começam com anthropic. são adicionadas ao seletor /model como opções personalizadas e roteadas para o endpoint Mantle. A configuração ainda restringe o seletor às entradas listadas, portanto inclua os aliases padrão junto com qualquer ID Mantle.

Comportamento especial do modelo

Configuração do modelo `default`

O comportamento de default depende do tipo de sua conta:

  • Max, Team Premium, Enterprise pagamento conforme o uso e API Anthropic: padrão para Opus 4.8
  • Claude Platform na AWS: padrão para Opus 4.7
  • Pro, Team Standard e assentos de assinatura Enterprise: padrão para Sonnet 4.6
  • Bedrock, Vertex e Foundry: padrão para Sonnet 4.5

Enterprise pagamento conforme o uso significa uma organização Enterprise cobrada por uso em vez de por assento de assinatura.

Fable 5 não é o modelo padrão em nenhum tipo de conta. As sessões usam Fable 5 apenas depois que você o escolhe, com /model fable, uma configuração model ou o alias best onde Fable 5 está disponível. Escolhê-lo com /model o salva como o modelo selecionado em suas configurações de usuário, portanto as sessões posteriores começam em Fable 5 até que você altere os modelos.

Configuração do modelo `opusplan`

O alias de modelo opusplan fornece uma abordagem híbrida automatizada:

  • Em Plan Mode - Usa opus para raciocínio complexo e decisões de arquitetura
  • Em modo de execução - Muda automaticamente para sonnet para geração de código e implementação

Isso oferece o melhor dos dois mundos: o raciocínio superior do Opus para planejamento e a eficiência do Sonnet para execução.

A fase Opus do Plan Mode usa a mesma janela de contexto da configuração do modelo opus. Nos níveis de assinatura onde Opus é automaticamente atualizado para contexto 1M, opusplan recebe a atualização em Plan Mode também. Para forçar contexto 1M para ambas as fases quando você não está em um nível de atualização automática, defina o modelo para opusplan[1m].

Quando availableModels exclui Opus, opusplan permanece em Sonnet em Plan Mode em vez de alternar. Da mesma forma, uma sessão Haiku que normalmente seria atualizada para Sonnet em Plan Mode permanece em Haiku quando Sonnet é excluído.

Para uma abordagem híbrida onde Claude decide no meio da tarefa quando consultar um segundo modelo em vez de alternar no limite do plano, veja a ferramenta advisor.

Cadeias de modelo de fallback

Quando o modelo primário está sobrecarregado, indisponível ou retorna outro erro de servidor não retentável, Claude Code pode alternar para um modelo de fallback em vez de falhar na solicitação. Erros de autenticação, faturamento, limite de taxa, tamanho de solicitação e transporte nunca acionam uma alternância; esses seguem sua manipulação de erro e retry normal.

Configure um ou mais modelos de fallback e Claude Code os tenta em ordem, mostrando um aviso quando alterna. A alternância dura apenas para a volta atual, portanto sua próxima mensagem tenta o modelo primário primeiro novamente. As cadeias são limitadas a três modelos após remoção de duplicatas, e entradas extras são ignoradas.

Defina uma cadeia para uma sessão com o sinalizador --fallback-model, que aceita uma lista separada por vírgulas:

claude --fallback-model sonnet,haiku

Para persistir uma cadeia entre sessões, defina fallbackModel em configurações como uma matriz:

{
  "fallbackModel": ["claude-sonnet-4-6", "claude-haiku-4-5"]
}

O sinalizador --fallback-model tem precedência sobre a configuração fallbackModel. Cada elemento aceita um nome de modelo ou alias, e "default" se expande para o modelo padrão.

Dois casos fazem um elemento ser ignorado:

  • Modelo indisponível: um modelo que não pode ser alcançado, como um modelo aposentado fixado em configurações, é ignorado e Claude Code continua para o próximo elemento.
  • Fora da lista de permissões: um elemento não permitido por availableModels é descartado quando a cadeia é lida e nunca é tentado.

Fallback automático de modelo

Esta seção cobre fallback baseado em conteúdo de Fable 5. Para fallback baseado em disponibilidade quando um modelo está sobrecarregado ou indisponível, veja Cadeias de modelo de fallback.

Fable 5 é executado com classificadores de segurança para conteúdo de cibersegurança e biologia. Quando um classificador sinaliza uma solicitação, Claude Code executa novamente essa solicitação no modelo Opus padrão e mostra um aviso na transcrição: Opus 4.8 na API Anthropic e implantações de gateway LLM, ou Opus 4.7 na Claude Platform na AWS.

A sessão então continua nesse modelo Opus. Para retornar a Fable 5, execute /model fable.

Verificar o que acionou fallback

O fallback pode ser acionado na primeira solicitação de uma sessão, antes de você enviar algo incomum, porque a primeira solicitação carrega contexto do espaço de trabalho, como seu conteúdo CLAUDE.md e status do git. Um repositório que contém material de segurança ou biologia pode acionar o classificador apenas nesse contexto.

Para verificar se as personalizações são o gatilho, inicie uma sessão com claude --safe-mode, que desabilita personalizações como CLAUDE.md, skills, servidores MCP e hooks. O status do git e nomes de diretórios não são personalizações e ainda estão inclusos.

Perguntar antes de alternar

Para decidir o que acontece cada vez que uma solicitação é sinalizada, em vez de alternar automaticamente, execute /config e desative "switch models when a message is flagged". Uma solicitação sinalizada então pausa a sessão com duas opções: alternar para o modelo Opus ou editar o prompt e tentar novamente em Fable 5.

Alguns casos se comportam diferentemente:

  • Se ambos os modelos sinalizarem a mesma solicitação, você pode editar o prompt e tentar novamente, ou iniciar uma nova sessão.
  • Em sessões móveis Claude Code na web, editar e tentar novamente não é suportado. Alterne modelos ou continue a sessão de um navegador de desktop ou do aplicativo de desktop.
  • Em modo não interativo e integrações SDK que não podem mostrar o prompt, uma solicitação sinalizada encerra a volta com uma recusa em vez disso.

Habilitar fallback em Bedrock, Vertex AI e Foundry

Em Amazon Bedrock, Google Vertex AI e Microsoft Foundry, IDs de modelo são específicos do provedor, portanto o fallback automático opera apenas quando Claude Code pode identificar ambos os modelos envolvidos:

  • Claude Code deve reconhecer o modelo atual como Fable 5: o ID do modelo contém claude-fable-5, corresponde ao valor de ANTHROPIC_DEFAULT_FABLE_MODEL ou é mapeado com modelOverrides.
  • O alvo de fallback deve resolver para um modelo Opus: o valor de ANTHROPIC_DEFAULT_OPUS_MODEL se definido, caso contrário uma entrada Opus 4.8 na lista de modelos do provedor.

Se qualquer modelo não puder ser identificado, Claude Code não alterna automaticamente. A solicitação sinalizada termina com uma mensagem de recusa, e você pode alternar modelos com /model e tentar novamente. Para habilitar fallback automático nesses provedores, defina ANTHROPIC_DEFAULT_FABLE_MODEL para seu ID de modelo Fable 5 e ANTHROPIC_DEFAULT_OPUS_MODEL para seu ID de modelo Opus 4.8.

Pesquisa de segurança e cargas de trabalho de biologia

Cargas de trabalho em segurança ofensiva ou biologia, incluindo testes de penetração, exercícios Capture the Flag (CTF) e bases de código adjacentes à biologia, acionam fallback frequentemente, geralmente na primeira solicitação. Para trabalho substancial de biologia, espere que quase todas as solicitações sejam redirecionadas.

Este é o roteamento esperado para esses domínios, não uma sinalização de conta. Se sua organização precisa de capacidade de classe Fable para este trabalho, pergunte ao seu time de contas Anthropic sobre programas de acesso confiável.

Ajustar nível de esforço

Níveis de esforço controlam raciocínio adaptativo, que permite que o modelo decida se e quanto pensar em cada etapa com base na complexidade da tarefa. Esforço menor é mais rápido e mais barato para tarefas diretas, enquanto esforço maior fornece raciocínio mais profundo para problemas complexos.

Os níveis de esforço disponíveis dependem do modelo. Modelos não listados aqui não suportam esforço:

Modelo Níveis
Fable 5 low, medium, high, xhigh, max
Opus 4.8 e Opus 4.7 low, medium, high, xhigh, max
Opus 4.6 e Sonnet 4.6 low, medium, high, max

Se você definir um nível que o modelo ativo não suporta, Claude Code volta para o nível mais alto suportado no ou abaixo do que você definiu. Por exemplo, xhigh é executado como high em Opus 4.6.

O esforço padrão é high em Fable 5, Opus 4.8, Opus 4.6 e Sonnet 4.6, e xhigh em Opus 4.7.

Quando você executa Fable 5, Opus 4.8 ou Opus 4.7 pela primeira vez, Claude Code aplica o esforço padrão desse modelo mesmo que você tenha definido anteriormente um nível diferente para outro modelo: high em Fable 5 e Opus 4.8, e xhigh em Opus 4.7. Execute /effort novamente para escolher um nível diferente após alternar.

low, medium, high e xhigh persistem entre sessões. max fornece o raciocínio mais profundo sem restrição no gasto de tokens e se aplica apenas à sessão atual, exceto quando definido através da variável de ambiente CLAUDE_CODE_EFFORT_LEVEL.

O menu /effort também oferece ultracode. Ultracode é uma configuração de Claude Code em vez de um nível de esforço do modelo: envia xhigh para o modelo e adicionalmente tem Claude orquestrar fluxos de trabalho dinâmicos para tarefas substanciais. Se aplica apenas à sessão atual. Defina através de /effort, ou passe "ultracode": true via --settings ou uma solicitação de controle do Agent SDK. Não faz parte da configuração effortLevel, do sinalizador --effort ou CLAUDE_CODE_EFFORT_LEVEL.

Escolher um nível de esforço

Cada nível negocia gasto de tokens contra capacidade. O padrão é adequado para a maioria das tarefas de codificação; ajuste quando você quiser um equilíbrio diferente.

Nível Quando usá-lo
low Reserve para tarefas curtas, delimitadas, sensíveis à latência que não são sensíveis à inteligência
medium Reduz o uso de tokens para trabalho sensível a custos que pode fazer concessões em inteligência
high Equilibra o uso de tokens e inteligência. Padrão em Fable 5, Opus 4.8, Opus 4.6 e Sonnet 4.6
xhigh Raciocínio mais profundo com gasto de tokens mais alto. Padrão em Opus 4.7
max Pode melhorar o desempenho em tarefas exigentes, mas pode mostrar retornos decrescentes e é propenso a pensar demais. Teste antes de adotar amplamente
ultracode Uma configuração de Claude Code que planeja um fluxo de trabalho dinâmico para cada tarefa substancial com raciocínio xhigh por mensagem. Apenas de sessão

A escala de esforço é calibrada por modelo, portanto o mesmo nome de nível não representa o mesmo valor subjacente entre modelos.

Usar ultrathink para raciocínio profundo único

Inclua ultrathink em qualquer lugar em seu prompt para solicitar raciocínio mais profundo nessa volta sem alterar sua configuração de esforço de sessão. Claude Code reconhece a palavra-chave e adiciona uma instrução no contexto. O nível de esforço enviado para a API permanece inalterado. Outras frases como "think", "think hard" e "think more" são passadas como texto de prompt ordinário e não são reconhecidas como palavras-chave.

Definir o nível de esforço

Você pode alterar o esforço através de qualquer um dos seguintes:

  • /effort: execute /effort sem argumentos para abrir um controle deslizante interativo, /effort seguido por um nome de nível para defini-lo diretamente, ou /effort auto para redefinir para o padrão do modelo
  • Em /model: use as teclas de seta esquerda/direita para ajustar o controle deslizante de esforço ao selecionar um modelo
  • Sinalizador --effort: passe um nome de nível para defini-lo para uma única sessão ao iniciar Claude Code
  • Variável de ambiente: defina CLAUDE_CODE_EFFORT_LEVEL para um nome de nível ou auto
  • Configurações: defina effortLevel para low, medium, high ou xhigh em seu arquivo de configurações. max e ultracode são apenas de sessão e não são aceitos aqui
  • Frontmatter de skill e subagent: defina effort em um arquivo markdown de skill ou subagent para substituir o nível de esforço quando esse skill ou subagent é executado

A variável de ambiente tem precedência sobre todos os outros métodos, depois seu nível configurado, depois o padrão do modelo. O esforço de frontmatter se aplica quando esse skill ou subagent está ativo, substituindo o nível de sessão, mas não a variável de ambiente.

O controle deslizante de esforço aparece em /model quando um modelo suportado é selecionado. O nível de esforço atual também é exibido ao lado do logo e spinner, por exemplo "with low effort", para que você possa confirmar qual configuração está ativa sem abrir /model.

Raciocínio adaptativo e orçamentos de pensamento fixos

O raciocínio adaptativo torna o pensamento opcional em cada etapa, portanto Claude pode responder mais rápido a prompts rotineiros e reservar pensamento mais profundo para etapas que se beneficiam dele. Se você quiser que Claude pense mais ou menos frequentemente do que o nível atual produz, você pode dizer isso diretamente em seu prompt ou em CLAUDE.md; o modelo responde a essa orientação dentro de sua configuração de esforço.

Opus 4.7 e posterior sempre usam raciocínio adaptativo, assim como Fable 5. O modo de orçamento de pensamento fixo e CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING não se aplicam a eles.

Em Opus 4.6 e Sonnet 4.6, você pode definir CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 para reverter para o orçamento de pensamento fixo anterior controlado por MAX_THINKING_TOKENS. Veja variáveis de ambiente.

Pensamento estendido

Pensamento estendido é o raciocínio que Claude emite antes de responder. Em modelos que suportam raciocínio adaptativo, o nível de esforço é o controle principal para quanto pensamento acontece; as configurações abaixo ativam ou desativam o pensamento e controlam como ele é exibido.

Controle Como defini-lo
Alternar para a sessão atual Pressione Option+T no macOS ou Alt+T no Windows e Linux
Definir o padrão global Execute /config e alterne o modo de pensamento. Salvo como alwaysThinkingEnabled em ~/.claude/settings.json
Desabilitar independentemente do esforço Defina MAX_THINKING_TOKENS=0, que desativa o pensamento na API Anthropic exceto em Fable 5. Em provedores de terceiros isso omite o parâmetro thinking em vez disso, e modelos de raciocínio adaptativo ainda podem pensar. Outros valores se aplicam apenas com um orçamento de pensamento fixo

O pensamento não pode ser desativado em Fable 5. O alternador de sessão, alwaysThinkingEnabled e MAX_THINKING_TOKENS=0 não têm efeito lá, e Fable 5 decide por etapa quanto pensar com base no nível de esforço.

A saída de pensamento é recolhida por padrão. Pressione Ctrl+O para alternar o modo verboso e ver o raciocínio como texto em itálico cinzento. Sessões interativas na API Anthropic recebem blocos de pensamento redigidos por padrão, portanto defina showThinkingSummaries: true em configurações se você quiser os resumos completos disponíveis quando expandir. Você é cobrado por todos os tokens de pensamento gerados, mesmo quando recolhidos ou redigidos.

Contexto estendido

Fable 5, Opus 4.6 e posterior, e Sonnet 4.6, suportam uma janela de contexto de 1 milhão de tokens para sessões longas com grandes bases de código.

A disponibilidade varia por modelo e plano. Nos planos Max, Team e Enterprise, Opus é automaticamente atualizado para contexto 1M sem configuração adicional. Isso se aplica aos assentos Team Standard e Team Premium. Na API Anthropic, Fable 5, Opus 4.8 e Opus 4.7 sempre são executados com a janela 1M. Sonnet com contexto 1M não faz parte da atualização automática e requer créditos de uso em todos os planos de assinatura, incluindo Max.

Plano Opus com contexto 1M Sonnet com contexto 1M
Max, Team e Enterprise Incluído na assinatura Requer créditos de uso
Pro Requer créditos de uso Requer créditos de uso
API e pagamento conforme o uso Acesso completo Acesso completo

Para desabilitar completamente o contexto 1M, defina CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Isso remove variantes de modelo 1M do seletor de modelo. Veja variáveis de ambiente.

A janela de contexto 1M usa preços de modelo padrão sem prêmio para tokens além de 200K. Para planos onde o contexto estendido está incluído em sua assinatura, o uso permanece coberto por sua assinatura. Para planos que acessam contexto estendido através de créditos de uso, os tokens são cobrados para créditos de uso.

Se sua conta suporta contexto 1M, a opção aparece no seletor de modelo (/model) nas versões mais recentes do Claude Code. Se você não a vir, tente reiniciar sua sessão.

Você também pode usar o sufixo [1m] com aliases de modelo ou nomes de modelo completos:

# Use o alias opus[1m] ou sonnet[1m]
/model opus[1m]
/model sonnet[1m]

# Ou anexe [1m] a um nome de modelo completo
/model claude-opus-4-8[1m]

Verificando seu modelo atual

Você pode ver qual modelo está usando atualmente de várias maneiras:

  1. Na linha de status (se configurada)
  2. Em /status, que também exibe as informações de sua conta.

Adicionar uma opção de modelo personalizado

Use ANTHROPIC_CUSTOM_MODEL_OPTION para adicionar uma única entrada personalizada ao seletor /model sem substituir os aliases integrados. Isso é útil para testar IDs de modelo que Claude Code não lista por padrão. Para implantações de gateway LLM, Claude Code pode preencher o seletor a partir do endpoint /v1/models do gateway quando CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 está definido, portanto essa variável é necessária apenas quando a descoberta está desabilitada ou não retorna o modelo que você deseja. Consulte Seleção de modelo de gateway LLM.

Este exemplo define todas as três variáveis para tornar uma implantação Opus roteada por gateway selecionável:

export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"

A entrada personalizada aparece na parte inferior do seletor /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME e ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION são opcionais. Se omitidos, o ID do modelo é usado como o nome e a descrição padrão é Custom model (<model-id>).

Claude Code ignora a validação para o ID do modelo definido em ANTHROPIC_CUSTOM_MODEL_OPTION, portanto você pode usar qualquer string que seu endpoint de API aceite.

Variáveis de ambiente

Você pode usar as seguintes variáveis de ambiente, que devem ser nomes de modelo completos (ou equivalente para seu provedor de API), para controlar os nomes de modelo para os quais os aliases mapeiam.

Variável de ambiente Descrição
ANTHROPIC_DEFAULT_FABLE_MODEL O modelo a usar para fable, e o ID de modelo que Claude Code reconhece como Fable 5 para fallback automático de modelo em provedores de terceiros
ANTHROPIC_DEFAULT_OPUS_MODEL O modelo a usar para opus, ou para opusplan quando Plan Mode está ativo.
ANTHROPIC_DEFAULT_SONNET_MODEL O modelo a usar para sonnet, ou para opusplan quando Plan Mode não está ativo.
ANTHROPIC_DEFAULT_HAIKU_MODEL O modelo a usar para haiku, ou funcionalidade de fundo
CLAUDE_CODE_SUBAGENT_MODEL O modelo a usar para todos os subagents e agent teams. Substitui tanto o parâmetro model por invocação quanto o frontmatter model da definição do subagent. Defina como inherit para usar resolução de modelo normal em vez disso

Nota: ANTHROPIC_SMALL_FAST_MODEL está descontinuado em favor de ANTHROPIC_DEFAULT_HAIKU_MODEL.

Fixar modelos para implantações de terceiros

Ao implantar Claude Code através de Bedrock, Vertex AI, Foundry ou Claude Platform on AWS, fixe versões de modelo antes de lançar para usuários.

Sem fixação, Claude Code usa aliases de modelo como fable, opus, sonnet e haiku que resolvem para um ID de modelo padrão integrado para cada provedor. Esse padrão pode ficar atrás da versão mais recente do Anthropic, e o modelo para o qual aponta pode ainda não estar habilitado na conta de um usuário. Quando o padrão não está disponível, os usuários de Bedrock e Vertex AI veem um aviso e voltam para a versão anterior para essa sessão, enquanto os usuários de Foundry veem erros porque Foundry não tem verificação de inicialização equivalente.

Use as seguintes variáveis de ambiente com IDs de modelo específicos de versão para seu provedor:

Provedor Exemplo
Bedrock export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-8'
Vertex AI export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8'
Foundry export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8'

Aplique o mesmo padrão para ANTHROPIC_DEFAULT_FABLE_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL e ANTHROPIC_DEFAULT_HAIKU_MODEL. Para IDs de modelo atuais e legados em todos os provedores, veja Visão geral de modelos. Para atualizar usuários para uma nova versão de modelo, atualize essas variáveis de ambiente e reimplante.

Para habilitar contexto estendido para um modelo fixado, anexe [1m] ao ID do modelo em ANTHROPIC_DEFAULT_OPUS_MODEL ou ANTHROPIC_DEFAULT_SONNET_MODEL:

export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8[1m]'

O sufixo [1m] aplica a janela de contexto 1M a todo o uso dos aliases opus e sonnet, incluindo a fase Opus do modo de plano de opusplan.

  • Claude Code remove o sufixo antes de enviar o ID do modelo para seu provedor.
  • Apenas anexe [1m] quando o modelo subjacente suportar contexto 1M.
  • O sufixo é lido por variável, não por modelo. No Bedrock, Vertex e Foundry, um ID de modelo sem [1m] em uma variável usa contexto 200K mesmo se outra variável define o mesmo modelo com o sufixo.

Personalizar exibição e capacidades do modelo fixado

Quando você fixa um modelo em um provedor de terceiros, o ID específico do provedor aparece como está no seletor /model e Claude Code pode não reconhecer quais recursos o modelo suporta. Você pode substituir o nome de exibição e declarar capacidades com variáveis de ambiente complementares para cada modelo fixado.

Essas variáveis têm efeito em provedores de terceiros, como Bedrock, Vertex AI e Foundry. As variáveis _NAME e _DESCRIPTION também têm efeito quando ANTHROPIC_BASE_URL aponta para um gateway LLM. Elas não têm efeito ao conectar diretamente a api.anthropic.com.

Variável de ambiente Descrição
ANTHROPIC_DEFAULT_OPUS_MODEL_NAME Nome de exibição para o modelo Opus fixado no seletor /model. Padrão para o ID do modelo quando não definido
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION Descrição de exibição para o modelo Opus fixado no seletor /model. Padrão para Custom Opus model quando não definido
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES Lista separada por vírgulas de capacidades que o modelo Opus fixado suporta

Os mesmos sufixos _NAME, _DESCRIPTION e _SUPPORTED_CAPABILITIES estão disponíveis para ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL, ANTHROPIC_DEFAULT_FABLE_MODEL e ANTHROPIC_CUSTOM_MODEL_OPTION.

Claude Code habilita recursos como níveis de esforço e pensamento estendido correspondendo o ID do modelo contra padrões conhecidos. IDs específicos do provedor, como ARNs Bedrock ou nomes de implantação personalizados, geralmente não correspondem a esses padrões, deixando recursos suportados desabilitados. Defina _SUPPORTED_CAPABILITIES para informar ao Claude Code quais recursos o modelo realmente suporta:

Valor de capacidade Habilita
effort Níveis de esforço e o comando /effort
xhigh_effort {/* min-version: 2.1.111 */}O nível de esforço xhigh
max_effort O nível de esforço max
thinking Pensamento estendido
adaptive_thinking Raciocínio adaptativo que aloca dinamicamente o pensamento com base na complexidade da tarefa
interleaved_thinking Pensamento entre chamadas de ferramenta

Quando _SUPPORTED_CAPABILITIES é definido, as capacidades listadas são habilitadas e as capacidades não listadas são desabilitadas para o modelo fixado correspondente. Quando a variável não está definida, Claude Code volta para detecção integrada baseada no ID do modelo.

Este exemplo fixa Opus para um ARN de modelo personalizado Bedrock, define um nome amigável e declara suas capacidades:

export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'

Substituir IDs de modelo por versão

As variáveis de ambiente no nível de família acima configuram um ID de modelo por alias de família. Se você precisar mapear várias versões dentro da mesma família para IDs de provedor distintos, use a configuração modelOverrides em vez disso.

modelOverrides mapeia IDs de modelo Anthropic individuais para as strings específicas do provedor que Claude Code envia para a API do seu provedor. Quando um usuário seleciona um modelo mapeado no seletor /model, Claude Code usa seu valor configurado em vez do padrão integrado.

Isso permite que administradores corporativos roteiem cada versão de modelo para um ARN de perfil de inferência Bedrock específico, nome de versão Vertex AI ou nome de implantação Foundry para governança, alocação de custos ou roteamento regional.

Defina modelOverrides em seu arquivo de configurações:

{
  "modelOverrides": {
    "claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
    "claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
    "claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
  }
}

As chaves devem ser IDs de modelo Anthropic conforme listado na Visão geral de modelos. Para IDs de modelo datados, inclua o sufixo de data exatamente como aparece lá. Chaves desconhecidas são ignoradas.

As substituições substituem os IDs de modelo integrados que suportam cada entrada no seletor /model. No Bedrock, as substituições têm precedência sobre qualquer perfil de inferência que Claude Code descobre automaticamente na inicialização. Os valores que você fornece diretamente através de ANTHROPIC_MODEL, --model ou as variáveis de ambiente ANTHROPIC_DEFAULT_*_MODEL são passados para o provedor como estão e não são transformados por modelOverrides.

modelOverrides funciona junto com availableModels. A lista de permissões é avaliada contra o ID de modelo Anthropic, não o valor de substituição, então uma entrada como "opus" em availableModels continua a corresponder mesmo quando versões do Opus são mapeadas para ARNs.

Configuração de prompt caching

Claude Code usa automaticamente prompt caching para otimizar o desempenho e reduzir custos. Você pode desabilitar prompt caching globalmente ou para níveis de modelo específicos:

Variável de ambiente Descrição
DISABLE_PROMPT_CACHING Defina como 1 para desabilitar prompt caching para todos os modelos. Tem precedência sobre as configurações por modelo
DISABLE_PROMPT_CACHING_HAIKU Defina como 1 para desabilitar prompt caching apenas para modelos Haiku
DISABLE_PROMPT_CACHING_SONNET Defina como 1 para desabilitar prompt caching apenas para modelos Sonnet
DISABLE_PROMPT_CACHING_OPUS Defina como 1 para desabilitar prompt caching apenas para modelos Opus
DISABLE_PROMPT_CACHING_FABLE Defina como 1 para desabilitar prompt caching apenas para modelos Fable

Para alterar o TTL do cache ou aprender o que dispara uma falha de cache, veja Como Claude Code usa prompt caching.