SpyBara
Go Premium

fast-mode.md 2026-06-16 21:57 UTC to 2026-06-17 17:02 UTC

4 added, 4 removed.

2026
Sat 27 01:01 Fri 26 23:00 Thu 25 23:58 Wed 24 22:02 Tue 23 22:00 Mon 22 23:59 Fri 19 22:58 Thu 18 22:00 Wed 17 17:02 Tue 16 21:57 Mon 15 23:02 Sat 13 21:59 Fri 12 22:00 Thu 11 23:01 Wed 10 23:57 Tue 9 06:34 Mon 8 06:52 Sat 6 06:24 Fri 5 06:45 Thu 4 06:52 Wed 3 06:53 Tue 2 06:51

Acelere respostas com modo rápido

Obtenha respostas mais rápidas do Opus no Claude Code alternando o modo rápido.

O modo rápido é uma configuração de alta velocidade para Claude Opus, tornando o modelo até 2,5x mais rápido a um custo maior por token. Ative-o com /fast quando você precisar de velocidade para trabalho interativo como iteração rápida ou depuração ao vivo, e desative-o quando o custo importa mais do que a latência.

O modo rápido não é um modelo diferente. Ele usa Claude Opus com uma configuração de API diferente que prioriza a velocidade sobre a eficiência de custo. Você obtém qualidade e capacidades idênticas com respostas mais rápidas. O modo rápido é suportado no Opus 4.8, Opus 4.7 e Opus 4.6. Não está disponível no Sonnet, Haiku ou outros modelos.

O que você precisa saber:

  • Use /fast para alternar o modo rápido no CLI do Claude Code. O modo rápido não é suportado na extensão VS Code.
  • O preço do modo rápido por MTok de entrada/saída é $10/$50 no Opus 4.8 e $30/$150 no Opus 4.7 e Opus 4.6.
  • Disponível para todos os usuários do Claude Code em planos de assinatura (Pro/Max/Team/Enterprise) e Claude Console.
  • Para usuários do Claude Code em planos de assinatura (Pro/Max/Team/Enterprise), o modo rápido está disponível apenas via créditos de uso e não está incluído nos limites de taxa de assinatura.

Esta página cobre como alternar o modo rápido, seu tradeoff de custo, quando usá-lo, requisitos, opt-in por sessão e comportamento de limite de taxa.

Alternar modo rápido

Alterne o modo rápido de uma destas formas:

Por padrão, o modo rápido persiste entre sessões. Os administradores podem configurar o modo rápido para ser redefinido a cada sessão. Consulte require per-session opt-in para obter detalhes.

Para melhor eficiência de custo, ative o modo rápido no início de uma sessão em vez de alternar no meio da conversa. Consulte understand the cost tradeoff para obter detalhes.

Quando você ativa o modo rápido:

  • Se você estiver em um modelo diferente, o Claude Code alterna automaticamente para o Opus
  • Você verá uma mensagem de confirmação: "Fast mode ON"
  • Um pequeno ícone aparece ao lado do prompt enquanto o modo rápido está ativo
  • Execute /fast novamente a qualquer momento para verificar se o modo rápido está ativado ou desativado

Quando você desativa o modo rápido com /fast novamente, você permanece no Opus. O modelo não reverte para seu modelo anterior. Para alternar para um modelo diferente, use /model.

O Opus 4.8 é o padrão do modo rápido no Claude Code v2.1.154 e posterior. Na v2.1.142 até v2.1.153, o modo rápido usa como padrão o Opus 4.7.

Entender o tradeoff de custo

O modo rápido tem preços por token mais altos do que o Opus padrão, com o multiplicador variando por modelo:

Modelo Entrada (MTok) Saída (MTok)
Opus 4.8 $10 $50
Opus 4.7 e Opus 4.6 $30 $150

O preço do modo rápido é fixo em toda a janela de contexto de 1M token. Para a taxa padrão do Opus para comparar, consulte a referência de preços do Claude.

A primeira vez que você ativa o modo rápido em uma conversa, você paga o preço total do token de entrada não armazenado em cache do modo rápido para todo o contexto da conversa. Quanto mais profundo você estiver em uma conversa, mais isso custa, portanto ativar o modo rápido desde o início é mais barato. O custo se aplica uma vez por conversa, portanto desativar e ativar o modo rápido novamente mais tarde não o repete. Para o mecanismo, consulte como o modo rápido interage com o cache de prompt.

Decidir quando usar o modo rápido

O modo rápido é melhor para trabalho interativo onde a latência de resposta importa mais do que o custo:

  • Iteração rápida em mudanças de código
  • Sessões de depuração ao vivo
  • Trabalho sensível ao tempo com prazos apertados

O modo padrão é melhor para:

  • Tarefas autônomas longas onde a velocidade importa menos
  • Processamento em lote ou pipelines CI/CD
  • Cargas de trabalho sensíveis ao custo

Modo rápido vs nível de esforço

O modo rápido e o nível de esforço afetam a velocidade de resposta, mas de formas diferentes:

Configuração Efeito
Modo rápido Mesma qualidade de modelo, latência mais baixa, custo mais alto
Nível de esforço mais baixo Menos tempo de pensamento, respostas mais rápidas, qualidade potencialmente mais baixa em tarefas complexas

Você pode combinar ambos: use o modo rápido com um nível de esforço mais baixo para máxima velocidade em tarefas diretas.

Requisitos

O modo rápido requer todos os seguintes:

  • Apenas API Anthropic ou assinatura: o modo rápido está disponível através da API do Anthropic Console e para planos de assinatura Claude usando créditos de uso. Não está disponível no Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry ou Claude Platform na AWS.
  • Créditos de uso ativados: sua conta deve ter créditos de uso ativados, o que permite cobrança além do uso incluído no seu plano. Para contas individuais, ative isso nas suas configurações de cobrança do Console. Para Teams e Enterprise, um administrador deve ativar créditos de uso para a organização.
  • Habilitação de administrador para Team e Enterprise: o modo rápido está desativado por padrão para organizações Team e Enterprise. Um administrador deve explicitamente ativar o modo rápido antes que os usuários possam acessá-lo.

Ativar modo rápido para sua organização

Os administradores podem ativar o modo rápido em:

Outra opção para desativar completamente o modo rápido é definir CLAUDE_CODE_DISABLE_FAST_MODE=1. Consulte Variáveis de ambiente.

Require per-session opt-in

Por padrão, o modo rápido persiste entre sessões: se um usuário ativa o modo rápido, ele permanece ativado em futuras sessões. Os administradores em planos Team ou Enterprise podem evitar isso definindo fastModePerSessionOptIn como true em managed settings ou server-managed settings. Isso faz com que cada sessão comece com o modo rápido desativado, exigindo que os usuários o ativem explicitamente com /fast.

{
  "fastModePerSessionOptIn": true
}

Isso é útil para controlar custos em organizações onde os usuários executam várias sessões simultâneas. Os usuários ainda podem ativar o modo rápido com /fast quando precisam de velocidade, mas ele é redefinido no início de cada nova sessão. A preferência de modo rápido do usuário ainda é salva, portanto remover essa configuração restaura o comportamento padrão persistente.

Lidar com limites de taxa

O modo rápido tem limites de taxa separados do Opus padrão. O modo rápido no Opus 4.8, Opus 4.7 e Opus 4.6 compartilham o mesmo pool de limite de taxa: o uso em qualquer um deles é extraído dos mesmos limites. Quando você atinge o limite de taxa do modo rápido ou fica sem créditos de uso:

  1. O modo rápido automaticamente volta para velocidade padrão
  2. O ícone fica cinza para indicar cooldown
  3. Você continua trabalhando com velocidade e preços padrão
  4. Quando o cooldown expira, o modo rápido é automaticamente reativado

Para desativar o modo rápido manualmente em vez de esperar pelo cooldown, execute /fast novamente.

Research preview

O modo rápido é um recurso de visualização de pesquisa. Isso significa:

  • O recurso pode mudar com base no feedback
  • A disponibilidade e preços estão sujeitos a alterações
  • A configuração de API subjacente pode evoluir

Relate problemas ou feedback através de seus canais de suporte Anthropic usuais.

Veja também