Acelere respostas com modo rápido
Obtenha respostas mais rápidas do Opus no Claude Code alternando o modo rápido.
O modo rápido está em visualização de pesquisa. O recurso, preços e disponibilidade podem mudar com base no feedback.
O modo rápido é uma configuração de alta velocidade para Claude Opus, tornando o modelo até 2,5x mais rápido a um custo maior por token. Ative-o com /fast quando você precisar de velocidade para trabalho interativo como iteração rápida ou depuração ao vivo, e desative-o quando o custo importa mais do que a latência.
O modo rápido não é um modelo diferente. Ele usa Claude Opus com uma configuração de API diferente que prioriza a velocidade sobre a eficiência de custo. Você obtém qualidade e capacidades idênticas com respostas mais rápidas. O modo rápido é suportado no Opus 4.8, Opus 4.7 e Opus 4.6. Não está disponível no Sonnet, Haiku ou outros modelos.
O modo rápido para Opus 4.6 está descontinuado e será removido aproximadamente 30 dias após o lançamento do Opus 4.8. Após a remoção, o modo rápido no Opus 4.6 volta para a velocidade padrão com preços padrão. Migre para Opus 4.8 ou Opus 4.7 para manter a aceleração.
O modo rápido requer Claude Code v2.1.36 ou posterior. Verifique sua versão com claude --version.
O que você precisa saber:
- Use
/fastpara alternar o modo rápido no CLI do Claude Code. O modo rápido não é suportado na extensão VS Code. - O preço do modo rápido por MTok de entrada/saída é $10/$50 no Opus 4.8 e $30/$150 no Opus 4.7 e Opus 4.6.
- Disponível para todos os usuários do Claude Code em planos de assinatura (Pro/Max/Team/Enterprise) e Claude Console.
- Para usuários do Claude Code em planos de assinatura (Pro/Max/Team/Enterprise), o modo rápido está disponível apenas via créditos de uso e não está incluído nos limites de taxa de assinatura.
Esta página cobre como alternar o modo rápido, seu tradeoff de custo, quando usá-lo, requisitos, opt-in por sessão e comportamento de limite de taxa.
Alternar modo rápido
Alterne o modo rápido de uma destas formas:
- Digite
/faste pressione Tab para alternar ativado ou desativado - Defina
"fastMode": trueno seu arquivo de configurações do usuário
Por padrão, o modo rápido persiste entre sessões. Os administradores podem configurar o modo rápido para ser redefinido a cada sessão. Consulte require per-session opt-in para obter detalhes.
Para melhor eficiência de custo, ative o modo rápido no início de uma sessão em vez de alternar no meio da conversa. Consulte understand the cost tradeoff para obter detalhes.
Quando você ativa o modo rápido:
- Se você estiver em um modelo diferente, o Claude Code alterna automaticamente para o Opus
- Você verá uma mensagem de confirmação: "Fast mode ON"
- Um pequeno ícone
↯aparece ao lado do prompt enquanto o modo rápido está ativo - Execute
/fastnovamente a qualquer momento para verificar se o modo rápido está ativado ou desativado
Quando você desativa o modo rápido com /fast novamente, você permanece no Opus. O modelo não reverte para seu modelo anterior. Para alternar para um modelo diferente, use /model.
O Opus 4.8 é o padrão do modo rápido no Claude Code v2.1.154 e posterior. Na v2.1.142 até v2.1.153, o modo rápido usa como padrão o Opus 4.7.
Entender o tradeoff de custo
O modo rápido tem preços por token mais altos do que o Opus padrão, com o multiplicador variando por modelo:
| Modelo | Entrada (MTok) | Saída (MTok) |
|---|---|---|
| Opus 4.8 | $10 | $50 |
| Opus 4.7 e Opus 4.6 | $30 | $150 |
O preço do modo rápido é fixo em toda a janela de contexto de 1M token. Para a taxa padrão do Opus para comparar, consulte a referência de preços do Claude.
A primeira vez que você ativa o modo rápido em uma conversa, você paga o preço total do token de entrada não armazenado em cache do modo rápido para todo o contexto da conversa. Quanto mais profundo você estiver em uma conversa, mais isso custa, portanto ativar o modo rápido desde o início é mais barato. O custo se aplica uma vez por conversa, portanto desativar e ativar o modo rápido novamente mais tarde não o repete. Para o mecanismo, consulte como o modo rápido interage com o cache de prompt.
Decidir quando usar o modo rápido
O modo rápido é melhor para trabalho interativo onde a latência de resposta importa mais do que o custo:
- Iteração rápida em mudanças de código
- Sessões de depuração ao vivo
- Trabalho sensível ao tempo com prazos apertados
O modo padrão é melhor para:
- Tarefas autônomas longas onde a velocidade importa menos
- Processamento em lote ou pipelines CI/CD
- Cargas de trabalho sensíveis ao custo
Modo rápido vs nível de esforço
O modo rápido e o nível de esforço afetam a velocidade de resposta, mas de formas diferentes:
| Configuração | Efeito |
|---|---|
| Modo rápido | Mesma qualidade de modelo, latência mais baixa, custo mais alto |
| Nível de esforço mais baixo | Menos tempo de pensamento, respostas mais rápidas, qualidade potencialmente mais baixa em tarefas complexas |
Você pode combinar ambos: use o modo rápido com um nível de esforço mais baixo para máxima velocidade em tarefas diretas.
Requisitos
O modo rápido requer todos os seguintes:
- Apenas API Anthropic ou assinatura: o modo rápido está disponível através da API do Anthropic Console e para planos de assinatura Claude usando créditos de uso. Não está disponível no Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry ou Claude Platform na AWS.
- Créditos de uso ativados: sua conta deve ter créditos de uso ativados, o que permite cobrança além do uso incluído no seu plano. Para contas individuais, ative isso nas suas configurações de cobrança do Console. Para Teams e Enterprise, um administrador deve ativar créditos de uso para a organização.
O uso do modo rápido é cobrado diretamente nos créditos de uso, mesmo que você tenha uso restante no seu plano. Isso significa que os tokens do modo rápido não contam contra o uso incluído do seu plano e são cobrados à taxa do modo rápido desde o primeiro token.
- Habilitação de administrador para Team e Enterprise: o modo rápido está desativado por padrão para organizações Team e Enterprise. Um administrador deve explicitamente ativar o modo rápido antes que os usuários possam acessá-lo.
Se seu administrador não tiver ativado o modo rápido para sua organização, o comando /fast mostrará "Fast mode has been disabled by your organization." Se a lista de permissões availableModels da sua organização excluir o modelo Opus do modo rápido, /fast é recusado com "is not in your organization's allowed models".
Ativar modo rápido para sua organização
Os administradores podem ativar o modo rápido em:
- Console (clientes de API): Preferências do Claude Code
- Claude AI (Team e Enterprise): Admin Settings > Claude Code
Outra opção para desativar completamente o modo rápido é definir CLAUDE_CODE_DISABLE_FAST_MODE=1. Consulte Variáveis de ambiente.
Require per-session opt-in
Por padrão, o modo rápido persiste entre sessões: se um usuário ativa o modo rápido, ele permanece ativado em futuras sessões. Os administradores em planos Team ou Enterprise podem evitar isso definindo fastModePerSessionOptIn como true em managed settings ou server-managed settings. Isso faz com que cada sessão comece com o modo rápido desativado, exigindo que os usuários o ativem explicitamente com /fast.
{
"fastModePerSessionOptIn": true
}
Isso é útil para controlar custos em organizações onde os usuários executam várias sessões simultâneas. Os usuários ainda podem ativar o modo rápido com /fast quando precisam de velocidade, mas ele é redefinido no início de cada nova sessão. A preferência de modo rápido do usuário ainda é salva, portanto remover essa configuração restaura o comportamento padrão persistente.
Lidar com limites de taxa
O modo rápido tem limites de taxa separados do Opus padrão. O modo rápido no Opus 4.8, Opus 4.7 e Opus 4.6 compartilham o mesmo pool de limite de taxa: o uso em qualquer um deles é extraído dos mesmos limites. Quando você atinge o limite de taxa do modo rápido ou fica sem créditos de uso:
- O modo rápido automaticamente volta para velocidade padrão
- O ícone
↯fica cinza para indicar cooldown - Você continua trabalhando com velocidade e preços padrão
- Quando o cooldown expira, o modo rápido é automaticamente reativado
Para desativar o modo rápido manualmente em vez de esperar pelo cooldown, execute /fast novamente.
Research preview
O modo rápido é um recurso de visualização de pesquisa. Isso significa:
- O recurso pode mudar com base no feedback
- A disponibilidade e preços estão sujeitos a alterações
- A configuração de API subjacente pode evoluir
Relate problemas ou feedback através de seus canais de suporte Anthropic usuais.
Veja também
- Configuração de modelo: alterne modelos e ajuste níveis de esforço
- Gerenciar custos efetivamente: rastreie o uso de tokens e reduza custos
- Configuração da linha de status: exiba informações de modelo e contexto