SpyBara
Go Premium

fast-mode.md 2026-06-16 21:57 UTC to 2026-06-17 17:02 UTC

1 added, 1 removed.

2026
Tue 30 07:01 Mon 29 23:02 Sat 27 01:01 Fri 26 23:00 Thu 25 23:58 Wed 24 22:02 Tue 23 22:00 Mon 22 23:59 Fri 19 22:58 Thu 18 22:00 Wed 17 17:02 Tue 16 21:57 Mon 15 23:02 Sat 13 21:59 Fri 12 22:00 Thu 11 23:01 Wed 10 23:57 Tue 9 06:34 Mon 8 06:52 Sat 6 06:24 Fri 5 06:45 Thu 4 06:52 Wed 3 06:53 Tue 2 06:51

Ускорьте ответы с помощью быстрого режима

Получайте более быстрые ответы Opus в Claude Code, включив быстрый режим.

Быстрый режим — это высокоскоростная конфигурация для Claude Opus, которая делает модель в 2,5 раза быстрее при более высокой стоимости за токен. Включайте его с помощью /fast, когда вам нужна скорость для интерактивной работы, такой как быстрая итерация или живая отладка, и отключайте, когда стоимость важнее, чем задержка.

Быстрый режим — это не другая модель. Он использует Claude Opus с другой конфигурацией API, которая приоритизирует скорость над экономичностью. Вы получаете идентичное качество и возможности с более быстрыми ответами. Быстрый режим поддерживается на Opus 4.8, Opus 4.7 и Opus 4.6. Он недоступен на Sonnet, Haiku или других моделях.

Что нужно знать:

  • Используйте /fast для включения быстрого режима в Claude Code CLI. Быстрый режим не поддерживается в расширении VS Code.
  • Цены на быстрый режим составляют $10/$50 MTok на Opus 4.8 и $30/$150 MTok на Opus 4.7 и Opus 4.6.
  • Доступно всем пользователям Claude Code на планах подписки (Pro/Max/Team/Enterprise) и Claude Console.
  • Для пользователей Claude Code на планах подписки (Pro/Max/Team/Enterprise) быстрый режим доступен только через кредиты использования и не включен в лимиты скорости подписки.

На этой странице рассматривается, как включить быстрый режим, его компромисс стоимости, когда его использовать, требования, обязательное согласие за сеанс и поведение лимитов скорости.

Включение быстрого режима

Включайте быстрый режим одним из следующих способов:

По умолчанию быстрый режим сохраняется между сеансами. Администраторы могут настроить быстрый режим на сброс каждого сеанса. Подробности см. в разделе обязательное согласие за сеанс.

Для лучшей экономичности включайте быстрый режим в начале сеанса, а не переключайтесь в середине разговора. Подробности см. в разделе понимание компромисса стоимости.

Когда вы включаете быстрый режим:

  • Если вы используете другую модель, Claude Code автоматически переключается на Opus
  • Вы увидите сообщение подтверждения: "Fast mode ON"
  • Рядом с приглашением появляется небольшой значок во время активного быстрого режима
  • Запустите /fast снова в любое время, чтобы проверить, включен или отключен быстрый режим

Когда вы отключаете быстрый режим с помощью /fast снова, вы остаетесь на Opus. Модель не возвращается к вашей предыдущей модели. Чтобы переключиться на другую модель, используйте /model.

Opus 4.8 является стандартным режимом быстрого режима в Claude Code v2.1.154 и позже. На версиях v2.1.142 по v2.1.153 быстрый режим по умолчанию использует Opus 4.7.

Понимание компромисса стоимости

Быстрый режим имеет более высокую цену за токен, чем стандартный Opus, с множителем, варьирующимся в зависимости от модели:

Модель Входные данные (MTok) Выходные данные (MTok)
Opus 4.8 $10 $50
Opus 4.7 и Opus 4.6 $30 $150

Цены на быстрый режим одинаковы по всему контекстному окну из 1M токенов. Для сравнения со стандартной ставкой Opus см. справочник по ценам Claude.

Первый раз, когда вы включаете быстрый режим в разговоре, вы платите полную цену быстрого режима без кэша за входные токены для всего контекста разговора. Чем глубже вы находитесь в разговоре, тем больше это стоит, поэтому включение быстрого режима с самого начала дешевле. Стоимость применяется один раз за разговор, поэтому отключение и повторное включение быстрого режима позже не повторяет её. Для механизма см. как быстрый режим взаимодействует с кэшем подсказок.

Решение о том, когда использовать быстрый режим

Быстрый режим лучше всего подходит для интерактивной работы, где задержка ответа важнее стоимости:

  • Быстрая итерация изменений кода
  • Сеансы живой отладки
  • Работа, чувствительная ко времени, с жесткими сроками

Стандартный режим лучше для:

  • Долгих автономных задач, где скорость менее важна
  • Пакетной обработки или конвейеров CI/CD
  • Рабочих нагрузок, чувствительных к стоимости

Быстрый режим в сравнении с уровнем усилий

Быстрый режим и уровень усилий оба влияют на скорость ответа, но по-разному:

Параметр Эффект
Быстрый режим Одинаковое качество модели, меньшая задержка, более высокая стоимость
Более низкий уровень усилий Меньше времени на размышление, более быстрые ответы, потенциально более низкое качество на сложных задачах

Вы можете комбинировать оба: используйте быстрый режим с более низким уровнем усилий для максимальной скорости на простых задачах.

Требования

Быстрый режим требует всех следующих условий:

  • Только API Anthropic или подписка: быстрый режим доступен через API Anthropic Console и для планов подписки Claude с использованием дополнительного использования. Он недоступен на Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry или Claude Platform на AWS.
  • Включено дополнительное использование: ваша учетная запись должна иметь включенное дополнительное использование, которое позволяет выставлять счета сверх включенного использования вашего плана. Для индивидуальных учетных записей включите это в параметрах выставления счетов Console. Для Team и Enterprise администратор должен включить дополнительное использование для организации.
  • Включение администратором для Team и Enterprise: быстрый режим отключен по умолчанию для организаций Team и Enterprise. Администратор должен явно включить быстрый режим перед тем, как пользователи смогут получить к нему доступ.

Включение быстрого режима для вашей организации

Администраторы могут включить быстрый режим в:

Другой вариант полного отключения быстрого режима — установить CLAUDE_CODE_DISABLE_FAST_MODE=1. См. Переменные окружения.

Обязательное согласие за сеанс

По умолчанию быстрый режим сохраняется между сеансами: если пользователь включает быстрый режим, он остается включенным в будущих сеансах. Администраторы на планах Team или Enterprise могут предотвратить это, установив fastModePerSessionOptIn на true в управляемых параметрах или параметрах, управляемых сервером. Это приводит к тому, что каждый сеанс начинается с отключенным быстрым режимом, требуя от пользователей явного включения его с помощью /fast.

{
  "fastModePerSessionOptIn": true
}

Это полезно для контроля затрат в организациях, где пользователи запускают несколько одновременных сеансов. Пользователи все еще могут включить быстрый режим с помощью /fast, когда им нужна скорость, но он сбрасывается в начале каждого нового сеанса. Предпочтение пользователя для быстрого режима все еще сохраняется, поэтому удаление этого параметра восстанавливает поведение по умолчанию с сохранением.

Обработка лимитов скорости

Быстрый режим имеет отдельные лимиты скорости от стандартного Opus. Быстрый режим на Opus 4.8, Opus 4.7 и Opus 4.6 использует один и тот же пул лимитов скорости: использование на любой из них берет из одних и тех же лимитов. Когда вы достигаете лимита скорости быстрого режима или исчерпываете кредиты использования:

  1. Быстрый режим автоматически переключается на стандартную скорость
  2. Значок становится серым, указывая на охлаждение
  3. Вы продолжаете работать со стандартной скоростью и ценами
  4. Когда охлаждение истекает, быстрый режим автоматически повторно включается

Чтобы вместо этого отключить быстрый режим вручную, запустите /fast снова.

Исследовательское превью

Быстрый режим — это функция исследовательского превью. Это означает:

  • Функция может измениться на основе отзывов
  • Доступность и цены могут измениться
  • Базовая конфигурация API может развиваться

Сообщайте о проблемах или отзывах через ваши обычные каналы поддержки Anthropic.

См. также