Ускорьте ответы с помощью быстрого режима
Получайте более быстрые ответы Opus в Claude Code, включив быстрый режим.
Быстрый режим находится в исследовательском превью. Функция, цены и доступность могут измениться на основе отзывов.
Быстрый режим — это высокоскоростная конфигурация для Claude Opus, которая делает модель в 2,5 раза быстрее при более высокой стоимости за токен. Включайте его с помощью /fast, когда вам нужна скорость для интерактивной работы, такой как быстрая итерация или живая отладка, и отключайте, когда стоимость важнее, чем задержка.
Быстрый режим — это не другая модель. Он использует Claude Opus с другой конфигурацией API, которая приоритизирует скорость над экономичностью. Вы получаете идентичное качество и возможности с более быстрыми ответами. Быстрый режим поддерживается на Opus 4.8, Opus 4.7 и Opus 4.6. Он недоступен на Sonnet, Haiku или других моделях.
Быстрый режим для Opus 4.6 устарел и будет удален примерно через 30 дней после запуска Opus 4.8. После удаления быстрый режим на Opus 4.6 вернётся к стандартной скорости со стандартными ценами. Перейдите на Opus 4.8 или Opus 4.7, чтобы сохранить ускорение.
Быстрый режим требует Claude Code v2.1.36 или позже. Проверьте вашу версию с помощью claude --version.
Что нужно знать:
- Используйте
/fastдля включения быстрого режима в Claude Code CLI. Быстрый режим не поддерживается в расширении VS Code. - Цены на быстрый режим составляют $10/$50 MTok на Opus 4.8 и $30/$150 MTok на Opus 4.7 и Opus 4.6.
- Доступно всем пользователям Claude Code на планах подписки (Pro/Max/Team/Enterprise) и Claude Console.
- Для пользователей Claude Code на планах подписки (Pro/Max/Team/Enterprise) быстрый режим доступен только через кредиты использования и не включен в лимиты скорости подписки.
На этой странице рассматривается, как включить быстрый режим, его компромисс стоимости, когда его использовать, требования, обязательное согласие за сеанс и поведение лимитов скорости.
Включение быстрого режима
Включайте быстрый режим одним из следующих способов:
- Введите
/fastи нажмите Tab для включения или отключения - Установите
"fastMode": trueв вашем файле пользовательских настроек
По умолчанию быстрый режим сохраняется между сеансами. Администраторы могут настроить быстрый режим на сброс каждого сеанса. Подробности см. в разделе обязательное согласие за сеанс.
Для лучшей экономичности включайте быстрый режим в начале сеанса, а не переключайтесь в середине разговора. Подробности см. в разделе понимание компромисса стоимости.
Когда вы включаете быстрый режим:
- Если вы используете другую модель, Claude Code автоматически переключается на Opus
- Вы увидите сообщение подтверждения: "Fast mode ON"
- Рядом с приглашением появляется небольшой значок
↯во время активного быстрого режима - Запустите
/fastснова в любое время, чтобы проверить, включен или отключен быстрый режим
Когда вы отключаете быстрый режим с помощью /fast снова, вы остаетесь на Opus. Модель не возвращается к вашей предыдущей модели. Чтобы переключиться на другую модель, используйте /model.
Opus 4.8 является стандартным режимом быстрого режима в Claude Code v2.1.154 и позже. На версиях v2.1.142 по v2.1.153 быстрый режим по умолчанию использует Opus 4.7.
Понимание компромисса стоимости
Быстрый режим имеет более высокую цену за токен, чем стандартный Opus, с множителем, варьирующимся в зависимости от модели:
| Модель | Входные данные (MTok) | Выходные данные (MTok) |
|---|---|---|
| Opus 4.8 | $10 | $50 |
| Opus 4.7 и Opus 4.6 | $30 | $150 |
Цены на быстрый режим одинаковы по всему контекстному окну из 1M токенов. Для сравнения со стандартной ставкой Opus см. справочник по ценам Claude.
Первый раз, когда вы включаете быстрый режим в разговоре, вы платите полную цену быстрого режима без кэша за входные токены для всего контекста разговора. Чем глубже вы находитесь в разговоре, тем больше это стоит, поэтому включение быстрого режима с самого начала дешевле. Стоимость применяется один раз за разговор, поэтому отключение и повторное включение быстрого режима позже не повторяет её. Для механизма см. как быстрый режим взаимодействует с кэшем подсказок.
Решение о том, когда использовать быстрый режим
Быстрый режим лучше всего подходит для интерактивной работы, где задержка ответа важнее стоимости:
- Быстрая итерация изменений кода
- Сеансы живой отладки
- Работа, чувствительная ко времени, с жесткими сроками
Стандартный режим лучше для:
- Долгих автономных задач, где скорость менее важна
- Пакетной обработки или конвейеров CI/CD
- Рабочих нагрузок, чувствительных к стоимости
Быстрый режим в сравнении с уровнем усилий
Быстрый режим и уровень усилий оба влияют на скорость ответа, но по-разному:
| Параметр | Эффект |
|---|---|
| Быстрый режим | Одинаковое качество модели, меньшая задержка, более высокая стоимость |
| Более низкий уровень усилий | Меньше времени на размышление, более быстрые ответы, потенциально более низкое качество на сложных задачах |
Вы можете комбинировать оба: используйте быстрый режим с более низким уровнем усилий для максимальной скорости на простых задачах.
Требования
Быстрый режим требует всех следующих условий:
- Только API Anthropic или подписка: быстрый режим доступен через API Anthropic Console и для планов подписки Claude с использованием дополнительного использования. Он недоступен на Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry или Claude Platform на AWS.
- Включено дополнительное использование: ваша учетная запись должна иметь включенное дополнительное использование, которое позволяет выставлять счета сверх включенного использования вашего плана. Для индивидуальных учетных записей включите это в параметрах выставления счетов Console. Для Team и Enterprise администратор должен включить дополнительное использование для организации.
Использование быстрого режима выставляется непосредственно на дополнительное использование, даже если у вас осталось использование в вашем плане. Это означает, что токены быстрого режима не учитываются в отношении включенного использования вашего плана и взимаются по цене быстрого режима с первого токена.
- Включение администратором для Team и Enterprise: быстрый режим отключен по умолчанию для организаций Team и Enterprise. Администратор должен явно включить быстрый режим перед тем, как пользователи смогут получить к нему доступ.
Если ваш администратор не включил быстрый режим для вашей организации, команда /fast покажет "Fast mode has been disabled by your organization." Если список разрешенных моделей вашей организации availableModels исключает модель быстрого режима Opus, /fast отклоняется с сообщением "is not in your organization's allowed models".
Включение быстрого режима для вашей организации
Администраторы могут включить быстрый режим в:
- Console (клиенты API): Параметры Claude Code
- Claude AI (Team и Enterprise): Admin Settings > Claude Code
Другой вариант полного отключения быстрого режима — установить CLAUDE_CODE_DISABLE_FAST_MODE=1. См. Переменные окружения.
Обязательное согласие за сеанс
По умолчанию быстрый режим сохраняется между сеансами: если пользователь включает быстрый режим, он остается включенным в будущих сеансах. Администраторы на планах Team или Enterprise могут предотвратить это, установив fastModePerSessionOptIn на true в управляемых параметрах или параметрах, управляемых сервером. Это приводит к тому, что каждый сеанс начинается с отключенным быстрым режимом, требуя от пользователей явного включения его с помощью /fast.
{
"fastModePerSessionOptIn": true
}
Это полезно для контроля затрат в организациях, где пользователи запускают несколько одновременных сеансов. Пользователи все еще могут включить быстрый режим с помощью /fast, когда им нужна скорость, но он сбрасывается в начале каждого нового сеанса. Предпочтение пользователя для быстрого режима все еще сохраняется, поэтому удаление этого параметра восстанавливает поведение по умолчанию с сохранением.
Обработка лимитов скорости
Быстрый режим имеет отдельные лимиты скорости от стандартного Opus. Быстрый режим на Opus 4.8, Opus 4.7 и Opus 4.6 использует один и тот же пул лимитов скорости: использование на любой из них берет из одних и тех же лимитов. Когда вы достигаете лимита скорости быстрого режима или исчерпываете кредиты использования:
- Быстрый режим автоматически переключается на стандартную скорость
- Значок
↯становится серым, указывая на охлаждение - Вы продолжаете работать со стандартной скоростью и ценами
- Когда охлаждение истекает, быстрый режим автоматически повторно включается
Чтобы вместо этого отключить быстрый режим вручную, запустите /fast снова.
Исследовательское превью
Быстрый режим — это функция исследовательского превью. Это означает:
- Функция может измениться на основе отзывов
- Доступность и цены могут измениться
- Базовая конфигурация API может развиваться
Сообщайте о проблемах или отзывах через ваши обычные каналы поддержки Anthropic.
См. также
- Конфигурация модели: переключение моделей и регулировка уровней усилий
- Эффективное управление затратами: отслеживание использования токенов и снижение затрат
- Конфигурация строки состояния: отображение информации о модели и контексте