Конфигурация модели
Узнайте о конфигурации модели Claude Code, включая псевдонимы моделей, такие как
opusplan
Доступные модели
Для параметра model в Claude Code вы можете настроить либо:
- Псевдоним модели
- Имя модели
- Anthropic API: полное имя модели
- Bedrock: ARN профиля вывода
- Foundry: имя развертывания
- Vertex: имя версии
ANTHROPIC_BASE_URL изменяет, куда отправляются запросы, а не какая модель на них отвечает. Чтобы маршрутизировать Claude через шлюз LLM, см. конфигурация шлюза LLM.
Псевдонимы моделей
Псевдонимы моделей предоставляют удобный способ выбора параметров модели без необходимости запоминать точные номера версий:
| Псевдоним модели | Поведение |
|---|---|
default |
Специальное значение, которое очищает любое переопределение модели и возвращается к рекомендуемой модели для типа вашей учетной записи. Сам по себе не является псевдонимом модели |
best |
Использует Fable 5, где ваша организация имеет к нему доступ, в противном случае последнюю модель Opus |
fable |
Использует Claude Fable 5 для ваших самых сложных и долгоживущих задач |
sonnet |
Использует последнюю модель Sonnet для ежедневных задач кодирования |
opus |
Использует последнюю модель Opus для сложных задач рассуждения |
haiku |
Использует быструю и эффективную модель Haiku для простых задач |
sonnet[1m] |
Использует Sonnet с контекстным окном в 1 миллион токенов для длительных сеансов |
opus[1m] |
Использует Opus с контекстным окном в 1 миллион токенов для длительных сеансов |
opusplan |
Специальный режим, который использует opus во время режима плана, а затем переключается на sonnet для выполнения |
На Anthropic API opus разрешается в Opus 4.8, а sonnet разрешается в Sonnet 4.6. На Claude Platform on AWS opus разрешается в Opus 4.7, а sonnet разрешается в Sonnet 4.6. На Bedrock, Vertex и Foundry opus разрешается в Opus 4.6, а sonnet разрешается в Sonnet 4.5; более новые модели доступны на этих поставщиках путем явного выбора полного имени модели или установки ANTHROPIC_DEFAULT_OPUS_MODEL или ANTHROPIC_DEFAULT_SONNET_MODEL.
Псевдонимы указывают на рекомендуемую версию для вашего поставщика и обновляются со временем. Чтобы закрепить определенную версию, используйте полное имя модели (например, claude-opus-4-8) или установите соответствующую переменную окружения, такую как ANTHROPIC_DEFAULT_OPUS_MODEL.
Opus 4.8 требует Claude Code v2.1.154 или более поздней версии. Запустите claude update для обновления.
Работа с Fable 5
Claude Fable 5 — это наиболее мощная модель в Claude Code, подходящая для задач, которые занимают больше одного сеанса. Она поддерживает длительные автономные сеансы, проводит исследования перед действием и проверяет свою работу чаще, чем меньшие модели.
Fable 5 не является моделью по умолчанию. Выберите её с помощью /model fable. Запросы, которые её классификаторы безопасности помечают, чаще всего в областях кибербезопасности и биологии, запускают автоматический откат модели.
Чтобы получить максимум от Fable 5:
- Описывайте результат, а не шаги: передайте ей результат, который вы хотите, и позвольте ей спланировать путь. Чтобы она продолжала работать до тех пор, пока этот результат не будет достигнут, установите цель.
- Передавайте ей неоднозначные проблемы: исследования первопричин, отладка сбоев и решения по архитектуре — это то, где дополнительное исследование и проверка окупаются.
- Пропускайте напоминания о проверке: она проверяет свою собственную работу с меньшим количеством подсказок, поэтому напоминания о тестировании или проверке обычно не требуются.
- Масштабируйте более крупные задачи: дайте ей работу, которую вы обычно разбиваете на части. Она выдерживает длительные сеансы без потери нити.
Fable 5 требует Claude Code v2.1.170 или более поздней версии. Более старые версии не показывают Fable 5 в средстве выбора модели и не могут её выбрать. Запустите claude update для обновления. Fable 5 недоступна при нулевом сохранении данных, где средство выбора /model либо её опускает, либо показывает её отключённой.
Установка вашей модели
Вы можете настроить вашу модель несколькими способами, перечисленными в порядке приоритета:
- Во время сеанса - Используйте
/model <alias|name>для переключения немедленно, или запустите/modelбез аргумента для открытия средства выбора. Средство выбора запрашивает подтверждение, когда в разговоре есть предыдущий вывод, так как следующий ответ перечитывает полную историю без кэшированного контекста - При запуске - Запустите с
claude --model <alias|name> - Переменная окружения - Установите
ANTHROPIC_MODEL=<alias|name> - Параметры - Настройте постоянно в файле параметров, используя поле
model.
Начиная с версии v2.1.153, /model сохраняет ваш выбор в качестве значения по умолчанию для новых сеансов путем записи поля model в ваши пользовательские параметры. В средстве выбора:
Enter: переключить модель и сохранить в качестве значения по умолчаниюs: переключить модель только для этого сеанса
Ввод /model <name> напрямую ведет себя как Enter. Параметры проекта и управляемые параметры по-прежнему имеют приоритет и переприменяются при следующем запуске.
В версиях v2.1.144 по v2.1.152 /model применялся только к текущему сеансу, а d в средстве выбора сохранял значение по умолчанию.
Флаг --model и переменная окружения ANTHROPIC_MODEL применяются только к сеансу, с которым вы их запускаете. Чтобы запустить разные модели в разных терминалах одновременно, запустите каждый с собственным флагом --model вместо переключения с помощью /model.
Возобновленные сеансы, запущенные с claude --resume, --continue или средством выбора /resume, сохраняют модель, которую они использовали при сохранении стенограммы, независимо от текущего параметра model. Если эта модель была снята с производства, сеанс переходит к обычному порядку приоритета. Это предотвращает изменение модели при возобновлении выбором /model другого сеанса.
Когда активная модель при запуске поступает из параметров проекта или управляемых параметров, а не из вашего собственного выбора, заголовок при запуске показывает, какой файл параметров установил его. Запустите /model для переопределения; параметр проекта или управляемый параметр переприменяется при следующем запуске.
Пример использования:
# Запустить с Opus
claude --model opus
# Переключиться на Sonnet во время сеанса
/model sonnet
Пример файла параметров:
{
"permissions": {
...
},
"model": "opus"
}
Ограничение выбора модели
Администраторы предприятия могут использовать availableModels в управляемых или политических параметрах для ограничения того, какие модели могут выбирать пользователи.
Когда установлен availableModels, список разрешений применяется к каждой поверхности, где пользователь может назвать модель:
- Модель основного сеанса:
/model, флаг--modelи переменная окруженияANTHROPIC_MODEL - Разрешение псевдонимов: {/* min-version: 2.1.176 */}переменные окружения
ANTHROPIC_DEFAULT_OPUS_MODEL,ANTHROPIC_DEFAULT_SONNET_MODEL,ANTHROPIC_DEFAULT_HAIKU_MODELиANTHROPIC_DEFAULT_FABLE_MODELне могут перенаправить разрешённый псевдоним на модель вне списка - Быстрый режим: {/* min-version: 2.1.176 */}
/fastотказывает переключаться, когда это неявно переключилось бы на модель Opus вне списка, с сообщением "is not in your organization's allowed models" - Модели подагентов: поле
modelв подагенте frontmatter, параметрmodelинструмента Agent, средство выбора модели в/agentsиCLAUDE_CODE_SUBAGENT_MODEL - Модель советника: настроенный параметр
advisorModel - Цепочки резервных моделей: элементы цепочки резервной модели вне списка удаляются
Переключение на заблокированную модель с помощью /model отклоняется с ошибкой, в то время как заблокированный флаг --model или значение ANTHROPIC_MODEL заменяются при запуске с предупреждением, в котором указаны как запрошенная, так и подставленная модели, и сеанс начинается с моделью по умолчанию. Заблокированное переопределение подагента или советника возвращается к унаследованной или модели по умолчанию, а не к отказу в запросе.
{
"availableModels": ["sonnet", "haiku"]
}
Поведение модели по умолчанию
По умолчанию опция Default в средстве выбора модели не затрагивается availableModels. Она остается доступной и представляет системное значение по умолчанию во время выполнения на основе уровня подписки пользователя.
Чтобы расширить список разрешений на опцию Default, установите enforceAvailableModels в значение true в управляемых или политических параметрах вместе с непустым списком availableModels. Когда значение по умолчанию для уровня не находится в списке разрешений, Default разрешается на первую разрешённую запись вместо значения по умолчанию для уровня. Это требует Claude Code v2.1.175 или более поздней версии.
Пустой массив availableModels никогда не включает принудительное применение. Даже с availableModels: [] пользователи все ещё могут использовать Claude Code с моделью Default для своего уровня независимо от enforceAvailableModels.
Управление моделью, на которой работают пользователи
Параметр model является начальным выбором, а не принудительным. Он устанавливает, какая модель активна при запуске сеанса, но пользователи все ещё могут открыть /model и выбрать Default, который разрешается в системное значение по умолчанию для их уровня независимо от того, что установлено в model.
Для полного управления опытом работы с моделью объедините эти параметры:
availableModels: ограничивает, на какие именованные модели пользователи могут переключатьсяenforceAvailableModels: расширяет список разрешенийavailableModelsна опцию Default, поэтому Default не может разрешиться на модель вне спискаmodel: устанавливает начальный выбор модели при запуске сеансаANTHROPIC_DEFAULT_SONNET_MODEL/ANTHROPIC_DEFAULT_OPUS_MODEL/ANTHROPIC_DEFAULT_HAIKU_MODEL/ANTHROPIC_DEFAULT_FABLE_MODEL: управляют тем, на что разрешаются опция Default и псевдонимыsonnet,opus,haikuиfable
Этот пример запускает пользователей на Sonnet 4.5, ограничивает средство выбора Sonnet и Haiku, и гарантирует, что Default разрешается на модель из списка разрешений, а не на значение по умолчанию для уровня:
{
"model": "claude-sonnet-4-5",
"availableModels": ["claude-sonnet-4-5", "haiku"],
"enforceAvailableModels": true,
"env": {
"ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
}
}
Без enforceAvailableModels или блока env пользователь, который выбирает Default в средстве выбора, получит последний выпуск для своего уровня, обходя закрепление версии в model и availableModels. Два параметра охватывают разные области: enforceAvailableModels заставляет Default соблюдать список разрешений, в то время как блок env закрепляет, на какую версию разрешается разрешённый псевдоним, такой как sonnet. Используйте enforceAvailableModels отдельно, когда ограничения семейств моделей достаточно; добавьте блок env, когда вам также нужно закрепить конкретную версию.
Поведение слияния
Когда availableModels установлен в параметрах пользователя, проекта и локальных параметрах, массивы объединяются и дедублицируются на этих уровнях.
Когда availableModels установлен в управляемых или политических параметрах, управляемое или политическое значение полностью заменяет объединённый результат: записи, добавленные в параметры пользователя или проекта, не могут расширить его. Управляемые и политические параметры заменяют значения с более низким приоритетом для enforceAvailableModels таким же образом. Начиная с Claude Code v2.1.175, это единственный способ обеспечить строгий список разрешений; более ранние версии объединяют управляемый список с записями с более низким приоритетом.
Идентификаторы моделей Mantle
Когда включена конечная точка Bedrock Mantle, записи в availableModels, начинающиеся с anthropic., добавляются в средство выбора /model как пользовательские опции и маршрутизируются на конечную точку Mantle. Параметр всё ещё ограничивает средство выбора перечисленными записями, поэтому включите стандартные псевдонимы вместе с любыми идентификаторами Mantle.
Специальное поведение модели
Параметр модели `default`
Поведение default зависит от типа вашей учетной записи:
- Max, Team Premium, Enterprise с оплатой по мере использования и Anthropic API: по умолчанию Opus 4.8
- Claude Platform на AWS: по умолчанию Opus 4.7
- Pro, Team Standard и места Enterprise подписки: по умолчанию Sonnet 4.6
- Bedrock, Vertex и Foundry: по умолчанию Sonnet 4.5
Enterprise с оплатой по мере использования означает организацию Enterprise, выставляемую счет по использованию, а не по месту подписки.
Fable 5 не является моделью по умолчанию ни для одного типа учетной записи. Сеансы используют Fable 5 только после того, как вы выберете его с помощью /model fable, параметра model или псевдонима best, где доступна Fable 5. Выбор его с помощью /model сохраняет его как выбранную модель в параметрах пользователя, поэтому более поздние сеансы начинаются с Fable 5, пока вы не измените модели.
Параметр модели `opusplan`
Псевдоним модели opusplan предоставляет автоматизированный гибридный подход:
- В режиме плана - Использует
opusдля сложного рассуждения и решений архитектуры - В режиме выполнения - Автоматически переключается на
sonnetдля генерации кода и реализации
Это дает вам лучшее из обоих миров: превосходное рассуждение Opus для планирования и эффективность Sonnet для выполнения.
Фаза Opus в режиме плана использует то же контекстное окно, что и параметр модели opus. На уровнях подписки, где Opus автоматически обновляется до контекста 1M, opusplan получает обновление и в режиме плана. Чтобы принудительно установить контекст 1M для обеих фаз, когда вы не находитесь на уровне с автоматическим обновлением, установите модель на opusplan[1m].
Когда availableModels исключает Opus, opusplan остается на Sonnet в режиме плана вместо переключения. Аналогично, сеанс Haiku, который обычно обновляется до Sonnet в режиме плана, остается на Haiku, когда Sonnet исключен.
Для гибридного подхода, при котором Claude решает в середине задачи, когда обратиться ко второй модели, а не переключаться на границе плана, см. инструмент advisor.
Цепочки резервных моделей
Когда основная модель перегружена, недоступна или возвращает другую неповторяемую ошибку сервера, Claude Code может переключиться на резервную модель вместо отказа в запросе. Ошибки аутентификации, выставления счетов, ограничения скорости, размера запроса и транспорта никогда не вызывают переключение; они следуют своей обычной обработке повторных попыток и ошибок.
Настройте одну или несколько резервных моделей, и Claude Code попробует их по порядку, показывая уведомление при переключении. Переключение длится только для текущего хода, поэтому ваше следующее сообщение сначала попробует основную модель снова. Цепочки ограничены тремя моделями после удаления дубликатов, и дополнительные записи игнорируются.
Установите цепочку для одного сеанса с флагом --fallback-model, который принимает список, разделенный запятыми:
claude --fallback-model sonnet,haiku
Чтобы сохранить цепочку между сеансами, установите fallbackModel в параметрах как массив:
{
"fallbackModel": ["claude-sonnet-4-6", "claude-haiku-4-5"]
}
Флаг --fallback-model имеет приоритет над параметром fallbackModel. Каждый элемент принимает имя модели или псевдоним, и "default" расширяется до модели по умолчанию.
Два случая вызывают пропуск элемента:
- Недоступная модель: модель, которая не может быть достигнута, такая как снятая с производства модель, закрепленная в параметрах, пропускается, и Claude Code продолжает со следующего элемента.
- Вне списка разрешений: элемент, не разрешенный
availableModels, удаляется при чтении цепочки и никогда не пробуется.
Автоматический резервный вариант модели
Этот раздел охватывает резервный вариант на основе содержимого из Fable 5. Для резервного варианта на основе доступности, когда модель перегружена или недоступна, см. Цепочки резервных моделей.
Fable 5 работает с классификаторами безопасности для содержимого кибербезопасности и биологии. Когда классификатор помечает запрос, Claude Code повторно запускает этот запрос на модели Opus по умолчанию и показывает уведомление в стенограмме: Opus 4.8 на Anthropic API и развертываниях LLM gateway, или Opus 4.7 на Claude Platform на AWS.
Сеанс затем продолжается на этой модели Opus. Чтобы вернуться к Fable 5, запустите /model fable.
Проверка того, что вызвало резервный вариант
Резервный вариант может быть вызван на первом запросе сеанса, прежде чем вы отправите что-либо необычное, потому что первый запрос содержит контекст рабочей области, такой как содержимое вашего CLAUDE.md и статус git. Репозиторий, содержащий материал по безопасности или биологии, может активировать классификатор только на этом контексте.
Чтобы проверить, являются ли настройки триггером, запустите сеанс с claude --safe-mode, который отключает настройки, такие как CLAUDE.md, skills, MCP серверы и hooks. Статус Git и имена каталогов не являются настройками и по-прежнему включены.
Спросить перед переключением
Чтобы решить, что происходит каждый раз, когда запрос помечается, вместо автоматического переключения, запустите /config и отключите "switch models when a message is flagged". Помеченный запрос затем приостанавливает сеанс с двумя вариантами: переключиться на модель Opus или отредактировать подсказку и повторить попытку на Fable 5.
Некоторые случаи ведут себя иначе:
- Если обе модели помечают один и тот же запрос, вы можете отредактировать подсказку и повторить попытку, или начать новый сеанс.
- На мобильных сеансах Claude Code в веб-браузере редактирование и повторная попытка не поддерживаются. Переключите модели или продолжите сеанс из браузера рабочего стола или приложения рабочего стола.
- В неинтерактивном режиме и интеграциях SDK, которые не могут показать подсказку, помеченный запрос завершает ход с отказом вместо этого.
Включение резервного варианта на Bedrock, Vertex AI и Foundry
На Amazon Bedrock, Google Vertex AI и Microsoft Foundry идентификаторы моделей зависят от поставщика, поэтому автоматический резервный вариант работает только, когда Claude Code может идентифицировать обе задействованные модели:
- Claude Code должен распознавать текущую модель как Fable 5: идентификатор модели содержит
claude-fable-5, соответствует значениюANTHROPIC_DEFAULT_FABLE_MODELили сопоставляется сmodelOverrides. - Цель резервного варианта должна разрешаться в модель Opus: значение
ANTHROPIC_DEFAULT_OPUS_MODEL, если установлено, в противном случае запись Opus 4.8 в списке моделей поставщика.
Если одна из моделей не может быть идентифицирована, Claude Code не переключается автоматически. Помеченный запрос завершается с сообщением об отказе, и вы можете переключить модели с помощью /model и повторить попытку. Чтобы включить автоматический резервный вариант на этих поставщиках, установите ANTHROPIC_DEFAULT_FABLE_MODEL на идентификатор вашей модели Fable 5 и ANTHROPIC_DEFAULT_OPUS_MODEL на идентификатор вашей модели Opus 4.8.
Рабочие нагрузки исследования безопасности и биологии
Рабочие нагрузки в наступательной безопасности или биологии, включая тестирование на проникновение, упражнения Capture the Flag (CTF) и кодовые базы, смежные с биологией, часто вызывают резервный вариант, часто на первом запросе. Для существенной работы в области биологии ожидайте, что почти все запросы будут перенаправлены.
Это ожидаемая маршрутизация для этих областей, а не флаг учетной записи. Если вашей организации требуется возможность класса Fable для этой работы, обратитесь к команде учетной записи Anthropic о программах доверенного доступа.
Регулировка уровня усилий
Уровни усилий управляют адаптивным рассуждением, которое позволяет модели решать, думать ли и сколько думать на каждом шаге на основе сложности задачи. Более низкие усилия работают быстрее и дешевле для простых задач, а более высокие усилия обеспечивают более глубокое рассуждение для сложных проблем.
Доступные уровни усилий зависят от модели. Модели, не указанные здесь, не поддерживают усилия:
| Модель | Уровни |
|---|---|
| Fable 5 | low, medium, high, xhigh, max |
| Opus 4.8 и Opus 4.7 | low, medium, high, xhigh, max |
| Opus 4.6 и Sonnet 4.6 | low, medium, high, max |
Если вы установите уровень, который активная модель не поддерживает, Claude Code вернется к наивысшему поддерживаемому уровню на или ниже установленного вами. Например, xhigh работает как high на Opus 4.6.
Усилие по умолчанию составляет high на Fable 5, Opus 4.8, Opus 4.6 и Sonnet 4.6, и xhigh на Opus 4.7.
Когда вы впервые запускаете Fable 5, Opus 4.8 или Opus 4.7, Claude Code применяет усилие по умолчанию этой модели, даже если вы ранее установили другой уровень для другой модели: high на Fable 5 и Opus 4.8, и xhigh на Opus 4.7. Запустите /effort снова, чтобы выбрать другой уровень после переключения.
low, medium, high и xhigh сохраняются между сеансами. max обеспечивает самое глубокое рассуждение без ограничений на расходование токенов и применяется только к текущему сеансу, кроме случаев, когда установлено через переменную окружения CLAUDE_CODE_EFFORT_LEVEL.
Меню /effort также предлагает ultracode. Ultracode — это параметр Claude Code, а не уровень усилий модели: он отправляет xhigh модели и дополнительно позволяет Claude организовать динамические рабочие процессы для существенных задач. Применяется только к текущему сеансу. Установите его через /effort или передайте "ultracode": true через --settings или запрос управления Agent SDK. Это не часть параметра effortLevel, флага --effort или CLAUDE_CODE_EFFORT_LEVEL.
Выбор уровня усилий
Каждый уровень обменивает расходование токенов на возможность. Значение по умолчанию подходит для большинства задач кодирования; регулируйте, когда вы хотите другой баланс.
| Уровень | Когда его использовать |
|---|---|
low |
Зарезервируйте для коротких, ограниченных, чувствительных к задержкам задач, которые не требуют высокого интеллекта |
medium |
Снижает использование токенов для работы, чувствительной к затратам, которая может пожертвовать некоторым интеллектом |
high |
Балансирует использование токенов и интеллект. По умолчанию на Fable 5, Opus 4.8, Opus 4.6 и Sonnet 4.6 |
xhigh |
Более глубокое рассуждение при более высоком расходовании токенов. По умолчанию на Opus 4.7 |
max |
Может улучшить производительность на сложных задачах, но может показать убывающую отдачу и склонен к переосмыслению. Протестируйте перед широким внедрением |
ultracode |
Параметр Claude Code, который планирует динамический рабочий процесс для каждой существенной задачи с рассуждением xhigh для каждого сообщения. Только для сеанса |
Шкала усилий откалибрована для каждой модели, поэтому одно и то же имя уровня не представляет одно и то же базовое значение в разных моделях.
Используйте ultrathink для одноразового глубокого рассуждения
Включите ultrathink в любом месте вашей подсказки, чтобы запросить более глубокое рассуждение на этом ходу без изменения параметра усилий сеанса. Claude Code распознает ключевое слово и добавляет встроенную инструкцию. Уровень усилий, отправляемый в API, остается неизменным. Другие фразы, такие как "think", "think hard" и "think more", передаются как обычный текст подсказки и не распознаются как ключевые слова.
Установка уровня усилий
Вы можете изменить усилие любым из следующих способов:
/effort: запустите/effortбез аргументов для открытия интерактивного ползунка,/effortс последующим именем уровня для установки его напрямую, или/effort autoдля сброса на значение по умолчанию модели- В
/model: используйте клавиши со стрелками влево/вправо для регулировки ползунка усилий при выборе модели - Флаг
--effort: передайте имя уровня для установки его на один сеанс при запуске Claude Code - Переменная окружения: установите
CLAUDE_CODE_EFFORT_LEVELна имя уровня илиauto - Параметры: установите
effortLevelвlow,medium,highилиxhighв файле параметров.maxиultracodeявляются только для сеанса и не принимаются здесь - Frontmatter skill и subagent: установите
effortв файле markdown skill или subagent для переопределения уровня усилий при запуске этого skill или subagent
Переменная окружения имеет приоритет над всеми другими методами, затем ваш настроенный уровень, затем значение по умолчанию модели. Frontmatter усилие применяется, когда этот skill или subagent активен, переопределяя уровень сеанса, но не переменную окружения.
Ползунок усилий появляется в /model при выборе поддерживаемой модели. Текущий уровень усилий также отображается рядом с логотипом и спиннером, например "with low effort", поэтому вы можете подтвердить, какой параметр активен, без открытия /model.
Адаптивное рассуждение и фиксированные бюджеты мышления
Адаптивное рассуждение делает мышление необязательным на каждом шаге, поэтому Claude может быстрее реагировать на рутинные подсказки и зарезервировать более глубокое мышление для шагов, которые от него выигрывают. Если вы хотите, чтобы Claude думал чаще или реже, чем производит текущий уровень, вы можете сказать об этом прямо в вашей подсказке или в CLAUDE.md; модель реагирует на это руководство в рамках своего параметра усилий.
Opus 4.7 и более поздние версии всегда используют адаптивное рассуждение, как и Fable 5. Режим фиксированного бюджета мышления и CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING не применяются к ним.
На Opus 4.6 и Sonnet 4.6 вы можете установить CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 для возврата к предыдущему фиксированному бюджету мышления, контролируемому MAX_THINKING_TOKENS. См. переменные окружения.
Расширенное мышление
Расширенное мышление — это рассуждение, которое Claude выдает перед ответом. На моделях, поддерживающих адаптивное рассуждение, уровень усилий является основным управлением тем, сколько мышления происходит; параметры ниже включают или отключают мышление и управляют его отображением.
| Управление | Как его установить |
|---|---|
| Переключение для текущего сеанса | Нажмите Option+T на macOS или Alt+T на Windows и Linux |
| Установка глобального значения по умолчанию | Запустите /config и переключите режим мышления. Сохраняется как alwaysThinkingEnabled в ~/.claude/settings.json |
| Отключение независимо от усилий | Установите MAX_THINKING_TOKENS=0, что отключает мышление на Anthropic API, кроме Fable 5. На поставщиках третьих сторон это опускает параметр thinking вместо этого, и модели адаптивного рассуждения могут все еще думать. Другие значения применяются только с фиксированным бюджетом мышления |
Мышление не может быть отключено на Fable 5. Переключение сеанса, alwaysThinkingEnabled и MAX_THINKING_TOKENS=0 не имеют там никакого эффекта, и Fable 5 решает на каждом шаге, сколько думать на основе уровня усилий.
Вывод мышления свернут по умолчанию. Нажмите Ctrl+O для переключения режима подробности и просмотра рассуждения как серого курсивного текста. Интерактивные сеансы на Anthropic API получают отредактированные блоки мышления по умолчанию, поэтому установите showThinkingSummaries: true в параметрах, если вы хотите, чтобы полные резюме были доступны при развертывании. Вам выставляется счет за все сгенерированные токены мышления, даже если они свернуты или отредактированы.
Расширенный контекст
Fable 5, Opus 4.6 и более поздние версии, а также Sonnet 4.6, поддерживают контекстное окно в 1 миллион токенов для длительных сеансов с большими кодовыми базами.
Доступность варьируется в зависимости от модели и плана. На планах Max, Team и Enterprise Opus автоматически обновляется до контекста 1M без дополнительной конфигурации. Это применяется как к местам Team Standard, так и к Team Premium. На Anthropic API Fable 5, Opus 4.8 и Opus 4.7 всегда работают с окном 1M. Sonnet с контекстом 1M не входит в автоматическое обновление и требует дополнительного использования на каждом плане подписки, включая Max.
| План | Opus с контекстом 1M | Sonnet с контекстом 1M |
|---|---|---|
| Max, Team и Enterprise | Включено в подписку | Требует дополнительного использования |
| Pro | Требует дополнительного использования | Требует дополнительного использования |
| API и оплата по мере использования | Полный доступ | Полный доступ |
Чтобы полностью отключить контекст 1M, установите CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Это удаляет варианты моделей 1M из средства выбора модели. См. переменные окружения.
Контекстное окно 1M использует стандартное ценообразование модели без премии за токены сверх 200K. Для планов, где расширенный контекст включен в вашу подписку, использование остается покрытым вашей подпиской. Для планов, которые получают доступ к расширенному контексту через дополнительное использование, токены выставляются в счет дополнительного использования.
Если ваша учетная запись поддерживает контекст 1M, опция появляется в средстве выбора модели (/model) в последних версиях Claude Code. Если вы его не видите, попробуйте перезагрузить сеанс.
Вы также можете использовать суффикс [1m] с псевдонимами моделей или полными именами моделей:
# Используйте псевдоним opus[1m] или sonnet[1m]
/model opus[1m]
/model sonnet[1m]
# Или добавьте [1m] к полному имени модели
/model claude-opus-4-8[1m]
Проверка вашей текущей модели
Вы можете увидеть, какую модель вы используете в настоящее время, несколькими способами:
- В строке состояния (если настроено)
- В
/status, который также отображает информацию вашей учетной записи.
Добавление пользовательского варианта модели
Используйте ANTHROPIC_CUSTOM_MODEL_OPTION для добавления одной пользовательской записи в средство выбора /model без замены встроенных псевдонимов. Это полезно для тестирования идентификаторов моделей, которые Claude Code не указывает по умолчанию. Для развертываний шлюза LLM Claude Code может заполнять средство выбора из конечной точки /v1/models шлюза, когда установлено значение CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1, поэтому эта переменная требуется только в том случае, если обнаружение отключено или не возвращает нужную вам модель. См. Выбор модели шлюза LLM.
Этот пример устанавливает все три переменные, чтобы сделать развертывание Opus с маршрутизацией через шлюз выбираемым:
export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"
Пользовательская запись появляется в нижней части средства выбора /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME и ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION являются необязательными. Если они опущены, идентификатор модели используется как имя, а описание по умолчанию — Custom model (<model-id>).
Claude Code пропускает валидацию для идентификатора модели, установленного в ANTHROPIC_CUSTOM_MODEL_OPTION, поэтому вы можете использовать любую строку, которую принимает ваша конечная точка API.
Переменные окружения
Вы можете использовать следующие переменные окружения, которые должны быть полными именами моделей (или эквивалентом для вашего поставщика API), для управления именами моделей, на которые отображаются псевдонимы.
| Переменная окружения | Описание |
|---|---|
ANTHROPIC_DEFAULT_FABLE_MODEL |
Модель для использования для fable, и идентификатор модели, который Claude Code распознает как Fable 5 для автоматического переключения модели у поставщиков третьих сторон |
ANTHROPIC_DEFAULT_OPUS_MODEL |
Модель для использования для opus, или для opusplan при активном Plan Mode. |
ANTHROPIC_DEFAULT_SONNET_MODEL |
Модель для использования для sonnet, или для opusplan при неактивном Plan Mode. |
ANTHROPIC_DEFAULT_HAIKU_MODEL |
Модель для использования для haiku, или фоновой функциональности |
CLAUDE_CODE_SUBAGENT_MODEL |
Модель для использования для всех subagents и agent teams. Переопределяет как параметр model для каждого вызова, так и frontmatter model определения subagent. Установите на inherit для использования обычного разрешения модели вместо этого |
Примечание: ANTHROPIC_SMALL_FAST_MODEL устарел в пользу ANTHROPIC_DEFAULT_HAIKU_MODEL.
Закрепление моделей для развертываний третьих сторон
При развертывании Claude Code через Bedrock, Vertex AI, Foundry или Claude Platform on AWS закрепите версии моделей перед развертыванием для пользователей.
Без закрепления Claude Code использует псевдонимы моделей, такие как fable, opus, sonnet и haiku, которые разрешаются в встроенный идентификатор модели по умолчанию для каждого поставщика. Это значение по умолчанию может отставать от последнего выпуска Anthropic, и модель, на которую оно указывает, может быть еще не включена в учетную запись пользователя. Когда значение по умолчанию недоступно, пользователи Bedrock и Vertex AI видят уведомление и возвращаются к предыдущей версии для этого сеанса, в то время как пользователи Foundry видят ошибки, потому что Foundry не имеет эквивалентной проверки при запуске.
Установите переменные окружения модели на конкретные идентификаторы версий как часть вашей начальной настройки. Закрепление позволяет вам контролировать, когда ваши пользователи переходят на новую модель.
Используйте следующие переменные окружения с идентификаторами моделей, специфичными для версии, для вашего поставщика:
| Поставщик | Пример |
|---|---|
| Bedrock | export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-8' |
| Vertex AI | export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8' |
| Foundry | export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8' |
Применяйте тот же шаблон для ANTHROPIC_DEFAULT_FABLE_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL и ANTHROPIC_DEFAULT_HAIKU_MODEL. Для текущих и устаревших идентификаторов моделей во всех поставщиках см. Обзор моделей. Чтобы обновить пользователей до новой версии модели, обновите эти переменные окружения и переразверните.
Чтобы включить расширенный контекст для закрепленной модели, добавьте [1m] к идентификатору модели в ANTHROPIC_DEFAULT_OPUS_MODEL или ANTHROPIC_DEFAULT_SONNET_MODEL:
export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8[1m]'
Суффикс [1m] применяет контекстное окно 1M ко всему использованию псевдонимов opus и sonnet, включая фазу Opus в режиме плана opusplan.
- Claude Code удаляет суффикс перед отправкой идентификатора модели вашему поставщику.
- Добавляйте
[1m]только когда базовая модель поддерживает контекст 1M. - Суффикс читается для каждой переменной, а не для каждой модели. На Bedrock, Vertex и Foundry идентификатор модели без
[1m]в одной переменной использует контекст 200K, даже если другая переменная устанавливает ту же модель с суффиксом.
Список разрешений settings.availableModels все еще применяется при использовании поставщиков третьих сторон. Фильтрация соответствует псевдониму модели, такому как opus, префиксу версии, такому как claude-opus-4-8, или полному идентификатору модели. Любой суффикс [1m] удаляется как из записи списка разрешений, так и из запрашиваемой модели перед сопоставлением, поэтому запись claude-opus-4-8 разрешает как стандартные, так и строки Opus с контекстом 1M. Префиксы, специфичные для поставщика, такие как us.anthropic., не удаляются: укажите ту же форму в availableModels, которую показывает средство выбора, или отобразите ее через modelOverrides.
Настройка отображения и возможностей закрепленной модели
Когда вы закрепляете модель у поставщика третьей стороны, идентификатор, специфичный для поставщика, отображается как есть в средстве выбора /model, и Claude Code может не распознать, какие функции поддерживает модель. Вы можете переопределить отображаемое имя и объявить возможности с помощью вспомогательных переменных окружения для каждой закрепленной модели.
Эти переменные вступают в силу у поставщиков третьих сторон, таких как Bedrock, Vertex AI и Foundry. Переменные _NAME и _DESCRIPTION также вступают в силу, когда ANTHROPIC_BASE_URL указывает на LLM gateway. Они не имеют эффекта при прямом подключении к api.anthropic.com.
| Переменная окружения | Описание |
|---|---|
ANTHROPIC_DEFAULT_OPUS_MODEL_NAME |
Отображаемое имя для закрепленной модели Opus в средстве выбора /model. По умолчанию используется идентификатор модели, если не установлено |
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION |
Отображаемое описание для закрепленной модели Opus в средстве выбора /model. По умолчанию используется Custom Opus model, если не установлено |
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES |
Разделенный запятыми список возможностей, которые поддерживает закрепленная модель Opus |
Те же суффиксы _NAME, _DESCRIPTION и _SUPPORTED_CAPABILITIES доступны для ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL, ANTHROPIC_DEFAULT_FABLE_MODEL и ANTHROPIC_CUSTOM_MODEL_OPTION.
Claude Code включает функции, такие как уровни усилий и расширенное мышление, путем сопоставления идентификатора модели с известными шаблонами. Идентификаторы, специфичные для поставщика, такие как ARN Bedrock или пользовательские имена развертывания, часто не соответствуют этим шаблонам, оставляя поддерживаемые функции отключенными. Установите _SUPPORTED_CAPABILITIES, чтобы сообщить Claude Code, какие функции фактически поддерживает модель:
| Значение возможности | Включает |
|---|---|
effort |
Уровни усилий и команду /effort |
xhigh_effort |
{/* min-version: 2.1.111 */}Уровень усилий xhigh |
max_effort |
Уровень усилий max |
thinking |
Расширенное мышление |
adaptive_thinking |
Адаптивное рассуждение, которое динамически распределяет мышление на основе сложности задачи |
interleaved_thinking |
Мышление между вызовами инструментов |
Когда установлена _SUPPORTED_CAPABILITIES, перечисленные возможности включены, а неперечисленные возможности отключены для соответствующей закрепленной модели. Когда переменная не установлена, Claude Code возвращается к встроенному обнаружению на основе идентификатора модели.
Этот пример закрепляет Opus на пользовательский ARN модели Bedrock, устанавливает понятное имя и объявляет его возможности:
export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'
Переопределение идентификаторов моделей для каждой версии
Переменные окружения уровня семейства выше настраивают один идентификатор модели для каждого псевдонима семейства. Если вам нужно отобразить несколько версий в одном семействе на различные идентификаторы поставщика, используйте вместо этого параметр modelOverrides.
modelOverrides отображает отдельные идентификаторы моделей Anthropic на строки, специфичные для поставщика, которые Claude Code отправляет API вашего поставщика. Когда пользователь выбирает отображаемую модель в средстве выбора /model, Claude Code использует ваше настроенное значение вместо встроенного значения по умолчанию.
Это позволяет администраторам предприятия маршрутизировать каждую версию модели на конкретный ARN профиля вывода Bedrock, имя версии Vertex AI или имя развертывания Foundry для управления, распределения затрат или региональной маршрутизации.
Установите modelOverrides в файле параметров:
{
"modelOverrides": {
"claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
"claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
"claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
}
}
Ключи должны быть идентификаторами моделей Anthropic, как указано в Обзоре моделей. Для датированных идентификаторов моделей включите суффикс даты точно так, как он там отображается. Неизвестные ключи игнорируются.
Переопределения заменяют встроенные идентификаторы моделей, которые поддерживают каждую запись в средстве выбора /model. На Bedrock переопределения имеют приоритет над любыми профилями вывода, которые Claude Code автоматически обнаруживает при запуске. Значения, которые вы предоставляете непосредственно через ANTHROPIC_MODEL, --model или переменные окружения ANTHROPIC_DEFAULT_*_MODEL, передаются поставщику как есть и не преобразуются modelOverrides.
modelOverrides работает вместе с availableModels. Список разрешений оценивается по идентификатору модели Anthropic, а не по значению переопределения, поэтому запись, такая как "opus" в availableModels, продолжает совпадать, даже когда версии Opus отображаются на ARN.
Конфигурация кэширования подсказок
Claude Code автоматически использует кэширование подсказок для оптимизации производительности и снижения затрат. Вы можете отключить кэширование подсказок глобально или для конкретных уровней моделей:
| Переменная окружения | Описание |
|---|---|
DISABLE_PROMPT_CACHING |
Установите на 1 для отключения кэширования подсказок для всех моделей. Имеет приоритет над параметрами для каждой модели |
DISABLE_PROMPT_CACHING_HAIKU |
Установите на 1 для отключения кэширования подсказок только для моделей Haiku |
DISABLE_PROMPT_CACHING_SONNET |
Установите на 1 для отключения кэширования подсказок только для моделей Sonnet |
DISABLE_PROMPT_CACHING_OPUS |
Установите на 1 для отключения кэширования подсказок только для моделей Opus |
DISABLE_PROMPT_CACHING_FABLE |
Установите на 1 для отключения кэширования подсказок только для моделей Fable |
Чтобы изменить TTL кэша или узнать, что вызывает промах кэша, см. Как Claude Code использует кэширование подсказок.