SpyBara
Go Premium

model-config.md 2026-05-17 01:01 UTC to 2026-05-18 23:59 UTC

2 added, 2 removed.

2026
Sun 31 06:39 Sat 30 06:23 Fri 29 06:38 Thu 28 06:37 Wed 27 06:42 Tue 26 06:33 Sun 24 06:25 Sat 23 06:18 Fri 22 06:33 Thu 21 06:36 Wed 20 06:35 Tue 19 06:34 Mon 18 23:59 Sun 17 01:01 Fri 15 22:58 Thu 14 17:02 Wed 13 23:01 Tue 12 22:57 Mon 11 23:00 Sun 10 23:03 Sat 9 04:57 Fri 8 22:00 Thu 7 22:59 Tue 5 23:00 Mon 4 22:58 Sat 2 18:14 Fri 1 18:19

Конфигурация модели

Узнайте о конфигурации модели Claude Code, включая псевдонимы моделей, такие как opusplan

Доступные модели

Для параметра model в Claude Code вы можете настроить либо:

  • Псевдоним модели
  • Имя модели
    • Anthropic API: полное имя модели
    • Bedrock: ARN профиля вывода
    • Foundry: имя развертывания
    • Vertex: имя версии

Псевдонимы моделей

Псевдонимы моделей предоставляют удобный способ выбора параметров модели без необходимости запоминать точные номера версий:

Псевдоним модели Поведение
default Специальное значение, которое очищает любое переопределение модели и возвращается к рекомендуемой модели для типа вашей учетной записи. Сам по себе не является псевдонимом модели
best Использует наиболее мощную доступную модель, в настоящее время эквивалентную opus
sonnet Использует последнюю модель Sonnet для ежедневных задач кодирования
opus Использует последнюю модель Opus для сложных задач рассуждения
haiku Использует быструю и эффективную модель Haiku для простых задач
sonnet[1m] Использует Sonnet с контекстным окном в 1 миллион токенов для длительных сеансов
opus[1m] Использует Opus с контекстным окном в 1 миллион токенов для длительных сеансов
opusplan Специальный режим, который использует opus во время режима плана, а затем переключается на sonnet для выполнения

На Anthropic API и Claude Platform on AWS opus разрешается в Opus 4.7, а sonnet разрешается в Sonnet 4.6. На Bedrock, Vertex и Foundry opus разрешается в Opus 4.6, а sonnet разрешается в Sonnet 4.5; более новые модели доступны на этих поставщиках путем явного выбора полного имени модели или установки ANTHROPIC_DEFAULT_OPUS_MODEL или ANTHROPIC_DEFAULT_SONNET_MODEL.

Псевдонимы указывают на рекомендуемую версию для вашего поставщика и обновляются со временем. Чтобы закрепить определенную версию, используйте полное имя модели (например, claude-opus-4-7) или установите соответствующую переменную окружения, такую как ANTHROPIC_DEFAULT_OPUS_MODEL.

Установка вашей модели

Вы можете настроить вашу модель несколькими способами, перечисленными в порядке приоритета:

  1. Во время сеанса - Используйте /model <alias|name> для переключения немедленно, или запустите /model без аргумента для открытия средства выбора. Средство выбора запрашивает подтверждение, когда в разговоре есть предыдущий вывод, так как следующий ответ перечитывает полную историю без кэшированного контекста
  2. При запуске - Запустите с claude --model <alias|name>
  3. Переменная окружения - Установите ANTHROPIC_MODEL=<alias|name>
  4. Параметры - Настройте постоянно в файле параметров, используя поле model.

Ваш выбор /model сохраняется в параметры пользователя и сохраняется при перезагрузке. Начиная с версии v2.1.117, если файл .claude/settings.json проекта закрепляет другую модель, Claude Code также записывает ваш выбор в .claude/settings.local.json, чтобы он продолжал применяться в этом проекте после перезагрузки. Управляемые параметры имеют приоритет и переприменяются при следующем запуске.

Когда активная модель при запуске поступает из параметров проекта или управляемых параметров, а не из вашего собственного выбора, заголовок при запуске показывает, какой файл параметров установил его. Запустите /model для переопределения в текущем сеансе.

Пример использования:

# Запустить с Opus
claude --model opus

# Переключиться на Sonnet во время сеанса
/model sonnet

Пример файла параметров:

{
    "permissions": {
        ...
    },
    "model": "opus"
}

Ограничение выбора модели

Администраторы предприятия могут использовать availableModels в управляемых или политических параметрах для ограничения того, какие модели могут выбирать пользователи.

Когда установлен availableModels, пользователи не могут переключаться на модели, отсутствующие в списке, через /model, флаг --model или переменную окружения ANTHROPIC_MODEL.

{
  "availableModels": ["sonnet", "haiku"]
}

Поведение модели по умолчанию

Опция Default в средстве выбора модели не затрагивается availableModels. Она всегда остается доступной и представляет системное значение по умолчанию во время выполнения на основе уровня подписки пользователя.

Даже с availableModels: [] пользователи все еще могут использовать Claude Code с моделью Default для своего уровня.

Управление моделью, на которой работают пользователи

Параметр model является начальным выбором, а не принудительным. Он устанавливает, какая модель активна при запуске сеанса, но пользователи все еще могут открыть /model и выбрать Default, который разрешается в системное значение по умолчанию для их уровня независимо от того, что установлено в model.

Для полного управления опытом работы с моделью объедините три параметра:

  • availableModels: ограничивает, на какие именованные модели пользователи могут переключаться
  • model: устанавливает начальный выбор модели при запуске сеанса
  • ANTHROPIC_DEFAULT_SONNET_MODEL / ANTHROPIC_DEFAULT_OPUS_MODEL / ANTHROPIC_DEFAULT_HAIKU_MODEL: управляют тем, на что разрешаются опция Default и псевдонимы sonnet, opus и haiku

Этот пример запускает пользователей на Sonnet 4.5, ограничивает средство выбора Sonnet и Haiku, и закрепляет Default для разрешения на Sonnet 4.5 вместо последнего выпуска:

{
  "model": "claude-sonnet-4-5",
  "availableModels": ["claude-sonnet-4-5", "haiku"],
  "env": {
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
  }
}

Без блока env пользователь, который выбирает Default в средстве выбора, получит последний выпуск Sonnet, обходя закрепление версии в model и availableModels.

Поведение слияния

Когда availableModels установлен на нескольких уровнях, таких как параметры пользователя и параметры проекта, массивы объединяются и дедублицируются. Для обеспечения строгого списка разрешений установите availableModels в управляемых или политических параметрах, которые имеют наивысший приоритет.

Идентификаторы моделей Mantle

Когда включена конечная точка Bedrock Mantle, записи в availableModels, начинающиеся с anthropic., добавляются в средство выбора /model как пользовательские опции и маршрутизируются на конечную точку Mantle. Это исключение из сопоставления только псевдонимов, описанного в Закрепление моделей для развертываний третьих сторон. Параметр все еще ограничивает средство выбора перечисленными записями, поэтому включите стандартные псевдонимы вместе с любыми идентификаторами Mantle.

Специальное поведение модели

Параметр модели default

Поведение default зависит от типа вашей учетной записи:

  • Max и Team Premium: по умолчанию Opus 4.7
  • Pro, Team Standard, Enterprise и Anthropic API: по умолчанию Sonnet 4.6
  • Bedrock, Vertex и Foundry: по умолчанию Sonnet 4.5

Claude Code может автоматически вернуться к Sonnet, если вы достигнете порога использования с Opus.

Параметр модели opusplan

Псевдоним модели opusplan предоставляет автоматизированный гибридный подход:

  • В режиме плана - Использует opus для сложного рассуждения и решений архитектуры
  • В режиме выполнения - Автоматически переключается на sonnet для генерации кода и реализации

Это дает вам лучшее из обоих миров: превосходное рассуждение Opus для планирования и эффективность Sonnet для выполнения.

Фаза Opus в режиме плана работает со стандартным контекстным окном 200K. Автоматическое обновление 1M, описанное в Расширенный контекст, применяется к параметру модели opus и не распространяется на opusplan.

Регулировка уровня усилий

Уровни усилий управляют адаптивным рассуждением, которое позволяет модели решать, думать ли и сколько думать на каждом шаге на основе сложности задачи. Более низкие усилия работают быстрее и дешевле для простых задач, а более высокие усилия обеспечивают более глубокое рассуждение для сложных проблем.

Усилие поддерживается на Opus 4.7, Opus 4.6 и Sonnet 4.6. Доступные уровни зависят от модели:

Модель Уровни
Opus 4.7 low, medium, high, xhigh, max
Opus 4.6 и Sonnet 4.6 low, medium, high, max

Если вы установите уровень, который активная модель не поддерживает, Claude Code вернется к наивысшему поддерживаемому уровню на или ниже установленного вами. Например, xhigh работает как high на Opus 4.6.

Начиная с версии 2.1.117, усилие по умолчанию составляет xhigh на Opus 4.7 и high на Opus 4.6 и Sonnet 4.6.

Когда вы впервые запускаете Opus 4.7, Claude Code применяет xhigh, даже если вы ранее установили другой уровень усилий для Opus 4.6 или Sonnet 4.6. Запустите /effort снова, чтобы выбрать другой уровень после переключения.

low, medium, high и xhigh сохраняются между сеансами. max обеспечивает самое глубокое рассуждение без ограничений на расходование токенов и применяется только к текущему сеансу, кроме случаев, когда установлено через переменную окружения CLAUDE_CODE_EFFORT_LEVEL.

Выбор уровня усилий

Каждый уровень обменивает расходование токенов на возможность. Значение по умолчанию подходит для большинства задач кодирования; регулируйте, когда вы хотите другой баланс.

Уровень Когда его использовать
low Зарезервируйте для коротких, ограниченных, чувствительных к задержкам задач, которые не требуют высокого интеллекта
medium Снижает использование токенов для работы, чувствительной к затратам, которая может пожертвовать некоторым интеллектом
high Балансирует использование токенов и интеллект. Используйте как минимум для работы, чувствительной к интеллекту, или для снижения расходования токенов относительно xhigh
xhigh Лучшие результаты для большинства задач кодирования и агентских задач. Рекомендуемое значение по умолчанию на Opus 4.7
max Может улучшить производительность на сложных задачах, но может показать убывающую отдачу и склонен к переосмыслению. Протестируйте перед широким внедрением

Шкала усилий откалибрована для каждой модели, поэтому одно и то же имя уровня не представляет одно и то же базовое значение в разных моделях.

Используйте ultrathink для одноразового глубокого рассуждения

Включите ultrathink в любом месте вашей подсказки, чтобы запросить более глубокое рассуждение на этом ходу без изменения параметра усилий сеанса. Claude Code распознает ключевое слово и добавляет встроенную инструкцию. Уровень усилий, отправляемый в API, остается неизменным. Другие фразы, такие как "think", "think hard" и "think more", передаются как обычный текст подсказки и не распознаются как ключевые слова.

Установка уровня усилий

Вы можете изменить усилие любым из следующих способов:

  • /effort: запустите /effort без аргументов для открытия интерактивного ползунка, /effort с последующим именем уровня для установки его напрямую, или /effort auto для сброса на значение по умолчанию модели
  • В /model: используйте клавиши со стрелками влево/вправо для регулировки ползунка усилий при выборе модели
  • Флаг --effort: передайте имя уровня для установки его на один сеанс при запуске Claude Code
  • Переменная окружения: установите CLAUDE_CODE_EFFORT_LEVEL на имя уровня или auto
  • Параметры: установите effortLevel в low, medium, high или xhigh в файле параметров. max является только для сеанса и не принимается здесь
  • Frontmatter skill и subagent: установите effort в файле markdown skill или subagent для переопределения уровня усилий при запуске этого skill или subagent

Переменная окружения имеет приоритет над всеми другими методами, затем ваш настроенный уровень, затем значение по умолчанию модели. Frontmatter усилие применяется, когда этот skill или subagent активен, переопределяя уровень сеанса, но не переменную окружения.

Ползунок усилий появляется в /model при выборе поддерживаемой модели. Текущий уровень усилий также отображается рядом с логотипом и спиннером, например "with low effort", поэтому вы можете подтвердить, какой параметр активен, без открытия /model.

Адаптивное рассуждение и фиксированные бюджеты мышления

Адаптивное рассуждение делает мышление необязательным на каждом шаге, поэтому Claude может быстрее реагировать на рутинные подсказки и зарезервировать более глубокое мышление для шагов, которые от него выигрывают. Если вы хотите, чтобы Claude думал чаще или реже, чем производит текущий уровень, вы можете сказать об этом прямо в вашей подсказке или в CLAUDE.md; модель реагирует на это руководство в рамках своего параметра усилий.

Opus 4.7 всегда использует адаптивное рассуждение. Режим фиксированного бюджета мышления и CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING не применяются к нему.

На Opus 4.6 и Sonnet 4.6 вы можете установить CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 для возврата к предыдущему фиксированному бюджету мышления, контролируемому MAX_THINKING_TOKENS. См. переменные окружения.

Расширенное мышление

Расширенное мышление — это рассуждение, которое Claude выдает перед ответом. На моделях, поддерживающих адаптивное рассуждение, уровень усилий является основным управлением тем, сколько мышления происходит; параметры ниже включают или отключают мышление и управляют его отображением.

Управление Как его установить
Переключение для текущего сеанса Нажмите Option+T на macOS или Alt+T на Windows и Linux
Установка глобального значения по умолчанию Запустите /config и переключите режим мышления. Сохраняется как alwaysThinkingEnabled в ~/.claude/settings.json
Отключение независимо от усилий Установите MAX_THINKING_TOKENS=0. Другие значения применяются только с фиксированным бюджетом мышления

Вывод мышления свернут по умолчанию. Нажмите Ctrl+O для переключения режима подробности и просмотра рассуждения как серого курсивного текста. Интерактивные сеансы на Anthropic API получают отредактированные блоки мышления по умолчанию, поэтому установите showThinkingSummaries: true в параметрах, если вы хотите, чтобы полные резюме были доступны при развертывании. Вам выставляется счет за все сгенерированные токены мышления, даже если они свернуты или отредактированы.

Расширенный контекст

Opus 4.7, Opus 4.6 и Sonnet 4.6 поддерживают контекстное окно в 1 миллион токенов для длительных сеансов с большими кодовыми базами.

Доступность варьируется в зависимости от модели и плана. На планах Max, Team и Enterprise Opus автоматически обновляется до контекста 1M без дополнительной конфигурации. Это применяется как к местам Team Standard, так и к Team Premium. Sonnet с контекстом 1M не входит в автоматическое обновление и требует дополнительного использования на каждом плане подписки, включая Max.

План Opus с контекстом 1M Sonnet с контекстом 1M
Max, Team и Enterprise Включено в подписку Требует дополнительного использования
Pro Требует дополнительного использования Требует дополнительного использования
API и оплата по мере использования Полный доступ Полный доступ

Чтобы полностью отключить контекст 1M, установите CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Это удаляет варианты моделей 1M из средства выбора модели. См. переменные окружения.

Контекстное окно 1M использует стандартное ценообразование модели без премии за токены сверх 200K. Для планов, где расширенный контекст включен в вашу подписку, использование остается покрытым вашей подпиской. Для планов, которые получают доступ к расширенному контексту через дополнительное использование, токены выставляются в счет дополнительного использования.

Если ваша учетная запись поддерживает контекст 1M, опция появляется в средстве выбора модели (/model) в последних версиях Claude Code. Если вы его не видите, попробуйте перезагрузить сеанс.

Вы также можете использовать суффикс [1m] с псевдонимами моделей или полными именами моделей:

# Используйте псевдоним opus[1m] или sonnet[1m]
/model opus[1m]
/model sonnet[1m]

# Или добавьте [1m] к полному имени модели
/model claude-opus-4-7[1m]

Проверка вашей текущей модели

Вы можете увидеть, какую модель вы используете в настоящее время, несколькими способами:

  1. В строке состояния (если настроено)
  2. В /status, который также отображает информацию вашей учетной записи.

Добавление пользовательского варианта модели

Используйте ANTHROPIC_CUSTOM_MODEL_OPTION для добавления одной пользовательской записи в средство выбора /model без замены встроенных псевдонимов. Это полезно для тестирования идентификаторов моделей, которые Claude Code не указывает по умолчанию. Для развертываний шлюза LLM Claude Code может заполнять средство выбора из конечной точки /v1/models шлюза, когда установлено значение CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1, поэтому эта переменная требуется только в том случае, если обнаружение отключено или не возвращает нужную вам модель. См. Выбор модели шлюза LLM.

Этот пример устанавливает все три переменные, чтобы сделать развертывание Opus с маршрутизацией через шлюз выбираемым:

export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"

Пользовательская запись появляется в нижней части средства выбора /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME и ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION являются необязательными. Если они опущены, идентификатор модели используется как имя, а описание по умолчанию — Custom model (<model-id>).

Claude Code пропускает валидацию для идентификатора модели, установленного в ANTHROPIC_CUSTOM_MODEL_OPTION, поэтому вы можете использовать любую строку, которую принимает ваша конечная точка API.

Переменные окружения

Вы можете использовать следующие переменные окружения, которые должны быть полными именами моделей (или эквивалентом для вашего поставщика API), для управления именами моделей, на которые отображаются псевдонимы.

Переменная окружения Описание
ANTHROPIC_DEFAULT_OPUS_MODEL Модель для использования для opus, или для opusplan при активном Plan Mode.
ANTHROPIC_DEFAULT_SONNET_MODEL Модель для использования для sonnet, или для opusplan при неактивном Plan Mode.
ANTHROPIC_DEFAULT_HAIKU_MODEL Модель для использования для haiku, или фоновой функциональности
CLAUDE_CODE_SUBAGENT_MODEL Модель для использования для всех subagents. Переопределяет как параметр model для каждого вызова, так и frontmatter model определения subagent

Примечание: ANTHROPIC_SMALL_FAST_MODEL устарел в пользу ANTHROPIC_DEFAULT_HAIKU_MODEL.

Закрепление моделей для развертываний третьих сторон

При развертывании Claude Code через Bedrock, Vertex AI, Foundry или Claude Platform on AWS закрепите версии моделей перед развертыванием для пользователей.

Без закрепления Claude Code использует псевдонимы моделей (sonnet, opus, haiku), которые разрешаются в последнюю версию. Когда Anthropic выпускает новую модель, которая еще не включена в учетную запись пользователя, пользователи Bedrock и Vertex AI видят уведомление и возвращаются к предыдущей версии для этого сеанса, в то время как пользователи Foundry видят ошибки, потому что Foundry не имеет эквивалентной проверки при запуске.

Используйте следующие переменные окружения с идентификаторами моделей, специфичными для версии, для вашего поставщика:

Поставщик Пример
Bedrock export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-7'
Vertex AI export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7'
Foundry export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7'

Применяйте тот же шаблон для ANTHROPIC_DEFAULT_SONNET_MODEL и ANTHROPIC_DEFAULT_HAIKU_MODEL. Для текущих и устаревших идентификаторов моделей во всех поставщиках см. Обзор моделей. Чтобы обновить пользователей до новой версии модели, обновите эти переменные окружения и переразверните.

Чтобы включить расширенный контекст для закрепленной модели, добавьте [1m] к идентификатору модели в ANTHROPIC_DEFAULT_OPUS_MODEL или ANTHROPIC_DEFAULT_SONNET_MODEL:

export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-7[1m]'

Суффикс [1m] применяет контекстное окно 1M ко всему использованию этого псевдонима, включая opusplan. Claude Code удаляет суффикс перед отправкой идентификатора модели вашему поставщику. Добавляйте [1m] только когда базовая модель поддерживает контекст 1M, такая как Opus 4.7 или Sonnet 4.6.

Настройка отображения и возможностей закрепленной модели

Когда вы закрепляете модель у поставщика третьей стороны, идентификатор, специфичный для поставщика, отображается как есть в средстве выбора /model, и Claude Code может не распознать, какие функции поддерживает модель. Вы можете переопределить отображаемое имя и объявить возможности с помощью вспомогательных переменных окружения для каждой закрепленной модели.

Эти переменные вступают в силу у поставщиков третьих сторон, таких как Bedrock, Vertex AI и Foundry. Переменные _NAME и _DESCRIPTION также вступают в силу, когда ANTHROPIC_BASE_URL указывает на LLM gateway. Они не имеют эффекта при прямом подключении к api.anthropic.com.

Переменная окружения Описание
ANTHROPIC_DEFAULT_OPUS_MODEL_NAME Отображаемое имя для закрепленной модели Opus в средстве выбора /model. По умолчанию используется идентификатор модели, если не установлено
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION Отображаемое описание для закрепленной модели Opus в средстве выбора /model. По умолчанию используется Custom Opus model, если не установлено
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES Разделенный запятыми список возможностей, которые поддерживает закрепленная модель Opus

Те же суффиксы _NAME, _DESCRIPTION и _SUPPORTED_CAPABILITIES доступны для ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL и ANTHROPIC_CUSTOM_MODEL_OPTION.

Claude Code включает функции, такие как уровни усилий и расширенное мышление, путем сопоставления идентификатора модели с известными шаблонами. Идентификаторы, специфичные для поставщика, такие как ARN Bedrock или пользовательские имена развертывания, часто не соответствуют этим шаблонам, оставляя поддерживаемые функции отключенными. Установите _SUPPORTED_CAPABILITIES, чтобы сообщить Claude Code, какие функции фактически поддерживает модель:

Значение возможности Включает
effort Уровни усилий и команду /effort
xhigh_effort {/* min-version: 2.1.111 */}Уровень усилий xhigh
max_effort Уровень усилий max
thinking Расширенное мышление
adaptive_thinking Адаптивное рассуждение, которое динамически распределяет мышление на основе сложности задачи
interleaved_thinking Мышление между вызовами инструментов

Когда установлена _SUPPORTED_CAPABILITIES, перечисленные возможности включены, а неперечисленные возможности отключены для соответствующей закрепленной модели. Когда переменная не установлена, Claude Code возвращается к встроенному обнаружению на основе идентификатора модели.

Этот пример закрепляет Opus на пользовательский ARN модели Bedrock, устанавливает понятное имя и объявляет его возможности:

export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'

Переопределение идентификаторов моделей для каждой версии

Переменные окружения уровня семейства выше настраивают один идентификатор модели для каждого псевдонима семейства. Если вам нужно отобразить несколько версий в одном семействе на различные идентификаторы поставщика, используйте вместо этого параметр modelOverrides.

modelOverrides отображает отдельные идентификаторы моделей Anthropic на строки, специфичные для поставщика, которые Claude Code отправляет API вашего поставщика. Когда пользователь выбирает отображаемую модель в средстве выбора /model, Claude Code использует ваше настроенное значение вместо встроенного значения по умолчанию.

Это позволяет администраторам предприятия маршрутизировать каждую версию модели на конкретный ARN профиля вывода Bedrock, имя версии Vertex AI или имя развертывания Foundry для управления, распределения затрат или региональной маршрутизации.

Установите modelOverrides в файле параметров:

{
  "modelOverrides": {
    "claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
    "claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
    "claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
  }
}

Ключи должны быть идентификаторами моделей Anthropic, как указано в Обзоре моделей. Для датированных идентификаторов моделей включите суффикс даты точно так, как он там отображается. Неизвестные ключи игнорируются.

Переопределения заменяют встроенные идентификаторы моделей, которые поддерживают каждую запись в средстве выбора /model. На Bedrock переопределения имеют приоритет над любыми профилями вывода, которые Claude Code автоматически обнаруживает при запуске. Значения, которые вы предоставляете непосредственно через ANTHROPIC_MODEL, --model или переменные окружения ANTHROPIC_DEFAULT_*_MODEL, передаются поставщику как есть и не преобразуются modelOverrides.

modelOverrides работает вместе с availableModels. Список разрешений оценивается по идентификатору модели Anthropic, а не по значению переопределения, поэтому запись, такая как "opus" в availableModels, продолжает совпадать, даже когда версии Opus отображаются на ARN.

Конфигурация кэширования подсказок

Claude Code автоматически использует кэширование подсказок для оптимизации производительности и снижения затрат. Вы можете отключить кэширование подсказок глобально или для конкретных уровней моделей:

Переменная окружения Описание
DISABLE_PROMPT_CACHING Установите на 1 для отключения кэширования подсказок для всех моделей (имеет приоритет над параметрами для каждой модели)
DISABLE_PROMPT_CACHING_HAIKU Установите на 1 для отключения кэширования подсказок только для моделей Haiku
DISABLE_PROMPT_CACHING_SONNET Установите на 1 для отключения кэширования подсказок только для моделей Sonnet
DISABLE_PROMPT_CACHING_OPUS Установите на 1 для отключения кэширования подсказок только для моделей Opus

Эти переменные окружения дают вам точный контроль над поведением кэширования подсказок. Глобальный параметр DISABLE_PROMPT_CACHING имеет приоритет над параметрами для каждой модели, позволяя вам быстро отключить все кэширование при необходимости. Параметры для каждой модели полезны для выборочного управления, например при отладке конкретных моделей или работе с облачными поставщиками, которые могут иметь различные реализации кэширования.