SpyBara
Go Premium

model-config.md 2026-06-23 22:00 UTC to 2026-06-24 22:02 UTC

69 added, 16 removed.

2026
Tue 30 21:01 Mon 29 23:02 Sat 27 01:01 Fri 26 23:00 Thu 25 23:58 Wed 24 22:02 Tue 23 22:00 Mon 22 23:59 Fri 19 22:58 Thu 18 22:00 Wed 17 17:02 Tue 16 21:57 Mon 15 23:02 Sat 13 21:59 Fri 12 22:00 Thu 11 23:01 Wed 10 23:57 Tue 9 06:34 Mon 8 06:52 Sat 6 06:24 Fri 5 06:45 Thu 4 06:52 Wed 3 06:53 Tue 2 06:51

Konfigurasi model

Pelajari tentang konfigurasi model Claude Code, termasuk alias model seperti opusplan

Model yang tersedia

Untuk pengaturan model di Claude Code, Anda dapat mengonfigurasi salah satu dari:

  • Sebuah alias model
  • Sebuah nama model
    • Anthropic API: Sebuah nama model lengkap
    • Bedrock: ARN profil inferensi
    • Foundry: nama deployment
    • Vertex: nama versi

Alias model

Alias model menyediakan cara yang nyaman untuk memilih pengaturan model tanpa perlu mengingat nomor versi yang tepat:

Alias model Perilaku
default Nilai khusus yang menghapus penggantian model apa pun dan kembali ke model yang direkomendasikan untuk jenis akun Anda. Bukan sendiri alias model
best Menggunakan Fable 5 di mana organisasi Anda memiliki akses ke dalamnya, jika tidak maka model Opus terbaru
fable Menggunakan Claude Fable 5 untuk tugas-tugas tersulit dan paling lama Anda
sonnet Menggunakan model Sonnet terbaru untuk tugas coding sehari-hari
opus Menggunakan model Opus terbaru untuk tugas penalaran kompleks
haiku Menggunakan model Haiku yang cepat dan efisien untuk tugas sederhana
sonnet[1m] Menggunakan Sonnet dengan jendela konteks 1 juta token untuk sesi panjang
opus[1m] Menggunakan Opus dengan jendela konteks 1 juta token untuk sesi panjang
opusplan Mode khusus yang menggunakan opus selama Plan Mode, kemudian beralih ke sonnet untuk eksekusi

Di Anthropic API, opus diselesaikan ke Opus 4.8 dan sonnet diselesaikan ke Sonnet 4.6. Di Claude Platform on AWS, opus diselesaikan ke Opus 4.7 dan sonnet diselesaikan ke Sonnet 4.6. Di Bedrock, Vertex, dan Foundry, opus diselesaikan ke Opus 4.6 dan sonnet diselesaikan ke Sonnet 4.5; model yang lebih baru tersedia di penyedia tersebut dengan memilih nama model lengkap secara eksplisit atau mengatur ANTHROPIC_DEFAULT_OPUS_MODEL atau ANTHROPIC_DEFAULT_SONNET_MODEL.

Alias menunjuk ke versi yang direkomendasikan untuk penyedia Anda dan diperbarui seiring waktu. Untuk menetapkan versi tertentu, gunakan nama model lengkap (misalnya, claude-opus-4-8) atau atur variabel lingkungan yang sesuai seperti ANTHROPIC_DEFAULT_OPUS_MODEL.

Bekerja dengan Fable 5

Claude Fable 5 adalah model paling mampu di Claude Code, cocok untuk tugas yang lebih besar dari satu sesi. Ini mempertahankan sesi otonomi yang panjang, menyelidiki sebelum bertindak, dan memverifikasi pekerjaan lebih sering daripada model yang lebih kecil.

Fable 5 bukan model default. Pilih dengan /model fable. Permintaan yang ditandai oleh pengklasifikasi keamanannya, paling sering di domain keamanan siber dan biologi, memicu fallback model otomatis.

Untuk mendapatkan hasil maksimal dari Fable 5:

  • Jelaskan hasilnya, bukan langkah-langkahnya: berikan hasil yang Anda inginkan dan biarkan ia merencanakan jalurnya. Untuk membuatnya terus bekerja sampai hasil itu terpenuhi, tetapkan tujuan.
  • Berikan masalah yang ambigu: investigasi akar penyebab, debugging pemadaman, dan keputusan arsitektur adalah tempat investigasi dan verifikasi ekstra memberikan hasil.
  • Lewati pengingat verifikasi: ia memverifikasi pekerjaan sendiri dengan prompting yang lebih sedikit, jadi pengingat untuk menguji atau memeriksa biasanya tidak perlu.
  • Ukur tugas yang lebih besar: berikan pekerjaan yang biasanya akan Anda pecah menjadi beberapa bagian. Ia mempertahankan sesi panjang tanpa kehilangan benang merah.

Mengatur model Anda

Anda dapat mengonfigurasi model Anda dengan beberapa cara, yang tercantum dalam urutan prioritas:

  1. Selama sesi - Gunakan /model <alias|name> untuk beralih segera, atau jalankan /model tanpa argumen untuk membuka pemilih. Pemilih meminta konfirmasi ketika percakapan memiliki output sebelumnya, karena respons berikutnya membaca ulang riwayat lengkap tanpa konteks cache
  2. Saat startup - Luncurkan dengan claude --model <alias|name>
  3. Variabel lingkungan - Atur ANTHROPIC_MODEL=<alias|name>
  4. Pengaturan - Konfigurasi secara permanen di file pengaturan Anda menggunakan bidang model.

Mulai dari v2.1.153, /model menyimpan pilihan Anda sebagai default untuk sesi baru dengan menulis bidang model di pengaturan pengguna Anda. Di pemilih:

  • Enter: beralih model dan simpan sebagai default Anda
  • s: beralih model hanya untuk sesi ini

Mengetik /model <name> langsung berperilaku seperti Enter. Pengaturan proyek dan yang dikelola masih memiliki prioritas dan diterapkan kembali pada peluncuran berikutnya.

Di v2.1.144 hingga v2.1.152, /model hanya berlaku untuk sesi saat ini dan d di pemilih menyimpan default.

Bendera --model dan variabel lingkungan ANTHROPIC_MODEL hanya berlaku untuk sesi yang Anda luncurkan dengan mereka. Untuk menjalankan model yang berbeda di terminal yang berbeda pada waktu yang sama, luncurkan masing-masing dengan bendera --model miliknya sendiri daripada beralih dengan /model.

Sesi yang dilanjutkan dimulai dengan claude --resume, --continue, atau pemilih /resume menyimpan model yang mereka gunakan ketika transkrip disimpan, terlepas dari pengaturan model saat ini. Jika model tersebut telah pensiun atau dikecualikan oleh availableModels, sesi jatuh melalui urutan prioritas normal. Ini mencegah pilihan /model sesi lain dari mengubah model saat dilanjutkan.

Ketika model aktif saat startup berasal dari pengaturan proyek atau yang dikelola daripada pilihan Anda sendiri, header startup menunjukkan file pengaturan mana yang menetapkannya. Jalankan /model untuk mengganti; pengaturan proyek atau yang dikelola diterapkan kembali pada peluncuran berikutnya.

Ketika model yang diminta memiliki tanggal pensiun yang dijadwalkan atau secara otomatis dipetakan ulang ke versi yang lebih baru, Claude Code menampilkan peringatan yang menyebutkan model yang diminta. Sesi interaktif menampilkannya sebagai pemberitahuan startup. Dari v2.1.182, peringatan yang sama ditulis ke stderr dalam mode non-interaktif ketika menggunakan format output teks default. Pemeriksaan juga mencakup model yang ditetapkan dalam frontmatter subagent. Peringatan stderr ditekan untuk --output-format json dan stream-json; baca model aktual dari bidang modelUsage dari pesan hasil sebagai gantinya.

Contoh penggunaan:

# Mulai dengan Opus
claude --model opus

# Beralih ke Sonnet selama sesi
/model sonnet

Contoh file pengaturan:

{
    "permissions": {
        ...
    },
    "model": "opus"
}

Batasi pemilihan model

Administrator enterprise dapat menggunakan availableModels dalam pengaturan terkelola atau kebijakan untuk membatasi model mana yang dapat dipilih pengguna. Entri cocok dengan keluarga model seperti sonnet, awalan versi seperti claude-sonnet-4-5, atau ID model lengkap seperti claude-sonnet-4-5-20250929.

Ketika availableModels diatur, daftar izin berlaku di mana pun pengguna dapat menentukan model:

  • Model sesi utama: /model, flag --model, variabel lingkungan ANTHROPIC_MODEL, pengaturan model, dan model yang dipulihkan ketika melanjutkan sesi
  • Resolusi alias: {/* min-version: 2.1.176 */}variabel lingkungan ANTHROPIC_DEFAULT_OPUS_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL, dan ANTHROPIC_DEFAULT_FABLE_MODEL tidak dapat mengarahkan ulang alias yang diizinkan ke model di luar daftar
  • Mode cepat: {/* min-version: 2.1.176 */}/fast menolak untuk beralih ketika akan secara implisit beralih ke model Opus di luar daftar, dengan pesan "is not in your organization's allowed models"
  • Model subagent: bidang model dalam frontmatter subagent, parameter model dari alat Agent, pemilih model di /agents, dan CLAUDE_CODE_SUBAGENT_MODEL
  • Model skill dan command: frontmatter model dalam skills dan commands
  • Model advisor: pengaturan advisorModel yang dikonfigurasi dan flag --advisor
  • Model background agent: model yang dipilih dalam dispatch picker

Beralih ke model yang diblokir dengan /model ditolak dengan kesalahan, sementara flag --model yang diblokir, ANTHROPIC_MODEL, atau nilai pengaturan model diganti saat startup dengan peringatan yang menyebutkan model yang diminta dan model pengganti, dan sesi dimulai pada model default. Penggantian subagent, skill, atau command yang diblokir kembali ke model yang diwariskan atau default daripada gagal dalam permintaan; pengaturan advisorModel yang diblokir menonaktifkan advisor untuk sesi, sementara nilai flag --advisor yang diblokir keluar dengan kesalahan saat peluncuran. Model yang dikecualikan disembunyikan dari pemilih /model.

Perubahan model otomatis diperiksa dengan cara yang sama: elemen dari rantai model fallback di luar daftar izin dihapus, peningkatan mode rencana seperti opusplan ke model yang dikecualikan dilewati sehingga perencanaan berlanjut pada model sesi, dan fallback model otomatis yang targetnya dikecualikan tidak berjalan, sehingga permintaan yang ditandai berakhir dengan penolakan. Mengaktifkan mode cepat ditolak ketika model yang akan dijalankan sesi setelahnya berada di luar daftar izin.

{
  "availableModels": ["sonnet", "haiku"]
}

Cakupan permukaan

Setiap permukaan memberlakukan daftar izin yang diterimanya. Mekanisme pengiriman mana yang mencapai setiap permukaan berbeda:

Mekanisme pengiriman CLI dan IDE Sesi lokal Desktop Sesi web, mobile, dan cloud Agent SDK dan non-interaktif Cowork
Pengaturan terkelola server dari konsol admin Diberlakukan Diberlakukan Diberlakukan Diberlakukan Tidak dikirimkan
File pengaturan MDM atau terkelola Diberlakukan Diberlakukan Tidak dikirimkan Diberlakukan Diberlakukan di mana diterapkan
  • Sesi cloud, di Claude Code di web atau di aplikasi Desktop, berjalan di VM yang dikelola Anthropic: pengaturan yang diterapkan ke perangkat Anda tidak mencapainya, jadi kirimkan daftar izin melalui pengaturan terkelola server. Peralihan model pertengahan sesi dalam sesi cloud ditolak ketika model yang diminta dikecualikan oleh daftar izin. Penolakan sisi server saat pembuatan sesi berlaku untuk pembatasan model organisasi, bukan kunci pengaturan availableModels.
  • Cowork, tab pekerjaan agentic di aplikasi Claude Desktop, bukan permukaan Claude Code dan tidak menerima pengaturan terkelola server sesuai desain. File pengaturan terkelola berlaku untuk sesi Cowork ketika ada di mana sesi berjalan; sesi Cowork jarak jauh berjalan di VM yang dikelola Anthropic, di mana file yang diterapkan perangkat tidak ada.
  • Sesi di penyedia pihak ketiga seperti Bedrock, Vertex AI, Foundry, dan Claude Platform di AWS tidak menerima pengaturan terkelola server, jadi kirimkan daftar izin melalui file pengaturan MDM atau terkelola di sana.
  • Pengiriman terkelola server juga memerlukan sesi untuk mengautentikasi dengan login organisasi atau kunci API yang dikonfigurasi langsung. Fleet yang menghasilkan kunci hanya melalui skrip apiKeyHelper harus mengirimkan daftar izin melalui file pengaturan MDM atau terkelola.
  • Tab Desktop Code juga menampilkan sesi SSH, yang membaca file pengaturan terkelola dari host jarak jauh tempat mereka berjalan. Lihat Pengaturan terkelola Desktop.
  • Pemilih model di claude.ai dan di aplikasi Desktop menyembunyikan atau memudarkan model yang dikecualikan oleh daftar izin organisasi Anda. Status pemilih adalah kenyamanan bagi pengguna; penegakan terjadi dalam sesi.

Perilaku model default

Opsi Default di pemilih model tidak dipengaruhi oleh availableModels kecuali enforceAvailableModels juga diatur. Dengan sendirinya, availableModels membiarkan Default tersedia, diselesaikan ke default runtime sistem berdasarkan tingkat langganan pengguna. Jika default tingkat adalah model yang ingin Anda batasi, atur enforceAvailableModels juga.

Array availableModels yang kosong tidak pernah melibatkan penegakan Default-model: dengan availableModels: [], pilihan model bernama diblokir tetapi model Default untuk jenis akun tetap dapat digunakan terlepas dari enforceAvailableModels.

Berlakukan daftar izin untuk model Default

Atur enforceAvailableModels: true bersama availableModels yang tidak kosong dalam pengaturan terkelola untuk memperluas daftar izin ke opsi Default. Ini memerlukan Claude Code v2.1.175 atau lebih baru.

{
  "availableModels": ["sonnet", "haiku"],
  "enforceAvailableModels": true
}

Ketika model default untuk jenis akun pengguna tidak ada dalam daftar izin, opsi Default malah diselesaikan ke entri pertama availableModels yang menamai model yang diizinkan dan tersedia, dan baris Default pemilih /model menunjukkan model tersebut. Ini berlaku di mana pun default dicapai: startup sesi, memilih Default di /model, kata kunci "default" dalam rantai model fallback, dan fallback yang digunakan ketika pilihan yang dikecualikan dihapus.

enforceAvailableModels tidak berpengaruh ketika availableModels tidak diatur atau kosong: dengan availableModels: [], model Default untuk jenis akun tetap dapat digunakan, sehingga pengaturan tidak dapat mengunci pengguna dari setiap model. Ketika availableModels tidak kosong tetapi tidak ada entri yang diselesaikan ke model yang diizinkan dan tersedia, penegakan menurun dan Default jatuh kembali ke default jenis akun, dengan peringatan yang hanya terlihat di bawah --debug. Pertahankan setidaknya satu entri yang dijamin tersedia dalam daftar untuk menghindari ini.

Terapkan kedua kunci dalam sumber terkelola dengan prioritas tertinggi: sumber terkelola yang diterapkan admin tidak menggabung, jadi pasangan yang ditempatkan dalam file pengaturan terkelola diabaikan ketika konsol admin mengirimkan pengaturan apa pun.

Kontrol model yang dijalankan pengguna

Pengaturan model adalah pilihan awal, bukan penegakan. Ini menetapkan model mana yang aktif ketika sesi dimulai, tetapi pengguna masih dapat membuka /model dan memilih Default, yang diselesaikan ke default sistem untuk tingkat mereka terlepas dari apa yang model diatur, kecuali enforceAvailableModels mengarahkannya ulang.

Untuk sepenuhnya mengontrol pengalaman model, gabungkan pengaturan ini:

  • availableModels: membatasi model bernama mana yang dapat dialihkan pengguna
  • enforceAvailableModels: memperluas daftar izin availableModels ke opsi Default, sehingga Default tidak dapat diselesaikan ke model di luar daftar
  • model: menetapkan pilihan model awal ketika sesi dimulai
  • ANTHROPIC_DEFAULT_SONNET_MODEL / ANTHROPIC_DEFAULT_OPUS_MODEL / ANTHROPIC_DEFAULT_HAIKU_MODEL / ANTHROPIC_DEFAULT_FABLE_MODEL: mengontrol apa yang diselesaikan opsi Default dan alias sonnet, opus, haiku, dan fable

Contoh ini memulai pengguna di Sonnet 4.5, membatasi pemilih ke Sonnet dan Haiku, dan memastikan Default diselesaikan ke model dalam daftar izin daripada default tingkat:

{
  "model": "claude-sonnet-4-5",
  "availableModels": ["claude-sonnet-4-5", "haiku"],
  "enforceAvailableModels": true,
  "env": {
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
  }
}

Tanpa enforceAvailableModels atau blok env, pengguna yang memilih Default di pemilih akan mendapatkan rilis terbaru untuk tingkat mereka, melewati pin versi dalam model dan availableModels. Dua pengaturan mencakup cakupan yang berbeda: enforceAvailableModels membuat Default mematuhi daftar izin, sementara blok env menetapkan versi mana yang diselesaikan alias yang diizinkan seperti sonnet. Gunakan enforceAvailableModels saja ketika membatasi keluarga model sudah cukup; tambahkan blok env ketika Anda juga perlu menetapkan versi tertentu.

Perilaku penggabungan

Ketika sumber pengaturan terkelola dengan prioritas tertinggi mendefinisikan availableModels, hanya daftar itu yang berlaku: entri dalam pengaturan pengguna, proyek, atau lokal tidak dapat memperluas daftar, dan sumber terkelola yang diterapkan admin tidak menggabung satu sama lain, jadi daftar yang diterapkan dalam file pengaturan terkelola diabaikan ketika pengaturan terkelola server mengirimkan kunci apa pun. Jika tidak, daftar dari pengaturan pengguna, proyek, dan lokal digabungkan dan dideduplikasi seperti pengaturan array lainnya. {/* min-version: 2.1.175 */}Mulai dari Claude Code v2.1.175, daftar terkelola menggantikan entri prioritas lebih rendah; versi sebelumnya menggabungkan mereka.

Dalam daftar yang efektif, entri yang menamai model tertentu dalam keluarga, baik awalan versi atau ID model lengkap, menonaktifkan entri wildcard keluarga itu: ["sonnet", "claude-sonnet-4-5"] hanya memungkinkan versi Sonnet 4.5, bukan setiap model Sonnet.

ID model Mantle

Ketika endpoint Bedrock Mantle diaktifkan, entri dalam availableModels yang dimulai dengan anthropic. ditambahkan ke pemilih /model sebagai opsi kustom dan dirutekan ke endpoint Mantle. Ini adalah pengecualian terhadap pencocokan alias yang dijelaskan dalam Pin models for third-party deployments. Pengaturan masih membatasi pemilih ke entri yang tercantum, dan ID Mantle menyematkan nama keluarga, jadi dihitung sebagai entri tertentu dan menonaktifkan wildcard keluarga itu: bersama ID Mantle apa pun, daftarkan awalan versi atau ID lengkap yang ingin Anda pertahankan dapat dipilih. Lihat Perilaku penggabungan.

Pembatasan model organisasi

Gunakan toggle Konsol alih-alih availableModels ketika anggota Anda mengautentikasi melalui API Anthropic dan Anda menginginkan satu sakelar di seluruh organisasi tanpa menerapkan file pengaturan. Admin organisasi membatasi model mana yang dapat dijalankan anggota dengan menonaktifkan model individual di Konsol Claude. Pembatasan ini dikirimkan dengan hak akses akun ketika Claude Code mengautentikasi, terpisah dari daftar availableModels apa pun dalam pengaturan, dan server memberlakukan pembatasan yang sama secara independen ketika sesi dibuat. Memerlukan Claude Code v2.1.187 atau lebih baru.

Model yang dibatasi disembunyikan dari pemilih /model. Memilihnya berdasarkan nama dengan --model, variabel lingkungan ANTHROPIC_MODEL, atau pengaturan model menunjukkan pemberitahuan Model "<name>" is restricted by your organization's settings. Using <model> instead. dan sesi dimulai pada model yang diizinkan. Mengetik /model <name> untuk model yang dibatasi ditolak dengan Model '<name>' is restricted by your organization's settings. Run /model to choose a different model. dan sesi mempertahankan model saat ini.

Dua mekanisme tersusun: model dapat dipilih hanya ketika diizinkan oleh availableModels dan tidak dibatasi oleh organisasi. Pembatasan organisasi dikirimkan ke sesi di API Anthropic dan penyebaran LLM gateway. Sesi di Bedrock, Vertex AI, Foundry, dan Claude Platform di AWS tidak menerimanya, jadi gunakan availableModels di penyedia tersebut.

Perilaku model khusus

Pengaturan model `default`

Perilaku default tergantung pada jenis akun Anda:

  • Max, Team Premium, Enterprise pay-as-you-go, dan Anthropic API: default ke Opus 4.8
  • Claude Platform di AWS: default ke Opus 4.7
  • Pro, Team Standard, dan kursi langganan Enterprise: default ke Sonnet 4.6
  • Bedrock, Vertex, dan Foundry: default ke Sonnet 4.5

Enterprise pay-as-you-go berarti organisasi Enterprise yang ditagihkan berdasarkan penggunaan daripada kursi langganan.

Ketika pengaturan terkelola memberlakukan allowlist untuk model Default dan default jenis akun tidak ada dalam availableModels, default diselesaikan ke Default yang diberlakukan daripada default jenis akun di atas.

Fable 5 bukan model default pada jenis akun apa pun. Sesi menggunakan Fable 5 hanya setelah Anda memilihnya, dengan /model fable, pengaturan model, atau alias best di mana Fable 5 tersedia. Memilihnya dengan /model menyimpannya sebagai model yang dipilih dalam pengaturan pengguna Anda, sehingga sesi berikutnya dimulai pada Fable 5 sampai Anda mengubah model.

Pengaturan model `opusplan`

Alias model opusplan menyediakan pendekatan hibrida otomatis:

  • Dalam plan mode - Menggunakan opus untuk penalaran kompleks dan keputusan arsitektur
  • Dalam execution mode - Secara otomatis beralih ke sonnet untuk pembuatan kode dan implementasi

Ini memberi Anda yang terbaik dari kedua dunia: penalaran superior Opus untuk perencanaan, dan efisiensi Sonnet untuk eksekusi.

Fase Opus dalam plan mode menggunakan jendela konteks yang sama dengan pengaturan model opus. Pada tingkat langganan di mana Opus secara otomatis ditingkatkan ke konteks 1M, opusplan menerima peningkatan dalam plan mode juga. Untuk memaksa konteks 1M untuk kedua fase ketika Anda tidak berada di tingkat auto-upgrade, atur model ke opusplan[1m].

Ketika availableModels mengecualikan Opus, opusplan tetap pada Sonnet dalam plan mode daripada beralih. Demikian pula, sesi Haiku yang biasanya akan ditingkatkan ke Sonnet dalam plan mode tetap pada Haiku ketika Sonnet dikecualikan.

Untuk pendekatan hibrida di mana Claude memutuskan di tengah-tugas kapan harus berkonsultasi dengan model kedua daripada beralih di batas rencana, lihat advisor tool.

Fallback model chains

Ketika model utama kelebihan beban, tidak tersedia, atau mengembalikan kesalahan server yang tidak dapat dicoba ulang lainnya, Claude Code dapat beralih ke model fallback daripada gagal permintaan. Kesalahan autentikasi, penagihan, batas laju, ukuran permintaan, dan transportasi tidak pernah memicu switch; mereka mengikuti retry dan penanganan kesalahan normal mereka.

Konfigurasikan satu atau lebih model fallback dan Claude Code mencobanya secara berurutan, menampilkan pemberitahuan saat beralih. Switch berlangsung hanya untuk giliran saat ini, jadi pesan berikutnya Anda mencoba model utama terlebih dahulu lagi. Chain dibatasi pada tiga model setelah penghapusan duplikat, dan entri tambahan diabaikan.

Atur chain untuk satu sesi dengan flag --fallback-model, yang menerima daftar yang dipisahkan koma:

claude --fallback-model sonnet,haiku

Untuk mempertahankan chain di seluruh sesi, atur fallbackModel dalam settings sebagai array:

{
  "fallbackModel": ["claude-sonnet-4-6", "claude-haiku-4-5"]
}

Flag --fallback-model mengambil alih pengaturan fallbackModel. Setiap elemen menerima nama model atau alias, dan "default" berkembang menjadi model default.

Dua kasus menyebabkan elemen dilewati:

  • Unavailable model: model yang tidak dapat dijangkau, seperti model yang pensiun yang disematkan dalam pengaturan, dilewati dan Claude Code melanjutkan ke elemen berikutnya.
  • Outside the allowlist: elemen yang tidak diizinkan oleh availableModels dijatuhkan saat chain dibaca dan tidak pernah dicoba.

Automatic model fallback

Bagian ini mencakup fallback berbasis konten dari Fable 5. Untuk fallback berbasis ketersediaan ketika model kelebihan beban atau tidak tersedia, lihat Fallback model chains.

Fable 5 berjalan dengan pengklasifikasi keamanan untuk konten keamanan siber dan biologi. Ketika pengklasifikasi menandai permintaan, Claude Code menjalankan kembali permintaan itu pada model Opus default dan menampilkan pemberitahuan dalam transkrip: Opus 4.8 pada Anthropic API dan penyebaran LLM gateway, atau Opus 4.7 pada Claude Platform di AWS.

Sesi kemudian berlanjut pada model Opus itu. Untuk kembali ke Fable 5, jalankan /model fable.

Target fallback diperiksa terhadap availableModels. Ketika diblokir, tidak ada fallback yang terjadi. Penolakan muncul sebagai kesalahan normal dan model sesi tidak berubah.

Check what triggered fallback

Fallback dapat memicu pada permintaan pertama sesi, sebelum Anda mengirim apa pun yang tidak biasa, karena permintaan pertama membawa konteks workspace seperti konten CLAUDE.md dan status git Anda. Repositori yang berisi materi keamanan atau biologi dapat memicu pengklasifikasi pada konteks itu saja.

Untuk memeriksa apakah kustomisasi adalah pemicu, mulai sesi dengan claude --safe-mode, yang menonaktifkan kustomisasi seperti CLAUDE.md, skills, MCP servers, dan hooks. Status git dan nama direktori bukan kustomisasi dan masih disertakan.

Ask before switching

Untuk memutuskan apa yang terjadi setiap kali permintaan ditandai, daripada beralih secara otomatis, jalankan /config dan matikan "switch models when a message is flagged". Permintaan yang ditandai kemudian menjeda sesi dengan dua opsi: beralih ke model Opus, atau edit prompt dan coba ulang pada Fable 5.

Beberapa kasus berperilaku berbeda:

  • Jika kedua model menandai permintaan yang sama, Anda dapat mengedit prompt dan mencoba ulang, atau memulai sesi baru.
  • Pada sesi mobile Claude Code di web, pengeditan dan pengulangan tidak didukung. Beralih model, atau lanjutkan sesi dari browser desktop atau aplikasi desktop.
  • Dalam non-interactive mode dan integrasi SDK yang tidak dapat menampilkan prompt, permintaan yang ditandai mengakhiri giliran dengan penolakan sebagai gantinya.
  • Ketika target fallback diblokir oleh availableModels, prompt tidak ditampilkan. Permintaan yang ditandai berakhir dengan penolakan, sama seperti fallback otomatis ketika target diblokir.

Enable fallback on Bedrock, Vertex AI, and Foundry

Pada Amazon Bedrock, Google Vertex AI, dan Microsoft Foundry, ID model spesifik penyedia, jadi fallback otomatis hanya beroperasi ketika Claude Code dapat mengidentifikasi kedua model yang terlibat:

  • Claude Code harus mengenali model saat ini sebagai Fable 5: ID model berisi claude-fable-5, cocok dengan nilai ANTHROPIC_DEFAULT_FABLE_MODEL, atau dipetakan dengan modelOverrides.
  • Target fallback harus diselesaikan ke model Opus: nilai ANTHROPIC_DEFAULT_OPUS_MODEL jika diatur, jika tidak, entri Opus 4.8 dalam daftar model penyedia.

Jika salah satu model tidak dapat diidentifikasi, Claude Code tidak beralih secara otomatis. Permintaan yang ditandai berakhir dengan pesan penolakan, dan Anda dapat beralih model dengan /model dan coba ulang. Untuk mengaktifkan fallback otomatis pada penyedia ini, atur ANTHROPIC_DEFAULT_FABLE_MODEL ke ID model Fable 5 Anda dan ANTHROPIC_DEFAULT_OPUS_MODEL ke ID model Opus 4.8 Anda.

Security research and biology workloads

Beban kerja dalam keamanan ofensif atau biologi, termasuk penetration testing, latihan Capture the Flag (CTF), dan basis kode yang berdekatan dengan biologi, memicu fallback sering, sering pada permintaan pertama. Untuk pekerjaan biologi substansial, harapkan hampir semua permintaan untuk dialihkan.

Ini adalah routing yang diharapkan untuk domain ini, bukan bendera akun. Jika organisasi Anda membutuhkan kemampuan kelas Fable untuk pekerjaan ini, tanyakan kepada tim akun Anthropic Anda tentang program akses terpercaya.

Adjust effort level

Effort levels mengontrol penalaran adaptif, yang memungkinkan model memutuskan apakah dan berapa banyak untuk berpikir pada setiap langkah berdasarkan kompleksitas tugas. Usaha lebih rendah lebih cepat dan lebih murah untuk tugas-tugas langsung, sementara usaha lebih tinggi memberikan penalaran lebih dalam untuk masalah kompleks.

Tingkat usaha yang tersedia tergantung pada model. Model yang tidak tercantum di sini tidak mendukung usaha:

Model Levels
Fable 5 low, medium, high, xhigh, max
Opus 4.8 dan Opus 4.7 low, medium, high, xhigh, max
Opus 4.6 dan Sonnet 4.6 low, medium, high, max

Jika Anda menetapkan tingkat yang tidak didukung model aktif, Claude Code kembali ke tingkat tertinggi yang didukung pada atau di bawah tingkat yang Anda tetapkan. Misalnya, xhigh berjalan sebagai high pada Opus 4.6.

Usaha default adalah high pada Fable 5, Opus 4.8, Opus 4.6, dan Sonnet 4.6, dan xhigh pada Opus 4.7.

Ketika Anda pertama kali menjalankan Fable 5, Opus 4.8, atau Opus 4.7, Claude Code menerapkan usaha default model itu bahkan jika Anda sebelumnya menetapkan tingkat yang berbeda untuk model lain: high pada Fable 5 dan Opus 4.8, dan xhigh pada Opus 4.7. Jalankan /effort lagi untuk memilih tingkat yang berbeda setelah beralih.

low, medium, high, dan xhigh bertahan di seluruh sesi. max memberikan penalaran paling dalam tanpa batasan pengeluaran token dan berlaku untuk sesi saat ini saja, kecuali ketika diatur melalui variabel lingkungan CLAUDE_CODE_EFFORT_LEVEL.

Menu /effort juga menawarkan ultracode. Ultracode adalah pengaturan Claude Code daripada tingkat usaha model: ia mengirim xhigh ke model dan selain itu memiliki Claude mengorkestra alur kerja dinamis untuk tugas-tugas substansial. Ini berlaku untuk sesi saat ini saja. Atur melalui /effort, atau teruskan "ultracode": true melalui --settings atau permintaan kontrol Agent SDK. Ini bukan bagian dari pengaturan effortLevel, flag --effort, atau CLAUDE_CODE_EFFORT_LEVEL.

Choose an effort level

Setiap tingkat menukar pengeluaran token terhadap kemampuan. Default cocok untuk sebagian besar tugas coding; sesuaikan ketika Anda menginginkan keseimbangan yang berbeda.

Level When to use it
low Cadangkan untuk tugas pendek, terbatas, sensitif latensi yang tidak sensitif intelijen
medium Mengurangi penggunaan token untuk pekerjaan sensitif biaya yang dapat menukar beberapa intelijen
high Menyeimbangkan penggunaan token dan intelijen. Default pada Fable 5, Opus 4.8, Opus 4.6, dan Sonnet 4.6
xhigh Penalaran lebih dalam dengan pengeluaran token lebih tinggi. Default pada Opus 4.7
max Dapat meningkatkan kinerja pada tugas yang menuntut tetapi mungkin menunjukkan hasil yang berkurang dan rentan terhadap overthinking. Uji sebelum mengadopsi secara luas
ultracode Pengaturan Claude Code yang merencanakan alur kerja dinamis untuk setiap tugas substansial dengan penalaran xhigh per-pesan. Hanya sesi

Skala usaha dikalibrasi per model, jadi nama tingkat yang sama tidak mewakili nilai yang sama di seluruh model.

Use ultrathink for one-off deep reasoning

Sertakan ultrathink di mana saja dalam prompt Anda untuk meminta penalaran lebih dalam pada giliran itu tanpa mengubah pengaturan usaha sesi Anda. Claude Code mengenali kata kunci dan menambahkan instruksi dalam konteks. Tingkat usaha yang dikirim ke API tidak berubah. Frasa lain seperti "think", "think hard", dan "think more" dilewatkan sebagai teks prompt biasa dan tidak dikenali sebagai kata kunci.

Set the effort level

Anda dapat mengubah usaha melalui salah satu dari berikut ini:

  • /effort: jalankan /effort tanpa argumen untuk membuka slider interaktif, /effort diikuti dengan nama tingkat untuk menetapkannya secara langsung, atau /effort auto untuk mengatur ulang ke default model
  • Dalam /model: gunakan tombol panah kiri/kanan untuk menyesuaikan slider usaha saat memilih model
  • Flag --effort: teruskan nama tingkat untuk menetapkannya untuk sesi tunggal saat meluncurkan Claude Code
  • Variabel lingkungan: atur CLAUDE_CODE_EFFORT_LEVEL ke nama tingkat atau auto
  • Pengaturan: atur effortLevel ke low, medium, high, atau xhigh dalam file pengaturan Anda. max dan ultracode adalah hanya sesi dan tidak diterima di sini
  • Skill dan subagent frontmatter: atur effort dalam file markdown skill atau subagent untuk mengganti tingkat usaha ketika skill atau subagent itu berjalan

Variabel lingkungan mengambil alih semua metode lain, kemudian tingkat yang Anda konfigurasi, kemudian default model. Usaha frontmatter berlaku ketika skill atau subagent itu aktif, mengganti tingkat sesi tetapi bukan variabel lingkungan.

Slider usaha muncul dalam /model ketika model yang didukung dipilih. Tingkat usaha saat ini juga ditampilkan di sebelah logo dan spinner, misalnya "with low effort", sehingga Anda dapat mengkonfirmasi pengaturan mana yang aktif tanpa membuka /model.

Adaptive reasoning and fixed thinking budgets

Penalaran adaptif membuat pemikiran opsional pada setiap langkah, jadi Claude dapat merespons lebih cepat ke prompt rutin dan menyisihkan pemikiran lebih dalam untuk langkah yang mendapat manfaat darinya. Jika Anda ingin Claude berpikir lebih atau kurang sering daripada tingkat saat ini menghasilkan, Anda dapat mengatakan demikian secara langsung dalam prompt Anda atau dalam CLAUDE.md; model merespons panduan itu dalam pengaturan usahanya.

Opus 4.7 dan yang lebih baru selalu menggunakan penalaran adaptif, seperti halnya Fable 5. Mode anggaran pemikiran tetap dan CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING tidak berlaku untuk mereka.

Di Opus 4.6 dan Sonnet 4.6, Anda dapat mengatur CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 untuk kembali ke anggaran pemikiran tetap sebelumnya yang dikendalikan oleh MAX_THINKING_TOKENS. Lihat variabel lingkungan.

Extended thinking

Pemikiran diperluas adalah penalaran yang Claude keluarkan sebelum merespons. Pada model yang mendukung penalaran adaptif, tingkat usaha adalah kontrol utama untuk berapa banyak pemikiran yang terjadi; pengaturan di bawah ini menghidupkan atau mematikan pemikiran dan mengontrol cara tampilannya.

Control How to set it
Toggle untuk sesi saat ini Tekan Option+T di macOS atau Alt+T di Windows dan Linux
Atur default global Jalankan /config dan toggle thinking mode. Disimpan sebagai alwaysThinkingEnabled dalam ~/.claude/settings.json
Nonaktifkan terlepas dari usaha Atur MAX_THINKING_TOKENS=0, yang mematikan pemikiran pada Anthropic API kecuali pada Fable 5. Pada penyedia pihak ketiga ini menghilangkan parameter thinking sebagai gantinya, dan model penalaran adaptif mungkin masih berpikir. Nilai lain berlaku hanya dengan anggaran pemikiran tetap

Pemikiran tidak dapat dimatikan pada Fable 5. Toggle sesi, alwaysThinkingEnabled, dan MAX_THINKING_TOKENS=0 tidak memiliki efek di sana, dan Fable 5 memutuskan per langkah berapa banyak untuk berpikir berdasarkan tingkat usaha.

Output pemikiran dilipat secara default. Tekan Ctrl+O untuk toggle verbose mode dan lihat penalaran sebagai teks miring abu-abu. Sesi interaktif pada Anthropic API menerima blok pemikiran yang diredaksi secara default, jadi atur showThinkingSummaries: true dalam pengaturan jika Anda menginginkan ringkasan lengkap yang tersedia saat Anda memperluas. Anda dikenakan biaya untuk semua token pemikiran yang dihasilkan, bahkan ketika dilipat atau diredaksi.

Extended context

Fable 5, Opus 4.6 dan yang lebih baru, dan Sonnet 4.6 mendukung jendela konteks 1 juta token untuk sesi panjang dengan basis kode besar.

Ketersediaan bervariasi menurut model dan paket. Di paket Max, Team, dan Enterprise, Opus secara otomatis ditingkatkan ke konteks 1M tanpa konfigurasi tambahan. Ini berlaku untuk kedua kursi Team Standard dan Team Premium. Pada Anthropic API, Fable 5, Opus 4.8, dan Opus 4.7 selalu berjalan dengan jendela 1M. Sonnet dengan konteks 1M bukan bagian dari peningkatan otomatis dan memerlukan penggunaan tambahan di setiap paket langganan, termasuk Max.

Plan Opus dengan konteks 1M Sonnet dengan konteks 1M
Max, Team, dan Enterprise Disertakan dengan langganan Memerlukan penggunaan tambahan
Pro Memerlukan penggunaan tambahan Memerlukan penggunaan tambahan
API dan pay-as-you-go Akses penuh Akses penuh

Untuk menonaktifkan konteks 1M sepenuhnya, atur CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Ini menghapus varian model 1M dari pemilih model. Lihat variabel lingkungan.

Jendela konteks 1M menggunakan harga model standar tanpa premium untuk token di luar 200K. Untuk paket di mana konteks diperluas disertakan dengan langganan Anda, penggunaan tetap tercakup oleh langganan Anda. Untuk paket yang mengakses konteks diperluas melalui penggunaan tambahan, token ditagihkan ke penggunaan tambahan.

Jika akun Anda mendukung konteks 1M, opsi muncul di pemilih model (/model) dalam versi terbaru Claude Code. Jika Anda tidak melihatnya, coba mulai ulang sesi Anda.

Anda juga dapat menggunakan akhiran [1m] dengan alias model atau nama model lengkap:

# Gunakan alias opus[1m] atau sonnet[1m]
/model opus[1m]
/model sonnet[1m]

# Atau tambahkan [1m] ke nama model lengkap
/model claude-opus-4-8[1m]

Memeriksa model Anda saat ini

Anda dapat melihat model mana yang sedang Anda gunakan dengan beberapa cara:

  1. Dalam status line (jika dikonfigurasi)
  2. Dalam /status, yang juga menampilkan informasi akun Anda.

Tambahkan opsi model kustom

Gunakan ANTHROPIC_CUSTOM_MODEL_OPTION untuk menambahkan satu entri kustom ke pemilih /model tanpa mengganti alias bawaan. Ini berguna untuk pengujian ID model yang tidak tercantum Claude Code secara default. Untuk deployment gateway LLM, Claude Code dapat mengisi pemilih dari endpoint /v1/models gateway ketika CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 diatur, jadi variabel ini diperlukan hanya ketika penemuan dinonaktifkan atau tidak mengembalikan model yang Anda inginkan. Lihat pemilihan model gateway LLM.

Contoh ini menetapkan ketiga variabel untuk membuat deployment Opus yang dirutekan gateway dapat dipilih:

export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"

Entri kustom muncul di bagian bawah pemilih /model. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME dan ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION bersifat opsional. Jika dihilangkan, ID model digunakan sebagai nama dan deskripsi default ke Custom model (<model-id>).

Claude Code melewati validasi untuk ID model yang ditetapkan dalam ANTHROPIC_CUSTOM_MODEL_OPTION, sehingga Anda dapat menggunakan string apa pun yang diterima endpoint API Anda. Ketika availableModels diatur, sertakan ID model kustom dalam daftar izin juga: entri kustom disaring dari pemilih dan pemilihan --model darinya ditolak seperti model yang dikecualikan lainnya. ID kustom yang menyematkan nama keluarga, seperti my-gateway/claude-opus-4-7, dihitung sebagai entri spesifik untuk keluarga itu dan menonaktifkan wildcard-nya, jadi juga daftarkan versi yang ingin Anda pertahankan dapat dipilih. Lihat perilaku penggabungan.

Variabel lingkungan

Anda dapat menggunakan variabel lingkungan berikut, yang harus berupa nama model lengkap (atau setara untuk penyedia API Anda), untuk mengontrol nama model yang dipetakan alias.

Variabel lingkungan Deskripsi
ANTHROPIC_DEFAULT_FABLE_MODEL Model yang digunakan untuk fable, dan ID model yang dikenali Claude Code sebagai Fable 5 untuk fallback model otomatis pada penyedia pihak ketiga
ANTHROPIC_DEFAULT_OPUS_MODEL Model yang digunakan untuk opus, atau untuk opusplan ketika Plan Mode aktif.
ANTHROPIC_DEFAULT_SONNET_MODEL Model yang digunakan untuk sonnet, atau untuk opusplan ketika Plan Mode tidak aktif.
ANTHROPIC_DEFAULT_HAIKU_MODEL Model yang digunakan untuk haiku, atau fungsionalitas latar belakang
CLAUDE_CODE_SUBAGENT_MODEL Model yang digunakan untuk semua subagents dan agent teams. Mengganti baik parameter model per-invocation maupun frontmatter model definisi subagent. Atur ke inherit untuk menggunakan resolusi model normal sebagai gantinya

Catatan: ANTHROPIC_SMALL_FAST_MODEL sudah usang dan digantikan oleh ANTHROPIC_DEFAULT_HAIKU_MODEL.

Tetapkan model untuk deployment pihak ketiga

Saat menerapkan Claude Code melalui Bedrock, Vertex AI, Foundry, atau Claude Platform on AWS, tetapkan versi model sebelum meluncurkan ke pengguna.

Tanpa penentapan, Claude Code menggunakan alias model seperti fable, opus, sonnet, dan haiku yang diselesaikan ke ID model default bawaan untuk setiap penyedia. Default tersebut dapat tertinggal dari rilis Anthropic terbaru, dan model yang ditunjuknya mungkin belum diaktifkan di akun pengguna. Ketika default tidak tersedia, pengguna Bedrock dan Vertex AI melihat pemberitahuan dan kembali ke versi sebelumnya untuk sesi itu, sementara pengguna Foundry melihat kesalahan karena Foundry tidak memiliki pemeriksaan startup yang setara.

Gunakan variabel lingkungan berikut dengan ID model spesifik versi untuk penyedia Anda:

Penyedia Contoh
Bedrock export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-8'
Vertex AI export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8'
Foundry export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8'

Terapkan pola yang sama untuk ANTHROPIC_DEFAULT_FABLE_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL, dan ANTHROPIC_DEFAULT_HAIKU_MODEL. Untuk ID model saat ini dan warisan di semua penyedia, lihat Ikhtisar Model. Untuk meningkatkan pengguna ke versi model baru, perbarui variabel lingkungan ini dan terapkan kembali.

Untuk mengaktifkan konteks diperluas untuk model yang ditetapkan, tambahkan [1m] ke ID model dalam ANTHROPIC_DEFAULT_OPUS_MODEL atau ANTHROPIC_DEFAULT_SONNET_MODEL:

export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8[1m]'

Akhiran [1m] menerapkan jendela konteks 1M ke semua penggunaan alias opus dan sonnet, termasuk fase Opus mode-rencana dari opusplan.

  • Claude Code menghapus akhiran sebelum mengirim ID model ke penyedia Anda.
  • Hanya tambahkan [1m] ketika model yang mendasar mendukung konteks 1M.
  • Akhiran dibaca per variabel, bukan per model. Di Bedrock, Vertex, dan Foundry, ID model tanpa [1m] dalam satu variabel menggunakan konteks 200K bahkan jika variabel lain menetapkan model yang sama dengan akhiran.

Sesuaikan tampilan dan kemampuan model yang ditetapkan

Ketika Anda menetapkan model pada penyedia pihak ketiga, ID spesifik penyedia muncul apa adanya di pemilih /model dan Claude Code mungkin tidak mengenali fitur mana yang didukung model. Anda dapat mengganti nama tampilan dan mendeklarasikan kemampuan dengan variabel lingkungan pendamping untuk setiap model yang ditetapkan.

Variabel ini berlaku pada penyedia pihak ketiga seperti Bedrock, Vertex AI, dan Foundry. Variabel _NAME dan _DESCRIPTION juga berlaku ketika ANTHROPIC_BASE_URL menunjuk ke gateway LLM. Mereka tidak berpengaruh saat menghubungkan langsung ke api.anthropic.com.

Variabel lingkungan Deskripsi
ANTHROPIC_DEFAULT_OPUS_MODEL_NAME Nama tampilan untuk model Opus yang ditetapkan di pemilih /model. Default ke ID model saat tidak diatur
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION Deskripsi tampilan untuk model Opus yang ditetapkan di pemilih /model. Default ke Custom Opus model saat tidak diatur
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES Daftar kemampuan yang dipisahkan koma yang didukung model Opus yang ditetapkan

Akhiran _NAME, _DESCRIPTION, dan _SUPPORTED_CAPABILITIES yang sama tersedia untuk ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL, ANTHROPIC_DEFAULT_FABLE_MODEL, dan ANTHROPIC_CUSTOM_MODEL_OPTION.

Claude Code mengaktifkan fitur seperti tingkat usaha dan extended thinking dengan mencocokkan ID model terhadap pola yang dikenal. ID spesifik penyedia seperti ARN Bedrock atau nama deployment kustom sering kali tidak cocok dengan pola ini, meninggalkan fitur yang didukung dinonaktifkan. Atur _SUPPORTED_CAPABILITIES untuk memberi tahu Claude Code fitur mana yang benar-benar didukung model:

Nilai kemampuan Mengaktifkan
effort Tingkat usaha dan perintah /effort
xhigh_effort {/* min-version: 2.1.111 */}Tingkat usaha xhigh
max_effort Tingkat usaha max
thinking Extended thinking
adaptive_thinking Penalaran adaptif yang secara dinamis mengalokasikan pemikiran berdasarkan kompleksitas tugas
interleaved_thinking Pemikiran antara panggilan alat

Ketika _SUPPORTED_CAPABILITIES diatur, kemampuan yang tercantum diaktifkan dan kemampuan yang tidak tercantum dinonaktifkan untuk model yang ditetapkan yang cocok. Ketika variabel tidak diatur, Claude Code kembali ke deteksi bawaan berdasarkan ID model.

Contoh ini menetapkan Opus ke ARN model kustom Bedrock, menetapkan nama yang ramah, dan mendeklarasikan kemampuannya:

export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'

Ganti ID model per versi

Variabel lingkungan tingkat keluarga di atas mengonfigurasi satu ID model per alias keluarga. Jika Anda perlu memetakan beberapa versi dalam keluarga yang sama ke ID penyedia yang berbeda, gunakan pengaturan modelOverrides sebagai gantinya.

modelOverrides memetakan ID model Anthropic individual ke string spesifik penyedia yang dikirim Claude Code ke API penyedia Anda. Ketika pengguna memilih model yang dipetakan di pemilih /model, Claude Code menggunakan nilai yang Anda konfigurasi alih-alih default bawaan.

Ini memungkinkan administrator enterprise untuk merutekan setiap versi model ke ARN profil inferensi Bedrock tertentu, nama versi Vertex AI, atau nama deployment Foundry untuk tata kelola, alokasi biaya, atau perutean regional.

Atur modelOverrides dalam file pengaturan Anda:

{
  "modelOverrides": {
    "claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
    "claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
    "claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
  }
}

Kunci harus berupa ID model Anthropic seperti yang tercantum dalam Ikhtisar Model. Untuk ID model bertanggal, sertakan akhiran tanggal persis seperti yang muncul di sana. Kunci yang tidak dikenal diabaikan.

Penggantian menggantikan ID model bawaan yang mendukung setiap entri di pemilih /model. Di Bedrock, penggantian mengambil alih profil inferensi apa pun yang ditemukan Claude Code secara otomatis saat startup. Nilai yang Anda berikan langsung melalui ANTHROPIC_MODEL, --model, atau variabel lingkungan ANTHROPIC_DEFAULT_*_MODEL diteruskan ke penyedia apa adanya dan tidak diubah oleh modelOverrides.

modelOverrides bekerja bersama availableModels. Allowlist dievaluasi terhadap ID model Anthropic, bukan nilai penggantian, jadi entri seperti "opus" dalam availableModels terus cocok bahkan ketika versi Opus dipetakan ke ARN. Ketika enforceAvailableModels diatur dalam pengaturan terkelola, Default yang diterapkan diselesaikan melalui modelOverrides dari sumber terkelola dengan prioritas tertinggi saja. Pemetaan admin, seperti versi yang ditetapkan ke ARN profil inferensi, dihormati dalam Default yang diterapkan. Penggantian dari pengaturan pengguna atau proyek tidak mempengaruhinya.

Konfigurasi prompt caching

Claude Code secara otomatis menggunakan prompt caching untuk mengoptimalkan kinerja dan mengurangi biaya. Anda dapat menonaktifkan prompt caching secara global atau untuk tingkat model tertentu:

Variabel lingkungan Deskripsi
DISABLE_PROMPT_CACHING Atur ke 1 untuk menonaktifkan prompt caching untuk semua model. Mengambil alih pengaturan per-model
DISABLE_PROMPT_CACHING_HAIKU Atur ke 1 untuk menonaktifkan prompt caching hanya untuk model Haiku
DISABLE_PROMPT_CACHING_SONNET Atur ke 1 untuk menonaktifkan prompt caching hanya untuk model Sonnet
DISABLE_PROMPT_CACHING_OPUS Atur ke 1 untuk menonaktifkan prompt caching hanya untuk model Opus
DISABLE_PROMPT_CACHING_FABLE Atur ke 1 untuk menonaktifkan prompt caching hanya untuk model Fable

Untuk mengubah cache TTL atau mempelajari apa yang memicu cache miss, lihat Bagaimana Claude Code menggunakan prompt caching.