Percepat respons dengan mode cepat
Dapatkan respons Opus yang lebih cepat di Claude Code dengan mengaktifkan mode cepat.
Mode cepat berada dalam pratinjau penelitian. Fitur, harga, dan ketersediaan dapat berubah berdasarkan umpan balik.
Mode cepat adalah konfigurasi kecepatan tinggi untuk Claude Opus, membuat model hingga 2,5x lebih cepat dengan biaya per token yang lebih tinggi. Aktifkan dengan /fast ketika Anda membutuhkan kecepatan untuk pekerjaan interaktif seperti iterasi cepat atau debugging langsung, dan nonaktifkan ketika biaya lebih penting daripada latensi.
Mode cepat bukan model yang berbeda. Mode ini menggunakan Claude Opus dengan konfigurasi API berbeda yang memprioritaskan kecepatan daripada efisiensi biaya. Anda mendapatkan kualitas dan kemampuan yang identik dengan respons yang lebih cepat. Mode cepat didukung pada Opus 4.8, Opus 4.7, dan Opus 4.6. Mode ini tidak tersedia pada Sonnet, Haiku, atau model lainnya.
Mode cepat untuk Opus 4.6 sudah usang dan akan dihapus sekitar 30 hari setelah peluncuran Opus 4.8. Setelah penghapusan, mode cepat pada Opus 4.6 kembali ke kecepatan standar dengan harga standar. Migrasikan ke Opus 4.8 atau Opus 4.7 untuk mempertahankan percepatan.
Mode cepat memerlukan Claude Code v2.1.36 atau lebih baru. Periksa versi Anda dengan claude --version.
Yang perlu diketahui:
- Gunakan
/fastuntuk mengaktifkan mode cepat di Claude Code CLI. Mode cepat tidak didukung di ekstensi VS Code. - Harga mode cepat per MTok input/output adalah $10/$50 pada Opus 4.8 dan $30/$150 pada Opus 4.7 dan Opus 4.6.
- Tersedia untuk semua pengguna Claude Code pada paket berlangganan (Pro/Max/Team/Enterprise) dan Claude Console.
- Untuk pengguna Claude Code pada paket berlangganan (Pro/Max/Team/Enterprise), mode cepat tersedia hanya melalui penggunaan kredit dan tidak termasuk dalam batas laju penggunaan berlangganan.
Halaman ini mencakup cara mengaktifkan mode cepat, pertukaran biayanya, kapan menggunakannya, persyaratan, opt-in per sesi, dan perilaku batas laju.
Aktifkan mode cepat
Aktifkan mode cepat dengan salah satu cara berikut:
- Ketik
/fastdan tekan Tab untuk mengaktifkan atau menonaktifkan - Atur
"fastMode": truedi file pengaturan pengguna Anda
Secara default, mode cepat bertahan di seluruh sesi. Administrator dapat mengonfigurasi mode cepat untuk disetel ulang setiap sesi. Lihat require per-session opt-in untuk detail.
Untuk efisiensi biaya terbaik, aktifkan mode cepat di awal sesi daripada beralih di tengah percakapan. Lihat understand the cost tradeoff untuk detail.
Ketika Anda mengaktifkan mode cepat:
- Jika Anda berada di model yang berbeda, Claude Code secara otomatis beralih ke Opus
- Anda akan melihat pesan konfirmasi: "Fast mode ON"
- Ikon kecil
↯muncul di sebelah prompt saat mode cepat aktif - Jalankan
/fastlagi kapan saja untuk memeriksa apakah mode cepat aktif atau tidak
Ketika Anda menonaktifkan mode cepat dengan /fast lagi, Anda tetap berada di Opus. Model tidak kembali ke model sebelumnya. Untuk beralih ke model yang berbeda, gunakan /model.
Opus 4.8 adalah default mode cepat di Claude Code v2.1.154 dan lebih baru. Pada v2.1.142 hingga v2.1.153, mode cepat default ke Opus 4.7.
Pahami pertukaran biaya
Mode cepat memiliki harga per-token yang lebih tinggi daripada Opus standar, dengan pengganda yang bervariasi menurut model:
| Model | Input (MTok) | Output (MTok) |
|---|---|---|
| Opus 4.8 | $10 | $50 |
| Opus 4.7 dan Opus 4.6 | $30 | $150 |
Harga mode cepat datar di seluruh jendela konteks 1M token penuh. Untuk tarif Opus standar yang akan dibandingkan, lihat referensi harga Claude.
Pertama kali Anda mengaktifkan mode cepat dalam percakapan, Anda membayar harga token input tanpa cache mode cepat penuh untuk seluruh konteks percakapan. Semakin dalam Anda berada dalam percakapan, semakin mahal biayanya, jadi mengaktifkan mode cepat dari awal lebih murah. Biaya diterapkan sekali per percakapan, jadi mematikan dan menyalakan kembali mode cepat nanti tidak mengulanginya. Untuk mekanismenya, lihat bagaimana mode cepat berinteraksi dengan prompt cache.
Tentukan kapan menggunakan mode cepat
Mode cepat terbaik untuk pekerjaan interaktif di mana latensi respons lebih penting daripada biaya:
- Iterasi cepat pada perubahan kode
- Sesi debugging langsung
- Pekerjaan sensitif waktu dengan tenggat waktu ketat
Mode standar lebih baik untuk:
- Tugas otonomi jangka panjang di mana kecepatan kurang penting
- Pemrosesan batch atau pipeline CI/CD
- Beban kerja sensitif biaya
Mode cepat vs tingkat usaha
Mode cepat dan tingkat usaha keduanya mempengaruhi kecepatan respons, tetapi dengan cara yang berbeda:
| Pengaturan | Efek |
|---|---|
| Mode cepat | Kualitas model yang sama, latensi lebih rendah, biaya lebih tinggi |
| Tingkat usaha lebih rendah | Waktu pemikiran lebih sedikit, respons lebih cepat, potensi kualitas lebih rendah pada tugas kompleks |
Anda dapat menggabungkan keduanya: gunakan mode cepat dengan tingkat usaha yang lebih rendah untuk kecepatan maksimal pada tugas yang mudah.
Persyaratan
Mode cepat memerlukan semua hal berikut:
- Hanya API Anthropic atau langganan: mode cepat tersedia melalui API Konsol Anthropic dan untuk paket langganan Claude menggunakan penggunaan kredit. Mode ini tidak tersedia di Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry, atau Claude Platform di AWS.
- Penggunaan kredit diaktifkan: akun Anda harus memiliki penggunaan kredit diaktifkan, yang memungkinkan penagihan di luar penggunaan yang disertakan dalam paket Anda. Untuk akun individual, aktifkan ini di pengaturan penagihan Konsol Anda. Untuk Teams dan Enterprise, admin harus mengaktifkan penggunaan kredit untuk organisasi.
Penggunaan mode cepat ditagih langsung ke penggunaan kredit, bahkan jika Anda memiliki penggunaan yang tersisa di paket Anda. Ini berarti token mode cepat tidak dihitung terhadap penggunaan yang disertakan dalam paket Anda dan dikenakan biaya dengan tarif mode cepat dari token pertama.
- Aktivasi admin untuk Teams dan Enterprise: mode cepat dinonaktifkan secara default untuk organisasi Teams dan Enterprise. Admin harus secara eksplisit mengaktifkan mode cepat sebelum pengguna dapat mengaksesnya.
Jika admin Anda belum mengaktifkan mode cepat untuk organisasi Anda, perintah /fast akan menampilkan "Fast mode has been disabled by your organization." Jika daftar allowlist availableModels organisasi Anda mengecualikan model Opus mode cepat, /fast ditolak dengan "is not in your organization's allowed models".
Aktifkan mode cepat untuk organisasi Anda
Admin dapat mengaktifkan mode cepat di:
- Konsol (pelanggan API): preferensi Claude Code
- Claude AI (Teams dan Enterprise): Admin Settings > Claude Code
Opsi lain untuk menonaktifkan mode cepat sepenuhnya adalah dengan menetapkan CLAUDE_CODE_DISABLE_FAST_MODE=1. Lihat Variabel lingkungan.
Require per-session opt-in
Secara default, mode cepat bertahan di seluruh sesi: jika pengguna mengaktifkan mode cepat, mode ini tetap aktif di sesi mendatang. Administrator pada paket Teams atau Enterprise dapat mencegah ini dengan menetapkan fastModePerSessionOptIn ke true di pengaturan terkelola atau pengaturan yang dikelola server. Ini menyebabkan setiap sesi dimulai dengan mode cepat mati, memerlukan pengguna untuk secara eksplisit mengaktifkannya dengan /fast.
{
"fastModePerSessionOptIn": true
}
Ini berguna untuk mengontrol biaya di organisasi di mana pengguna menjalankan beberapa sesi bersamaan. Pengguna masih dapat mengaktifkan mode cepat dengan /fast ketika mereka membutuhkan kecepatan, tetapi mode ini disetel ulang di awal setiap sesi baru. Preferensi mode cepat pengguna masih disimpan, jadi menghapus pengaturan ini mengembalikan perilaku persisten default.
Tangani batas laju
Mode cepat memiliki batas laju terpisah dari Opus standar. Mode cepat pada Opus 4.8, Opus 4.7, dan Opus 4.6 berbagi pool batas laju yang sama: penggunaan pada salah satu dari mereka menarik dari batas yang sama. Ketika Anda mencapai batas laju mode cepat atau kehabisan kredit penggunaan:
- Mode cepat secara otomatis kembali ke kecepatan standar
- Ikon
↯berubah menjadi abu-abu untuk menunjukkan cooldown - Anda terus bekerja dengan kecepatan dan harga standar
- Ketika cooldown berakhir, mode cepat secara otomatis diaktifkan kembali
Untuk menonaktifkan mode cepat secara manual daripada menunggu cooldown, jalankan /fast lagi.
Pratinjau penelitian
Mode cepat adalah fitur pratinjau penelitian. Ini berarti:
- Fitur dapat berubah berdasarkan umpan balik
- Ketersediaan dan harga dapat berubah
- Konfigurasi API yang mendasar dapat berkembang
Laporkan masalah atau umpan balik melalui saluran dukungan Anthropic biasa Anda.
Lihat juga
- Konfigurasi model: beralih model dan sesuaikan tingkat usaha
- Kelola biaya secara efektif: lacak penggunaan token dan kurangi biaya
- Konfigurasi baris status: tampilkan informasi model dan konteks