Beschleunigen Sie Antworten mit dem Schnellmodus
Erhalten Sie schnellere Opus-Antworten in Claude Code durch Aktivierung des Schnellmodus.
Der Schnellmodus befindet sich in Forschungsvorschau. Die Funktion, Preisgestaltung und Verfügbarkeit können sich basierend auf Feedback ändern.
Der Schnellmodus ist eine Hochgeschwindigkeitskonfiguration für Claude Opus, die das Modell bis zu 2,5x schneller macht, allerdings zu höheren Kosten pro Token. Aktivieren Sie ihn mit /fast, wenn Sie Geschwindigkeit für interaktive Arbeiten wie schnelle Iteration oder Live-Debugging benötigen, und deaktivieren Sie ihn, wenn Kosten wichtiger sind als Latenz.
Der Schnellmodus ist kein anderes Modell. Er verwendet Claude Opus mit einer anderen API-Konfiguration, die Geschwindigkeit über Kosteneffizienz priorisiert. Sie erhalten identische Qualität und Funktionen mit schnelleren Antworten. Der Schnellmodus wird auf Opus 4.8, Opus 4.7 und Opus 4.6 unterstützt. Er ist nicht auf Sonnet, Haiku oder anderen Modellen verfügbar.
Der Schnellmodus für Opus 4.6 ist veraltet und wird ungefähr 30 Tage nach dem Start von Opus 4.8 entfernt. Nach der Entfernung fällt der Schnellmodus auf Opus 4.6 auf Standardgeschwindigkeit mit Standardpreisen zurück. Migrieren Sie zu Opus 4.8 oder Opus 4.7, um die Beschleunigung beizubehalten.
Der Schnellmodus erfordert Claude Code v2.1.36 oder später. Überprüfen Sie Ihre Version mit claude --version.
Was Sie wissen sollten:
- Verwenden Sie
/fast, um den Schnellmodus in der Claude Code CLI ein- oder auszuschalten. Der Schnellmodus wird in der VS Code-Erweiterung nicht unterstützt. - Die Preisgestaltung für den Schnellmodus beträgt $10/$50 pro MTok Ein-/Ausgabe auf Opus 4.8 und $30/$150 pro MTok auf Opus 4.7 und Opus 4.6.
- Verfügbar für alle Claude Code-Benutzer mit Abonnementplänen (Pro/Max/Team/Enterprise) und Claude Console.
- Für Claude Code-Benutzer mit Abonnementplänen (Pro/Max/Team/Enterprise) ist der Schnellmodus nur über Nutzungsguthaben verfügbar und nicht in den Abonnement-Ratenlimits enthalten.
Diese Seite behandelt, wie Sie den Schnellmodus aktivieren, die Kostenabwägung, wann Sie ihn verwenden, Anforderungen, Opt-in pro Sitzung und Ratenlimit-Verhalten.
Schnellmodus aktivieren
Aktivieren Sie den Schnellmodus auf eine dieser Weisen:
- Geben Sie
/fastein und drücken Sie Tab, um ihn ein- oder auszuschalten - Setzen Sie
"fastMode": truein Ihrer Benutzereinstellungsdatei
Standardmäßig bleibt der Schnellmodus über Sitzungen hinweg erhalten. Administratoren können den Schnellmodus so konfigurieren, dass er sich bei jeder Sitzung zurückgesetzt wird. Weitere Informationen finden Sie unter Opt-in pro Sitzung erforderlich.
Für die beste Kosteneffizienz aktivieren Sie den Schnellmodus am Anfang einer Sitzung, anstatt ihn mitten in einem Gespräch zu wechseln. Weitere Informationen finden Sie unter Kostenabwägung verstehen.
Wenn Sie den Schnellmodus aktivieren:
- Wenn Sie sich auf einem anderen Modell befinden, wechselt Claude Code automatisch zu Opus
- Sie sehen eine Bestätigungsmeldung: „Fast mode ON"
- Ein kleines
↯-Symbol wird neben der Eingabeaufforderung angezeigt, während der Schnellmodus aktiv ist - Führen Sie
/fastjederzeit erneut aus, um zu überprüfen, ob der Schnellmodus aktiviert oder deaktiviert ist
Wenn Sie den Schnellmodus mit /fast erneut deaktivieren, bleiben Sie auf Opus. Das Modell wird nicht auf Ihr vorheriges Modell zurückgesetzt. Um zu einem anderen Modell zu wechseln, verwenden Sie /model.
Opus 4.8 ist der Standard für den Schnellmodus in Claude Code v2.1.154 und später. In v2.1.142 bis v2.1.153 wird der Schnellmodus standardmäßig auf Opus 4.7 gesetzt.
Kostenabwägung verstehen
Der Schnellmodus hat höhere Pro-Token-Preise als Standard-Opus, wobei der Multiplikator je nach Modell variiert:
| Modell | Eingabe (MTok) | Ausgabe (MTok) |
|---|---|---|
| Opus 4.8 | $10 | $50 |
| Opus 4.7 und Opus 4.6 | $30 | $150 |
Die Preisgestaltung für den Schnellmodus ist über das gesamte 1M-Token-Kontextfenster einheitlich. Für den Standard-Opus-Satz zum Vergleich siehe die Claude-Preisreferenz.
Wenn Sie den Schnellmodus zum ersten Mal in einem Gespräch aktivieren, zahlen Sie den vollständigen Schnellmodus-Preis für nicht zwischengespeicherte Eingabe-Token für den gesamten Gesprächskontext. Je tiefer Sie sich in einem Gespräch befinden, desto mehr kostet dies, daher ist die Aktivierung des Schnellmodus von Anfang an günstiger. Die Kosten fallen einmal pro Gespräch an, daher führt das spätere Ausschalten und erneute Einschalten des Schnellmodus nicht zu einer Wiederholung. Für den Mechanismus siehe wie der Schnellmodus mit dem Prompt-Cache interagiert.
Entscheiden Sie, wann Sie den Schnellmodus verwenden
Der Schnellmodus ist am besten für interaktive Arbeiten geeignet, bei denen die Antwortlatenz wichtiger ist als die Kosten:
- Schnelle Iteration bei Code-Änderungen
- Live-Debugging-Sitzungen
- Zeitkritische Arbeiten mit engen Fristen
Der Standardmodus ist besser für:
- Lange autonome Aufgaben, bei denen Geschwindigkeit weniger wichtig ist
- Batch-Verarbeitung oder CI/CD-Pipelines
- Kostenempfindliche Arbeitslasten
Schnellmodus vs. Anstrengungsstufe
Der Schnellmodus und die Anstrengungsstufe beeinflussen beide die Antwortgeschwindigkeit, aber auf unterschiedliche Weise:
| Einstellung | Auswirkung |
|---|---|
| Schnellmodus | Gleiche Modellqualität, niedrigere Latenz, höhere Kosten |
| Niedrigere Anstrengungsstufe | Weniger Denkzeit, schnellere Antworten, möglicherweise niedrigere Qualität bei komplexen Aufgaben |
Sie können beide kombinieren: Verwenden Sie den Schnellmodus mit einer niedrigeren Anstrengungsstufe für maximale Geschwindigkeit bei einfachen Aufgaben.
Anforderungen
Der Schnellmodus erfordert alle folgenden Voraussetzungen:
- Nur Anthropic API oder Abonnement: Der Schnellmodus ist über die Anthropic Console API und für Claude-Abonnementpläne mit Nutzungsguthaben verfügbar. Er ist nicht auf Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry oder Claude Platform auf AWS verfügbar.
- Nutzungsguthaben aktiviert: Ihr Konto muss Nutzungsguthaben aktiviert haben, was eine Abrechnung über die in Ihrem Plan enthaltene Nutzung hinaus ermöglicht. Aktivieren Sie dies für einzelne Konten in Ihren Console-Abrechnungseinstellungen. Für Teams und Enterprise muss ein Administrator die Nutzungsguthaben für die Organisation aktivieren.
Die Nutzung des Schnellmodus wird direkt von Nutzungsguthaben abgerechnet, auch wenn Sie noch Nutzung in Ihrem Plan haben. Dies bedeutet, dass Schnellmodus-Token nicht gegen die in Ihrem Plan enthaltene Nutzung angerechnet werden und vom ersten Token an zum Schnellmodus-Tarif berechnet werden.
- Admin-Aktivierung für Teams und Enterprise: Der Schnellmodus ist standardmäßig für Teams- und Enterprise-Organisationen deaktiviert. Ein Administrator muss den Schnellmodus explizit aktivieren, bevor Benutzer darauf zugreifen können.
Wenn Ihr Administrator den Schnellmodus für Ihre Organisation nicht aktiviert hat, zeigt der Befehl /fast „Fast mode has been disabled by your organization." an. Wenn die availableModels-Zulassungsliste Ihrer Organisation das Schnellmodus-Opus-Modell ausschließt, wird /fast mit „is not in your organization's allowed models" abgelehnt.
Schnellmodus für Ihre Organisation aktivieren
Administratoren können den Schnellmodus aktivieren in:
- Console (API-Kunden): Claude Code-Einstellungen
- Claude AI (Teams und Enterprise): Admin-Einstellungen > Claude Code
Eine weitere Option zum vollständigen Deaktivieren des Schnellmodus ist das Setzen von CLAUDE_CODE_DISABLE_FAST_MODE=1. Siehe Umgebungsvariablen.
Opt-in pro Sitzung erforderlich
Standardmäßig bleibt der Schnellmodus über Sitzungen hinweg erhalten: Wenn ein Benutzer den Schnellmodus aktiviert, bleibt er in zukünftigen Sitzungen aktiviert. Administratoren in Teams- oder Enterprise-Plänen können dies verhindern, indem sie fastModePerSessionOptIn in verwalteten Einstellungen oder servergesteuerten Einstellungen auf true setzen. Dies führt dazu, dass jede Sitzung mit deaktiviertem Schnellmodus beginnt und Benutzer ihn explizit mit /fast aktivieren müssen.
{
"fastModePerSessionOptIn": true
}
Dies ist nützlich zur Kostenkontrolle in Organisationen, in denen Benutzer mehrere gleichzeitige Sitzungen ausführen. Benutzer können den Schnellmodus immer noch mit /fast aktivieren, wenn sie Geschwindigkeit benötigen, aber er wird zu Beginn jeder neuen Sitzung zurückgesetzt. Die Schnellmodus-Einstellung des Benutzers wird immer noch gespeichert, sodass das Entfernen dieser Einstellung das standardmäßige persistente Verhalten wiederherstellt.
Ratenlimits handhaben
Der Schnellmodus hat separate Ratenlimits vom Standard-Opus. Der Schnellmodus auf Opus 4.8, Opus 4.7 und Opus 4.6 teilen sich den gleichen Ratenlimit-Pool: Die Nutzung auf einem beliebigen dieser Modelle wird von den gleichen Limits abgezogen. Wenn Sie das Ratenlimit des Schnellmodus erreichen oder keine Nutzungsguthaben mehr haben:
- Der Schnellmodus fällt automatisch auf Standard-Geschwindigkeit auf
- Das
↯-Symbol wird grau, um die Abkühlung anzuzeigen - Sie arbeiten weiterhin mit Standard-Geschwindigkeit und -Preisen
- Wenn die Abkühlung abläuft, wird der Schnellmodus automatisch wieder aktiviert
Um den Schnellmodus manuell zu deaktivieren, anstatt auf die Abkühlung zu warten, führen Sie /fast erneut aus.
Forschungsvorschau
Der Schnellmodus ist eine Forschungsvorschau-Funktion. Dies bedeutet:
- Die Funktion kann sich basierend auf Feedback ändern
- Verfügbarkeit und Preisgestaltung können sich ändern
- Die zugrunde liegende API-Konfiguration kann sich weiterentwickeln
Melden Sie Probleme oder Feedback über Ihre üblichen Anthropic-Supportkanäle.
Siehe auch
- Modellkonfiguration: Wechseln Sie Modelle und passen Sie Anstrengungsstufen an
- Kosten effektiv verwalten: Verfolgen Sie die Token-Nutzung und reduzieren Sie Kosten
- Statuszeilen-Konfiguration: Zeigen Sie Modell- und Kontextinformationen an