SpyBara
Go Premium

fast-mode.md 2026-06-16 21:57 UTC to 2026-06-17 17:02 UTC

1 added, 1 removed.

2026
Tue 23 22:00 Mon 22 23:59 Fri 19 22:58 Thu 18 22:00 Wed 17 17:02 Tue 16 21:57 Mon 15 23:02 Sat 13 21:59 Fri 12 22:00 Thu 11 23:01 Wed 10 23:57 Tue 9 06:34 Mon 8 06:52 Sat 6 06:24 Fri 5 06:45 Thu 4 06:52 Wed 3 06:53 Tue 2 06:51

Beschleunigen Sie Antworten mit dem Schnellmodus

Erhalten Sie schnellere Opus-Antworten in Claude Code durch Aktivierung des Schnellmodus.

Der Schnellmodus ist eine Hochgeschwindigkeitskonfiguration für Claude Opus, die das Modell bis zu 2,5x schneller macht, allerdings zu höheren Kosten pro Token. Aktivieren Sie ihn mit /fast, wenn Sie Geschwindigkeit für interaktive Arbeiten wie schnelle Iteration oder Live-Debugging benötigen, und deaktivieren Sie ihn, wenn Kosten wichtiger sind als Latenz.

Der Schnellmodus ist kein anderes Modell. Er verwendet Claude Opus mit einer anderen API-Konfiguration, die Geschwindigkeit über Kosteneffizienz priorisiert. Sie erhalten identische Qualität und Funktionen mit schnelleren Antworten. Der Schnellmodus wird auf Opus 4.8, Opus 4.7 und Opus 4.6 unterstützt. Er ist nicht auf Sonnet, Haiku oder anderen Modellen verfügbar.

Was Sie wissen sollten:

  • Verwenden Sie /fast, um den Schnellmodus in der Claude Code CLI ein- oder auszuschalten. Der Schnellmodus wird in der VS Code-Erweiterung nicht unterstützt.
  • Die Preisgestaltung für den Schnellmodus beträgt $10/$50 pro MTok Ein-/Ausgabe auf Opus 4.8 und $30/$150 pro MTok auf Opus 4.7 und Opus 4.6.
  • Verfügbar für alle Claude Code-Benutzer mit Abonnementplänen (Pro/Max/Team/Enterprise) und Claude Console.
  • Für Claude Code-Benutzer mit Abonnementplänen (Pro/Max/Team/Enterprise) ist der Schnellmodus nur über Nutzungsguthaben verfügbar und nicht in den Abonnement-Ratenlimits enthalten.

Diese Seite behandelt, wie Sie den Schnellmodus aktivieren, die Kostenabwägung, wann Sie ihn verwenden, Anforderungen, Opt-in pro Sitzung und Ratenlimit-Verhalten.

Schnellmodus aktivieren

Aktivieren Sie den Schnellmodus auf eine dieser Weisen:

  • Geben Sie /fast ein und drücken Sie Tab, um ihn ein- oder auszuschalten
  • Setzen Sie "fastMode": true in Ihrer Benutzereinstellungsdatei

Standardmäßig bleibt der Schnellmodus über Sitzungen hinweg erhalten. Administratoren können den Schnellmodus so konfigurieren, dass er sich bei jeder Sitzung zurückgesetzt wird. Weitere Informationen finden Sie unter Opt-in pro Sitzung erforderlich.

Für die beste Kosteneffizienz aktivieren Sie den Schnellmodus am Anfang einer Sitzung, anstatt ihn mitten in einem Gespräch zu wechseln. Weitere Informationen finden Sie unter Kostenabwägung verstehen.

Wenn Sie den Schnellmodus aktivieren:

  • Wenn Sie sich auf einem anderen Modell befinden, wechselt Claude Code automatisch zu Opus
  • Sie sehen eine Bestätigungsmeldung: „Fast mode ON"
  • Ein kleines -Symbol wird neben der Eingabeaufforderung angezeigt, während der Schnellmodus aktiv ist
  • Führen Sie /fast jederzeit erneut aus, um zu überprüfen, ob der Schnellmodus aktiviert oder deaktiviert ist

Wenn Sie den Schnellmodus mit /fast erneut deaktivieren, bleiben Sie auf Opus. Das Modell wird nicht auf Ihr vorheriges Modell zurückgesetzt. Um zu einem anderen Modell zu wechseln, verwenden Sie /model.

Opus 4.8 ist der Standard für den Schnellmodus in Claude Code v2.1.154 und später. In v2.1.142 bis v2.1.153 wird der Schnellmodus standardmäßig auf Opus 4.7 gesetzt.

Kostenabwägung verstehen

Der Schnellmodus hat höhere Pro-Token-Preise als Standard-Opus, wobei der Multiplikator je nach Modell variiert:

Modell Eingabe (MTok) Ausgabe (MTok)
Opus 4.8 $10 $50
Opus 4.7 und Opus 4.6 $30 $150

Die Preisgestaltung für den Schnellmodus ist über das gesamte 1M-Token-Kontextfenster einheitlich. Für den Standard-Opus-Satz zum Vergleich siehe die Claude-Preisreferenz.

Wenn Sie den Schnellmodus zum ersten Mal in einem Gespräch aktivieren, zahlen Sie den vollständigen Schnellmodus-Preis für nicht zwischengespeicherte Eingabe-Token für den gesamten Gesprächskontext. Je tiefer Sie sich in einem Gespräch befinden, desto mehr kostet dies, daher ist die Aktivierung des Schnellmodus von Anfang an günstiger. Die Kosten fallen einmal pro Gespräch an, daher führt das spätere Ausschalten und erneute Einschalten des Schnellmodus nicht zu einer Wiederholung. Für den Mechanismus siehe wie der Schnellmodus mit dem Prompt-Cache interagiert.

Entscheiden Sie, wann Sie den Schnellmodus verwenden

Der Schnellmodus ist am besten für interaktive Arbeiten geeignet, bei denen die Antwortlatenz wichtiger ist als die Kosten:

  • Schnelle Iteration bei Code-Änderungen
  • Live-Debugging-Sitzungen
  • Zeitkritische Arbeiten mit engen Fristen

Der Standardmodus ist besser für:

  • Lange autonome Aufgaben, bei denen Geschwindigkeit weniger wichtig ist
  • Batch-Verarbeitung oder CI/CD-Pipelines
  • Kostenempfindliche Arbeitslasten

Schnellmodus vs. Anstrengungsstufe

Der Schnellmodus und die Anstrengungsstufe beeinflussen beide die Antwortgeschwindigkeit, aber auf unterschiedliche Weise:

Einstellung Auswirkung
Schnellmodus Gleiche Modellqualität, niedrigere Latenz, höhere Kosten
Niedrigere Anstrengungsstufe Weniger Denkzeit, schnellere Antworten, möglicherweise niedrigere Qualität bei komplexen Aufgaben

Sie können beide kombinieren: Verwenden Sie den Schnellmodus mit einer niedrigeren Anstrengungsstufe für maximale Geschwindigkeit bei einfachen Aufgaben.

Anforderungen

Der Schnellmodus erfordert alle folgenden Voraussetzungen:

  • Nur Anthropic API oder Abonnement: Der Schnellmodus ist über die Anthropic Console API und für Claude-Abonnementpläne mit Nutzungsguthaben verfügbar. Er ist nicht auf Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry oder Claude Platform auf AWS verfügbar.
  • Nutzungsguthaben aktiviert: Ihr Konto muss Nutzungsguthaben aktiviert haben, was eine Abrechnung über die in Ihrem Plan enthaltene Nutzung hinaus ermöglicht. Aktivieren Sie dies für einzelne Konten in Ihren Console-Abrechnungseinstellungen. Für Teams und Enterprise muss ein Administrator die Nutzungsguthaben für die Organisation aktivieren.
  • Admin-Aktivierung für Teams und Enterprise: Der Schnellmodus ist standardmäßig für Teams- und Enterprise-Organisationen deaktiviert. Ein Administrator muss den Schnellmodus explizit aktivieren, bevor Benutzer darauf zugreifen können.

Schnellmodus für Ihre Organisation aktivieren

Administratoren können den Schnellmodus aktivieren in:

Eine weitere Option zum vollständigen Deaktivieren des Schnellmodus ist das Setzen von CLAUDE_CODE_DISABLE_FAST_MODE=1. Siehe Umgebungsvariablen.

Opt-in pro Sitzung erforderlich

Standardmäßig bleibt der Schnellmodus über Sitzungen hinweg erhalten: Wenn ein Benutzer den Schnellmodus aktiviert, bleibt er in zukünftigen Sitzungen aktiviert. Administratoren in Teams- oder Enterprise-Plänen können dies verhindern, indem sie fastModePerSessionOptIn in verwalteten Einstellungen oder servergesteuerten Einstellungen auf true setzen. Dies führt dazu, dass jede Sitzung mit deaktiviertem Schnellmodus beginnt und Benutzer ihn explizit mit /fast aktivieren müssen.

{
  "fastModePerSessionOptIn": true
}

Dies ist nützlich zur Kostenkontrolle in Organisationen, in denen Benutzer mehrere gleichzeitige Sitzungen ausführen. Benutzer können den Schnellmodus immer noch mit /fast aktivieren, wenn sie Geschwindigkeit benötigen, aber er wird zu Beginn jeder neuen Sitzung zurückgesetzt. Die Schnellmodus-Einstellung des Benutzers wird immer noch gespeichert, sodass das Entfernen dieser Einstellung das standardmäßige persistente Verhalten wiederherstellt.

Ratenlimits handhaben

Der Schnellmodus hat separate Ratenlimits vom Standard-Opus. Der Schnellmodus auf Opus 4.8, Opus 4.7 und Opus 4.6 teilen sich den gleichen Ratenlimit-Pool: Die Nutzung auf einem beliebigen dieser Modelle wird von den gleichen Limits abgezogen. Wenn Sie das Ratenlimit des Schnellmodus erreichen oder keine Nutzungsguthaben mehr haben:

  1. Der Schnellmodus fällt automatisch auf Standard-Geschwindigkeit auf
  2. Das -Symbol wird grau, um die Abkühlung anzuzeigen
  3. Sie arbeiten weiterhin mit Standard-Geschwindigkeit und -Preisen
  4. Wenn die Abkühlung abläuft, wird der Schnellmodus automatisch wieder aktiviert

Um den Schnellmodus manuell zu deaktivieren, anstatt auf die Abkühlung zu warten, führen Sie /fast erneut aus.

Forschungsvorschau

Der Schnellmodus ist eine Forschungsvorschau-Funktion. Dies bedeutet:

  • Die Funktion kann sich basierend auf Feedback ändern
  • Verfügbarkeit und Preisgestaltung können sich ändern
  • Die zugrunde liegende API-Konfiguration kann sich weiterentwickeln

Melden Sie Probleme oder Feedback über Ihre üblichen Anthropic-Supportkanäle.

Siehe auch