SpyBara
Go Premium

model-config.md 2026-06-16 21:57 UTC to 2026-06-17 17:02 UTC

149 added, 29 removed.

2026
Fri 19 22:58 Thu 18 22:00 Wed 17 17:02 Tue 16 21:57 Mon 15 23:02 Sat 13 21:59 Fri 12 22:00 Thu 11 23:01 Wed 10 23:57 Tue 9 06:34 Mon 8 06:52 Sat 6 06:24 Fri 5 06:45 Thu 4 06:52 Wed 3 06:53 Tue 2 06:51

Modellkonfiguration

Erfahren Sie mehr über die Claude Code-Modellkonfiguration, einschließlich Modellaliase wie opusplan

Verfügbare Modelle

Für die model-Einstellung in Claude Code können Sie konfigurieren:

  • Einen Modellalias
  • Einen Modellnamen
    • Anthropic API: Einen vollständigen Modellnamen
    • Bedrock: ein Inference-Profil-ARN
    • Foundry: einen Bereitstellungsnamen
    • Vertex: einen Versionsnamen

Modellaliase

Modellaliase bieten eine bequeme Möglichkeit, Modelleinstellungen auszuwählen, ohne sich genaue Versionsnummern merken zu müssen:

Modellalias Verhalten
default Spezieller Wert, der jede Modellüberschreibung löscht und auf das empfohlene Modell für Ihren Kontotyp zurückgesetzt wird. Ist selbst kein Modellalias
best Verwendet Fable 5, wo Ihre Organisation Zugriff darauf hat, andernfalls das neueste Opus-Modell
fable Verwendet Claude Fable 5 für Ihre schwierigsten und längsten Aufgaben
sonnet Verwendet das neueste Sonnet-Modell für tägliche Codierungsaufgaben
opus Verwendet das neueste Opus-Modell für komplexe Reasoning-Aufgaben
haiku Verwendet das schnelle und effiziente Haiku-Modell für einfache Aufgaben
sonnet[1m] Verwendet Sonnet mit einem 1-Million-Token-Kontextfenster für lange Sitzungen
opus[1m] Verwendet Opus mit einem 1-Million-Token-Kontextfenster für lange Sitzungen
opusplan Spezieller Modus, der opus während des Plan Mode verwendet und dann zu sonnet für die Ausführung wechselt

Bei der Anthropic API wird opus zu Opus 4.8 und sonnet zu Sonnet 4.6 aufgelöst. Bei Claude Platform on AWS wird opus zu Opus 4.7 und sonnet zu Sonnet 4.6 aufgelöst. Bei Bedrock, Vertex und Foundry wird opus zu Opus 4.6 und sonnet zu Sonnet 4.5 aufgelöst; neuere Modelle sind bei diesen Anbietern verfügbar, indem Sie den vollständigen Modellnamen explizit auswählen oder ANTHROPIC_DEFAULT_OPUS_MODEL oder ANTHROPIC_DEFAULT_SONNET_MODEL setzen.

Aliase verweisen auf die empfohlene Version für Ihren Anbieter und werden im Laufe der Zeit aktualisiert. Um eine bestimmte Version zu fixieren, verwenden Sie den vollständigen Modellnamen (z. B. claude-opus-4-8) oder setzen Sie die entsprechende Umgebungsvariable wie ANTHROPIC_DEFAULT_OPUS_MODEL.

Mit Fable 5 arbeiten

Claude Fable 5 ist das leistungsfähigste Modell in Claude Code, geeignet für Aufgaben, die länger als eine einzelne Sitzung dauern. Es unterstützt lange autonome Sitzungen, untersucht vor dem Handeln und überprüft seine Arbeit häufiger als kleinere Modelle.

Fable 5 ist nicht das Standardmodell. Wählen Sie es mit /model fable aus. Anfragen, die seine Sicherheitsklassifizierer kennzeichnen, meist in Cybersicherheits- und Biologie-Bereichen, lösen automatisches Modell-Fallback aus.

Um das Beste aus Fable 5 herauszuholen:

  • Beschreiben Sie das Ergebnis, nicht die Schritte: Geben Sie ihm das Ergebnis, das Sie möchten, und lassen Sie es den Weg planen. Um es arbeiten zu lassen, bis dieses Ergebnis eintritt, setzen Sie ein Ziel.
  • Geben Sie ihm mehrdeutige Probleme: Root-Cause-Untersuchungen, Ausfalldebugging und Architekturentscheidungen sind Bereiche, in denen die zusätzliche Untersuchung und Überprüfung sich auszahlt.
  • Überspringen Sie die Überprüfungserinnerungen: Es überprüft seine eigene Arbeit mit weniger Aufforderungen, daher sind Erinnerungen zum Testen oder Überprüfen normalerweise unnötig.
  • Größere Aufgaben einschätzen: Geben Sie ihm Arbeit, die Sie normalerweise in Teile aufteilen würden. Es hält lange Sitzungen, ohne den Faden zu verlieren.

Einstellung Ihres Modells

Sie können Ihr Modell auf mehrere Arten konfigurieren, aufgelistet nach Priorität:

  1. Während der Sitzung - Verwenden Sie /model <alias|name>, um sofort zu wechseln, oder führen Sie /model ohne Argument aus, um die Auswahl zu öffnen. Die Auswahl fordert zur Bestätigung auf, wenn das Gespräch vorherige Ausgaben hat, da die nächste Antwort den vollständigen Verlauf ohne zwischengespeicherten Kontext erneut liest
  2. Beim Start - Starten Sie mit claude --model <alias|name>
  3. Umgebungsvariable - Setzen Sie ANTHROPIC_MODEL=<alias|name>
  4. Einstellungen - Konfigurieren Sie dauerhaft in Ihrer Einstellungsdatei mit dem model-Feld.

Ab v2.1.153 speichert /model Ihre Auswahl als Standard für neue Sitzungen, indem das model-Feld in Ihren Benutzereinstellungen geschrieben wird. In der Auswahl:

  • Enter: Modell wechseln und als Standard speichern
  • s: Modell nur für diese Sitzung wechseln

Die direkte Eingabe von /model <name> verhält sich wie Enter. Projekt- und verwaltete Einstellungen haben weiterhin Vorrang und werden beim nächsten Start erneut angewendet.

In v2.1.144 bis v2.1.152 galt /model nur für die aktuelle Sitzung und d in der Auswahl speicherte einen Standard.

Das --model-Flag und die ANTHROPIC_MODEL-Umgebungsvariable gelten nur für die Sitzung, mit der Sie sie starten. Um verschiedene Modelle in verschiedenen Terminals gleichzeitig auszuführen, starten Sie jedes mit seinem eigenen --model-Flag, anstatt mit /model zu wechseln.

Fortgesetzte Sitzungen, die mit claude --resume, --continue oder der /resume-Auswahl gestartet werden, behalten das Modell bei, das sie verwendeten, als das Transkript gespeichert wurde, unabhängig von der aktuellen model-Einstellung. Wenn dieses Modell eingestellt wurde, fällt die Sitzung auf die normale Prioritätsreihenfolge zurück. Dies verhindert, dass die /model-Auswahl einer anderen Sitzung das Modell beim Fortsetzen ändert.

Wenn das aktive Modell beim Start aus Projekt- oder verwalteten Einstellungen stammt und nicht aus Ihrer eigenen Auswahl, zeigt der Startheader an, welche Einstellungsdatei es festgelegt hat. Führen Sie /model aus, um es zu überschreiben; die Projekt- oder verwaltete Einstellung wird beim nächsten Start erneut angewendet.

Beispielverwendung:

# Mit Opus starten
claude --model opus

# Während der Sitzung zu Sonnet wechseln
/model sonnet

Beispiel-Einstellungsdatei:

{
    "permissions": {
        ...
    },
    "model": "opus"
}

Modellauswahl einschränken

Enterprise-Administratoren können availableModels in verwalteten oder Richtlinieneinstellungen verwenden, um einzuschränken, welche Modelle Benutzer auswählen können.

Wenn availableModels gesetzt ist, gilt die Zulassungsliste überall dort, wo ein Benutzer ein Modell angeben kann:

  • Hauptsitzungsmodell: /model, das --model-Flag und die ANTHROPIC_MODEL-Umgebungsvariable
  • Alias-Auflösung: {/* min-version: 2.1.176 */}die Umgebungsvariablen ANTHROPIC_DEFAULT_OPUS_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL und ANTHROPIC_DEFAULT_FABLE_MODEL können einen zulässigen Alias nicht zu einem Modell außerhalb der Liste umleiten
  • Schnellmodus: {/* min-version: 2.1.176 */}/fast weigert sich umzuschalten, wenn dies implizit zu einem Opus-Modell außerhalb der Liste führen würde, mit der Meldung „is not in your organization's allowed models"
  • Subagent-Modelle: das model-Feld in Subagent-Frontmatter, der model-Parameter des Agent-Tools, die Modellauswahl in /agents und CLAUDE_CODE_SUBAGENT_MODEL
  • Advisor-Modell: die konfigurierte advisorModel-Einstellung
  • Fallback-Ketten: Elemente einer Fallback-Modellkette außerhalb der Liste werden gelöscht

Das Wechseln zu einem blockierten Modell mit /model wird mit einem Fehler abgelehnt, während ein blockiertes --model-Flag oder ANTHROPIC_MODEL-Wert beim Start mit einer Warnung ersetzt wird, die sowohl das angeforderte als auch das ersetzte Modell benennt, und die Sitzung startet auf dem Standardmodell. Ein blockierter Subagent- oder Advisor-Override fällt auf das geerbte oder Standardmodell zurück, anstatt die Anfrage fehlschlagen zu lassen.

{
  "availableModels": ["sonnet", "haiku"]
}

Standardmodell-Verhalten

Standardmäßig wird die Option „Standard" in der Modellauswahl nicht von availableModels beeinflusst. Sie bleibt verfügbar und stellt den Laufzeit-Standard des Systems dar, basierend auf dem Abonnement-Tier des Benutzers.

Um die Zulassungsliste auf die Option „Standard" auszudehnen, setzen Sie enforceAvailableModels auf true in verwalteten oder Richtlinieneinstellungen zusammen mit einer nicht leeren availableModels-Liste. Wenn der Tier-Standard nicht in der Zulassungsliste enthalten ist, wird „Standard" stattdessen auf den ersten zulässigen Eintrag aufgelöst. Dies erfordert Claude Code v2.1.175 oder später.

Ein leeres availableModels-Array aktiviert niemals die Erzwingung. Auch mit availableModels: [] können Benutzer Claude Code weiterhin mit dem Standardmodell für ihren Tier verwenden, unabhängig von enforceAvailableModels.

Kontrollieren Sie das Modell, auf dem Benutzer ausgeführt werden

Die model-Einstellung ist eine anfängliche Auswahl, keine Erzwingung. Sie legt fest, welches Modell aktiv ist, wenn eine Sitzung startet, aber Benutzer können weiterhin /model öffnen und „Standard" auswählen, das unabhängig davon auf den Systemstandard für ihren Tier aufgelöst wird, was model gesetzt ist.

Um die Modellerfahrung vollständig zu kontrollieren, kombinieren Sie diese Einstellungen:

  • availableModels: schränkt ein, welche benannten Modelle Benutzer wechseln können
  • enforceAvailableModels: erweitert die availableModels-Zulassungsliste auf die Option „Standard", sodass „Standard" nicht auf ein Modell außerhalb der Liste aufgelöst werden kann
  • model: legt die anfängliche Modellauswahl fest, wenn eine Sitzung startet
  • ANTHROPIC_DEFAULT_SONNET_MODEL / ANTHROPIC_DEFAULT_OPUS_MODEL / ANTHROPIC_DEFAULT_HAIKU_MODEL / ANTHROPIC_DEFAULT_FABLE_MODEL: steuern, worauf sich die Option „Standard" und die Aliase sonnet, opus, haiku und fable auflösen

Dieses Beispiel startet Benutzer auf Sonnet 4.5, begrenzt die Auswahl auf Sonnet und Haiku und stellt sicher, dass „Standard" auf ein Modell in der Zulassungsliste aufgelöst wird, anstatt auf den Tier-Standard:

{
  "model": "claude-sonnet-4-5",
  "availableModels": ["claude-sonnet-4-5", "haiku"],
  "enforceAvailableModels": true,
  "env": {
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-5"
  }
}

Ohne enforceAvailableModels oder den env-Block würde ein Benutzer, der „Standard" in der Auswahl auswählt, die neueste Version für seinen Tier erhalten und damit die Versionsfixierung in model und availableModels umgehen. Die beiden Einstellungen decken unterschiedliche Bereiche ab: enforceAvailableModels macht „Standard" der Zulassungsliste unterworfen, während der env-Block festlegt, auf welche Version ein zulässiger Alias wie sonnet aufgelöst wird. Verwenden Sie enforceAvailableModels allein, wenn das Einschränken von Modellfamilien ausreicht; fügen Sie den env-Block hinzu, wenn Sie auch eine bestimmte Version fixieren müssen.

Merge-Verhalten

Wenn availableModels nur in Benutzer-, Projekt- und lokalen Einstellungen gesetzt ist, werden Arrays über diese Ebenen hinweg zusammengeführt und dedupliziert.

Wenn availableModels in verwalteten oder Richtlinieneinstellungen gesetzt ist, ersetzt der verwaltete oder Richtlinienwert das zusammengeführte Ergebnis vollständig: Einträge, die in Benutzer- oder Projekteinstellungen hinzugefügt werden, können ihn nicht erweitern. Verwaltete und Richtlinieneinstellungen ersetzen Werte mit niedrigerer Priorität für enforceAvailableModels auf die gleiche Weise. Ab Claude Code v2.1.175 ist dies die einzige Möglichkeit, eine strikte Zulassungsliste durchzusetzen; frühere Versionen führen die verwaltete Liste mit Einträgen mit niedrigerer Priorität zusammen.

Mantle-Modell-IDs

Wenn der Bedrock Mantle-Endpunkt aktiviert ist, werden Einträge in availableModels, die mit anthropic. beginnen, als benutzerdefinierte Optionen zur /model-Auswahl hinzugefügt und zum Mantle-Endpunkt weitergeleitet. Die Einstellung schränkt die Auswahl weiterhin auf aufgelistete Einträge ein, daher fügen Sie die Standard-Aliase zusammen mit allen Mantle-IDs ein.

Spezielles Modellverhalten

`default`-Modelleinstellung

Das Verhalten von default hängt von Ihrem Kontotyp ab:

  • Max, Team Premium, Enterprise Pay-as-you-go und Anthropic API: Standard ist Opus 4.8
  • Claude Platform auf AWS: Standard ist Opus 4.7
  • Pro, Team Standard und Enterprise-Abonnementplätze: Standard ist Sonnet 4.6
  • Bedrock, Vertex und Foundry: Standard ist Sonnet 4.5

Enterprise Pay-as-you-go bedeutet eine Enterprise-Organisation, die nach Nutzung statt nach Abonnementplatz abgerechnet wird.

Fable 5 ist auf keinem Kontotyp das Standardmodell. Sitzungen verwenden Fable 5 nur, nachdem Sie es auswählen, mit /model fable, einer model-Einstellung oder dem best-Alias, wo Fable 5 verfügbar ist. Wenn Sie es mit /model auswählen, wird es als das ausgewählte Modell in Ihren Benutzereinstellungen gespeichert, sodass spätere Sitzungen auf Fable 5 starten, bis Sie die Modelle ändern.

`opusplan`-Modelleinstellung

Der opusplan-Modellalias bietet einen automatisierten Hybrid-Ansatz:

  • Im Plan-Modus - Verwendet opus für komplexes Reasoning und Architekturentscheidungen
  • Im Ausführungsmodus - Wechselt automatisch zu sonnet für Code-Generierung und Implementierung

Dies gibt Ihnen das Beste aus beiden Welten: Opus's überlegenes Reasoning für die Planung und Sonnets Effizienz für die Ausführung.

Das Kontextfenster der Plan-Modus-Opus-Phase ist das gleiche wie bei der opus-Modelleinstellung. Bei Abonnement-Tiers, bei denen Opus automatisch auf 1M-Kontext aktualisiert wird, erhält opusplan die Aktualisierung auch im Plan-Modus. Um 1M-Kontext für beide Phasen zu erzwingen, wenn Sie sich nicht auf einem Auto-Upgrade-Tier befinden, setzen Sie das Modell auf opusplan[1m].

Für einen Hybrid-Ansatz, bei dem Claude während einer Aufgabe entscheidet, wann ein zweites Modell konsultiert werden soll, anstatt an der Plan-Grenze zu wechseln, siehe das Advisor-Tool.

Fallback-Modellketten

Wenn das primäre Modell überlastet ist, nicht verfügbar ist oder einen anderen nicht wiederholbaren Serverfehler zurückgibt, kann Claude Code zu einem Fallback-Modell wechseln, anstatt die Anfrage fehlschlagen zu lassen. Authentifizierungs-, Abrechnungs-, Rate-Limit-, Anfragegröße- und Transportfehler lösen niemals einen Wechsel aus; diese folgen ihrem normalen Wiederholungs- und Fehlerbehandlung.

Konfigurieren Sie ein oder mehrere Fallback-Modelle und Claude Code versucht sie der Reihe nach, wobei eine Benachrichtigung angezeigt wird, wenn es wechselt. Der Wechsel gilt nur für den aktuellen Durchgang, sodass Ihre nächste Nachricht zuerst wieder das primäre Modell versucht. Ketten sind auf drei Modelle nach Duplikatentfernung begrenzt, und zusätzliche Einträge werden ignoriert.

Setzen Sie eine Kette für eine Sitzung mit dem --fallback-model-Flag, das eine kommagetrennte Liste akzeptiert:

claude --fallback-model sonnet,haiku

Um eine Kette über Sitzungen hinweg beizubehalten, setzen Sie fallbackModel in Einstellungen als Array:

{
  "fallbackModel": ["claude-sonnet-4-6", "claude-haiku-4-5"]
}

Das --fallback-model-Flag hat Vorrang vor der fallbackModel-Einstellung. Jedes Element akzeptiert einen Modellnamen oder Alias, und "default" wird auf das Standardmodell erweitert.

Zwei Fälle führen dazu, dass ein Element übersprungen wird:

  • Nicht verfügbares Modell: Ein Modell, das nicht erreichbar ist, z. B. ein in Einstellungen angeheftetes veraltetes Modell, wird übersprungen und Claude Code fährt mit dem nächsten Element fort.
  • Außerhalb der Zulassungsliste: Ein Element, das nicht von availableModels erlaubt ist, wird gelöscht, wenn die Kette gelesen wird, und wird nie versucht.

Automatisches Modell-Fallback

Dieser Abschnitt behandelt inhaltsbasiertes Fallback von Fable 5. Für verfügbarkeitsbasiertes Fallback, wenn ein Modell überlastet oder nicht verfügbar ist, siehe Fallback-Modellketten.

Fable 5 wird mit Sicherheitsklassifizierern für Cybersicherheits- und Biologie-Inhalte ausgeführt. Wenn ein Klassifizierer eine Anfrage kennzeichnet, führt Claude Code diese Anfrage auf dem Standard-Opus-Modell erneut aus und zeigt eine Benachrichtigung im Transkript an: Opus 4.8 auf der Anthropic API und LLM-Gateway-Bereitstellungen oder Opus 4.7 auf Claude Platform auf AWS.

Die Sitzung wird dann auf diesem Opus-Modell fortgesetzt. Um zu Fable 5 zurückzukehren, führen Sie /model fable aus.

Überprüfen Sie, was das Fallback ausgelöst hat

Fallback kann bei der ersten Anfrage einer Sitzung ausgelöst werden, bevor Sie etwas Ungewöhnliches senden, da die erste Anfrage Workspace-Kontext wie Ihren CLAUDE.md-Inhalt und Git-Status trägt. Ein Repository, das Sicherheits- oder Biologie-Material enthält, kann den Klassifizierer allein auf diesem Kontext auslösen.

Um zu überprüfen, ob Anpassungen der Auslöser sind, starten Sie eine Sitzung mit claude --safe-mode, das Anpassungen wie CLAUDE.md, Skills, MCP-Server und Hooks deaktiviert. Git-Status und Verzeichnisnamen sind keine Anpassungen und sind immer noch enthalten.

Vor dem Wechsel fragen

Um zu entscheiden, was jedes Mal passiert, wenn eine Anfrage gekennzeichnet wird, anstatt automatisch zu wechseln, führen Sie /config aus und schalten Sie „Modelle wechseln, wenn eine Nachricht gekennzeichnet wird" aus. Eine gekennzeichnete Anfrage pausiert dann die Sitzung mit zwei Optionen: zum Opus-Modell wechseln oder den Prompt bearbeiten und auf Fable 5 erneut versuchen.

Einige Fälle verhalten sich unterschiedlich:

  • Wenn beide Modelle die gleiche Anfrage kennzeichnen, können Sie den Prompt bearbeiten und erneut versuchen oder eine neue Sitzung starten.
  • Bei mobilen Claude Code im Web-Sitzungen wird das Bearbeiten und erneute Versuchen nicht unterstützt. Wechseln Sie Modelle oder setzen Sie die Sitzung in einem Desktop-Browser oder der Desktop-App fort.
  • Im nicht-interaktiven Modus und SDK-Integrationen, die den Prompt nicht anzeigen können, endet eine gekennzeichnete Anfrage den Durchgang mit einer Ablehnung.

Aktivieren Sie Fallback auf Bedrock, Vertex AI und Foundry

Auf Amazon Bedrock, Google Vertex AI und Microsoft Foundry sind Modell-IDs anbieter-spezifisch, daher funktioniert automatisches Fallback nur, wenn Claude Code beide beteiligten Modelle identifizieren kann:

  • Claude Code muss das aktuelle Modell als Fable 5 erkennen: Die Modell-ID enthält claude-fable-5, stimmt mit dem Wert von ANTHROPIC_DEFAULT_FABLE_MODEL überein oder ist mit modelOverrides zugeordnet.
  • Das Fallback-Ziel muss zu einem Opus-Modell aufgelöst werden: Der Wert von ANTHROPIC_DEFAULT_OPUS_MODEL, falls gesetzt, andernfalls ein Opus 4.8-Eintrag in der Modellliste des Anbieters.

Wenn eines der Modelle nicht identifiziert werden kann, wechselt Claude Code nicht automatisch. Die gekennzeichnete Anfrage endet mit einer Ablehnungsmeldung, und Sie können Modelle mit /model wechseln und erneut versuchen. Um automatisches Fallback auf diesen Anbietern zu aktivieren, setzen Sie ANTHROPIC_DEFAULT_FABLE_MODEL auf Ihre Fable 5-Modell-ID und ANTHROPIC_DEFAULT_OPUS_MODEL auf Ihre Opus 4.8-Modell-ID.

Sicherheitsforschungs- und Biologie-Workloads

Workloads in offensiver Sicherheit oder Biologie, einschließlich Penetrationstests, Capture the Flag (CTF)-Übungen und biologie-nahe Codebases, lösen häufig Fallback aus, oft bei der ersten Anfrage. Für substantielle Biologie-Arbeit erwarten Sie, dass fast alle Anfragen umgeleitet werden.

Dies ist erwartetes Routing für diese Domänen, kein Konto-Flag. Wenn Ihre Organisation Fable-Klasse-Fähigkeit für diese Arbeit benötigt, fragen Sie Ihr Anthropic-Kontoteam nach vertrauenswürdigen Zugriffsprogrammen.

Anpassung des Aufwandsniveaus

Aufwandsniveaus steuern adaptives Reasoning, das das Modell entscheiden lässt, ob und wie viel es bei jedem Schritt basierend auf der Aufgabenkomplexität denken soll. Niedrigerer Aufwand ist schneller und günstiger für unkomplizierte Aufgaben, während höherer Aufwand tieferes Reasoning für komplexe Probleme bietet.

Die verfügbaren Aufwandsniveaus hängen vom Modell ab. Modelle, die hier nicht aufgeführt sind, unterstützen keinen Aufwand:

Modell Ebenen
Fable 5 low, medium, high, xhigh, max
Opus 4.8 und Opus 4.7 low, medium, high, xhigh, max
Opus 4.6 und Sonnet 4.6 low, medium, high, max

Wenn Sie eine Ebene setzen, die das aktive Modell nicht unterstützt, greift Claude Code auf die höchste unterstützte Ebene bei oder unter der von Ihnen gesetzten zurück. Zum Beispiel wird xhigh auf Opus 4.6 als high ausgeführt.

Der Standard-Aufwand ist high auf Fable 5, Opus 4.8, Opus 4.6 und Sonnet 4.6 und xhigh auf Opus 4.7.

Wenn Sie Fable 5, Opus 4.8 oder Opus 4.7 zum ersten Mal ausführen, wendet Claude Code das Standard-Aufwandsniveau dieses Modells an, auch wenn Sie zuvor ein anderes Niveau für ein anderes Modell gesetzt haben: high auf Fable 5 und Opus 4.8 und xhigh auf Opus 4.7. Führen Sie /effort erneut aus, um nach dem Wechsel ein anderes Niveau zu wählen.

low, medium, high und xhigh bleiben über Sitzungen hinweg erhalten. max bietet das tiefste Reasoning ohne Einschränkung bei der Token-Ausgabe und gilt nur für die aktuelle Sitzung, außer wenn es über die CLAUDE_CODE_EFFORT_LEVEL-Umgebungsvariable gesetzt wird.

Das /effort-Menü bietet auch ultracode. Ultracode ist eine Claude Code-Einstellung und keine Modell-Aufwandsebene: Es sendet xhigh an das Modell und lässt Claude zusätzlich dynamische Workflows für substantielle Aufgaben orchestrieren. Es gilt nur für die aktuelle Sitzung. Setzen Sie es über /effort oder übergeben Sie "ultracode": true über --settings oder eine Agent SDK-Steueranforderung. Es ist nicht Teil der effortLevel-Einstellung, des --effort-Flags oder CLAUDE_CODE_EFFORT_LEVEL.

Wählen Sie ein Aufwandsniveau

Jede Ebene tauscht Token-Ausgabe gegen Fähigkeit. Der Standard eignet sich für die meisten Codierungsaufgaben; passen Sie an, wenn Sie ein anderes Gleichgewicht wünschen.

Ebene Wann man es verwendet
low Reservieren Sie für kurze, begrenzte, latenzempfindliche Aufgaben, die nicht intelligenzempfindlich sind
medium Reduziert Token-Nutzung für kostensensitive Arbeiten, die etwas Intelligenz opfern können
high Balanciert Token-Nutzung und Intelligenz. Standard auf Fable 5, Opus 4.8, Opus 4.6 und Sonnet 4.6
xhigh Tieferes Reasoning bei höherer Token-Ausgabe. Standard auf Opus 4.7
max Kann die Leistung bei anspruchsvollen Aufgaben verbessern, kann aber abnehmende Erträge zeigen und ist anfällig für Überdenken. Testen Sie vor breiter Übernahme
ultracode Eine Claude Code-Einstellung, die einen dynamischen Workflow für jede substantielle Aufgabe mit xhigh-Pro-Nachricht-Reasoning plant. Nur für Sitzungen

Die Aufwandsskala ist pro Modell kalibriert, daher stellt der gleiche Ebenenname nicht den gleichen zugrunde liegenden Wert über Modelle hinweg dar.

Verwenden Sie ultrathink für einmaliges tiefes Reasoning

Fügen Sie ultrathink überall in Ihrem Prompt ein, um tieferes Reasoning bei diesem Durchgang anzufordern, ohne Ihre Sitzungsaufwandseinstellung zu ändern. Claude Code erkennt das Schlüsselwort und fügt eine In-Context-Anweisung hinzu. Das an die API gesendete Aufwandsniveau bleibt unverändert. Andere Phrasen wie „think", „think hard" und „think more" werden als gewöhnlicher Prompt-Text weitergeleitet und werden nicht als Schlüsselwörter erkannt.

Setzen Sie das Aufwandsniveau

Sie können Aufwand durch eine der folgenden Methoden ändern:

  • /effort: Führen Sie /effort ohne Argumente aus, um einen interaktiven Schieberegler zu öffnen, /effort gefolgt von einem Ebenennamen, um ihn direkt zu setzen, oder /effort auto, um auf den Modellstandard zurückzusetzen
  • In /model: Verwenden Sie die Pfeiltasten nach links/rechts, um den Aufwand-Schieberegler anzupassen, wenn Sie ein Modell auswählen
  • --effort-Flag: Übergeben Sie einen Ebenennamen, um ihn für eine einzelne Sitzung beim Starten von Claude Code zu setzen
  • Umgebungsvariable: Setzen Sie CLAUDE_CODE_EFFORT_LEVEL auf einen Ebenennamen oder auto
  • Einstellungen: Setzen Sie effortLevel auf low, medium, high oder xhigh in Ihrer Einstellungsdatei. max und ultracode sind nur für Sitzungen und werden hier nicht akzeptiert
  • Skill- und Subagent-Frontmatter: Setzen Sie effort in einer Skill- oder Subagent-Markdown-Datei, um das Aufwandsniveau zu überschreiben, wenn dieser Skill oder Subagent ausgeführt wird

Die Umgebungsvariable hat Vorrang vor allen anderen Methoden, dann Ihre konfigurierte Ebene, dann der Modellstandard. Frontmatter-Aufwand gilt, wenn dieser Skill oder Subagent aktiv ist, und überschreibt die Sitzungsebene, aber nicht die Umgebungsvariable.

Der Aufwand-Schieberegler erscheint in /model, wenn ein unterstütztes Modell ausgewählt ist. Das aktuelle Aufwandsniveau wird auch neben dem Logo und dem Spinner angezeigt, z. B. „with low effort", damit Sie bestätigen können, welche Einstellung aktiv ist, ohne /model zu öffnen.

Adaptives Reasoning und feste Thinking-Budgets

Adaptives Reasoning macht Thinking bei jedem Schritt optional, daher kann Claude schneller auf Routine-Prompts reagieren und tieferes Denken für Schritte reservieren, die davon profitieren. Wenn Sie möchten, dass Claude häufiger oder seltener denkt als das aktuelle Niveau erzeugt, können Sie dies direkt in Ihrem Prompt oder in CLAUDE.md sagen; das Modell reagiert auf diese Anleitung innerhalb seiner Aufwandseinstellung.

Opus 4.7 und später verwenden immer adaptives Reasoning, ebenso wie Fable 5. Der Modus mit festem Thinking-Budget und CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING gelten nicht dafür.

Bei Opus 4.6 und Sonnet 4.6 können Sie CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 setzen, um zum vorherigen festen Thinking-Budget zurückzukehren, das von MAX_THINKING_TOKENS gesteuert wird. Siehe Umgebungsvariablen.

Erweitertes Thinking

Erweitertes Thinking ist das Reasoning, das Claude vor der Antwort ausgibt. Bei Modellen, die adaptives Reasoning unterstützen, ist das Aufwandsniveau die primäre Kontrolle dafür, wie viel Thinking stattfindet; die folgenden Einstellungen schalten Thinking ein oder aus und steuern, wie es angezeigt wird.

Kontrolle Wie man es setzt
Umschalter für die aktuelle Sitzung Drücken Sie Option+T auf macOS oder Alt+T auf Windows und Linux
Setzen Sie den globalen Standard Führen Sie /config aus und schalten Sie den Thinking-Modus um. Gespeichert als alwaysThinkingEnabled in ~/.claude/settings.json
Deaktivieren Sie unabhängig vom Aufwand Setzen Sie MAX_THINKING_TOKENS=0, das Thinking auf der Anthropic API außer auf Fable 5 ausschaltet. Auf Drittanbieter-Anbietern wird stattdessen der thinking-Parameter weggelassen, und adaptive-Reasoning-Modelle können immer noch denken. Andere Werte gelten nur mit einem festen Thinking-Budget

Thinking kann auf Fable 5 nicht ausgeschaltet werden. Der Sitzungsumschalter, alwaysThinkingEnabled und MAX_THINKING_TOKENS=0 haben dort keine Auswirkung, und Fable 5 entscheidet pro Schritt, wie viel zu denken ist, basierend auf dem Aufwandsniveau.

Die Thinking-Ausgabe ist standardmäßig zusammengeklappt. Drücken Sie Ctrl+O, um den ausführlichen Modus umzuschalten und das Reasoning als grauer kursiver Text zu sehen. Interaktive Sitzungen auf der Anthropic API erhalten standardmäßig redigierte Thinking-Blöcke, daher setzen Sie showThinkingSummaries: true in Einstellungen, wenn Sie die vollständigen Zusammenfassungen verfügbar haben möchten, wenn Sie erweitern. Ihnen werden alle generierten Thinking-Token berechnet, auch wenn sie zusammengeklappt oder redigiert sind.

Erweiterter Kontext

Fable 5, Opus 4.6 und später sowie Sonnet 4.6 unterstützen ein 1-Million-Token-Kontextfenster für lange Sitzungen mit großen Codebases.

Die Verfügbarkeit variiert je nach Modell und Plan. Bei Max-, Team- und Enterprise-Plänen wird Opus automatisch auf 1M-Kontext ohne zusätzliche Konfiguration aktualisiert. Dies gilt für beide Team Standard- und Team Premium-Plätze. Auf der Anthropic API werden Fable 5, Opus 4.8 und Opus 4.7 immer mit dem 1M-Fenster ausgeführt. Sonnet mit 1M-Kontext ist nicht Teil der automatischen Aktualisierung und erfordert Nutzungsguthaben bei jedem Abonnementplan, einschließlich Max.

Plan Opus mit 1M-Kontext Sonnet mit 1M-Kontext
Max, Team und Enterprise Im Abonnement enthalten Erfordert Nutzungsguthaben
Pro Erfordert Nutzungsguthaben Erfordert Nutzungsguthaben
API und Pay-as-you-go Vollständiger Zugriff Vollständiger Zugriff

Um 1M-Kontext vollständig zu deaktivieren, setzen Sie CLAUDE_CODE_DISABLE_1M_CONTEXT=1. Dies entfernt 1M-Modellvarianten aus der Modellauswahl. Siehe Umgebungsvariablen.

Das 1M-Kontextfenster verwendet Standard-Modellpreise ohne Aufschlag für Token über 200K. Für Pläne, bei denen erweiterter Kontext in Ihrem Abonnement enthalten ist, bleibt die Nutzung von Ihrem Abonnement abgedeckt. Für Pläne, die über Nutzungsguthaben auf erweiterten Kontext zugreifen, werden Token zu Nutzungsguthaben abgerechnet.

Wenn Ihr Konto 1M-Kontext unterstützt, erscheint die Option in der Modellauswahl (/model) in den neuesten Versionen von Claude Code. Wenn Sie sie nicht sehen, versuchen Sie, Ihre Sitzung neu zu starten.

Sie können auch das [1m]-Suffix mit Modellaliasen oder vollständigen Modellnamen verwenden:

# Verwenden Sie den opus[1m]- oder sonnet[1m]-Alias
/model opus[1m]
/model sonnet[1m]

# Oder fügen Sie [1m] an einen vollständigen Modellnamen an
/model claude-opus-4-8[1m]

Überprüfung Ihres aktuellen Modells

Sie können sehen, welches Modell Sie derzeit verwenden, auf mehrere Arten:

  1. In der Statuszeile (falls konfiguriert)
  2. In /status, das auch Ihre Kontoinformationen anzeigt.

Benutzerdefinierte Modelloption hinzufügen

Verwenden Sie ANTHROPIC_CUSTOM_MODEL_OPTION, um einen einzelnen benutzerdefinierten Eintrag zur /model-Auswahl hinzuzufügen, ohne die integrierten Aliase zu ersetzen. Dies ist nützlich zum Testen von Modell-IDs, die Claude Code standardmäßig nicht auflistet. Für LLM-Gateway-Bereitstellungen kann Claude Code die Auswahl vom /v1/models-Endpunkt des Gateways auffüllen, wenn CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 gesetzt ist. Daher ist diese Variable nur erforderlich, wenn die Erkennung deaktiviert ist oder das gewünschte Modell nicht zurückgibt. Siehe LLM-Gateway-Modellauswahl.

Dieses Beispiel setzt alle drei Variablen, um eine Gateway-gesteuerte Opus-Bereitstellung auswählbar zu machen:

export ANTHROPIC_CUSTOM_MODEL_OPTION="my-gateway/claude-opus-4-7"
export ANTHROPIC_CUSTOM_MODEL_OPTION_NAME="Opus via Gateway"
export ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION="Custom deployment routed through the internal LLM gateway"

Der benutzerdefinierte Eintrag erscheint am unteren Ende der /model-Auswahl. ANTHROPIC_CUSTOM_MODEL_OPTION_NAME und ANTHROPIC_CUSTOM_MODEL_OPTION_DESCRIPTION sind optional. Wenn weggelassen, wird die Modell-ID als Name verwendet und die Beschreibung wird standardmäßig auf Custom model (<model-id>) gesetzt.

Claude Code überspringt die Validierung für die Modell-ID, die in ANTHROPIC_CUSTOM_MODEL_OPTION gesetzt ist, daher können Sie jeden String verwenden, den Ihr API-Endpunkt akzeptiert.

Umgebungsvariablen

Sie können die folgenden Umgebungsvariablen verwenden, die vollständige Modellnamen (oder Äquivalente für Ihren API-Anbieter) sein müssen, um die Modellnamen zu steuern, auf die die Aliase verweisen.

Umgebungsvariable Beschreibung
ANTHROPIC_DEFAULT_FABLE_MODEL Das Modell, das für fable verwendet werden soll, und die Modell-ID, die Claude Code als Fable 5 für automatisches Modell-Fallback bei Drittanbieter-Anbietern erkennt
ANTHROPIC_DEFAULT_OPUS_MODEL Das Modell, das für opus verwendet werden soll, oder für opusplan, wenn Plan Mode aktiv ist.
ANTHROPIC_DEFAULT_SONNET_MODEL Das Modell, das für sonnet verwendet werden soll, oder für opusplan, wenn Plan Mode nicht aktiv ist.
ANTHROPIC_DEFAULT_HAIKU_MODEL Das Modell, das für haiku verwendet werden soll, oder Hintergrundfunktionalität
CLAUDE_CODE_SUBAGENT_MODEL Das Modell, das für alle Subagents und Agent-Teams verwendet werden soll. Überschreibt sowohl den model-Parameter pro Aufruf als auch die model-Frontmatter der Subagent-Definition. Setzen Sie auf inherit, um stattdessen die normale Modellauflösung zu verwenden

Hinweis: ANTHROPIC_SMALL_FAST_MODEL ist veraltet zugunsten von ANTHROPIC_DEFAULT_HAIKU_MODEL.

Modelle für Drittanbieter-Bereitstellungen fixieren

Beim Bereitstellen von Claude Code über Bedrock, Vertex AI, Foundry oder Claude Platform on AWS sollten Sie Modellversionen vor dem Rollout für Benutzer fixieren.

Ohne Fixierung verwendet Claude Code Modellaliase wie fable, opus, sonnet und haiku, die zur integrierten Standard-Modell-ID für jeden Anbieter aufgelöst werden. Dieser Standard kann hinter der neuesten Anthropic-Veröffentlichung zurückbleiben, und das Modell, auf das er verweist, ist möglicherweise noch nicht in einem Benutzerkonto aktiviert. Wenn der Standard nicht verfügbar ist, sehen Bedrock- und Vertex AI-Benutzer einen Hinweis und greifen für diese Sitzung auf die vorherige Version zurück, während Foundry-Benutzer Fehler sehen, da Foundry keine entsprechende Startprüfung hat.

Verwenden Sie die folgenden Umgebungsvariablen mit versionsspezifischen Modell-IDs für Ihren Anbieter:

Anbieter Beispiel
Bedrock export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-8'
Vertex AI export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8'
Foundry export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8'

Wenden Sie das gleiche Muster auf ANTHROPIC_DEFAULT_FABLE_MODEL, ANTHROPIC_DEFAULT_SONNET_MODEL und ANTHROPIC_DEFAULT_HAIKU_MODEL an. Für aktuelle und ältere Modell-IDs über alle Anbieter hinweg siehe Modellübersicht. Um Benutzer auf eine neue Modellversion zu aktualisieren, aktualisieren Sie diese Umgebungsvariablen und stellen Sie erneut bereit.

Um erweiterten Kontext für ein fixiertes Modell zu aktivieren, fügen Sie [1m] an die Modell-ID in ANTHROPIC_DEFAULT_OPUS_MODEL oder ANTHROPIC_DEFAULT_SONNET_MODEL an:

export ANTHROPIC_DEFAULT_OPUS_MODEL='claude-opus-4-8[1m]'

Das [1m]-Suffix wendet das 1M-Kontextfenster auf alle Verwendungen der Aliase opus und sonnet an, einschließlich der Plan-Mode-Opus-Phase von opusplan.

  • Claude Code entfernt das Suffix, bevor die Modell-ID an Ihren Anbieter gesendet wird.
  • Fügen Sie [1m] nur an, wenn das zugrunde liegende Modell 1M-Kontext unterstützt.
  • Das Suffix wird pro Variable gelesen, nicht pro Modell. Bei Bedrock, Vertex und Foundry verwendet eine Modell-ID ohne [1m] in einer Variable 200K-Kontext, auch wenn eine andere Variable das gleiche Modell mit dem Suffix setzt.

Anzeige und Funktionen des fixierten Modells anpassen

Wenn Sie ein Modell bei einem Drittanbieter fixieren, erscheint die anbieterspezifische ID in der /model-Auswahl und Claude Code erkennt möglicherweise nicht, welche Funktionen das Modell unterstützt. Sie können den Anzeigenamen und die deklarierten Funktionen mit Begleit-Umgebungsvariablen für jedes fixierte Modell überschreiben.

Diese Variablen wirken sich auf Drittanbieter wie Bedrock, Vertex AI und Foundry aus. Die Variablen _NAME und _DESCRIPTION wirken sich auch aus, wenn ANTHROPIC_BASE_URL auf ein LLM-Gateway verweist. Sie haben keine Auswirkung bei direkter Verbindung zu api.anthropic.com.

Umgebungsvariable Beschreibung
ANTHROPIC_DEFAULT_OPUS_MODEL_NAME Anzeigename für das fixierte Opus-Modell in der /model-Auswahl. Standardmäßig die Modell-ID, wenn nicht gesetzt
ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION Anzeige-Beschreibung für das fixierte Opus-Modell in der /model-Auswahl. Standardmäßig Custom Opus model, wenn nicht gesetzt
ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES Komma-getrennte Liste der Funktionen, die das fixierte Opus-Modell unterstützt

Die gleichen _NAME-, _DESCRIPTION- und _SUPPORTED_CAPABILITIES-Suffixe sind für ANTHROPIC_DEFAULT_SONNET_MODEL, ANTHROPIC_DEFAULT_HAIKU_MODEL, ANTHROPIC_DEFAULT_FABLE_MODEL und ANTHROPIC_CUSTOM_MODEL_OPTION verfügbar.

Claude Code aktiviert Funktionen wie Aufwandsniveaus und erweitertes Denken durch Abgleich der Modell-ID mit bekannten Mustern. Anbieterspezifische IDs wie Bedrock-ARNs oder benutzerdefinierte Bereitstellungsnamen stimmen oft nicht mit diesen Mustern überein, wodurch unterstützte Funktionen deaktiviert bleiben. Setzen Sie _SUPPORTED_CAPABILITIES, um Claude Code mitzuteilen, welche Funktionen das Modell tatsächlich unterstützt:

Funktionswert Aktiviert
effort Aufwandsniveaus und der /effort-Befehl
xhigh_effort {/* min-version: 2.1.111 */}Das xhigh-Aufwandsniveau
max_effort Das max-Aufwandsniveau
thinking Erweitertes Denken
adaptive_thinking Adaptives Reasoning, das das Denken dynamisch basierend auf der Aufgabenkomplexität zuordnet
interleaved_thinking Denken zwischen Tool-Aufrufen

Wenn _SUPPORTED_CAPABILITIES gesetzt ist, werden aufgelistete Funktionen aktiviert und nicht aufgelistete Funktionen werden für das entsprechende fixierte Modell deaktiviert. Wenn die Variable nicht gesetzt ist, greift Claude Code auf die integrierte Erkennung basierend auf der Modell-ID zurück.

Dieses Beispiel fixiert Opus auf ein benutzerdefiniertes Bedrock-Modell-ARN, setzt einen benutzerfreundlichen Namen und deklariert seine Funktionen:

export ANTHROPIC_DEFAULT_OPUS_MODEL='arn:aws:bedrock:us-east-1:123456789012:custom-model/abc'
export ANTHROPIC_DEFAULT_OPUS_MODEL_NAME='Opus via Bedrock'
export ANTHROPIC_DEFAULT_OPUS_MODEL_DESCRIPTION='Opus 4.7 routed through a Bedrock custom endpoint'
export ANTHROPIC_DEFAULT_OPUS_MODEL_SUPPORTED_CAPABILITIES='effort,xhigh_effort,max_effort,thinking,adaptive_thinking,interleaved_thinking'

Modell-IDs pro Version überschreiben

Die oben genannten Umgebungsvariablen auf Familienebene konfigurieren eine Modell-ID pro Familienalias. Wenn Sie mehrere Versionen innerhalb der gleichen Familie auf unterschiedliche Anbieter-IDs abbilden müssen, verwenden Sie stattdessen die modelOverrides-Einstellung.

modelOverrides ordnet einzelne Anthropic-Modell-IDs den anbieterspezifischen Strings zu, die Claude Code an die API Ihres Anbieters sendet. Wenn ein Benutzer ein zugeordnetes Modell in der /model-Auswahl auswählt, verwendet Claude Code Ihren konfigurierten Wert anstelle des integrierten Standards.

Dies ermöglicht es Enterprise-Administratoren, jede Modellversion zu einem bestimmten Bedrock-Inference-Profil-ARN, Vertex AI-Versionsnamen oder Foundry-Bereitstellungsnamen für Governance, Kostenzuteilung oder regionales Routing zu leiten.

Setzen Sie modelOverrides in Ihrer Einstellungsdatei:

{
  "modelOverrides": {
    "claude-opus-4-7": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-prod",
    "claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
    "claude-sonnet-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/sonnet-prod"
  }
}

Schlüssel müssen Anthropic-Modell-IDs sein, wie in der Modellübersicht aufgelistet. Für datierte Modell-IDs fügen Sie das Datumssuffix genau so ein, wie es dort angezeigt wird. Unbekannte Schlüssel werden ignoriert.

Überschreibungen ersetzen die integrierten Modell-IDs, die jeden Eintrag in der /model-Auswahl unterstützen. Bei Bedrock haben Überschreibungen Vorrang vor allen Inference-Profilen, die Claude Code beim Start automatisch erkennt. Werte, die Sie direkt über ANTHROPIC_MODEL, --model oder die ANTHROPIC_DEFAULT_*_MODEL-Umgebungsvariablen bereitstellen, werden unverändert an den Anbieter übergeben und werden nicht durch modelOverrides transformiert.

modelOverrides funktioniert zusammen mit availableModels. Die Zulassungsliste wird gegen die Anthropic-Modell-ID ausgewertet, nicht gegen den Überschreibungswert, daher ein Eintrag wie "opus" in availableModels stimmt weiterhin überein, auch wenn Opus-Versionen ARNs zugeordnet sind.

Prompt-Caching-Konfiguration

Claude Code verwendet automatisch Prompt-Caching, um die Leistung zu optimieren und Kosten zu senken. Sie können Prompt-Caching global oder für bestimmte Modell-Tiers deaktivieren:

Umgebungsvariable Beschreibung
DISABLE_PROMPT_CACHING Setzen Sie auf 1, um Prompt-Caching für alle Modelle zu deaktivieren. Hat Vorrang vor den modellspezifischen Einstellungen
DISABLE_PROMPT_CACHING_HAIKU Setzen Sie auf 1, um Prompt-Caching nur für Haiku-Modelle zu deaktivieren
DISABLE_PROMPT_CACHING_SONNET Setzen Sie auf 1, um Prompt-Caching nur für Sonnet-Modelle zu deaktivieren
DISABLE_PROMPT_CACHING_OPUS Setzen Sie auf 1, um Prompt-Caching nur für Opus-Modelle zu deaktivieren
DISABLE_PROMPT_CACHING_FABLE Setzen Sie auf 1, um Prompt-Caching nur für Fable-Modelle zu deaktivieren

Um die Cache-TTL zu ändern oder zu erfahren, was einen Cache-Miss auslöst, siehe Wie Claude Code Prompt-Caching verwendet.