Tokens, Kontext & Gedächtnis

Einsteiger

Drei Konzepte erklären viele "Warum hat es das getan?"-Momente: Tokens, das Kontextfenster und das Gedächtnis.

Tokens: die Einheit, in der Modelle denken

Modelle lesen keine Zeichen oder Wörter — sie lesen Tokens, Textstücke von etwa ¾ eines Wortes im Englischen. "Unbelievable" sind vielleicht 3–4 Tokens; häufige Wörter sind je eines. Sowohl deine Eingabe als auch die Ausgabe des Modells werden in Tokens gezählt, und genau das ist die Einheit, in der Preise und Limits gemessen werden.

Du musst nicht von Hand zählen, aber ein grobes Gefühl hilft: ~750 Wörter ≈ ~1.000 Tokens. Probiere es aus:

14Wörter

69Zeichen

~17–19geschätzte Tokens

Nur ein grobes Gefühl (~Zeichen ÷ 4, oder Wörter × 1,33). Token-Zahlen sind modellspezifisch — verwende niemals den Tokenizer eines anderen Modells. Für exakte Werte nutze Anthropics Token-Counting-Endpoint.

Das Kontextfenster: das Arbeitsgedächtnis

Das Kontextfenster ist die maximale Anzahl an Tokens, die das Modell gleichzeitig berücksichtigen kann — dein Prompt plus seine Antwort plus die gesamte bisherige Konversation. Stell es dir wie den Schreibtisch des Modells vor: groß, aber endlich.

Wenn eine Konversation über das Fenster hinauswächst, fällt der älteste Inhalt vom Schreibtisch. Deshalb kann ein sehr langer Chat scheinbar "vergessen", was du am Anfang gesagt hast, oder anfangen abzudriften.

:::tip Praktische Konsequenzen

Platziere bei langen Dokumenten die zentrale Anweisung ganz oben und wiederhole sie am Ende.
Starte einen frischen Chat für ein neues Thema, statt eine riesige Historie mitzuschleppen.
In Claude Code verwalte dies bewusst — siehe Kontextverwaltung. :::

Gedächtnis: es gibt keines, es sei denn, du stellst es bereit

Standardmäßig ist jede Konversation ein unbeschriebenes Blatt. Das Modell erinnert sich nicht an deinen letzten Chat. Scheinbares "Gedächtnis" entsteht aus einem der folgenden Punkte:

Erneutes Senden der Historie — Chat-Apps senden die Konversation in jedem Zug erneut (bis das Fenster voll ist).
Explizite Gedächtnis-Funktionen — einige Claude-Oberflächen bieten chatübergreifendes Gedächtnis (siehe Gedächtnis über Chats hinweg).
Dateien, die du bereitstellst — Projekte und CLAUDE.md liefern persistenten Kontext, den du kontrollierst.
Die API ist zustandslos — um eine Konversation fortzusetzen, sendest du die vorherigen Nachrichten selbst zurück (Erster API-Aufruf).

Warum das wichtig ist

Fast jedes "es hat meine frühere Anweisung ignoriert"- oder "es hat den Faden verloren"-Problem lässt sich auf ein vollgelaufenes Kontextfenster oder eine kalt gestartete neue Sitzung zurückführen. Mit diesem Wissen strukturierst du Prompts und Sitzungen so, dass das Wichtige auf dem Schreibtisch bleibt.

Tokens: die Einheit, in der Modelle denken​

Das Kontextfenster: das Arbeitsgedächtnis​

Gedächtnis: es gibt keines, es sei denn, du stellst es bereit​

Warum das wichtig ist​

Weiter​

Tokens: die Einheit, in der Modelle denken

Das Kontextfenster: das Arbeitsgedächtnis

Gedächtnis: es gibt keines, es sei denn, du stellst es bereit

Warum das wichtig ist

Weiter