Token, contesto e memoria
Tre idee sbloccano molti momenti del tipo "perché ha fatto così?": i token, la finestra di contesto e la memoria.
Token: l'unità in cui pensano i modelli
I modelli non leggono caratteri o parole — leggono token, frammenti di testo lunghi all'incirca ¾ di una parola in inglese. "Unbelievable" potrebbe essere 3–4 token; le parole comuni ne valgono uno ciascuna. Sia il tuo input sia l'output del modello vengono conteggiati in token, ed è in quello che si misurano prezzi e limiti.
Non devi contarli a mano, ma una stima approssimativa aiuta: ~750 parole ≈ ~1.000 token. Provalo:
Solo un'idea approssimativa (~caratteri ÷ 4, oppure parole × 1.33). Il conteggio dei token è specifico per ogni modello — non usare mai il tokenizer di un altro modello. Per numeri esatti usa l'endpoint di conteggio token di Anthropic.
La finestra di contesto: la memoria di lavoro
La finestra di contesto è il numero massimo di token che il modello può considerare contemporaneamente — il tuo prompt più la sua risposta più l'intera conversazione finora. Pensala come la scrivania del modello: grande, ma finita.
Quando una conversazione cresce oltre la finestra, il contenuto più vecchio cade dalla scrivania. Ecco perché una chat molto lunga può sembrare "dimenticare" ciò che hai detto all'inizio, o iniziare a divagare.
:::tip Implicazioni pratiche
- Per i documenti lunghi, metti l'istruzione chiave in cima e ribadiscila alla fine.
- Avvia una nuova chat per un nuovo argomento invece di trascinarti dietro una cronologia enorme.
- In Claude Code, gestiscilo deliberatamente — vedi Gestione del contesto. :::
Memoria: non ce n'è, a meno che non la fornisca tu
Per impostazione predefinita, ogni conversazione è una tabula rasa. Il modello non ricorda la tua ultima chat. L'apparente "memoria" deriva da una di queste:
- Reinviare la cronologia — le app di chat reinviano la conversazione a ogni turno (finché la finestra non si riempie).
- Funzionalità di memoria esplicite — alcune superfici di Claude offrono memoria tra chat (vedi Memoria tra le chat).
- File che fornisci — i Progetti e CLAUDE.md danno un contesto persistente che controlli tu.
- L'API è stateless — per continuare una conversazione reinvii tu stesso i messaggi precedenti (Prima chiamata API).
Perché è importante
Quasi ogni problema del tipo "ha ignorato la mia istruzione precedente" o "ha perso il filo" risale al riempimento della finestra di contesto o all'avvio di una nuova sessione a freddo. Sapendolo, strutturerai prompt e sessioni per tenere le cose importanti sulla scrivania.