Token, contesto e memoria

Principiante

Tre idee sbloccano molti momenti del tipo "perché ha fatto così?": i token, la finestra di contesto e la memoria.

Token: l'unità in cui pensano i modelli

I modelli non leggono caratteri o parole — leggono token, frammenti di testo lunghi all'incirca ¾ di una parola in inglese. "Unbelievable" potrebbe essere 3–4 token; le parole comuni ne valgono uno ciascuna. Sia il tuo input sia l'output del modello vengono conteggiati in token, ed è in quello che si misurano prezzi e limiti.

Non devi contarli a mano, ma una stima approssimativa aiuta: ~750 parole ≈ ~1.000 token. Provalo:

11parole

72caratteri

~15–18token stimati

Solo un'idea approssimativa (~caratteri ÷ 4, oppure parole × 1.33). Il conteggio dei token è specifico per ogni modello — non usare mai il tokenizer di un altro modello. Per numeri esatti usa l'endpoint di conteggio token di Anthropic.

La finestra di contesto: la memoria di lavoro

La finestra di contesto è il numero massimo di token che il modello può considerare contemporaneamente — il tuo prompt più la sua risposta più l'intera conversazione finora. Pensala come la scrivania del modello: grande, ma finita.

Quando una conversazione cresce oltre la finestra, il contenuto più vecchio cade dalla scrivania. Ecco perché una chat molto lunga può sembrare "dimenticare" ciò che hai detto all'inizio, o iniziare a divagare.

:::tip Implicazioni pratiche

Per i documenti lunghi, metti l'istruzione chiave in cima e ribadiscila alla fine.
Avvia una nuova chat per un nuovo argomento invece di trascinarti dietro una cronologia enorme.
In Claude Code, gestiscilo deliberatamente — vedi Gestione del contesto. :::

Memoria: non ce n'è, a meno che non la fornisca tu

Per impostazione predefinita, ogni conversazione è una tabula rasa. Il modello non ricorda la tua ultima chat. L'apparente "memoria" deriva da una di queste:

Reinviare la cronologia — le app di chat reinviano la conversazione a ogni turno (finché la finestra non si riempie).
Funzionalità di memoria esplicite — alcune superfici di Claude offrono memoria tra chat (vedi Memoria tra le chat).
File che fornisci — i Progetti e CLAUDE.md danno un contesto persistente che controlli tu.
L'API è stateless — per continuare una conversazione reinvii tu stesso i messaggi precedenti (Prima chiamata API).

Perché è importante

Quasi ogni problema del tipo "ha ignorato la mia istruzione precedente" o "ha perso il filo" risale al riempimento della finestra di contesto o all'avvio di una nuova sessione a freddo. Sapendolo, strutturerai prompt e sessioni per tenere le cose importanti sulla scrivania.

Token: l'unità in cui pensano i modelli​

La finestra di contesto: la memoria di lavoro​

Memoria: non ce n'è, a meno che non la fornisca tu​

Perché è importante​

Prossimi passi​

Token: l'unità in cui pensano i modelli

La finestra di contesto: la memoria di lavoro

Memoria: non ce n'è, a meno che non la fornisca tu

Perché è importante

Prossimi passi