Passa al contenuto principale
Tutti i livelli

La Mezza Vita della Freschezza

Ecco una lente attorno a cui è costruito AILmanac, e l'idea più utile che possiamo consegnarti per lavorare con l'AI:

Non tutti i fatti sull'AI marciscono alla stessa velocità. Quindi non dovresti trattarli tutti allo stesso modo.

Il prezzo di un modello, il nome del modello "migliore", come funzionano i transformer — sono tutti "fatti", ma uno di essi cambia ogni settimana, uno cambia ogni mese e uno non è davvero cambiato da anni. Se memorizzi tutti e tre nella tua testa con uguale sicurezza, entro un mese ti sbaglierai con sicurezza su due di essi.

Un modello che troviamo utile: assegna a ogni fatto una mezza vita della freschezza — un'idea approssimativa di quanto tempo passa prima che sia al 50% probabile che sia obsoleto — e poi decidi come gestirlo in base a quella mezza vita, non in base a quanto ti sembra importante.

La mossa centrale: adatta la gestione alla mezza vita

Ci sono solo tre cose che puoi fare con qualsiasi fatto:

  • Memorizzalo in cache — tienilo in testa e agisci di conseguenza senza ri-verificare.
  • Ri-verificalo — assumi che possa essere cambiato; verificalo rispetto a una fonte prima di farci affidamento.
  • Collega, non memorizzare — non archiviare mai il valore; archivia un puntatore al luogo in cui vive il valore aggiornato.

L'errore che quasi tutti commettono è memorizzare in cache cose che dovrebbero essere collegate. Memorizzano un prezzo, lo ripetono in una riunione sei mesi dopo, e si sbagliano. La mezza vita della freschezza ti dice quale mossa fare.

I livelli

Un modello che troviamo utile è ordinare i fatti sull'AI in quattro livelli di decadimento. I confini sono volutamente sfumati — il punto è il gradiente, non i tagli esatti.

LivelloMezza vitaEsempiCosa fare
VolatileOre–giorniPrezzi esatti, rate limit, stato di coda/capacità, etichette UI e nomi di pulsanti in tempo reale, "l'API è attiva adesso"Collega, non memorizzare. Non citare mai a memoria. Estrai sempre il valore aggiornato dalla fonte ufficiale nel momento in cui ti serve.
VeloceSettimaneQuale modello è "migliore" o "predefinito" per un compito, impostazioni consigliate, quali funzionalità sono in anteprimaRi-verifica prima di farci affidamento. Va bene mantenere un'ipotesi di lavoro; verifica prima di scommetterci qualcosa.
LentoMesiQuali funzionalità esistono, nomi di strumenti e prodotti, ampi livelli di capacità ("può vedere le immagini?")Memorizza in cache, ma datalo. Tienilo in testa, ma allega un mentale "valido all'incirca da quando" e ri-verifica quando la posta in gioco è alta.
DurevoleAnniCome i transformer predicono i token, perché le context window contano, principi di prompting, la Scala della Fiducia, questo stesso frameworkMemorizza in cache liberamente. Queste sono le fondamenta che vale davvero la pena imparare. Investire qui produce interessi composti.

Come leggere i livelli

La trappola è la confusione di livello — trattare un fatto volatile come se fosse durevole. "Claude costa $X per milione di token" sembra un fatto solido, quindi le persone lo memorizzano in cache. Ma la sua mezza vita è di giorni, non di anni. La soluzione non è memorizzare con più impegno; è spostarlo di un livello più in basso nel modo in cui lo gestisci: collega alla fonte invece di citare un numero.

L'errore opposto è più raro ma reale: ri-cercare su Google le cose durevoli ("come funziona un LLM?") ogni volta invece di impararle una volta sola. Se la mezza vita di un fatto si misura in anni, smetti di ri-verificarlo e interiorizzalo.

Un test rapido quando ti scopri a enunciare un fatto sull'AI: "Qual è la mezza vita di ciò che ho appena detto?" Se la risposta onesta è "giorni", dovresti puntare a una fonte, non alla tua memoria.

Perché questo conta più per l'AI che per quasi qualunque altra cosa

La maggior parte dei campi ha un mix confortevole di fatti durevoli e volatili. L'AI è insolita: una grande quota dei "fatti" che le persone ripetono si trova nei livelli Volatile e Veloce — nomi di modelli, prezzi, limiti, quale cosa è la migliore questa settimana. Il rapporto volatile/durevole è alto. È esattamente per questo che tanti consigli sull'AI invecchiano male, ed è per questo che un'abitudine freschezza-prima ripaga di più qui che nei campi che si muovono più lentamente.

Spiega anche una regola controintuitiva: più un consiglio suona sicuro riguardo a un numero specifico, più dovresti diffidarne. Specificità e freschezza sono spesso in tensione. "Usa il modello capace più economico" è un consiglio durevole. "Usa il modello X a $Y" è la fotografia di un istante.

Come AILmanac stesso gira su questa idea

Questa non è solo teoria che ti consegniamo — è il sistema operativo dell'intero sito.

  • I fatti volatili non sono mai cablati nella prosa. Prezzi, limiti e nomi di modelli attuali vivono in un unico posto — data/models.json, la nostra unica fonte di verità — e sulla pagina Modelli e Prezzi, che teniamo verificata. Ovunque altro, colleghiamo a quelle invece di ripetere un numero destinato a marcire.
  • Ogni pagina volatile porta un timbro <VerifyNote> che registra quando un essere umano l'ha controllata l'ultima volta rispetto alla fonte ufficiale, così:
  • La Dashboard della Freschezza assegna un punteggio a ogni pagina rispetto alla sua data di ultima verifica e al tuo orologio attuale, così il sito non può diventare silenziosamente obsoleto senza mostrarlo. Quella dashboard è la Mezza Vita della Freschezza resa letterale: fa emergere quali pagine probabilmente sono decadute oltre la loro mezza vita e hanno bisogno che un essere umano le ri-verifichi.
  • Nel dubbio, puntiamo alla documentazione ufficiale invece di copiare un valore. Un link a una fonte mantenuta ha una mezza vita molto più lunga di un numero incollato in un paragrafo.

Se costruisci le tue note, prompt o documenti interni su Claude, ruba direttamente questo approccio: tieni i tuoi fatti volatili in un unico posto datato e collegabile, e scrivi tutto il resto in modo che duri più a lungo di essi.

Correlati