Tokens, contexto y memoria

Principiante

Tres ideas desbloquean muchos momentos de "¿por qué hizo eso?": los tokens, la ventana de contexto y la memoria.

Tokens: la unidad en la que piensan los modelos

Los modelos no leen caracteres ni palabras — leen tokens, fragmentos de texto que equivalen aproximadamente a ¾ de una palabra en inglés. "Unbelievable" podría ser de 3 a 4 tokens; las palabras comunes son uno cada una. Tanto tu entrada como la salida del modelo se cuentan en tokens, y eso es lo que se mide en precios y límites.

No necesitas contar a mano, pero una idea aproximada ayuda: ~750 palabras ≈ ~1.000 tokens. Pruébalo:

11palabras

68caracteres

~15–17tokens estimados

Solo una idea aproximada (~caracteres ÷ 4, o palabras × 1,33). El recuento de tokens depende del modelo: nunca uses el tokenizador de otro modelo. Para cifras exactas, usa el endpoint de recuento de tokens de Anthropic.

La ventana de contexto: la memoria de trabajo

La ventana de contexto es el número máximo de tokens que el modelo puede considerar a la vez — tu prompt más su respuesta más toda la conversación hasta ahora. Piénsalo como el escritorio del modelo: grande, pero finito.

Cuando una conversación crece más allá de la ventana, el contenido más antiguo se cae del escritorio. Por eso una conversación muy larga puede parecer que "olvida" lo que dijiste al principio, o empieza a desviarse.

:::tip Implicaciones prácticas

Para documentos largos, pon la instrucción clave al principio y repítela al final.
Inicia una conversación nueva para un tema nuevo en lugar de arrastrar un historial gigante.
En Claude Code, gestiona esto de forma deliberada — consulta Gestión del contexto. :::

Memoria: no hay ninguna, a menos que la proporciones

Por defecto, cada conversación es una hoja en blanco. El modelo no recuerda tu última conversación. La "memoria" aparente proviene de una de estas fuentes:

Reenviar el historial — las aplicaciones de chat reenvían la conversación en cada turno (hasta que se llena la ventana).
Funciones explícitas de memoria — algunas superficies de Claude ofrecen memoria entre conversaciones (consulta Memoria entre conversaciones).
Archivos que proporcionas — los Proyectos y CLAUDE.md dan un contexto persistente que tú controlas.
La API no tiene estado — para continuar una conversación, envías de vuelta los mensajes previos tú mismo (Primera llamada a la API).

Por qué esto importa

Casi todos los problemas de "ignoró mi instrucción anterior" o "perdió el hilo" se remontan a que la ventana de contexto se llena o a que se inicia una nueva sesión en frío. Sabiendo esto, estructurarás los prompts y las sesiones para mantener lo importante sobre el escritorio.

Tokens: la unidad en la que piensan los modelos​

La ventana de contexto: la memoria de trabajo​

Memoria: no hay ninguna, a menos que la proporciones​

Por qué esto importa​

Siguiente​

Tokens: la unidad en la que piensan los modelos

La ventana de contexto: la memoria de trabajo

Memoria: no hay ninguna, a menos que la proporciones

Por qué esto importa

Siguiente