跳到主要内容
所有级别

新鲜度半衰期

这是 AILmanac 整个网站围绕的一个视角,也是我们能交给你的、关于与 AI 协作最有用的一条观念:

并非所有关于 AI 的事实都以同样的速度腐烂。所以你不该对它们一视同仁。

一个模型的价格、"最好"模型的名字、Transformer 如何运作——这些都是"事实",但其中一条每周都在变,一条每月在变,还有一条多年来基本没怎么变过。如果你以同等的信心把这三条都装进脑子里,那么不出一个月,你就会信心十足地把其中两条说错。

我们觉得有用的一个模型:给每条事实一个新鲜度半衰期——一个关于它过多久后有 50% 的可能性已经过时的粗略感觉——然后基于这个半衰期来决定怎么处理它,而不是基于它感觉上有多重要。

核心动作:让处理方式匹配半衰期

对任何一条事实,你只能做三件事之一:

  • 缓存它——记在脑子里,不再核对就直接据此行动。
  • 重新核对它——假定它可能已经漂移;在依赖它之前对照来源核实。
  • 链接,而非记忆——根本不存储这个值;只存一个指向实时值所在位置的指针。

几乎所有人都犯的错误是:把本该链接的东西缓存了下来。他们记住了一个价格,半年后在会议上复述出来,结果是错的。新鲜度半衰期会告诉你该采取哪个动作。

各个层级

我们觉得有用的一个模型是把 AI 事实分到四个衰减层级里。各层之间的边界是故意模糊的——重点是这个梯度,而非精确的分界线。

层级半衰期示例该怎么做
易变小时到天确切价格、速率限制、队列/容量状态、实时 UI 标签和按钮名称、"API 现在是否在线"链接,而非记忆。 永远不要凭记忆引用。总是在你需要的那一刻从官方来源拉取实时值。
快变某个任务的"最佳"或"默认"模型是哪个、推荐设置、哪些功能处于预览阶段依赖前先重新核对。 持有一个临时假设没问题;但在押注任何东西之前先核实。
慢变到底存在哪些功能、工具和产品名称、宽泛的能力档位("它能看图吗?")缓存,但打上时间戳。 记在脑子里,但附上一个心理上的"大约截至何时",并在事关重大时重新核实。
持久Transformer 如何预测 token、为什么上下文窗口重要、提示原则、信任阶梯、乃至这个框架本身尽管缓存。 这些是真正值得学习的基础。在这里投入会产生复利。

如何解读这些层级

陷阱在于层级混淆——把一条易变的事实当作持久的来对待。"Claude 每百万 token 收费 $X" 感觉像一条扎实的事实,于是人们就把它缓存了。但它的半衰期是天,不是年。修正之道不是更用力地去记,而是在处理方式上把它降一级:链接到来源,而不是引用一个数字。

相反的错误更少见但确实存在:每次都去重新搜索那些持久的东西("LLM 是怎么工作的?"),而不是干脆学一次就记住。如果一条事实的半衰期是以年计的,就别再反复核对它了,把它内化吧。

当你发现自己正在陈述某条 AI 事实时,有个快速检验:"我刚说的那条的半衰期是多少?" 如果诚实的答案是"天",那你就应该指向一个来源,而不是你的记忆。

为什么这对 AI 比对几乎任何其他领域都更重要

大多数领域都有一种舒适的、持久事实与易变事实的混合。AI 不寻常:人们反复传播的"事实"中有很大一部分落在易变快变层级——模型名称、价格、限制、这周哪个东西最好。易变与持久之比很高。这恰恰是为什么如此多的 AI 建议会迅速过时,也是为什么"新鲜度优先"的习惯在这里比在变化更慢的领域回报更高。

它还解释了一条反直觉的规则:一条贴士对某个具体数字说得越自信,你就越该对它保持怀疑。 具体性与新鲜度常常处于张力之中。"用最便宜的够用模型"是持久的建议。"用模型 X,价格 $Y"则是某个瞬间的截图。

AILmanac 本身如何运行在这个观念之上

这不只是我们交给你的理论——它是整个网站的操作系统。

  • 易变事实从不硬编码进正文。 价格、限制和当前模型名称只存在一个地方——data/models.json,我们的唯一可信来源——以及我们持续核实的模型与定价页面。在其他任何地方,我们都链接到它们,而不是复述一个会腐烂的数字。
  • 每个易变页面都带有一个 <VerifyNote> 时间戳,记录人工上一次对照官方来源核对它的时间,就像这样:
  • 新鲜度仪表盘会为每个页面打分,依据是它的上次核实日期和你当前的时钟,这样网站就不会悄无声息地过时而不被显示出来。那个仪表盘就是新鲜度半衰期的具象化:它让那些很可能已经衰减过半、需要人工重新核实的页面浮现出来。
  • 拿不准时,我们就指向官方文档,而不是复制一个值。一个指向受维护来源的链接,其半衰期远比粘进段落里的一个数字要长。

如果你在 Claude 之上构建自己的笔记、提示或内部文档,请直接照搬这一套:把你的易变事实放在一个打了时间戳、可链接的地方,把其他一切都写成能比它们活得更久的样子。

相关内容