什么是 LLM?
用大白话讲下一个 token 预测——以及 LLM 不是什么。
Token、上下文与记忆
模型如何读取和记住文本,以及为什么长对话会跑偏。
System、User 与 Assistant 角色
一段对话的解剖结构,以及为什么系统提示是你最好的杠杆。
采样控制:温度及其相关参数
温度、top-p 与停止序列——何时该跑热、何时该跑冷。
幻觉及其减少方法
为什么模型会编造、高风险区域,以及一套具体的核实工具箱。
嵌入与向量检索
把含义表示为向量,以及语义检索的工作原理。
检索增强生成(RAG)
让任何模型回答关于你的数据的问题——以及要避免的失败模式。
微调 vs 提示 vs RAG
人们常弄错的决策框架,以及一条按此顺序尝试的规则。
评估 AI 质量(Evals)
构建黄金数据集、选定指标,并在用户之前发现回归。
隐私与数据处理
哪些内容可以安全粘贴、关于用你的数据训练,以及何时本地运行。
成本与延迟的权衡
成本/质量/速度三角,以及模型分级、缓存与批处理。
选择模型与提供商
一种厂商中立的选型方法——以及如何带着怀疑去读基准测试。
Claude 对比 ChatGPT、Gemini 与 Copilot
一种诚实、常青的方式,按你的需求比较各大助手。
AI 媒体生成(图像、音频、视频)
图像/音频/视频生成的定位——以及 Claude 能做什么、不能做什么。