LLMとは何か？

初級

大規模言語モデル（LLM）——Claudeの背後にある技術——は、一見すると単純な1つのことをします。テキストを読み、次に来るものを予測するのです。一度に1つの塊ずつ。それだけです。ほかのすべては、それを驚くほどうまくやることから現れます。

一文のメンタルモデル

LLMとは、膨大な量のテキストを読み、言語——そしてその中にある考え——がどう続く傾向にあるかのパターンを学んだ、非常に高度なオートコンプリートである。

質問をしても、モデルは答えを「調べている」わけではありません。あなたのテキストの最ももっともらしい続きを、トークンごとに生成しているのです（トークンとコンテキストを参照）。良い質問のもっともらしい続きは、たいてい良い答えです。だからこそ、そもそもこれが機能するのです。

なぜこれがその強みを説明するのか

文章、コード、推論にわたるパターンを学んだので、LLMは流暢に書き、要約し、翻訳し、説明し、コーディングできます。これらはすべて「このテキストを理にかなったように続ける」タスクです。明確な設定を与えれば、強力な続きを生み出します。だからこそプロンプティングがこれほど重要なのです。あなたは、モデルが続けるテキストの出だしを形作っているのです。

なぜこれがその癖を説明するのか

同じ仕組みが、粗削りな部分も説明します。

自信たっぷりに間違うことがある。 流暢に聞こえる続きが、常に真実とは限りません。それがハルシネーションです。
今日の事実を本当に「知っている」わけではない——あなたが与えるか、調べるツールを持っていない限り。
会話の間にメモリがない——あなたが何かを与えない限り。

LLMが「ではないもの」

:::warning 期待を調整すれば、より良い結果が得られる

❌ データベースや検索エンジンではない。 生成するのであって、検証済みのレコードを取り出すのではありません。
❌ 電卓ではない。 数学について推論できますが、正確である保証はありません。そのためにはツールを与えましょう。
❌ 人間ではない。 感情も、意図も、連続したメモリもありません。強力なテキストエンジンです。 :::

それを、たまに記憶違いをする、聡明で、速く、博識なアシスタントとして扱い——そして重要なことは検証しましょう。

一文のメンタルモデル​

なぜこれがその強みを説明するのか​

なぜこれがその癖を説明するのか​

LLMが「ではないもの」​

次に読む​

一文のメンタルモデル

なぜこれがその強みを説明するのか

なぜこれがその癖を説明するのか

LLMが「ではないもの」

次に読む