メインコンテンツまでスキップ

LLMとは何か?

初級

大規模言語モデル(LLM)——Claudeの背後にある技術——は、一見すると単純な1つのことをします。テキストを読み、次に来るものを予測するのです。一度に1つの塊ずつ。それだけです。ほかのすべては、それを驚くほどうまくやることから現れます。

一文のメンタルモデル

LLMとは、膨大な量のテキストを読み、言語——そしてその中にある考え——がどう続く傾向にあるかのパターンを学んだ、非常に高度なオートコンプリートである。

質問をしても、モデルは答えを「調べている」わけではありません。あなたのテキストの最ももっともらしい続きを、トークンごとに生成しているのです(トークンとコンテキストを参照)。良い質問のもっともらしい続きは、たいてい良い答えです。だからこそ、そもそもこれが機能するのです。

なぜこれがその強みを説明するのか

文章、コード、推論にわたるパターンを学んだので、LLMは流暢に書き、要約し、翻訳し、説明し、コーディングできます。これらはすべて「このテキストを理にかなったように続ける」タスクです。明確な設定を与えれば、強力な続きを生み出します。だからこそプロンプティングがこれほど重要なのです。あなたは、モデルが続けるテキストの出だしを形作っているのです。

なぜこれがその癖を説明するのか

同じ仕組みが、粗削りな部分も説明します。

  • 自信たっぷりに間違うことがある。 流暢に聞こえる続きが、常に真実とは限りません。それがハルシネーションです。
  • 今日の事実を本当に「知っている」わけではない——あなたが与えるか、調べるツールを持っていない限り。
  • 会話の間にメモリがない——あなたが何かを与えない限り。

LLMが「ではないもの」

:::warning 期待を調整すれば、より良い結果が得られる

  • データベースや検索エンジンではない。 生成するのであって、検証済みのレコードを取り出すのではありません。
  • 電卓ではない。 数学について推論できますが、正確である保証はありません。そのためにはツールを与えましょう。
  • 人間ではない。 感情も、意図も、連続したメモリもありません。強力なテキストエンジンです。 :::

それを、たまに記憶違いをする、聡明で、速く、博識なアシスタントとして扱い——そして重要なことは検証しましょう。

次に読む