ハルシネーションとその減らし方

中級

**ハルシネーション（幻覚）**とは、モデルが誤ったことを完全な自信をもって述べることです。嘘をついているわけでも壊れているわけでもありません。LLMの仕組みの裏返しなのです。LLMはもっともらしいテキストを生成しますが、もっともらしいことが常に真実とは限りません（LLMとは何か？を参照）。これをプロンプトで完全に消し去ることはできませんが、大幅に減らし、残りを捕まえることはできます。

なぜ起こるのか

モデルは、ありそうな続きを予測します。何かを「知らない」とき、最もそれらしく見える続きは、しばしば自信に満ちた、整った——そして誤った——回答になります。そのための余地を作らない限り、組み込みの「自信がない」というシグナルは存在しません。

高リスクの領域

出力が次のものを含むときは、最も懐疑的になりましょう。

引用、引用文、参考文献 — 捏造された論文、偽のURL、誤った帰属の引用文。
特定の数値、日付、統計 — もっともらしいが捏造された数字。
ニッチまたは非常に最近の事実 — モデルが確実に学習した範囲を超えるもの。
APIやライブラリの詳細 — 存在しないメソッドやパラメータ。
人物および法律/医療の具体的事項 — 重大で、微妙に間違えやすい。

削減のためのツールキット

これらを積み重ねましょう。それぞれが役立ちます。

ソースに根拠づける。 ソーステキストを貼り付け、*「上のテキストからのみ回答してください。そこになければ、ないと言ってください」*と伝えます。これがRAGの背後にある中心的なアイデアです。
逃げ道を与える。 *「確信がなければ『わかりません』と言ってください」*と明示的に許可します。自信に満ちた当て推量が劇的に減ります。
推論と引用を求める。 「各主張を裏付ける文をそのまま引用してください」。裏付けのない主張が一目瞭然になります。
創造性を下げる。 モデルが温度（temperature）の制御を公開している事実タスクでは下げましょう（サンプリング制御を参照）。
ツールを使う。 計算、最新データ、検索には、記憶に頼らせず、電卓/検索/ツールを与えましょう。
相互チェック。 同じ質問を2通りの方法で尋ねるか、2回目のパスで1回目を批評させましょう。

本当にあなたを守る心構え

:::warning 重要なことは——常に——検証する出力を100%信頼できるものにするプロンプトはありません。重要なことなら何でも——レポートの中の数値、引用、これから実行するコマンド、医療/法律/金融の詳細——信頼できるソースと照合して確認しましょう。AIは最終的な権威ではなく、速い初稿として扱いましょう。これが責任ある利用の核心です。 :::

シンプルなルール：間違っていることのコストが、検証の量を決める。 ブレインストーミング中？自由に信頼しましょう。統計を公表する？毎回検証しましょう。

なぜ起こるのか​

高リスクの領域​

削減のためのツールキット​

本当にあなたを守る心構え​

次に読む​

なぜ起こるのか

高リスクの領域

削減のためのツールキット

本当にあなたを守る心構え

次に読む