メインコンテンツまでスキップ

データ分析

すべてのレベル

AIでデータから答えを得るのに、データサイエンティストである必要はありません — ただし、AIを正直に保つ必要はあります。AIがクエリを書いて結果を説明し、あなたが数値が本物であることを確認します。

AIが役立つこと

  • 平易な言葉の質問からSQL / スプレッドシートの数式 / pandas を書く
  • クエリや結果がビジネス上どういう意味を持つかを説明する
  • 雑然としたデータをクリーニングして変換する(雑然とした状態を説明すると、手順が得られます)。
  • 質問に適したグラフを提案する
  • 出力を解釈し、次の質問を提案する。

安全なワークフロー

  1. データを説明する — カラム、型、そしてグレイン(1行 = ?)。名前を推測してはいけません。
  2. 分析が答えるべき質問を述べる
  3. クエリと、それが何をするか・その前提についての1行の説明を得る
  4. 実際のデータで自分で実行する
  5. 結果を持ち帰り、平易な言葉での解釈と注意点を得る。
My table `orders` has columns: order_id, customer_id, created_at, total_eur,
status. One row per order. Write SQL for monthly revenue from completed orders in
2025, and explain any assumptions.

ガードレール

:::warning AIが計算していない数値を決して信用しない AIがあなたのデータに対してクエリを実行せずに結果を述べた場合、その数値はでっち上げかもしれません。クエリは自分で実行し、自分で計算していない数値はすべて未検証として扱ってください。そして相関 ≠ 因果を忘れずに — 関連性に基づく主張にフラグを立てるよう求めてください。ハルシネーションを参照。 :::

  • 桁の妥当性を確認する — ありえない結果? 公表する前に調査してください。
  • 前提を述べる(NULL、重複排除、タイムゾーン、通貨)。
  • 機密データ/個人情報を貼り付けない — 検証していないツールには(プライバシー)。

次のステップ