数据分析
你不必是数据科学家也能借助 AI 从数据中获得答案——但你确实需要让它保持诚实。AI 负责编写查询并解释结果;而你负责确认这些数字是真实的。
它能帮上什么忙
- 根据一句通俗语言的问题编写 SQL / 电子表格公式 / pandas。
- 用业务术语解释一条查询或一个结果的含义。
- 清洗与转换杂乱的数据(描述杂乱之处,获得处理步骤)。
- 为这个问题推荐合适的图表。
- 解读输出结果并提出下一个该问的问题。
安全的工作流程
- 描述你的数据 —— 列、类型,以及粒度(一行 = ?)。不要臆测列名。
- 说明这次分析应当回答的问题。
- 获得查询 + 一行解释,说明它做了什么以及它所基于的假设。
- 在真实数据上自己运行它。
- 把结果拿回来,获得通俗语言的解读和注意事项。
My table `orders` has columns: order_id, customer_id, created_at, total_eur,
status. One row per order. Write SQL for monthly revenue from completed orders in
2025, and explain any assumptions.
护栏
:::warning 绝不要相信它没有计算过的数字 如果 AI 在没有对你的数据运行查询的情况下就给出一个结果,那个数字可能是编造的。请自己运行查询;把任何不是你亲自计算出来的数字都视为未经核实。还要记住相关性 ≠ 因果性——让它把关联性的论断标注出来。参见幻觉。 :::
- 对量级做合理性检查 —— 结果不合常理?那就去调查,而不是直接发布。
- 说明假设(空值、去重、时区、货币)。
- 不要把敏感/PII 数据粘贴到你尚未审查的工具中(隐私)。
下一步
- Artifacts:实时、可运行的输出 —— 快速搭建一个仪表板
- 数据分析师技能包
- 幻觉及如何减少它们