内容主要参考《数据可视化分析(第2版):分析原理和 Tableau、SQL实践(全彩)》
概览
业务分析是从抽象到具体、自上而下、如“抽丝剥茧”的过程,最重要的抽象方式是聚合。问题解析是业务分析的起点,聚合是分析的本质,视指标(聚合度量的业务形态)为问题的核心。以“聚合度”为尺度衡量多个问题的抽象化程度,结合“详细级别”通往多维度、结构化分析。
主要知识体系如下图
问题解析
业务分析的需求来源
业务分析通常从一个特定的业务场景或分析主题开始,它们还需要分解为一系列子问题,然后逐一假设、验证。
业务可视化分析的需求来源于业务问题,以人资为例,分析主题可以是快递员薪酬公平性。拆解子问题可以是,黑龙江省各城市快递员岗位的平均工资
业务问题的抽象特征:
问题结构(显性)、聚合过程(隐性)、字段角色分类(抽象)是业务问题普遍具有的三个抽象特征
问题结构
业务问题的组成有如下三部分:
- 分析范围->对应筛选条件,决定聚合值的大小->筛选(Filter)
- 分析对象-对应分析维度,维度是聚合的依据->详细级别(Level of Detail,LOD)
- 问题答案-对应聚合,聚合是分析的本质->聚合(Aggregation,AGG)
将问题拆解后,如下图
聚合过程
分析的本质是聚合,聚合是从明细表到交叉表(聚合表)的过程,不包含聚合的问题不能称为分析,只能称为查找
“字段角色”分类
字段分为定性的维度(Dimension)和定量的度量(Measure)
度量必然包含聚合。
维度描述问题(是什么),度量回答问题(有多少);维度是(聚合)度量的(分组和计算)依据。
指标
指标是聚合度量的业务形态。指标是从业务角度出发的名词。
与指标相关的名词解释
- 业务计量(Measurement):记录量化的业务过程,如金额,数量,折扣等,包含度量值的数据表常常被称为“事实表”(Fact Table)
- 问题度量(Measure):聚合的结果,比如销售额总和、平均年龄、客户数、最高产量等。
- 指标(Metrics):具有高度抽象水平、具有业务指导意义的度量才会被视为运营指标(Operational Metrics),这些关键指标相互补充,构成了企业的指标体系
关键绩效指标(KPI):最重要的指标被称为“关键绩效指标”(KPI,Key Performance Indicator)
指标必然是聚合度量,反之则不然。比如客户的首次订单日期(MAX([订单日期])是聚合度量,但不会作为指标使用,基于它和最后订单日期计算而来的“客户生命周期”才是具有业务指导意义的指标。业务指标都是动态的,随着业务变化的。
业务指标的常见分类- 简单指标
- 指标组合:由简单指标经过计算得到
- 复合指标:在指标组合的基础上,附加和筛选范围
没有评论