SA分析师认证课程 - 第四章 数据分析方法全解析

在当今数字化的时代,数据分析对于企业的决策和发展起着至关重要的作用。第四章课堂笔记详细介绍了多种数据分析方法,包括事件分析、漏斗分析、留存分析等,这些方法能够帮助我们更好地理解用户行为、评估业务效果以及优化产品体验。下面,我们一起深入学习这些数据分析方法。

一、事件分析

1. 基本概念

事件分析是基于事件的指标统计、属性分组、条件筛选等功能开展的查询分析。事件可以是用户注册、加入购物车、付费等操作,用于追踪和记录用户行为或业务的过程。其价值在于能够快速了解业务现状、发现异常情况,是日常监控的常用手段。

2. 记录方式 - Event - User 模型

该模型包含用户(Users)和事件(Events)两部分。用户部分记录用户的相关属性,如用户 ID、性别、城市等;事件部分记录用户的具体行为事件,涵盖用户 ID、事件名称、商品价格等信息。

3. 指标与事件、维度的关系

指标基于事件数据计算得出,例如日活是通过统计特定时间段内触发相关事件的用户数量得到的。指标反映业务现象或场景的量化特征,维度是将指标按特定角度拆分的字段,如不同商品类型的 GMV,产品类型就是维度。

4. 主要应用场景

  • 看量级:关注结果类指标的量级,采用数值卡片呈现,如全站流量、全站日活等。
  • 看趋势:观测指标随时间的变化趋势,线形图是较为合适的展示方式。
  • 看结构:了解整体和部分的构成情况,用环形图展示部分占总体的比例;若关注整体和部分构成随时间的变化趋势,可采用堆叠柱形图。
  • 看细分:可进行不同维度的细分,更易发现规律。若关注具体数据明细,可采用表格展示形式;若关注某个单一维度的数据对比,柱形图是较好的呈现形式。
  • 多指标分析:在评估活动效果时,同时观察多个相关指标在相同时间点的表现,如活动页浏览人数、点击参与活动人数等。
  • 小技巧:在概览中查看 TopN,将概览组件配置成表格,通过在表头点击升序或降序查看;使用双坐标轴,用于同时展示多个指标,且不同指标的量级差异较大的情况。

二、漏斗分析

1. 基本概念

漏斗分析用于描述随着步骤推进而发生流逝的过程,通过统计具有严格顺序的流程中前后步骤的人数及转化率,评估该流程各步骤的流失情况。

2. 指标算法

步骤转化率 = 下一步骤行为人数 / 当前步骤行为人数。

3. 主要应用场景

  • 两步骤漏斗:关注转化结果,信息来源于时间维度和分类维度。分析思路包括看趋势,查看近期转化率变化趋势;看细分,按常见细分维度对比查看;看占比,在细分维度下查看部分分类的转化率占整体的比重。
  • 多步骤漏斗:关注步骤表现,采用诊断思路,发现冲突并定位问题。

4. 实际操作

窗口期是漏斗分析中必须设置的参数,不设置窗口期无法准确查询出数据。

三、留存分析

1. 基本概念

留存分析指用户发生某行为之后,在一段时间后再次发生该行为的情形,用于统计用户发生某初始行为后,间隔一段时间再次发生某后续行为的比例,衡量用户行为在时间维度上的持续性。

2. 指标算法

留存率 = 后续行为日期的人数 / 初始行为日期的人数。

3. 主要应用场景

  • 平台留存:基于某个关键行为,选定恰当的留存指标,观察用户在平台整体的留存情况。
  • 新老留存:区分新老用户观察留存情况,评估新用户和老用户留存引导工作的成效。
  • 功能留存:观察功能的留存情况,结合其他指标综合评估功能对平台的整体贡献。还可使用功能留存矩阵评估功能对流程的影响,确定功能改善的工作方向。同时,涉及功能渗透率、功能使用频率、功能留存率(长期)等指标。

4. 留存与流失的计算差异

留存是第 N 日的留存,流失是连续 N 日的流失。

四、分布分析

1. 基本概念

分布分析指某事物按某种规则分布在不同区域,用于统计在某种划分维度下各个不同区域的人群数量,横向对比不同区域的人群集中程度。

2. 指标算法

分布人数 = 该区域分布人数,分布百分比 = 该区域分布人数 / 所有区域总人数。

3. 主要应用场景

  • 运营思考从事与人两方面出发,关注运营工作表现以及运营对象的表现。
  • 观察不同时期的分布差异,印证运营措施的效果,定位不达预期或超预期的用户。
  • 观察不同人群的分布差异,帮助决策是否针对用户分群制定差异化的运营策略。

4. 实际操作

间隔分析的聚合时间单位包括按天、按月、按周,不包括按小时。

五、间隔分析

1. 基本概念

间隔分析指两个关联事件之间的时间距离,通过统计两个关联事件之间的时间长短,评价事件发生过程所耗费的时间是否合理。

2. 指标算法

在选定的时间范围内找到首个行为 A,从该行为 A 开始往后找到最近的行为 B,计算这对行为 AB 的时间间隔。

3. 主要应用场景

  • 主要观察指标为中位值和均值,用于评估绝大部分人的耗时情况。
  • 次要观察指标为最大值和最小值,用于捕捉潜在的异常问题。
  • 观察上下四分位的宽度,评估过程的差异性和稳定性。宽度较宽表明大多数人的差异明显,有进一步优化的空间;宽度较窄说明大多数人的体验稳定,提升空间较小。
  • 业务目标通常是缩短关联事件的时间间隔,缩短相同行为的间隔通常可提升用户粘性,缩短不同行为的间隔通常可提升用户在转化流程中的效率和体验。

4. 实际操作

在统计间隔时长时,总体的最大值可能会受到各种因素影响,存在比每天的最大值都大的情况;上四分位的计算方法是将数据按从大到小排列后,取 1/4 处的值;假设注册流程包括手机号注册,填写基本信息,实名认证 3 个事件,填写基本信息与实名认证的时间间隔并不是用户在基本信息页的停留时长;通过显示设置,只能不显示最大值和最小值。

六、归因分析

1. 基本概念

归因分析是将某个事件的发生原因归功或归咎于前向事件,通过某些归因算法,赋予导致目标事件发生的待归因事件一个贡献权重,公平评估各项业务措施的贡献度和有效度。

2. 主要应用场景

业务目标通常是找出效果好和效果不好的手段,对好的手段进行发扬放大,对坏的手段进行改进提升。包括独立应用和综合应用。目标事件分为线索导向型和决策导向型,待归因事件通常是某个转化入口或引导手段,手段之间可能存在协作关系。贡献度计算根据目标事件类型不同而不同,线索导向型按线索条数计算,决策导向型按目标事件达成次数或目标事件达成金额计算。

3. 需要归因的业态

  • 线索导向型:用户决策周期长,需要获取线索在线下进一步沟通,线上转化仅起承接作用。
  • 决策导向型:用户决策周期短,经冲动刺激可成功引导用户,通常线上直接达成商业目标。

4. 贡献度算法

  • 首次触点归因:强调第一个归因事件的功劳,适用于线索导向型产品,手法层级少,手段间关联性低。
  • 末次触点归因:认为最后一个归因事件功劳为 100%,适用于决策导向型产品,手段间关联性低,技术实现难度低,最为常用。
  • 位置归因:根据归因事件的位置分配功劳,适用于重视线索与决策,有一定手段层级复杂性的产品,极少使用。
  • 线性归因:平均分配各归因事件的功劳,适用于决策导向型产品,引导手段分工细致、较平均,较为常用。
  • 时间衰减归因:更注重近期事件的影响,适用于决策导向型产品,手段与时效关系密切。

七、Session 分析

1. 基本概念

Session 也称会话,类似于一段完整的对话过程,将一段时间内的所有行为封装为一个单元。通过 Session 分析,可将一连串行为按规则组成更大的单元,并以此单元为角度进行分析。

2. 主要应用场景

  • 以 Session 作为分析单元:评估指标包括 Session 个数、Session 时长、Session 深度、Session 跳出率。
  • 以 Session 内的事件作为分析单元:评估指标包括 Session 内某事件的 Session 次数、Session 内某事件的 Session 次数 / 总 Session 次数、Session 内某事件的事件时长、Session 内某事件的事件时长 / 总 Session 时长。

八、路径分析

1. 基本概念

路径分析指某一时间段内,按时间先后顺序记录用户群体从前到后每一步行为的走向,在一定程度上还原用户群体的决策过程,研究用户在行为过程中的各种可能性,了解用户群体在决策过程中的差异。

2. 主要应用场景

  • 明确起点探究后续:以某事件为起点探究后续路径,分析用户在发生某个里程碑事件后,是否顺利走向设想中的下一步动作。
  • 明确终点探究来源:以某事件为终点探究前向路径,分析用户在到达某个关键业务节点前的行为,以便了解用户到达该节点的因素。
  • 核心要义:心中对用户的理想路径有明确设想,才能感知真实路径中用户不符预期的行为走向,实施纠正措施。

3. 实际操作

用户路径分析中单节点显示的数字值指的是 session 数,而不是用户数;需要先配置好待分析事件。

九、网页热力分析

1. 基本概念

网页热力分析应用特殊高亮的颜色、数据标注等,显示页面或页面组区域中不同元素的点击密度、触达率、停留分布等特征,以可视化方式展示用户对网页不同位置的热衷程度,帮助了解用户习惯,优化产品体验。

2. 指标算法

  • 元素点击率 = 元素点击次数 / 当前页面浏览次数。
  • 元素点击占比 = 元素点击次数 / 当前页面所有元素点击次数。

3. 主要应用场景

  • 单页面热力分析:适用于推广落地页、活动页、网站首页等单独承载特殊功能的页面。
  • 页面组热力分析:适用于商品详情页等界面结构相似的网页。
  • 用户浏览深度分析:触达率指在当前筛选条件下,最终到达网页中某个位置的用户的比例,通过统计用户退出页面前最终到达的位置,计算页面的触达深度,分析用户浏览深度,帮助优化页面的内容和结构设计。

4. 实际操作

网页热力分析通过特殊高亮的颜色等显示页面元素的点击密度等特征,颜色越深通常表示该页面元素被点击的次数越多。

十、用户分群

1. 基本概念

用户分群是依据用户的属性特征和行为特征将用户群体进行分类,并对其进行观察和分析。

2. 价值

帮助营销人员实现客户细分,针对不同用户制定不同的运营策略,实现精细化运营;帮助企业更好地了解用户。

3. 划分方式

包括用户属性划分、用户行为划分、用户属性 + 用户行为划分。

4. 主要应用场景

  • 实现用户切分,辅助精细化运营:结合短信、push、邮件等推送系统,向指定用户群推送消息,根据用户特征提供偏好信息,促进用户活跃和转化。
  • 人群洞察:分析指定用户群的用户画像,更聚焦地了解用户基础信息和行为偏好,便于运营人员进行精准运营和制定营销策略。

5. 实际操作

创建用户分群可以从多个角度进行,通过用户属性、用户行为、行为序列筛选目标人群,也可上传用户 ID 直接指定特定的用户群体作为目标人群。

十一、自定义查询

1. 价值

支持使用标准 SQL 对神策分析的所有数据进行查询,并对查询结果进行简单可视化。

2. 分群计算的基准时间(base_time)

创建例行分群时,数据范围动态变化,需使用动态时间表示数据的时间范围;手动分群只能计算一次,投入计算后 base_time 不可修改。

3. 应用场景实例

包括连续 N 天做某事、做某事前后发生其他行为的次数等。


总之,通过学习这些数据分析方法,我们能够更加深入地了解用户行为和业务效果,为企业的决策和发展提供有力支持。希望大家在实际应用中能够灵活运用这些方法,不断提升数据分析能力。