原创 PowerData-丁同学 PowerData
作者介绍
全文共 7670 个字,建议阅读 25 分钟
什么是指标体系
指标体系定义
指标体系是将零散单点的具有相互联系的指标,系统化的组织起来,通过单点看全局,通过全局解决单点的问题。它主要由指标和体系两部分组成。
指标是指将业务单元细分后量化的度量值,它使得业务目标可描述、可度量、可拆解,它是业务和数据的结合,是统计的基础,也是量化效果的重要依据。
举个通俗的例子,想象你正在玩一款建造城市的游戏。在游戏中,你需要关注许多不同的因素,如人口、资源、建筑物等。这些因素就是指标,它们帮助你了解城市的状况。但是,如果你只看一个因素,比如人口数量,你可能无法全面了解城市的发展。这时,城市建设的体系就派上用场了,它可以帮助你将人口、资源、建筑物等因素联系起来,让你更好地规划城市的发展。
总之,指标体系是一种管理工具,通过将各种度量值有机地组织在一起,帮助组织更好地了解业务并做出决策。它就像一把放大镜,让我们可以从不同角度来观察和分析业务运作的各个方面,有助于更好地优化和改进业务。
当我们谈论指标时,有两种主要类型:结果型指标和过程型指标。这两种类型在业务分析和决策中都起着重要作用,下面通过一个示例来解释它们:
假设我们经营一个在线电商网站,目标是提高销售收入,就会有以下几个指标:
- 结果型指标
一个典型的结果型指标可能是每月总销售额。这个指标是结果,因为它告诉我们在某段时间内我们实际赚了多少钱。结果型指标通常是延后知道的,因为您需要等到一段时间才能看到销售额的变化。这意味着在发生变化之前,我们很难采取直接的干预措施。结果型指标的作用在于监控业务的整体健康,如果总销售额骤降,这可能是一个警示信号,需要进一步调查。
- 过程型指标
与结果型指标不同,过程型指标关注的是影响最终结果的中间步骤。在电商网站的情境下,一个过程型指标可以是“购物车转化率”,即用户将商品加入购物车后最终完成购买的比例。这个指标告诉我们在用户购物的过程中,有多少人最终完成了购买。过程型指标可以通过采取不同的运营策略来影响,例如改善网站的用户界面、提供更多的支付选项或优化商品推荐算法。如果购物车转化率低,这可能表明用户在购物过程中遇到了问题,需要分析并采取措施以提高转化率,从而最终提高总销售额。
总之,结果型指标用于监测业务的总体表现,而过程型指标关注影响业务结果的中间步骤,并提供了指导改进的方向。通过同时关注这两种类型的指标,我们可以更全面地了解业务,并采取有针对性的措施来实现业务目标。
体系是由不同的维度组成,而维度是指用户观察、思考与表述某事物的“思维角度”,维度是指标体系的核心,没有维度,单纯说指标是没有任何意义的。
维度主要分为定性维度和定量维度,定性维度,主要是偏文字描述类如城市、性别、职业等;定量维度,主要是数值类描述如收入、年龄等,对定量维度需要做数值分组处理。
指标的构成
指标 = 业务维度描述 + 技术维度描述
指标,是反映某种事物或现象,描述在一定时间和条件下的规模、程度、比例、结构等概念,通常由指标名称和指标数值组成。
例如,‘用户平均停留时间’这个指标,它的业务维度描述告诉我们为什么这个指标重要,而技术维度描述则解释了如何计算这个指标的数值。指标数值是具体的结果,即 2 分钟。
这个指标可以帮助我们了解用户对网站的兴趣程度,从而采取措施来改进用户体验,例如增加吸引用户的内容或提高网站加载速度。通过将业务和技术维度结合起来,我们能够更好地理解和利用指标来优化业务。
指标的分级
在进行整个指标分级的时候,我们需要先思考:一级二级指标,能否反映产品当前的运营情况;三级四级指标能否帮助一线人员定位问题,指导运营工作。
数据本身是分层的,我们在思考指标的时候,也应该有一个层级的概念,而不是现阶段关心什么,我们就放什么;指标分级可以帮助我们更高效的去定位问题,去验证你的方法论,无需每次都要思考要去看哪些指标。
1. 公司战略层面指标
用于衡量公司整体目标达成情况,通常设定在 5-8 个指标。
这类指标是与业务紧密结合,按照行业标准进行制定,有可参考的行业标准指标,且这类指标针对全公司所有员工均具有核心的指导意义。
例如某游戏公司的一级指标:新增账号、留存率、DAU/MAU (日活跃用户/月活跃用户)、付费人数(率)、收入金额等。
2. 业务策略层面指标
为了实现一级指标,企业会做出一些策略,二级指标通常与这些策略有所关联。
可以简单理解为一级指标的实现路径,用于更快定位一级指标的问题。
例如某游戏公司一级指标是游戏收入,那么二级指标可以设定为不同游戏物品的收入。一级指标是 DAU(日活跃用户),那么二级指标设定为分服务器的 DAU 等。这样当一级指标出现问题的时候,我们可以快速查询到问题的所在点。
3. 业务执行层面指标
- 三级指标是对二级指标的路径拆解,用于定位二级指标的问题。
- 三级指标的使用通常是可以指导一线人员开展工作的指标内容。
- 三级指标的要求是:一线人员看到指标后,可以快速做出相应的动作。
例如游戏公司的二级指标是 XX 区服的 DAU,那么三级指标则可以设定为游戏时长、游戏频次、游戏等级分布、游戏关卡流失情况等。通过观察这些数据,可以去针对性地做调整,如某个关卡流失的用户特别高,那么尝试降低难度。
指标体系生命周期
生命周期主要包含定义、生产、消费、下线四个阶段。针对整个生命周期要持续做指标运维、质量保障,同时为了提高指标数据复用度,降低用户使用成本需要做对应的数据运营工作。
图 指标体系生命周期图
综合使用场景
指标体系主要是结合用户的业务场景来进行使用,多个不同的指标和维度可以组合起来进行业务的综合分析,用户可通过指标的变化看到整体业务的变化,并能够快速发现问题、定位问题。常用的场景一种是决策分析的场景,通过数据看清业务现状进行战略决策支持;另一种是运营分析场景,无论是做用户运营、产品运营还是活动运营都需要各类指标数据的支撑去看清问题、分析问题和指导解决问题。
指标体系的作用
衡量业务发展质量
指标体系可以反映业务客观事实,看清业务发展现状,通过指标对业务质量进行衡量,把控业务发展情况,针对发现的业务问题聚焦解决,促进业务有序增长。
建立指标因果关系
主要明确结果型指标和过程型指标关系,通过结果指标回溯过程指标,找到解决问题的核心原因。
指导用户分析工作
目的建立产品评估体系、活动效果评估体系、智能运营分析体系。
指导基础数据建设
明确基础数据建设方向,集中资源,避免过程和结果分析指标数据的遗漏或缺失。
指导内容产品建设
结合用户的业务场景来进行使用,多个不同的指标和维度可以组合起来进行业务的综合分析,用户可通过指标的变化看到整体业务的变化,并能够快速发现问题、定位问题。
统一指标消费口径
企业内统一关键指标业务口径及计算口径,统一企业业务目标,实现自上而下目标驱动。
搭建指标体系的方法
指标体系建设的常用方法是通过场景化进行指标体系的搭建,以用户的视角场景化思考,自上而下业务驱动指标体系建设,所以要在特定场景下做好指标体系建设,需要先选好指标,然后选择合适的方法搭建指标体系。
科学方法选指标
选指标常用方法是指标分级方法和 OSM 模型。
1. 指标分级
主要是指标内容纵向的思考,根据企业战略目标、组织及业务过程进行自上而下的指标分级,对指标进行层层剖析,主要分为三级 T1、T2、T3。
- T1 指标:公司战略层面指标
用于衡量公司整体目标达成情况的指标,主要是决策类指标,T1 指标使用通常服务于公司战略决策层。
- T2 指标:业务策略层面指标
为达成 T1 指标的目标,公司会对目标拆解到业务线或事业群,并有针对性做出一系列运营策略,T2 指标通常反映的是策略结果属于支持性指标同时也是业务线或事业群的核心指标。T2 指标是 T1 指标的纵向的路径拆解,便于 T1 指标的问题定位,T2 指标使用通常服务业务线或事业群。
- T3 指标:业务执行层面指标
T3 指标是对 T2 指标的拆解,用于定位 T2 指标的问题。T3 指标通常也是业务过程中最多的指标。根据各职能部门目标的不同,其关注的指标也各有差异。T3 指标的使用通常可以指导一线运营或分析人员开展工作,内容偏过程性指标,可以快速引导一线人员做出相应的动作。
2. OSM 模型(Obejective,Strategy,Measurement)
OMS模型是指标体系建设过程中辅助确定核心的重要方法,包含业务目标、业务策略、业务度量,是指标内容横向的思考。
- O
用户使用产品的目标是什么?产品满足了用户的什么需求?
主要从用户视角和业务视角确定目标,原则是切实可行、易理解、可干预、正向有益。
- S
为了达成上述目标我采取的策略是什么?
- M
这些策略随之带来的数据指标变化有哪些?
用分析模型搭建指标体系
AARRR 海盗模型是用户分析的经典模型,它反映了增长是系统性地贯穿于用户生命周期各个阶段的:用户拉新(Acquisition)、用户激活(Activation)、用户留存(Retention)、商业变现(Revenue)以及用户推荐(Referral)。
1. AARRR 模型
- A 拉新:
通过各种推广渠道,以各种方式获取目标用户,并对各种营销渠道的效果评估,不断优化投入策略,降低获客成本。涉及关键指标例如新增注册用户数、激活率、注册转化率、新客留存率、下载量、安装量等。
- A 活跃:
活跃用户指真正开始使用了产品提供的价值,我们需要掌握用户的行为数据,监控产品健康程度。这个模块主要反映用户进入产品的行为表现,是产品体验的核心所在。涉及关键指标例如 DAU/MAU (日活跃用户/月活跃用户)、日均使用时长、启动 APP 时长、启动 APP 次数等。
- R 留存:
衡量用户粘性和质量的指标。涉及关键指标例如留存率、流失率等。
- R 变现:
主要用来衡量产品商业价值。涉及关键指标例如生命周期价值(LTV)、客单价、总消费额(GMV )等。
- R 推荐:
衡量用户自传播程度和口碑情况。涉及关键指标例如邀请率、裂变系数等。可以根据实际业务场景,结合使用 OSM 和 AARRR 模型,来系统性的选择不同阶段所需要的核心数据指标。
可以根据实际业务场景,结合使用 OSM 和 AARRR 模型,来系统性的选择不同阶段所需要的核心数据指标。
图 指标构建图
场景化搭建指标体系
目前阶段互联网业务比较流行的一种通用抽象场景“人、货、场”,实际就是我们日常所说的用户、产品、场景,在通俗点讲就是谁在什么场景下使用了什么产品,不同的商业模式会有不同的组合模式。以滴滴实际场景为例:哪些场景(此处场景定义为终端,如 Native,微信,支付宝)的什么人(乘客)在平台上使用了哪些货(平台业务线,如快车/专车等),进而为评估用户增长的价值和效果。
- “人”的视角:
从“人”的视角,我们比较关心的是什么乘客在什么时间打的车,排了多长时间,等了多长时间上车,周期内第几次打车,打车花了多少钱,是否有投诉和取消行为,具体到数据指标主要看发单用户数、完单用户数、客单价、周期内完单订单数、取消订单数、评价订单数等。
- "货"的视角:
从“货”的视角,我们比较关心的就是成交了多少,交易额多少,花了多少,到具体数据指标主要会看总消费额(GMV)、成交率、取消率指标,再进一步会细分到城市、区域,一级品类、二级品类。数据的效果通过目标对比,横向对比、历史比较等方式进行分析确定。
- "场"的视角:
从“场”的视角,我们比较关心的就是哪个渠道用户点击量大曝光率大,带来了多少新用户,完成多少交易订单,客单价是多少;或者是哪个活动拉新或促活效果怎么样转化率多少,结合场景数据实际情况制定对应策略。
以上分别从“人”、“货”、“场”三个角度进行了数据指标和分析维度的提炼,下面我们把三类指标结合指标分级方法进行分解关联。
指标体系的管理
痛点分析
主要从业务、技术、产品三个视角来看:
- 业务视角:
- 业务分析场景指标、维度不明确;
- 频繁的需求变更和反复迭代,数据报表臃肿,数据参差不齐;
- 数据分析师分析具体业务问题找数据、核对确认数据成本较高。
- 技术视角:
- 指标定义,指标命名混乱,指标不唯一,指标维护口径不一致;
- 指标生产,重复建设;数据汇算成本较高;
- 指标消费,数据出口不统一,重复输出,输出口径不一致;
- 产品视角:
- 缺乏系统产品化支持从生产到消费数据流没有系统产品层面打通;
管理目标
- 技术目标:
统一指标和维度管理,指标命名、计算口径、统计来源唯一, 维度定义规范、维度值一致。
- 业务目标:
统一数据出口、场景化覆盖。
- 产品目标:
指标体系管理工具产品化落地;指标体系内容产品化落地支持决策、分析、运营例如决策北极星、智能运营分析产品等。
模型架构
1. 业务板块
业务逻辑层面进行抽象、物理组织架构层面进行细分,可根据实际业务情况进行层级分拆细化,层级分级建议进行最多进行三级分拆,一级细分可公司层面统一规范确定,二级及后续拆分可根据业务线实际业务进行拆分。这就是指标分级。
2. 规范定义:
- 数据域
面向业务分析,将业务过程或者维度进行抽象的集合。其中,业务过程可以概括为一个个不可拆分的行为事件,在业务过程之下,可以定义指标;维度是指度量的环境,如买家下单事件,买家是维度。为保障整个体系的生命力,数据域是需要抽象提炼、并且长期维护和更新的,但不轻易变动。在划分数据域时,既能涵盖当前所有的业务需求,又能在新业务进入时无影响的被包含进已有的数据域和扩展新的数据域。
- 业务过程
指公司的业务活动事件,如呼单、支付都是业务过程。其中,业务过程不可拆分。
- 时间周期
用来明确统计的时间范围或者时间点,如最近 30 天、自然周、截止当日等。
- 修饰类型
是对修饰词的一种抽象划分。修饰类型从属于某个业务域,如日志域的访问终端类型涵盖 APP 端、PC 端等修饰词。
- 修饰词
指的是统计维度以外指标的业务场景限定抽象,修饰词属于一种修饰类型,如在日志域的访问终端类型下,有修饰词 APP、PC 端等。
- 度量/原子指标
原子指标和度量含义相同,基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,具有明确业务含义的名称,如支付金额。
- 维度
维度是度量的环境,用来反映业务的一类属性,这类属性的集合构成一个维度,也可以称为实体对象。维度属于一个数据域,如地理维度(其中包括国家、地区、省市等)、时间维度(其中包括年、季、月、周、日等级别内容)。
- 维度属性
维度属性隶属于一个维度,如地理维度里面的国家名称、国家 ID、省份名称等都属于维度属性。
- 指标分类
指标分类主要分为原子指标、派生指标、衍生指标。
① 原子指标
基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,具有明确业务含义的名称,如呼单量、交易金额。
② 派生指标
派生指标由原子指标、业务限定、时间周期、统计粒度组合得到。原子指标、业务限定,直接归属在业务过程下。派生指标唯一归属一个原子指标,继承原子指标的数据域。
派生指标又分以下二种类型:
a. 事务型指标
事务型指标是指对业务活动进行衡量的指标。
例如,新发商品数,重发商品数,新增注册会员数,订单支付金额,这类指标需维护原子指标及业务限定,在此基础上根据指定的统计粒度创建派生指标。
b. 存量型指标
存量型指标是指对实体对象(如商品、会员)某些状态的统计,它最典型的特点是它的总量不是一个统计时间范围内的增量,而是历史累计到统计时间点的全量。
例如,当前商品总数,当前会员总数,这类指标维护原子指标及修饰词,在此基础上创建派生指标,对应的时间周期为“历史截止到当前”。
c. 衍生指标
衍生指标是在事务性指标和存量型指标的基础上复合成的。
例如,店铺最近 1 天无线端支付金额按行业降序排名、本月成交额与去年同期同比变化率等。主要有排名型、排名对象集合型、变化量型、变化率型、比率型、比例型、统计型均值。
如何确定指标体系
明确业务目的,确定核心指标
指标的选取是核心的一步。如果我们选择了正确的指标,它就像一个晴雨表,能很好地衡量业务的健康状况。如果我们选择了一个错误的或者是虚荣的指标,它可能会把我们引导到一个错误的路径上去,这是一个很大的陷阱。
业务目标其实是和我们的产品息息相关的,我们可以大致将我们的产品划分到下面四类中去。
针对每一类的产品,我们都可以抽象出下面的一些比较通用的指标。
1. 工具类业务
帮助用户节省时间,产品自身提供价值。如墨迹天气、TEA。核心指标应该聚焦到判断工具的使用率。
比如说为用户提供工具类型业务策略,一般是为了让用户节省时间,快速的定位到所需要的信息或者完成某一种任务, 那么这种策略核心的价值就在于提升效率,一般的衡量指标是:使用量,目标达成率, 频次;
以电商的例子来讲的话,就是第一步中的流量推荐位,以及搜索功能是不是能够让用户快速的定位到它所感兴趣的直播内容,那这种情况下做优化流量位的内容和搜索匹配优化我的衡量标准就是它的效率,曝光,点击,转化效率。
2. 内容类业务
比如说为了用户提供消遣的内容,让用户可以消磨时间, 那么这种策略的核心价值就在于为了用户提供丰富的高质量的内容,不管是短视频, 直播, 或者活动玩法。
那么这种策略的核心的价值就在于为用户提供内容的量与质,一般衡量指标是:消费人数, 消费广度, 消费市场,以及用户与内容的互动,用来衡量用户对于内容的喜爱。比如 B 站的弹幕就是一种用户对于内容认可的更高层次的情感表达。
3. 交易类业务
帮助用户节省时间,产品通过链接其他资源提供价值。如淘宝、京东金融。核心指标应该聚焦到转化率。
那么这种策略的核心价值就在于为用户提供好的购物体验,能够提升付费页面转化效率, 提升购买的总规模,客单价以及复购率。
4. 社交类业务
杀掉用户时间,产品通过链接其他资源提供价值。如 Soul、探探。核心指标应该聚焦到用户的活跃程度。
比如说为了用户提供与其他人的情感连接, 促进用户和用户之间的关系沉淀,进而让用户对于平台或者对于业务更有依赖性,促进用户的活跃和互动,一般的衡量指标是:内容的发布量,用户和用户之间的互动量,沉淀下来的关系对数。
微信,是用户和用户之间的一个情感的连接,那衡量这种连接的紧密性主要是人与人之间的互动量,点评赞数量,沉淀的关系的数量。
拆解核心指标
明确业务类型和业务指标之后,我们要结合实际业务,将主要关注的指标拆解到可行动的程度。
图 指标拆解示意图
- 按场景拆分成多个子指标的和
DAU ≈ 日新增用户+留存用户+回流用户;
- 按一定的关系拆分成多个子指标的积
GMV(总消费额)≈ 用户数 x 购买频次 x 客单价;
销售额 ≈ 用户总量 x 付费率 x 客单价;
LTV(生命周期总价值 ,life time value )=LT(生命周期 ,life time)x ARPU(每个用户的平均花费,Average Revenue Per Use)
指标迭代
一个好的指标肯定不是能一鼓作气就可以实现的,需要不断的迭代,而这个过程需要多方进行配合。
评价指标体系
在做一些数据分析的时候,我们都会看到列出来的一些标准:数据指标必须是准确的,是能够周期性统计,当然这只是一方面,另外一方面就是业务层面是有价值,可衡量业务真实情况,并且还要简单可执行。
从技术层面来看,一个好的指标,统一具备四个特点:容易收集快速衡量;准确度高;可被多维度分解;单一数据源。
就像我们经常使用的衡量 APP 产品启动人数,使用 UUID 或者是 COOKIE 往往比使用 IP 更加准确。
但很多时候,因为技术或者是业务自身的原因,我们往往很难找到很完美的指标。那么这个时候我们最重要的就是统一口径进行分析,更多地观察数据的波动情况。
我们可以从下面几个方面去评价指标体系的好坏,其实主要还是分为两大类,一是真实贴合业务,可以反映业务;二是可以快速定位问题,提供解决方案。
1. 系统性
能够发现局部与整体的关系及问题定位,当数据发生异动时,通过指标体系的逻辑拆解,能迅速定位到大致的异动模块及原因。
2. 全面性
能满足不同数据使用方的日常需求,对产品经营及发展情况有整体了解。
3. 认知统一
指标体系服务于不同角色群体,简单科学可解释,符合大众认知,大家都共同认可。
4. 真实性
指标体系要能反映产品真实情况,杜绝华而不实的虚荣指标;
指标是为了让公司,业务,或者项目的成员围绕着一个可量化的目标展开一系列的工作的。如果数据指标没有贴合业务核心目标的话,那么给公司,业务或者项目带来的会是巨大的损失。
5. 可迭代
指标体系随不同生命周期阶段而改变,指标体系要在发展中保持迭代。
6. 可操作
如果能从时间纵向对比、或者从其他维度比如用户群体、产品、地域等不同角度进行横向比较,可以更好地观察业务的发展趋势,定位问题,找到原因,以及改善业务中需要改善的环节。
- KPI 达标率:
如果你的核心指标是 KPI 指标,那就直接根据 KPI 达标率来判断即可。这个应该是最常见的一种方式。
- 竞品对标:
如果你能从靠谱渠道搜集到竞品相关数据,那以竞品为参照物进行判断。
- 环比对比:
查看环比数据,如果业务走势呈明显周期性,选择一个历史数据较为不错的数据进行对比。
- 同比对比:
查看同比数据,预估每个周期增长多少个百分点,与上一周期数据进行对比,看是否达标。
参考文献
[1] 玩物少年们:数据指标体系搭建实践
[2] 大数据技术派:数仓建模—指标体系
[3] NK冬至:数仓实践-数据指标体系建设OneData版本
[4] 大数据技术与架构:数据仓库&数据指标&数据治理体系搭建方法论
[5] PowerData满一:【万字长文】数仓构建理论
利用 flink retract 计算长生命周期下跨业务状态指标
我们是由一群数据从业人员,因为热爱凝聚在一起,以开源精神为基础,组成的PowerData数据之力社区。
如果你也想要加入学习,可关注下方公众号后点击“加入我们”,与PowerData一起成长!
同时可直接扫描下方二维码添加“PD\_Draw”(笔者)微信,和作者进行关于大数据相关的学习交流。
丁同学是一名23届的应届毕业生,在学校努力学习的同时,与开源社区的伙伴们进行良好的技术交流。在这个过程中,不断挑战自己、加强自身技术能力,拓宽自己的技术栈。不但拥有实战项目经历,还有较为出色的技术实力。
丁同学目前在寻找工作机会,感兴趣的小伙伴们可以加笔者微信交流呀~
- END -
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。