比例类数据的差异性检验与AB测试的终止点

2021-01-05
阅读 4 分钟
6.2k
在实际业务中,我们经常会遇到频率类事件的假设检验,这类数据包括:留存率、点击率、转化率。我们甚至可以把大多数AB测试类的场景都理解为「频率的假设检验」。本文试图创建一个一般性的频率假设检验工具的EXCEL实现,并介绍其工作原理。文件参考这里(https://github.com/threecifanggen/data-science-tools/blob/maste...

数据指标/表现度量系统(Performance Measurement System)综述

2017-02-14
阅读 4 分钟
9.8k
传统的定量管理学中,一直是采用单个混合指标或者财务指标(financial index,大多数称为财务度量,financial measurement)做决策,但主要的缺点就是滞后性以及无法管理细节被人诟病1。

双坐标轴?绝对的反人类设计(可视化误区系列之一)

2016-05-29
阅读 5 分钟
10k
It's not possible in ggplot2 because I believe plots with separate y scales (not y-scales that are transformations of each other) are fundamentally flawed. Some problems: The are not invertible: given a point on the plot space, you can not uniquely map it back to a point in the data space. They a...

一起来复习Data Science:那些让人抓狂的回归分析

2016-02-15
阅读 3 分钟
9.6k
回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。在此,我讲会从机器学习和统计学两个方面分别描述回归在两个领域中的区别。

一起来复习Data Science:统计学中那些让人容易遗忘的知识点

2016-02-03
阅读 3 分钟
8.2k
1 描述性统计和预测性统计 描述性统计(Descriptive Statistics) 描述性统计是用来描述数据现状的统计量,描述性统计包括以下值: 均值(Mean) 中值(Median) 范围(range,包括最大值和最小值) 方差(SD) 标准差(Var) 预测性统计(Predictive Statistics) 预测性统计是使用历史数据加上数据挖掘、机器学习等方法...