[译] 层次时间序列预测法

2021-10-31
阅读 3 分钟
4.9k
大多数关于时间序列预测的文章都侧重于特定的聚合程度。但是,当我们能够深入分析聚合的数据,以便在更细粒度的层次上观察同一个序列时,挑战就出现了。在这种情况下,我们往往会发现,对较低水平的预测与总体预测并不一致。为了确保不会出现这种情况,我们可以采用一种称为分层时间序列(HTS)预测的方法。
封面图

[译] 解密 Lyft 如何构建自动化营销平台

2021-02-06
阅读 4 分钟
2.9k
我们以使用世界上最好的交通工具改善人们生活的使命为荣。在美国和加拿大,每个月都有超过5000万辆“碳中性”的 Lyft 搭车活动,而我们对搭车的潜力几乎一无所知。

[译] Ray Tune: 炼丹师的调参新姿势

2021-01-17
阅读 4 分钟
7.2k
在机器学习的大多数漂亮的结果背后,是一个研究生(我)或工程师花费数小时训练模型和调整算法参数。正是这种乏味无聊的工作使得自动化调参成为可能。
封面图

[译] 解密 Uber 的因果推断最佳实践

2020-05-30
阅读 5 分钟
5.3k
在 Uber Labs,我们的任务是利用行为科学的洞察力和方法论来帮助产品和市场团队改善客户体验。 最近,我们引入了中介模型来解决用户的痛点,它是一种来自学术研究的统计方法。

[原]海纳百川 有容乃大:SparkR与Docker的机器学习实战

2016-03-21
阅读 5 分钟
26.7k
大数据时代,我们常常面对海量数据而头疼。作为学统计出身的人,我们想折腾大数据但又不想学习Hadoop或者Java,我们更倾向于把精力放在建模和算法设计上,SparkR和Docker的完美结合,让R的计算直接从一架战斗机的当兵作战华丽转变为一个航空母舰战斗群!不仅仅简化了分布式计算的操作,还简化了安装部署的环节,我们只几...

[译]快速上手:在R中使用XGBoost算法

2016-02-07
阅读 5 分钟
45.6k
介绍 你知道 XGBoost 算法是一种现在在数据科学竞赛的获胜方案很流行的算法吗? 那么,他比传统的随机森林和神经网络算法强在哪里呢?广义上来说,它在效率,准确性,可行性都更有优势(接下来我们将会详细讨论)。 在最近的几年中,模型预测已经变得越来越快速和准确了。我记得我曾花费数个小时在为某个模型构建特征工程...