[译] 解密 Netflix 如何提升AB实验效率

2021-01-31
阅读 3 分钟
2.9k
从波哥大的起居室,到东京的早间通勤,再到洛杉矶的海滩和柏林的宿舍,Netflix 致力于为全球1.39亿会员带来欢乐,并将人们与他们喜爱的故事联系起来。从注册过程中与 Netflix 的第一次接触开始 -- 无论是在移动设备、平板电脑、笔记本电脑还是电视上 -- 客户体验的每一个部分都充满了创新。我们通过不断地从数据中学习和...

[译] 解密 Lyft 的AB实验最佳实践

2020-07-26
阅读 6 分钟
3.8k
科技公司努力做出数据驱动的产品决策的趋势下,Lyft 也不能免俗。 正因为如此,在线实验,或者说 a / b 测试,变得无处不在。 AB测试太火了,以至于你可能会认为它是一个完全解决的问题。 在这篇文章中,我们将解释为什么实际情况相去甚远,在 Lyft 的拼车市场一样,系统是根据网络动态发展的。 正如我们将看到的,天真...

[原]深入对比数据科学工具箱:Python3 和 R 之争[2020版]

2020-02-13
阅读 8 分钟
11.5k
R 和 Python2/Python3 在过去十年(Pandas问世后)的数据科学领域持续着激烈的竞争,随着时间的推移竞争格局也从混沌走向清晰。

[原]数据科学教程: 如何使用 mlflow 管理数据科学工作流

2018-10-31
阅读 5 分钟
9.7k
背景 近年来,人工智能与数据科学领域发展迅速,传统项目在演化中也越来越复杂了,如何管理大量的机器学习项目成为一个难题。 在真正的机器学习项目中,我们需要在模型之外花费大量的时间。比如: 跟踪实验效果 机器学习算法有可配置的超参通常都是十几个到几十个不等,如何跟踪这些参数、代码以及数据在每个实验中的表...

[译]快速上手:在R中使用XGBoost算法

2016-02-07
阅读 5 分钟
45.6k
介绍 你知道 XGBoost 算法是一种现在在数据科学竞赛的获胜方案很流行的算法吗? 那么,他比传统的随机森林和神经网络算法强在哪里呢?广义上来说,它在效率,准确性,可行性都更有优势(接下来我们将会详细讨论)。 在最近的几年中,模型预测已经变得越来越快速和准确了。我记得我曾花费数个小时在为某个模型构建特征工程...