SF
λ and τ
λ and τ
注册登录
关注博客
注册登录
主页
关于
RSS
如何优化基于Jupyter的分析/挖掘测试项目
三次方根
2018-11-04
阅读 5 分钟
4k
对于一个有软件工程项目基础的程序员而言,我们这群来源「可疑」的Data Scientist最被人诟病的就是期代码质量堪忧到让人崩溃的程度。本篇文章将介绍自己在以python/Jupyter Notebook为基础的分析/挖掘项目时是如何优化代码使其具有更大的可读性(执行效率不是本文的主要目的)。
用户行为与生存分析
三次方根
2018-08-06
阅读 7 分钟
8.7k
生存分析(Survival Analysis)来源于基础医学领域,最早用来研究各种治疗方案对病人寿命的影响。而寿命则用一个end event(死亡)的方式衡量。基本定义如下:
从原理推导逻辑斯蒂回归——Logit变换和潜在因子误差
三次方根
2017-01-08
阅读 3 分钟
9.2k
逻辑斯蒂回归(Logistic Regression,以下简称LR)的应用还有工程学的思路一般介绍地都很清楚,大多数方法都从Sigmoid函数开始。本博文试图通过其他视角来重新理解LR是如何推导的。
与相关系数相关的二三事
三次方根
2016-12-24
阅读 4 分钟
12.7k
Let me think... 我们什么时候学过相关系数(Correlation)一个词语。对了,就是验证模型好坏的R方里面的R。在R语言里调用也很简单:
完整数据团队Tips(关于BI系统、数据仓库、数据挖掘和数据实验的27条建议)
三次方根
2016-12-22
阅读 2 分钟
4.2k
有没有明确的用户行为定义,还是说只有PV? 查看PV是了解用户在做什么的最快方法,但是还有其他更重要的事。如果以后考虑到要升级网站或者APP,那么最好的方法是将PV转化成定义好的并且清晰的事件,例如注册、购买等等。
梯度下降法变种的汇总
三次方根
2016-09-24
阅读 3 分钟
10k
在各类优化方法中,梯度下降法(Gradient Descent)是最为常见的策略。这里将对一些常见的梯度下降法的变种做一个梳理。方便大家更好地理解梯度下降法的应用域。
一起来复习Data Science:那些让人抓狂的回归分析
三次方根
2016-02-15
阅读 3 分钟
9.6k
回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。在此,我讲会从机器学习和统计学两个方面分别描述回归在两个领域中的区别。