Awesome Data Science in Python | 一文整理Python常用数据科学第三方模块

2019-06-16
阅读 1 分钟
3.9k
1. 机器学习 EDA lantern 特征工程 yellowbrick Featuretools 模型解释 SHAP Lime 通用 Scikit-learn 自动化机器学习 mljar-supervised 2. 统计方法 通用 StatsModels:通用概率派 Scipy:含常见分布、统计量计算 pyro:基于pyTorch的通用统计模型库 Edward:基于tensorflow的通用统计模型库 贝叶斯 PyStan:贝叶斯模型(...

用进度条助您特征工程一臂之力

2018-08-18
阅读 3 分钟
10k
在具体的分析或者特征工程之中,经常会遇到处理时间很久的问题,当然必要的优化是必须的。但是显然,数据量上升,计算量过大后,处理时间是必须的此。时,如果有个可以帮助您查看任务进度的进度条,必定可以提高你抓住处理时间去做(磨)别(洋)事(工)。当然逐行打印是不错的选择,但在Jupyter notebook/JupyterLab中...

从原理推导逻辑斯蒂回归——Logit变换和潜在因子误差

2017-01-08
阅读 3 分钟
9.2k
逻辑斯蒂回归(Logistic Regression,以下简称LR)的应用还有工程学的思路一般介绍地都很清楚,大多数方法都从Sigmoid函数开始。本博文试图通过其他视角来重新理解LR是如何推导的。

与相关系数相关的二三事

2016-12-24
阅读 4 分钟
12.7k
Let me think... 我们什么时候学过相关系数(Correlation)一个词语。对了,就是验证模型好坏的R方里面的R。在R语言里调用也很简单:

梯度下降法变种的汇总

2016-09-24
阅读 3 分钟
10k
在各类优化方法中,梯度下降法(Gradient Descent)是最为常见的策略。这里将对一些常见的梯度下降法的变种做一个梳理。方便大家更好地理解梯度下降法的应用域。

Python 和 R 数据分析/挖掘工具互查

2016-05-01
阅读 5 分钟
15.1k
在此总结一些在数据分析/挖掘中可能用到的功能,方便大家索引或者从一种语言迁移到另一种。当然,这篇博客还会随时更新(不会另起一篇,为了方便大家索引),请大家如果有需要收藏到书签中。

一起来复习Data Science:那些让人抓狂的回归分析

2016-02-15
阅读 3 分钟
9.6k
回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。在此,我讲会从机器学习和统计学两个方面分别描述回归在两个领域中的区别。