Awesome Data Science in Python | 一文整理Python常用数据科学第三方模块

2019-06-16
阅读 1 分钟
3.6k
1. 机器学习 EDA lantern 特征工程 yellowbrick Featuretools 模型解释 SHAP Lime 通用 Scikit-learn 自动化机器学习 mljar-supervised 2. 统计方法 通用 StatsModels:通用概率派 Scipy:含常见分布、统计量计算 pyro:基于pyTorch的通用统计模型库 Edward:基于tensorflow的通用统计模型库 贝叶斯 PyStan:贝叶斯模型(...

从原理推导逻辑斯蒂回归——Logit变换和潜在因子误差

2017-01-08
阅读 3 分钟
8.6k
逻辑斯蒂回归(Logistic Regression,以下简称LR)的应用还有工程学的思路一般介绍地都很清楚,大多数方法都从Sigmoid函数开始。本博文试图通过其他视角来重新理解LR是如何推导的。

Python来做假设检验

2016-11-28
阅读 2 分钟
21k
对于任何一个频率派的数据科学家而言,日常做数据分析难免还是会用到一些假设检验方法做一个数据探索和相关性、差异性分析,并且这也是做后续统计模型(机器学习类预测模型可以略过)预测的第一步。

一起来复习Data Science:那些让人抓狂的回归分析

2016-02-15
阅读 3 分钟
9.1k
回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。在此,我讲会从机器学习和统计学两个方面分别描述回归在两个领域中的区别。