深度学习教程 | 浅层神经网络

2022-04-14
阅读 7 分钟
949
作者:韩信子@ShowMeAI教程地址:[链接]本文地址:[链接]声明:版权所有,转载请联系平台与作者并注明出处收藏ShowMeAI查看更多精彩内容本系列为吴恩达老师《深度学习专项课程(Deep Learning Specialization)》学习与总结整理所得,对应的课程视频可以在这里查看。引言在ShowMeAI前一篇文章 神经网络基础 中我们对以下内...
封面图

深度学习教程 | 神经网络基础

2022-04-14
阅读 8 分钟
1.2k
作者:韩信子@ShowMeAI教程地址:[链接]本文地址:[链接]声明:版权所有,转载请联系平台与作者并注明出处收藏ShowMeAI查看更多精彩内容本系列为吴恩达老师《深度学习专项课程(Deep Learning Specialization)》学习与总结整理所得,对应的课程视频可以在这里查看。引言在ShowMeAI前一篇文章 深度学习概论 中我们对深度学...
封面图

机器学习实战 | AutoML自动化机器学习建模

2022-03-22
阅读 22 分钟
595
在前序系列文章中大家跟着ShowMeAI一起学习了如何构建机器学习应用。我们构建一个机器学习模型解决方案baseline很容易,但模型选择和泛化性能优化是一项艰巨的任务。选择合适的模型并是一个需要高计算成本、时间和精力的过程。
封面图

机器学习实战 | 自动化特征工程工具Featuretools应用

2022-03-22
阅读 7 分钟
676
在ShowMeAI的文章 机器学习特征工程最全解读 里,我们给大家详细介绍了特征工程的操作,但我们实际上有很多工具可以辅助我们更快捷地完成特征工程,在本篇内容中,ShowMeAI给大家介绍Featuretools这个Python自动化特征工程的工具库。我们会借助于BigMart Sales数据集来演示自动化特征工程的相关应用。
封面图

机器学习实战 | 机器学习特征工程最全解读

2022-03-22
阅读 32 分钟
1.2k
上图为大家熟悉的机器学习建模流程图,ShowMeAI在前序机器学习实战文章 Python机器学习算法应用实践中和大家讲到了整个建模流程非常重要的一步,是对于数据的预处理和特征工程,它很大程度决定了最后建模效果的好坏,在本篇内容汇总,我们给大家展开对数据预处理和特征工程的实战应用细节做一个全面的解读。
封面图

机器学习实战 | 综合项目-电商销量预估进阶方案

2022-03-22
阅读 15 分钟
894
同样还是Rossmann这个场景问题,ShowMeAI在上一篇 机器学习实战 | Python机器学习综合项目-电商销量预估 里给大家讲解了基本的数据探索性分析、数据预处理和建模过程,本篇我们再来看看这些过程,对其中一些细节做一些优化。
封面图

机器学习实战 | 综合项目-电商销量预估

2022-03-21
阅读 14 分钟
1.2k
在本篇内容中,ShowMeAI将基于Kaggle数据科学竞赛平台的Rossmann store sales大数据竞赛项目,给大家梳理和总结,基于Python解决电商建模的全过程:包括数据探索分析、数据预处理与特征工程、建模与调优。
封面图

机器学习实战 | LightGBM建模应用详解

2022-03-21
阅读 23 分钟
1.3k
LightGBM是微软开发的boosting集成模型,和XGBoost一样是对GBDT的优化和高效实现,原理有一些相似之处,但它很多方面比XGBoost有着更为优秀的表现。
封面图

机器学习实战 | XGBoost建模应用详解

2022-03-21
阅读 19 分钟
1.3k
XGBoost是eXtreme Gradient Boosting的缩写称呼,它是一个非常强大的Boosting算法工具包,优秀的性能(效果与速度)让其在很长一段时间内霸屏数据科学比赛解决方案榜首,现在很多大厂的机器学习方案依旧会首选这个模型。XGBoost在并行计算效率、缺失值处理、控制过拟合、预测泛化能力上都变现非常优秀。
封面图

机器学习实战 | SKLearn最全应用指南

2022-03-21
阅读 36 分钟
1k
我们在上一篇SKLearn入门与简单应用案例里给大家讲到了SKLearn工具的基本板块与使用方法,在本篇内容中,我们展开讲解SKLearn的进阶与核心内容。SKLearn中有六大任务模块,如下图所示:分别是分类、回归、聚类、降维、模型选择和预处理。
封面图

机器学习实战 | SKLearn入门与简单应用案例

2022-03-21
阅读 5 分钟
680
在前面的机器学习案例中,我们使用了Python机器学习工具库Scikit-Learn,它建立在NumPy、SciPy、Pandas和Matplotlib之上,也是最常用的Python机器学习工具库之一,里面的API的设计非常好,所有对象的接口简单,很适合新手上路。ShowMeAI在本篇内容中对Scikit-Learn做一个介绍。
封面图

机器学习实战 | Python机器学习算法应用实践

2022-03-21
阅读 23 分钟
1.6k
本篇文章希望带大家完整走一遍机器学习应用流程,我们会讲解到基于Python的机器学习算法,应用在结构化数据和非结构化数据(图像)上,希望通过文章内容帮助大家在案例中重温机器学习基础知识,并学习应用机器学习解决问题的基本流程。
封面图

机器学习实战:手把手教你玩转机器学习系列

2022-03-21
阅读 2 分钟
632
本篇内容是ShowMeAI组织的「Python机器学习实战」系列教程入口,本教程尽量以案例和代码驱动的方式,帮助大家学习机器学习算法应用流程和各个链条环节,掌握构建场景建模解决方案并进行效果调优的能力。(想深入理解涉及的机器学习算法原理的同学,可以关注ShowMeAI的另外一个系列图解机器学习算法)
封面图

图解机器学习 | 降维算法详解

2022-03-11
阅读 10 分钟
1.1k
在互联网大数据场景下,我们经常需要面对高维数据,在对这些数据做分析和可视化的时候,我们通常会面对「高维」这个障碍。在数据挖掘和建模的过程中,高维数据也同样带来大的计算量,占据更多的资源,而且许多变量之间可能存在相关性,从而增加了分析与建模的复杂性。
封面图

图解机器学习 | 聚类算法详解

2022-03-10
阅读 7 分钟
1.1k
聚类(Clustering)是最常见的无监督学习算法,它指的是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。也即聚类后同一类的数据尽可能聚集到一起,不同类数据尽量分离。
封面图

图解机器学习 | 支持向量机模型详解

2022-03-10
阅读 13 分钟
1.3k
本篇我们要讲解的模型是大名鼎鼎的支持向量机SVM,这是曾经在机器学习界有着近乎「垄断」地位的模型,影响力持续了好多年。直至今日,即使深度学习神经网络的影响力逐渐增强,但SVM在中小型数据集上依旧有着可以和神经网络抗衡的极好效果和模型鲁棒性。
封面图

图解机器学习 | LightGBM模型详解

2022-03-10
阅读 8 分钟
1.7k
之前ShowMeAI对强大的boosting模型工具XGBoost做了介绍(详见ShowMeAI文章图解机器学习 | XGBoost模型详解)。本篇我们来学习一下GBDT模型(详见ShowMeAI文章 图解机器学习 | GBDT模型详解)的另一个进化版本:LightGBM。
封面图

图解机器学习 | XGBoost模型详解

2022-03-10
阅读 16 分钟
2.2k
XGBoost是eXtreme Gradient Boosting的缩写称呼,它是一个非常强大的Boosting算法工具包,优秀的性能(效果与速度)让其在很长一段时间内霸屏数据科学比赛解决方案榜首,现在很多大厂的机器学习方案依旧会首选这个模型。
封面图

图解机器学习 | GBDT模型详解

2022-03-10
阅读 5 分钟
1.3k
GBDT(Gradient Boosting Decision Tree),全名叫梯度提升决策树,是一种迭代的决策树算法,又叫 MART(Multiple Additive Regression Tree),它通过构造一组弱的学习器(树),并把多颗决策树的结果累加起来作为最终的预测输出。该算法将决策树与集成思想进行了有效的结合。
封面图

图解机器学习 | 回归树模型详解

2022-03-10
阅读 6 分钟
1.6k
大家在前面的部分学习到了使用决策树进行分类,实际决策树也可以用作回归任务,我们叫作回归树。而回归树的结构还是树形结构,但是属性选择与生长方式和分类的决策树有不同,我们一起来看看它的原理知识吧。
封面图

图解机器学习 | 随机森林分类模型详解

2022-03-10
阅读 5 分钟
1.7k
随机森林是一种由决策树构成的(并行)集成算法,属于Bagging类型,通过组合多个弱分类器,最终结果通过投票或取均值,使得整体模型的结果具有较高的精确度和泛化性能,同时也有很好的稳定性,广泛应用在各种业务场景中。

图解机器学习 | 决策树模型详解

2022-03-10
阅读 9 分钟
1.6k
决策树(Decision Tree)是机器学习中一种经典的分类与回归算法。在本篇中我们讨论用于分类的决策树的原理知识。决策树模型呈树形结构,在分类问题中,一颗决策树可以视作 if-then 规则的集合。模型具有可读性,分类速度快的特点,在各种实际业务建模过程中广泛使用。
封面图

图解机器学习 | 朴素贝叶斯算法详解

2022-03-10
阅读 8 分钟
1.3k
在机器学习中如KNN、逻辑回归、决策树等模型都是判别方法,也就是直接学习出特征输出\(Y\)和特征\(X\)之间的关系(决策函数\(Y= f(X)\)或者条件分布\(P(Y|X)\))。但朴素贝叶斯是生成方法,它直接找出特征输出\(Y\)和特征\(X\)的联合分布\(P(X,Y)\),进而通过\(P(Y \mid X)= \frac{P(X,Y)}{P(X)}\)计算得出结果判定。
封面图

图解机器学习 | 逻辑回归算法详解

2022-03-10
阅读 9 分钟
1.5k
本篇内容我们给大家介绍机器学习领域最常见的模型之一:逻辑回归。它也是目前工业界解决问题最广泛作为baseline的解决方案。逻辑回归之所以被广泛应用,因为其简单有效且可解释性强。
封面图

图解机器学习 | KNN算法及其应用

2022-03-10
阅读 6 分钟
1.3k
KNN在我们日常生活中也有类似的思想应用,比如,我们判断一个人的人品,往往只需要观察他最密切的几个人的人品好坏就能得到结果了。这就是KNN的思想应用,KNN方法既可以做分类,也可以做回归。在本篇内容中,我们来给大家展开讲解KNN相关的知识原理。
封面图

图解机器学习 | 模型评估方法与准则

2022-03-10
阅读 11 分钟
1.9k
事实上,在机器学习领域,对模型的测量和评估至关重要。选择与问题相匹配的评估方法,能帮助我们快速准确地发现在模型选择和训练过程中出现的问题,进而对模型进行优化和迭代。本文我们系统地讲解一下机器学习模型评估相关知识。
封面图

图解大数据 | Spark GraphFrames-基于图的数据分析挖掘

2022-03-09
阅读 7 分钟
554
由Databricks、UC Berkeley以及MIT联合为Apache Spark开发了一款图处理类库,名为GraphFrames。该类库构建在DataFrame之上,既能利用DataFrame良好的扩展性和强大的性能,同时也为Scala、Java和Python提供了统一的图处理API。
封面图

图解大数据 | Spark机器学习(下)—建模与超参调优

2022-03-08
阅读 14 分钟
1.1k
分类是一种重要的机器学习和数据挖掘技术。分类的目的是根据数据集的特点构造一个分类函数或分类模型(也常常称作分类器),该模型能把未知类别的样本映射到给定类别中的一种技术。
封面图

图解大数据 | Spark机器学习(上)-工作流与特征工程

2022-03-08
阅读 9 分钟
1.2k
作者:韩信子@ShowMeAI教程地址:[链接]本文地址:[链接]声明:版权所有,转载请联系平台与作者并注明出处1.Spark机器学习工作流1)Spark mllib 与mlSpark中同样有用于大数据机器学习的板块MLlib/ML,可以支持对海量数据进行建模与应用。2)机器学习工作流(Pipeline)一个典型的机器学习过程,从数据收集开始,要经历多个...
封面图

图解大数据 | 流式数据处理-Spark Streaming

2022-03-08
阅读 10 分钟
684
作者:韩信子@ShowMeAI教程地址:[链接]本文地址:[链接]声明:版权所有,转载请联系平台与作者并注明出处1.Spark Streaming解读1)Spark Streaming简介Spark Streaming是Spark核心API的一个扩展,可以实现实时数据的可拓展,高吞吐量,容错机制的实时流处理框架。Spark Streaming 支持的数据输入源很多,例如:Kafka、 ...
封面图