Python的高级特性,模块和IO操作

2019-04-18
阅读 7 分钟
254
高级特性中会讲述列表生成式、生成器、和一些高级函数,学习这些方便我们快速的生成列表,节省我们使用Python的时间,更快的使用Python达成我们的目的。

python中的类&面向对象的基本概念

2019-04-18
阅读 3 分钟
222
首先我们为什么要学习面向对象,我讲一个故事,应该就可以明白了。在古时候,官府衙门如果要颁布什么告示就会去找工匠将命令中的字都雕刻到石刻上去,然后在把石刻当模板印出文字来, 当工匠辛辛苦苦将文字都在石刻上雕刻好,突然官府又说告示上的文字显得不够官方,不够威严,需要改动一两处小的文字。于是工匠又只能再取一...

机器学习之sklearn中的降维算法

2019-04-18
阅读 4 分钟
296
sklearn中降维算法都被包括在模块decomposition中,这个模块本质是一个矩阵分解模块。在过去的十年中,如果要讨论算法进步的先锋,矩阵分解可以说是独树一帜。矩阵分解可以用在降维,深度学习,聚类分析,数据预处理,低纬度特征学习,推荐系统,大数据分析等领域。在2006年,Netflix曾经举办了一个奖金为100万美元的推...

SKLearn分类树在合成数集上的表现

2019-04-18
阅读 6 分钟
258
小伙伴们大家好~o( ̄▽ ̄)ブ,我是菜菜,这里是我的sklearn课堂 我的开发环境是Jupyter lab,所用的库和版本大家参考: Python 3.7.1(你的版本至少要3.4以上 Scikit-learn 0.20.0 (你的版本至少要0.20 Graphviz 0.8.4 (没有画不出决策树哦,安装代码conda install python-graphviz Numpy 1.15.3, Pandas 0.23.4, Matplo...

机器学习中的“维度”是什么?

2019-04-18
阅读 2 分钟
322
“维度”这个词在机器学习里面,应该是一个高频词,它经常出现在人们的视野中,比如说随机森林是通过随机抽取特征来建树,以避免高维计算;再比如说,sklearn中导入特征矩阵,必须是至少二维;特征选择的目的是通过降维来降低算法的计算成本……这些语言都很正常地被我用来使用,直到有一天,一个小伙伴问了我,”维度“到底是...

sklearn中的数据预处理和特征工程

2019-04-18
阅读 19 分钟
288
小伙伴们大家好~o( ̄▽ ̄)ブ,我是菜菜,我的开发环境是Jupyter lab,所用的库和版本大家参考: Python 3.7.1(你的版本至少要3.4以上 Scikit-learn 0.20.0 (你的版本至少要0.19 Numpy 1.15.3, Pandas 0.23.4, Matplotlib 3.0.1, SciPy 1.1.0 1 sklearn中的数据预处理和特征工程 sklearn中包含众多数据预处理和特征工程...

数据挖掘的五大流程之数据预处理&特征工程

2019-04-18
阅读 2 分钟
303
想象一下未来美好的一天,你学完了菜菜的课程,成为一个精通各种算法和调参调库的数据挖掘工程师了。某一天你从你的同事,一位药物研究人员那里,得到了一份病人临床表现的数据。药物研究人员用前四列数据预测一下最后一数据,还说他要出差几天,可能没办法和你一起研究数据了,希望出差回来以后,可以有个初步分析结果...

随机森林在乳腺癌数据上的调参

2019-04-18
阅读 8 分钟
298
案例中,往往使用真实数据,为什么我们要使用sklearn自带的数据呢?因为真实数据在随机森林下的调参过程,往往非常缓慢。真实数据量大,维度高,在使用随机森林之前需要一系列的处理,因此不太适合用来做直播中的案例演示。原本,我为大家准备了kaggle上下载的辨别手写数字的数据,有4W多条记录700多个左右的特征,随机...

随机森林在sklearn中的实现

2019-04-18
阅读 6 分钟
469
小伙伴们大家好~o( ̄▽ ̄)ブ,我是菜菜,我的开发环境是Jupyter lab,所用的库和版本大家参考: Python 3.7.1(你的版本至少要3.4以上 Scikit-learn 0.20.0 (你的版本至少要0.19 Numpy 1.15.3, Pandas 0.23.4, Matplotlib 3.0.1, SciPy 1.1.0 1 概述 1.1 集成算法概述 集成学习(ensemble learning)是时下非常流行的机...

机器学习中调参的基本思想

2019-04-18
阅读 4 分钟
255
我发现大多数的机器学习相关的书都是遍历各种算法和案例,为大家讲解各种各样算法的原理和用途,但却对调参探究甚少。这中间有许多原因,其一是因为,调参的方式总是根据数据的状况而定,所以没有办法一概而论;其二是因为,其实大家也都没有特别好的办法。

SKlearn中分类决策树的重要参数详解

2019-04-18
阅读 4 分钟
330
classsklearn.tree.DecisionTreeClassifier(criterion=’gini’, splitter=’best’, max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=None, random_state=None, max_leaf_nodes=None, min_impurity_decrease=0.0, min_impurity_split=None, class_weight=None, pres...

机器学习之决策树在sklearn中的实现

2019-04-18
阅读 10 分钟
288
决策树在sklearn中的实现 小伙伴们大家好~o( ̄▽ ̄)ブ,首先声明一下,我的开发环境是Jupyter lab,所用的库和版本大家参考: Python 3.7.1(你的版本至少要3.4以上 Scikit-learn 0.20.0 (你的版本至少要0.20 Graphviz 0.8.4 (没有画不出决策树哦,安装代码conda install python-graphviz Numpy 1.15.3, Pandas 0.23.4, ...

毕业季即将来临 未来十年“最紧缺人才”的专业 人工智能排第一

2019-04-18
阅读 2 分钟
1.2k
又是一年毕业季,经历了面试屡次碰壁后,不禁回忆报考那年,当年为什么能选择这个专业!没就业前景,没发展前景,毕业等于失业,此时此刻竟无语凝噎。

用AI创造AI,人工智能无代码时代来临

2019-04-18
阅读 5 分钟
520
玛丽·雪莱在创作世界上第一部科幻小说《科学怪人》(又译:弗兰肯斯坦)的时候,恐怕没法预见到在一个多世纪后的今天,真的会出现一种脱胎于虚无,却能判断、能决策的存在。

IPF 2019:人工智能计算 驱动产业变革

2019-04-18
阅读 4 分钟
2.2k
医疗、金融、工业、交通、零售,目之所及,无不在经历智慧化的变革。而在众多产业转型、商业升级的故事背后,是人工智能计算的驱动力量。作为人工智能计算领导者的浪潮,在4月16日举行了IPF2019浪潮云数据中心合作伙伴大会,以“智慧凝聚”为主题,即意在凝聚生态力量,聚焦人工智能,拥抱智慧时代。

我国当前大数据的发展现状——阿里巴巴、百度和腾讯为例

2019-04-17
阅读 3 分钟
4.8k
大数据时代,催生了各种各样的数据分析和数据挖掘岗位,让使得越来越多人投身到大数据分析和大数据挖掘的行列。对于大数据的未来发展,大家都是秉持着乐观的心态的,而且当前的互联网金融和各个公司都开始重视和运用大数据来给自己的集团增添利益和名誉,其中最为出名的就当属阿里巴巴、百度和腾讯了。无论未来大数据的...

一篇文章带你使用Pandas画出图形

2019-04-17
阅读 6 分钟
472
这篇文章带领大家介绍一下如何使用pandas进行可视化操作,绘制一些图形,如条形图、直方图、散点图等,以及一些绘图时缺失值的绘制方式和一些绘图的工具和格式,方便大家更快的了解如何使用Pandas进行可视化的绘图,相信通过这篇文章大家可以在以后处理数据的时候可以绘制出自己想要的图形。

浪潮IPF2019——中国工程院院士王恩东提出人工智能计算是未来核心动力

2019-04-17
阅读 3 分钟
1k
4月16日,以“智慧凝聚”为主题的IPF2019浪潮云数据中心合作伙伴大会在上海举行,中国工程院院士、浪潮集团执行总裁王恩东在大会演讲时指出,人工智能正在驱动前所未有的社会变革,这一颠覆性技术依赖强大的计算力支撑,人工智能计算作为一种当下及未来的主要计算形态,正在成为智慧未来的核心动力。

带你领略pandas中多表之间如何处理

2019-04-16
阅读 7 分钟
391
但我们在处理Pandas多表数据时,我们需要将多个表之间进行表格的连接与合并,当连接完多表之后我们可能还需要对数据进行多重的索引,方便我们更快的找到数据,以及对数据进行做透视表,更加直观的去观察我们的数据,今天我们就围绕着数据合并以及数据重塑及透视表进行展开讲解,让我们去了解在Pandas中如何去这么操作数据。

2019Q1人才流动报告:上海平均月薪9723元位居第一,杭州涨薪最快

2019-04-16
阅读 2 分钟
374
金三银四是每年的招聘旺季,人才市场流动旺盛。在今年的政府工作报告中,国家首次将就业优先政策置于宏观层面,解决就业问题成为2019年经济转型升级中的重要任务。

2019风向趋势分析报告——覆盖5G、人工智能、金融科技等领域

2019-04-16
阅读 9 分钟
4.4k
在中国股权投资市场经历了周期性经济低潮后,移动互联网的创业红利逐渐消失。2019年以来,更多金融、医疗、交通、科技等领域的企业选择以更加开放和互惠互利的形式构建自己的商业生态和投资体系。

博士生AI岗位面试经验分享:这样可以让您的薪水翻一倍

2019-04-16
阅读 5 分钟
248
【导读】本文作者根据自己博士毕业后求职、面试的经历,从重要资源、公司、面试过程、薪资谈判等方面详细的介绍并分享了自我体会与经验。看完本文,你会对求职有一个深入的体会!

如何做好电商平台的数据分析——两个要点缺一不可

2019-04-16
阅读 3 分钟
260
一切能够进行产品推广、促进用户使用、提升用户粘性和留存、用户自传播、让用户付费的行为都可以称为运营。在运营中我们可以用AARRR增长模型将产品的运营路径拆分为:激活、注册、留存、下单、传播,然后根据每个路径进行分析,从而优化产品和运营策略。

Kaggle冠军经验分享丨如何用15个月冲到排行榜的首位

2019-02-19
阅读 4 分钟
1.1k
在最新的Kaggle用户排行榜上,排名第一位的ID是Bestfitting,他本人叫Shubin Dai。他在两年前加入Kaggle,目前生活在中国湖南省长沙。他是一名数据科学家、工程师,目前领导一家为银行提供软件解决方案的公司。在工作之余,除了Kaggle,Dai还是一名狂热的山地车手,喜欢户外运动。

转行学习数据分析师还来得及吗?

2019-02-18
阅读 3 分钟
860
2015年,“大数据” 成为国内年度热词,并首次出现在国家的《政府工作报告中》。同年,数据分析也开始如雨后春笋般成为朝阳行业,数据分析和大数据相关职位一度霸屏各大招聘网站。

被裁员后,我是如何成功找到了一份数据科学工作?

2019-02-15
阅读 3 分钟
642
作者 Kristen Kehrer中文翻译 MikaCDA 数据分析师原创作品,转载需授权 本文的目的为了告诉你们我是如何成功找到一份数据科学的工作。从被裁员到成功签约,这两个月对我来说即辛苦又紧张。 我拥有统计学硕士学位,并且自2010年以来一直从事高级分析工作。如果你是该领域的新手,那么你的体验可能会有所不同,但希望本文...

年近30岁的文科生从文案转行——比努力更重要的是努力的方向!

2019-02-13
阅读 2 分钟
499
非常荣幸能受CDA老师邀请,写一点东西来总结自己的转行之路,也希望对以后的学弟学妹们,有那么哪怕一丁点儿的帮助。(我毕业于天津师范大学,广播电视新闻专业,现入职某互联网公司,从事数据分析师,月薪16K,每年13薪)

如何胜任知名企业的商业数据分析师?

2019-02-13
阅读 2 分钟
1.1k
数据分析&数据挖掘技能这么多,难道要一一学完才能投入工作?想要入职知名企业的数据分析师,我们需要具备十项全能吗?如果想要胜任一份满意的商业数据分析师职位,我们如何才能站稳脚步呢?

如何成为数据科学家?数据科学业界大牛们倾囊相授

2019-02-13
阅读 4 分钟
3.4k
在大家的眼中,科学家的形象可能是一位表情严肃、着装单一、不修边幅、戴着一副厚重眼镜且天庭饱满,发际线无限上移的中老年理共男。但实际上,他们正式体面,幽默无比,可谓是集涵养和趣味于一身的真正撩妹达人!

过年回家,嘚瑟一下

2019-01-31
阅读 1 分钟
486
(文末有彩蛋)我是在北京上班的唐山人,离家算是很近了(有老乡吗),同事说我可以走路回家。每年都会看同事们上演年度抢票大戏,哈哈哈哈“还有2天就可以抢2号回家的票了”“我的天,又没见到票啥样就卖完了”“帮我加速”这几个字每天都会看见N遍各种加价加速神器齐助阵,别说,可能真的管用吧真心疼过年回家买不到票的同事...