基于Python图表绘图系统:matplotlib散点图和气泡图,你了解吗?

2020-05-22
阅读 2 分钟
228
​ 惯例先来简单介绍下什么是散点图:用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。散点图将序列显示为一组点。值由点在图表中的位置表示。类别由图表中的不同标记表示。(来源:百度百科)

数据处理:销售业绩分箱工具,pd.cut() Vs pd.qcut()

2020-05-22
阅读 6 分钟
216
​ 相信很多进行数据处理工作的小伙伴都遇到过这种需求,比如已经有了各个销售员的销售业绩,现在需要给各个销售业绩进行一个分档,诸如未完成任务,完成任务,超额完成任务等。要完成分档需要先对销售业绩的数值进行判断,然后再根据判断的结果进行一个分类,那么大家都是怎样进行分类的呢?

pandas数据处理:常用却不甚了解的函数,pd.read_excel()

2020-05-22
阅读 5 分钟
162
人们经常用pandas处理表格型数据,时常需要读入excel表格数据,很多人一般都是直接这么用:pd.read_excel(“文件路径文件名”),再多一点的设置可能是转义一下路径中的斜杠,一旦原始的excel表不是很规整,这样简单读入势必报错!

Python数据分析:强大字符串处理工具,正则表达式!

2020-05-22
阅读 2 分钟
171
正则表达式是处理字符串的强大工具。作为一个概念而言,正则表达式对于Python来说并不是独有的。 正则表达式是一个特殊的字符序列,它能帮助开发人员方便的检查一个字符串是否与某种模式匹配。

matplotlib中简单条形图,你了解吗?

2020-05-22
阅读 3 分钟
160
条形图是数据可视化图形中很基础也很常用的一种图,简单解释下:条形图也叫长条图(英语:bar chart),亦称条图(英语:bar graph)、条状图、棒形图、柱状图、条形图表,是一种以长方形的长度为变量的统计图表。长条图用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。...

数据统计方法:确定性时间序列的分析法

2020-05-21
阅读 2 分钟
231
时间序列分析是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计变化规律,以用于解决实际问题。通常影响时间序列变化的4个要素如下:

你了解matplotlib吗?多类别条形图篇

2020-05-21
阅读 4 分钟
211
这篇文章来探索下多类别条形图比如各学校包含语文、数学、英语三科成绩的条形图怎样绘制。在绘图之前,先来复习一下条形图函数中主要参数的含义: x控制的是每个条在x轴方向上的位置; height控制的是每个条的长度; width控制的是每个条的宽度; bottom控制的是每个条在y轴方向的起始位置 orientation控制的是条形的方...

python numpy库中矩阵用法指南

2020-05-21
阅读 6 分钟
199
在数学的概念中,矩阵(Matrix)是一个按照长方阵列排列的复数或实数集合,最早来自于方程组的系数及常数所构成的方阵。这一概念由19世纪英国数学家凯利首先提出。

kmeans优化算法:二分Kmeans聚类算法

2020-05-21
阅读 8 分钟
176
​ Bi这里是的意思就是Binary,二进制的意思,所以有时候叫这个算法为二进Kmeans算法。为什么我们需要用BiKmeans呢,就是为了解决初始化k个随机的质心点时其中一个或者多个点由于位置太极端而导致迭代的过程中消失的问题。BiKmeans只是Kmeans其中一个优化方案,其实还是有很多优化的方案,这里BiKmeans容易讲解和理解,并...

你的城市撒币了吗?Python分析各城市消费券发放数据

2020-05-21
阅读 3 分钟
682
作者:刘早起 来源:早起Python 前言 近期,全国多地以各种形式投放消费券、消费补贴来鼓励消费,部分城市在首期消费券的基础上,连续追加发放多期消费券。于是,不少网友相互比较起来:你在的城市“撒币”了吗?哪个城市发的券最多?跟随本文一起来看看。 数据说明 如果想从支付宝或者微信等官方网站爬取相关数据会非常困...

使用非参数统计检验进行分析的指南

2020-05-20
阅读 8 分钟
162
1980年代末,汉斯拉伊大学(Hansraj College)经济学荣誉毕业生的平均薪酬约为每年100万印度卢比。这一数字大大高于80年代初或90年代初毕业的人们。

你了解matplotlib吗?对称条形图和发散型条形图篇

2020-05-20
阅读 4 分钟
172
前两篇文章介绍了几种常见的条形图,实际上看起来简单的条形图可探索的设置还有很多!在体育赛事中,经常出现一种对称条形图,比如对比两个热门选手或者队伍在各方面的打分情况等,这也是在普通横向条形图的基础上绘制出来的,作为无所不能的python,当然也是可以绘制这种图形的!

使用Python构建一个推荐系统需要几步

2020-05-20
阅读 20 分钟
196
在我看来,作为一位中国人的我们不管做什么决定都在面临多种选择。例如,如果我这个时候想要买一本书,但是我却不知道我想看什么书、不知道类型、不知道方向,那么这个时候打开各种进行软件搜索可能会出现各种各样的结果。我可能会浪费大量时间在互联网上浏览各种并在各个希望淘金的站点中进行拖曳。我可能会寻求其他人...

深度学习与机器学习:了解差异

2020-05-20
阅读 5 分钟
140
机器学习和深度学习都是人工智能的形式。准确地说,深度学习是机器学习的一种特定形式。机器学习和深度学习都从训练和测试模型开始,并经过优化找到一个权重使模型效果更好。两者都可以处理数字(回归)和非数字(分类)问题,尽管在对象识别和语言翻译等多个应用领域中,深度学习模型往往比机器学习模型更适合。

分析10万条弹幕,告诉你《古董局中局2》这部鉴宝题材剧咋样?

2020-05-20
阅读 6 分钟
333
这部剧制作团队是《怒晴湘西》《龙岭迷窟》等网剧的经典配置——管虎监制+费振翔导演。按理说有了《龙岭迷窟》的成功,费振翔导演应该更加得心应手,但是《古2》的就完全没有《龙岭迷窟》给人带来的惊艳感了,有些地方还有点不尽人意。

使用Pandas,Seaborn和Plotly绘制漂亮的图表

2020-05-19
阅读 16 分钟
532
2018: Regplot showing how Life Ladder (Happiness) is positively correlated with Log GDP per capita (

如何选择正确的机器学习算法?

2020-05-19
阅读 4 分钟
197
有些问题非常具体,需要采取独特的方法。例如,如果您使用推荐系统,这是一种非常常见的机器学习算法,解决的是非常具体的问题。而其他问题非常开放,则需要试错的方法去解决。监督学习、分类和回归都是非常开放的。它们可以用于异常检测,或者用来打造更通用的预测模型。。

人工智能的对与错

2020-05-19
阅读 3 分钟
617
就像大多数科学家说的那样,我们距开发能够像人类一样有效地解决问题的人工智能还差几十年。在创造通用AI的道路上,人脑(可以说是最复杂的自然创造)是我们掌握的最佳指南。

基于Python的图表绘图系统matplotlib,“动态条形图”你了解吗?

2020-05-18
阅读 4 分钟
164
动态条形图大火了一阵子,尤其是那种对比世界各国历年来的GDP或者军事实力的动态条形图,配上激动人心的音乐,眼看着中国从后往前排名不断考前,作为爱国的人,集体荣誉感爆棚的那种,真的是心潮澎湃自豪到仿佛国力的提升我也做出了不可磨灭的贡献一般(捂脸)。

基于Python的图表绘图系统matplotlib,“饼图“”你真了解吗?

2020-05-18
阅读 3 分钟
260
​ 饼图,或称饼状图,是一个划分为几个扇形的圆形统计图表,用于描述量、频率或百分比之间的相对关系。在饼图中,每个扇区的弧长(以及圆心角和面积)大小为其所表示的数量的比例。这些扇区合在一起刚好是一个完全的圆形。顾名思义,这些扇区拼成了一个切开的饼形图案。

超详细教程 | pandas合并之append和concat

2020-05-18
阅读 9 分钟
213
本篇文章主要介绍了pandas中对series和dataframe对象进行连接的方法:pd.append()和pd.concat(),文中通过示例代码对这两种方法进行了详细的介绍,希望能对各位python小白的学习有所帮助。

Python分析101位《创造营2020》小姐姐,谁是你心中的颜值担当?

2020-05-18
阅读 7 分钟
1.7k
最近可以追的综艺真是太多了,特别是女团选秀节目。之前我们刚聊过《青春有你2》,现在隔壁鹅厂的《创造营2020》又火热开播了。除了数不清的漂亮小姐姐,导师团除了黄子韬、鹿晗,最新一期中吴亦凡更是作为特约教练登场,“归国三子”一下子就引爆了话题度。

美国确诊超100万!教你用Python画出全球疫情动态图

2020-05-18
阅读 3 分钟
174
目前,全球新冠疫情还十分严峻。昨夜今晨,疫情突破多个标志性的统计节点。其中,全球累计确诊近296万例,累计死亡超20万例;美国累计确诊超100万例,西班牙和意大利累计确诊均超过20万例。

python基础系列 | 示例讲解时间模块datetime

2020-05-15
阅读 10 分钟
135
Python 有很多种方式处理日期和时间,常见的时间处理的模块是datetime、time、calendar。能融汇贯通的了解和使用这三个模块,才能轻而易举地用python处理时间。本文以此为目的,通过讲述各个时间模块的概述、函数及相关知识细节、以及相应的示例来讲透它们的使用方式。

大数据之Hive安装配置

2020-05-15
阅读 8 分钟
152
hive默认将元数据存储到本地内嵌的Derby数据库中,但是Derby不支持多会话链接,因此我们使用mysql数据库来存储hive的元数据。配置完成hiveSQL的元数据库之后再开始安装、配置hive。

监督学习:从过去到现在的模型流行度(深度翻译好文)

2020-05-15
阅读 4 分钟
456
在过去的几十年中,机器学习领域发生了巨大的变化。诚然,有些方法已经存在很长时间了,但仍然是该领域的主要内容。例如,Legendre和Gauss已经在19世纪初提出了最小二乘的概念。在最近的几十年中,诸如神经网络等其他方法的最基本形式在1958年得到了极大的发展,而诸如支持向量机(SVM)等其他方法则是最近的。

案例算法 | 机器学习python应用,简单机器学习项目实践

2020-05-14
阅读 10 分钟
182
上一篇文章中介绍了机器学习的简单知识,还有python中进行机器学习实践需要的生态环境,接下来将会通过鸢尾花分类这个例子对机器学习做一个简要的介绍。通过一步一步地实现这个项目来介绍以下内容。

算法应用 | 机器学习python应用,初识机器学习是怎样滴感受?

2020-05-14
阅读 5 分钟
201
本系列文章主要介绍机器学习在实践中的应用,介绍利用 Python 的生态环境,使用机器学习的算法来解决工程实践中的问题,而不是介绍算法本身。本系列文章参考了《机器学习Python实践》,会通过例子一步一步地引导大家使用机器学习来处理和分类与回归模型相关的问题。每个算法模型都介绍其较为通用且实用的建模过程,力争...

傻傻分不清系列 | Python中各种字符串处理方法

2020-05-14
阅读 6 分钟
140
Python的初学者在学习字符串内建函数的时候往往会很困惑:字符串的内建函数是对单个字符串对象处理,如果要对成千上万个字符串对象处理该怎么办?

想知道B站献礼视频《后浪》大家都在讨论什么吗?

2020-05-13
阅读 2 分钟
880
五四青年节B站献礼视频,在五四青年节当天,小破站联合众多官方大V,为所有青年人献上了一份特殊的演讲,并且重金买下来最好的广告时段,并且在第二天,形成全网的疯狂讨论,咋一听这段描述,小破站这次真的太牛了,真是我们年轻人食用最多的APP,但是,很遗憾,这次营销事件是成功的,但是小破站的口碑翻车了!