Python分析《青你2》67万条弹幕,看看有没有你Pick的小姐姐

2020-05-13
阅读 6 分钟
1k
今天我们来聊一聊选秀节目《青春有你2》。 Show me data,用数据说话 淡黄的长裙,蓬松的头发 你牵着我的手,看最新展出的油画 无论最近有没有看《青春有你2》,想必很多人都被这段歌词给洗脑了。就是这段过于魔性还有点像朗读的rap,在许多人脑中疯狂循环。成功把Jony J 逼疯,这也缔造了选秀节目的历史,原来还可以这...

实用宝典 | 如何用Python实现人机猜拳小游戏

2020-05-13
阅读 3 分钟
166
首先,解释一下人机猜拳,猜拳相信大家都了解,通俗讲就是“石头、剪刀、布”嘛!再简单不过的一个小游戏,而所谓人机猜拳其实就是猜拳的双方中一方是人另一方是计算机。

傻傻分不清楚系列 | Python中各种时间处理方法(下)

2020-05-12
阅读 4 分钟
142
今天我们把Pandas库中处理时间的各种函数与方法也加进来讨论,当然,由于Pandas中处理时间的方法和类太多太强大,我们仅仅是对其中探讨Pandas其中部分,特别是其中与time库、datetime库有关联且又容易混淆的相关知识。

傻傻分不清楚系列 | Python中各种时间处理方法(上)

2020-05-12
阅读 7 分钟
145
相信大多数数据分析师在入手Python的时候,在学习到time库与datetime库时,都会对两个库里面长得很像,又相互有关联的各种类和方法感到非常窝心。当接触到pandas处理时间序列的方法时,再次发现其中各种类和方法又和前面两个时间库的方法“长得好像又似乎有点不同”,此时,想必每个强迫症学习着内心早已经发出“土拨鼠呐喊”。

从时间序列ariam模型到Prophet模型的应用

2020-05-09
阅读 7 分钟
197
前两个星期,我的一个朋友(任职于上海的一家数据公司的机器学习岗位)在工作中有一个华为手机各价位销售趋势预测的项目,需要用到时间序列,找到我一起做一下协助。数据是2016年12月-2019年12月的脱敏数据,拿到的数据很简单,我们的思路是按照价格段来分组,根据不同的价格段用前三年的数据划分训练集和测试集,预测2020...

五一小长假幸运狂欢周,CDA数据分析师给你幸运带你飞!

2020-04-30
阅读 1 分钟
518
今年的五一小长假,可谓是非比寻常的一个假期,这是咱们国家抗疫成效显著之后,全国各地陆续解除一级戒备的第一个小长假。之前的我们,都宅家祈祷,祈祷疫情快快过去,祈祷大家快快热闹起来!

Python爬虫告诉你:拿下60亿流量的《惊雷》都是哪些人在听?

2020-04-29
阅读 13 分钟
1.7k
CDA数据分析师 出品 惊雷/通天修为/天塌地陷紫金锤 紫电/玄真火焰/九天玄剑惊天变 这看起来不着边际的歌词,配上简单粗暴的蹦迪音乐。 最近,一首《惊雷》的喊麦歌曲在短视频平台火了,震惊了整个音乐圈。 但4月10日歌手杨坤却在直播中批评《惊雷》“要歌没歌,要旋律没旋律,要节奏没节奏,要律动没律动”,评价其“难听”...

潘粤明版《鬼吹灯》口碑炸裂!豆瓣8.3高分到底好看在哪?

2020-04-29
阅读 4 分钟
352
这次《鬼吹灯》就又双叒叕来了,由潘粤明、张雨绮主演的《龙岭迷窟》是《鬼吹灯》系列的第二部,接着上部《精绝古城》的故事,讲的是摸金三人组从精绝古城归来之后,又因为一只陕西乡间的绣花鞋,因缘巧合进入废弃新墓。

睡眠研究可以帮助创建更好的AI模型吗?

2020-04-28
阅读 3 分钟
394
numpy.polyfit(x, y, deg, rcond=None, full=False, w=None, cov=False)# x:要拟合点的横坐标# y:要拟合点的纵坐标# deg:自由度.例如:自由度为2,那么拟合出来的曲线就是二次函数,自由度是3,拟合出来的曲线就是3次函数

聊天机器人:电子商务的下一代技术

2020-04-28
阅读 3 分钟
268
最近,很多组织出于增强客户体验,简化流程以及推动对数字和创新技术的需求,相互竞争以实现聊天机器人。诸如聊天机器人之类的认知技术已经融入生活的各个方面,因为它们具有高度的自动化可行性,较高的准确性潜力,较低的复杂性和执行时间。

今年你被降掉的薪资,还有机会涨回来吗?

2020-04-28
阅读 4 分钟
179
最近一段时间,受新冠肺炎疫情冲击,全球不少企业不得不选择裁员降薪。据不完全统计,截至 4 月 10 日,全球已至少有 200 多家知名公司进行了近 300 次裁员,不少知名企业宣布降薪、冻薪,就连欧洲各大足球俱乐部、一向不差钱的美国名校也纷纷推出降薪计划。国内很多互联网企业的经营状况也受到不同程度的冲击,纷纷加入...

加快Python算法的四个方法(四)Dask

2020-04-24
阅读 7 分钟
167
相信大家在做一些算法经常会被庞大的数据量所造成的超多计算量需要的时间而折磨的痛苦不已,接下来我们围绕四个方法来帮助大家加快一下Python的计算时间,减少大家在算法上的等待时间。今天给大家讲述最后一方面的内容,关于Dask的方法运用。

加快Python算法的四个方法(三)数据并行化

2020-04-24
阅读 6 分钟
131
相信大家在做一些算法经常会被庞大的数据量所造成的超多计算量需要的时间而折磨的痛苦不已,接下来我们围绕四个方法来帮助大家加快一下Python的计算时间,减少大家在算法上的等待时间。以下给大家讲解关于数据并行化这方面的内容。

加快Python算法的四个方法(二)Numba

2020-04-24
阅读 5 分钟
150
相信大家在做一些算法经常会被庞大的数据量所造成的超多计算量需要的时间而折磨的痛苦不已,接下来我们围绕四个方法来帮助大家加快一下Python的计算时间,减少大家在算法上的等待时间。今天给大家介绍Numba这一块的内容。

加快Python算法的四个方法(一)PyTorch

2020-04-24
阅读 6 分钟
238
相信大家在做一些算法经常会被庞大的数据量所造成的超多计算量需要的时间而折磨的痛苦不已,接下来我们围绕四个方法来帮助大家加快一下Python的计算时间,减少大家在算法上的等待时间。下面为大家讲述有关PyTorch的内容。

python如何计算环比增长率?

2020-04-23
阅读 4 分钟
153
很多企业比较注重自己的业务增长情况,时常会需要计算同比增长率和环比增长率。从上学的时候就有很多小伙伴搞不清楚这两个增长率之间的区别,这里简单直白的解释一下:

Python中的变量与字符串数据类型

2020-04-23
阅读 5 分钟
137
大家好,我是一行,作为当下最受欢迎和市场使用的编程语言之一,Python在广大职场人士的日常事务中占据越来越重要的位置。今天我们就对Python中变量以及字符串数据类型做一个总结,一起从零开始学习Python。

Pandas的函数应用及映射方法

2020-04-23
阅读 4 分钟
202
在数据分析师日常的数据清洗工作中,经常需要对数据进行各种映射变换,通过Pandas可以非常方便地解决此问题,其提供了map()、apply()、mapapply()等方法,下面将一一详细介绍这三个映射函数的用法及三者的区别。

Python中的数字类型格式与运算

2020-04-23
阅读 6 分钟
166
Python中的数字(Digital)与数学中的数字相同,可以通过各种各样的运算符实现各种计算,在Python中数字类型的数据格式分为以下几种:

当代年轻人,为什么越来越穷?

2020-04-20
阅读 4 分钟
465
作者 | 啡小沫来源 | ID:feixiaomo6 1 这个问题,在网上被浏览了400多万次。 不吹不黑,我们先来看一组数据。 知乎大V、经济学博弈论话题优秀回答者Manolo列举了Raj Chetty等六位研究者2017年发表在Science上的研究数据。 研究者把1940-1980年间出生的孩子在30岁年纪达到的收入,与其父辈的收入做了对比。 排除通货膨胀...

一文弄懂apply、map和applymap三种函数的区别

2020-04-20
阅读 3 分钟
168
在日常处理数据的过程中,会经常遇到这样的情况,对一个DataFrame进行逐行、逐列或者逐元素的操作,很多小伙伴也知道需要用到apply、map或者applymap,但是具体什么情况下运用哪种方法或者说对这些方法了解不够,用起来晕晕乎乎始终没有很明白,希望这一篇文章能够帮助有需要的小伙伴弄懂他们之间的区别,并且在遇到问题...

通俗易懂告诉你:何为95%置信区间?

2020-04-20
阅读 3 分钟
621
简单理解,比如从北京到张家界旅游5天,你恐怕不能准确说出要花多少钱,但你可以给出一个范围,比如10000—13000,你会觉得比较可信。如果给的范围太大,比如10000—30000,虽然可信度更高一些,但这么大的范围参考意义不大;如果给的范围很小,如10000—10500,虽然准确性提高了,但可信度就似乎不会很高。而找到一个合适...

0基础不用怕,从0到1轻松教你入门Python

2020-04-20
阅读 8 分钟
1.7k
大家好,我是写BUG的一行,大家可以叫我一行,今天带领大家进行Python从入门到提高的学习路程。首先我们先对Python有个基本的了解和清晰的概念,然后再一步一步从基础开始提升,进而全面开启你的Python进修之路。

主数据的3大特征、4个超越和3个二八原则

2020-04-20
阅读 3 分钟
213
导读:主数据(Master Data)是具有共享性的基础数据,可以在企业内跨越各个业务部门被重复使用的,因此通常长期存在且应用于多个系统。由于主数据是企业基准数据,数据来源单一、准确、权威,具有较高的业务价值,因此是企业执行业务操作和决策分析的数据标准。

设计出色的 tableau 仪表板扩展

2020-04-20
阅读 2 分钟
167
您是否已经创建了一个 Tableau 仪表板扩展? 太棒了! 但是您是通过什么与用户进行交互的?它容易使用吗?它美观且有效吗? 本文将告诉您如何让仪表板扩展为用户提供友好的体验!如果您刚刚开始构建仪表板扩展,可查看下方链接学习更多相关知识。 来源 | Tableau社区 通过您的仪表板扩展提供出色的用户体验 在您的仪表板...

pandas数据合并之一文弄懂pd.merge()

2020-04-20
阅读 4 分钟
152
在合并数据的操作中,除了pd.concat()函数,另一个常用的函数就是pd.merge()了,这两个函数也经常被拿来比较,其实只要弄懂了函数中重要参数的作用理解了每个函数的用法,自然就知道在哪种情况下使用哪一个函数,需要对函数中的哪个参数进行怎样的设置了。好了,让我们步入正题来认识一下pd.merge()函数吧!

pandas数据合并之一文弄懂pd.concat()

2020-04-17
阅读 3 分钟
242
在工作中经常会遇到多个表进行拼接合并的需求,在pandas中有多个拼接合并的方法,每种方法都有自己擅长的拼接方式,这篇文章只对pd.concat()进行详细讲解,希望能帮助有需要的朋友一次彻底弄清楚它的用法。

MySQL忘记密码的处理方法、正则表达式、自连接方法及应用场景

2020-04-17
阅读 9 分钟
169
大家好,欢迎来到小编的MySQL课堂。上一系列给大家介绍了MySQL中的索引、关联子查询以及语句的优化技巧,今天给大家讲解下部分的内容——MySQL忘记密码的处理方法、MySQL正则表达式、MySQL自连接方法及应用场景。

pandas数据合并之一文弄懂pd.merge()

2020-04-17
阅读 4 分钟
147
在合并数据的操作中,除了pd.concat()函数,另一个常用的函数就是pd.merge()了,这两个函数也经常被拿来比较,其实只要弄懂了函数中重要参数的作用理解了每个函数的用法,自然就知道在哪种情况下使用哪一个函数,需要对函数中的哪个参数进行怎样的设置了。好了,让我们步入正题来认识一下pd.merge()函数吧!

那些干到40岁的程序员都去哪儿了?

2020-04-17
阅读 4 分钟
442
原因主要有几点,一是担心未来能不能继续保持现有收入,害怕40岁之后薪资会不会下降,甚至失业。二是大家普遍有房贷或者车贷,这本身也是一种精神压力。三是身边的某某所在的公司要上市了,某某在大厂又升职了,对比产生了落差。