时间序列数据的特征提取

2020-04-03
阅读 2 分钟
179
当你想对时间序列数据做分类时,有两种选择,一个是用时间序列特定的方法,比如说说LSTM模型。另外一种方法就是来从时间序列中提取特征从而将这些特征用在有监督的模型上。在这篇文章中,我们来看下如何使用tsfresh包自动的提取时间序列数据。

让你成为统计大师的假设检验指南

2020-04-03
阅读 6 分钟
216
当一个人MIS专业人士的身份开始了职业生涯,然后进入商业智能(BI),随后进入了商业分析,统计建模以及机器学习领域。这些转换中的每一个都会要求改变如何关于看待数据的思维方式。

军事中的大数据应用——为人工智能做准备

2020-04-03
阅读 5 分钟
325
妥善管理的大量数据对包括军事在内的许多行业都是福音。如果不知道何时,何地以及在什么资源上进行部署,就不可能进行有效的军事行动。因此,军事大数据可以帮助国防领导人做出更好的决策,前提这些数据不是" 黑暗数据"。

AI如何改变人类社会的各种业务模式?

2020-04-02
阅读 2 分钟
488
在过去的20年中,一些愤世嫉俗的人一直担心,人工智能(AI)的发展会破坏企业结构,导致大量失业和财富不平等加剧。到目前为止,这些担忧尚未实现。但这并不是说AI并没有从很多方面改变商业世界,AI带来了与挑战一样多的新机会。

罗永浩直播卖货:1.1亿销售额,近5000万人围观,抖音请值了?

2020-04-02
阅读 5 分钟
2.4k
累计4800万人围观,1.1亿销售额,抖音音浪收入超过360万元,创下了抖音平台目前已知的最高带货纪录。 作者 | Bonnie 来源 | 创业邦 就在昨晚,罗永浩以还不错的数据在抖音完成了他的首场3小时直播带货。 而在另一边,有着淘宝第一主播称号的薇娅,以4000万的价格直播卖火箭。 注:50万是定金,然后成功卖出 开播之前,罗...

破解机器学习的误区——常见机器学习神话究竟从何而来?

2020-04-01
阅读 4 分钟
687
Forrester Research最近发布了一份名为“ 粉碎机器学习的七个神话”的报告。在其中,作者警告说:“不幸的是,一些对机器学习项目做出重要决策的企业领导者,普遍存在机器学习的误解。”

美国疫情确诊超18万!CNN主播感染!特朗普:未来是痛苦的两周!

2020-04-01
阅读 4 分钟
259
据人民日报,美国约翰斯·霍普金斯大学发布的实时统计数据显示,截至北京时间4月1日06时30分左右,全球新冠肺炎确诊病例已超过85万例,共计855007例。

从净赚2亿到巨亏5亿,业绩大变脸的宝宝树都经历了什么?

2020-04-01
阅读 5 分钟
2.1k
3月30日晚间,宝宝树集团(下称宝宝树)发布2019年度业绩。年报显示,公司全年收入约3.57亿元人民币,相比2018年的7.6亿元下降53%;净亏损高达4.94亿元,相比2018年的盈利2.01亿元,下降346%,堪称大变脸。截至昨日(3月31日)收盘,宝宝树股价报0.94港元,总市值为15.19亿港元。

通过一张图就能看懂世界石油分布?Python爬虫轻松搞定!

2020-03-31
阅读 4 分钟
727
面对在OPEC+会议中坚持不再减产的俄罗斯,沙特阿拉伯决意提升石油产能抢占市场,石油价格战毫无征兆地开打。国际原油价格出现大幅波动。3月9日,黑色星期一,世界油价剧烈杀跌,跌幅超过30%。

疫情当下,除了屯吃喝,为何世界人民还在疯狂抢购卫生纸?

2020-03-31
阅读 4 分钟
192
目前,新冠肺炎在国内的情况逐步转好。但另一方面,疫情在全球蔓延的形势还十分严峻。根据世卫组织发布的数据,截至2020年3月30日,全球新冠肺炎确诊病例已经突破71万。

了解CNN的局限性,这是AI的最大成就之一

2020-03-30
阅读 5 分钟
477
经过漫长的冬季之后,人工智能的发展经历了炎热的夏天,这主要归功于深度学习和人工神经网络的发展。更准确地说,对深度学习的新兴趣很大程度上归功于卷积神经网络(CNN)的成功,卷积神经网络是一种特别擅长处理可视数据的神经网络结构。

用Python实现随机森林算法

2020-03-30
阅读 9 分钟
191
拥有高方差使得决策树(secision tress)在处理特定训练数据集时其结果显得相对脆弱。bagging(bootstrap aggregating 的缩写)算法从训练数据的样本中建立复合模型,可以有效降低决策树的方差,但树与树之间有高度关联(并不是理想的树的状态)。

python统计分析之HR如何察觉员工的潜在离职因素

2020-03-30
阅读 7 分钟
189
CDA数据分析师 出品 前言: 大数据使企业能够确定变量,预测自家公司的员工离职率。” ——《哈佛商业评论》2017年8月 “员工流失分析就是评估公司员工流动率的过程,目的是预测未来的员工离职状况,减少员工流失情况。” ——《福布斯》2016年3月 一、背景介绍 1. 数据来源 本项目数据集来自DataCastle训练赛。 数据及代码链接...

疫情之下:内心越慌乱,你越要修炼这4件事

2020-03-30
阅读 5 分钟
230
这次疫情,给我们每个人的生活都带来了不同程度的混乱。 作者 | 艾菲原文 | 疫情之下:内心越慌乱,你越要修炼这4件事 但同时,我们也不得不承认,它只是在用一种近乎极端残酷的方式,迫使我们去重新审视生活的本来样貌: 原本的生活是祥和的,忽然,某个意外出现,也许是被离婚分手、也许是被公司辞退、也许是生病住院...

疫情过后,正确的生活打开方式

2020-03-30
阅读 2 分钟
198
我们的生活被突如其来的“疫情”按下了暂停键, 在一次次的重启中我们逐渐领悟,生命的意义。 疫情过后,我们的生活要如何正确打开呢? 保持合理的饮食作息习惯 果蔬多一点 多吃蔬菜对保护心血管和防癌很有好处,每天都应吃不少于 300 克的蔬菜,以叶菜和深色蔬菜(如深绿色、红色、橘红色、紫色等)为主。 尽可能每天吃一...

特斯拉电池工厂大裁员;美计划限制华为芯片供应;海康威视暂停调薪

2020-03-30
阅读 4 分钟
2.9k
根据三言财经本周报道,海康威视内部员工通过脉脉爆料称收到公司邮件上注明:取消所有餐费补贴、取消小零食、取消交通补贴、取消通讯补贴、取消过节费、取消工作服、取消生日福利,并延长剩余年假清偿,调整从 3 月份开始。同时,四月份薪资不再调整。

7个回归分析方法!数据分析师必须掌握

2020-03-30
阅读 5 分钟
210
回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析、时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。

医疗保健中的自然语言处理

2020-03-27
阅读 5 分钟
457
当涉及医疗保健行业时,人们可能会想到AI方法的众多用例,例如机器视觉或预测分析。但是, 自然语言处理(NLP)在医疗保健中的应用也多种多样。

2020~2030:人工智能将占据主导地位的十年

2020-03-27
阅读 3 分钟
532
机器人学家和科幻小说家艾萨克·阿西莫夫(Isaac Asimov)在他的小说《机器人》(1950年)中预测,到2030年,机器人和人工智能将被禁止进入地球。相反,我们看到了人工智能的巨大进步,而且这种趋势可能会在未来十年内持续下去。

机器学习算法之有监督学习和无监督学习的区别

2020-03-27
阅读 2 分钟
308
如今机器学习和人工智能是大家耳熟能详的两个词汇,在我们日常生活中也是被高频的提到。其实机器学习只是人工智能的一部分,是人工智能的一个子集,它往往是通过示例和经验模型让计算机去执行一些操作任务,研究人员和开发人员比较比较热衷于它。在生活中,我们应用的很多东西其实都使用的是机器学习算法,例如我们使用...

疫情过后,我很担心900万武汉人接下来该怎么办

2020-03-27
阅读 4 分钟
243
来源 | 周冲的影像声色 黎明之后,看见伤痕。 1 90岁硬核奶奶的儿子,还是走了。 3月10日凌晨,林鸣医生发微博长文,和奶奶说:“对不起”。 早在2月4日时,奶奶的儿子就不在人世了。 但医生担忧奶奶身体,一直瞒着。 奶奶之前写的信,儿子最终没能看到。 在那封信里,她说: “儿子,要挺住,要坚强,战胜病魔。要配合医生...

数据科学、人工智能与机器学习傻傻分不清楚,这次通通给你讲清楚

2020-03-27
阅读 4 分钟
508
尽管"数据科学"、人工智能 (AI) 和机器学习属于同一领域,彼此相互联系,但是它们也有特定的应用背景和意义。它们有时也会有重叠,但基本上它们都有自己的特定的用途。

深度学习基础:为什么神经网络的感知机中的神经元需要偏置项?

2020-03-27
阅读 3 分钟
232
每个人都知道神经网络中的偏置(bias)是什么,而且从人类实现第一个感知器开始,每个人都知道神经元需要添加偏置项。但你是否考虑过我们为什么要使用偏置项呢?就我而言,直到不久前我才弄清楚这个问题。当时我和一个本科生讨论了一些神经网络模型,但不知何故她把“偏置输入”(bias input)和“统计基差”( statistical b...

智能图像识别初探系列(五)

2020-03-26
阅读 3 分钟
177
在2015年,何凯明提出了152层的ResNet,以3.6%的误差摘得了2015年ILSVRC比赛的桂冠,同时ResNet的提出解决了神经网络中因为网络深度导致的“梯度消失”的问题,并提供了一个非常好的思路。我们一般认为,网络结构愈深(复杂,参数多)愈是有着更强的表达能力。

智能图像识别初探系列(四)

2020-03-26
阅读 3 分钟
198
CDA数据分析师 出品 一、提升模型性能 在上一篇文章中,我们了解了AlexNet的优缺点,当时我们提到了过拟合问题还记得么? 神经网络的一个比较严重的问题就是过拟合问题,在AlexNet论文中采用的数据扩充和Dropout的方法处理过拟合问题。 Data Augmentation(数据扩张,就是对原始数据做一些变化) 数据扩充是防止过拟合的最...

智能图像识别初探系列(三)

2020-03-26
阅读 4 分钟
275
我们提到卷积神经网络技术是一种深度前馈神经网络,在图片分类、图片检索、目标检测、目标分割、目标跟踪、视频分类、姿态估计等图像视频相关领域中已有很多较为成功的应用。

智能图像识别初探系列(二)

2020-03-25
阅读 5 分钟
228
在上期文章中,我们了解了图像识别的大致流程,并对图像处理中涉及的图像预处理和图像分割方法进行了阐述。在本期中,我们会接着上期的内容继续对图处理部分进行细分介绍,并了解卷积神经网络的基本结构以及图像处理相关算法的基本知识。

智能图像识别初探系列(一)

2020-03-25
阅读 4 分钟
277
想必各位机友都知道图像识别技术是人工智能的一个重要领域。随着计算机技术的迅速发展和科技的不断进步,图像识别技术已经在众多领域中得到了应用,其产生的目的是为了让计算机代替人类去处理大量的物理信息,并以此用来识别不同模式下目标和对象的一门技术。

python数据类型串讲(下)

2020-03-25
阅读 6 分钟
148
顾名思义,字典就像我们日常生活中使用的新华字典,其作用在于根据索引(拼音或偏旁)快速查找到所需内容,而python中的字典也是如此,python中字典的索引称为"键"(key),由python中不可变的数据类型(如字符串、数值等)构成,具有固定(不可变)、唯一(不可重复)性;python中字典的内容称为"值",其可以为python中...

Python数据类型串讲(中)

2020-03-25
阅读 7 分钟
158
所谓序列,即元素的有序排列。序列中每个位置的元素都有其对应的唯一编号,也就是说我们可以通过元素的位置标识,去搜索到该元素。python中的内建序列有6种:列表、元祖、字符串、Unicode字符串、xrange对象、buffer对象,其中列表和元祖是最常见的序列,应重点掌握。字符串在上一篇文章中已简单介绍,下面将以字符串为...