数据分析大作战,SQL V.S. Python,来看看这些考题你都会吗 ⛵

2022-08-26
阅读 15 分钟
480
SQL与Pandas都可以完成大部分数据分析需求。本文用SQL与Pands逐一实现10类核心数据分析需求,轻松进行对比学习:数据选择、限制、统计计数、排序、新字段生成、数据选择、数据分组、统计均值、方差、极差/范围。

图数据挖掘!使用图分析+AI进行保险欺诈检测 ⛵

2022-08-26
阅读 5 分钟
157
本文将基于保险欺诈场景案例讲解如何进行有效的图挖掘,并将挖掘到的信息提供给AI模型,辅助精准检测和识别商业保险欺诈。💡 作者:韩信子@ShowMeAI📘 机器学习实战系列:[链接]📘 本文地址:[链接]📢 声明:版权所有,转载请联系平台与作者并注明出处📢 收藏ShowMeAI查看更多精彩内容保险欺诈是一个巨大的问题,保险业长期以...

面试现场!月薪3w+的这些数据挖掘SQL面试题你都掌握了吗? ⛵

2022-08-26
阅读 10 分钟
135
💡 作者:韩信子@ShowMeAI📘 数据分析实战系列:[链接]📘 AI 面试题库系列:[链接]📘 本文地址:[链接]📢 声明:版权所有,转载请联系平台与作者并注明出处📢 收藏ShowMeAI查看更多精彩内容本篇内容基于场景面试题完成,在给定场景和数据表的前提下,有一系列的分析挖掘问题,大家可以基于SQL来完成。场景:Danny非常喜欢日本...

数据专家最常使用的 10 大类 Pandas 函数 ⛵

2022-08-09
阅读 4 分钟
254
Python具有极其活跃的社区和覆盖全领域的第三方库工具库,近年来一直位居编程语言热度头部位置,而数据科学领域最受欢迎的python工具库之一是 Pandas。随着这么多年来的社区高速发展和海量的开源贡献者,使得 pandas 几乎可以胜任任何数据处理工作。

掌握这9个单行代码技巧!你也能写出『高端』Python代码 ⛵

2022-08-09
阅读 4 分钟
231
Python 是一个简单易上手可读性强且功能强大的编程语言,它有一些独特的技巧和写法,可以在不影响可读性的情况下大大缩短我们的 Python 代码,让它看起来更加紧凑和高级。

刘畊宏男孩女孩看过来!运动数据分析挖掘!⛵

2022-08-09
阅读 10 分钟
236
因为疫情,2年多的时间里,大家多了很多居家的经历,但是运动健康并不能因为居家而停止,健身随时随处可以进行!健身环大冒险等大热,而前阵子的刘畊宏跳操,带火了一大票畊宏男孩女孩,可穿戴设备市场大涨,而这些设备也记录了大量的运动数据。

二手车价格预测 | 构建AI模型并部署Web应用 ⛵

2022-08-09
阅读 16 分钟
269
一份来自『RESEARCH AND MARKETS』的二手车报告预计,从 2022 年到 2030 年,全球二手车市场将以 6.1% 的复合年增长率增长,到 2030 年达到 2.67 万亿美元。人工智能技术的广泛使用增加了车主和买家之间的透明度,提升了购买体验,极大地推动了二手车市场的增长。

看看你离世界一流大厂有多远?3道Google最新SQL面试题 ⛵

2022-08-09
阅读 6 分钟
235
下面是最新的 3 道 Google SQL 面试题和参考答案。这些题目面向的 Google 职位包括:数据科学 家、数据分析师、商业智能 工程师、数据工程师和商业分析师。

客户流失?来看看大厂如何基于spark+机器学习构建千万数据规模上的用户留存模型 ⛵

2022-08-09
阅读 33 分钟
293
Sparkify 是一个音乐流媒体平台,用户可以获取部分免费音乐资源,也有不少用户开启了会员订阅计划(参考QQ音乐),在Sparkify中享受优质音乐内容。

再见 Excel,你好 Python Spreadsheets! ⛵

2022-08-09
阅读 6 分钟
220
💡 作者:韩信子@ShowMeAI📘 数据分析◉技能提升系列:[链接]📘 数据分析实战系列:[链接]📘 本文地址:[链接]📢 声明:版权所有,转载请联系平台与作者并注明出处📢 收藏ShowMeAI查看更多精彩内容Excel是大家最常用的数据分析工具之一,借助它可以便捷地完成数据清理、统计计算、数据分析(数据透视图)和图表呈现等。但是!大...

羡慕 Excel 的高级选择与文本框颜色呈现?Pandas 也可以拥有!! ⛵

2022-08-09
阅读 5 分钟
225
用过 Excel 的数据分析师,对 Excel 的『条件选择』与『格式呈现』功能大都印象深刻。下方动图演示了 Excel『数据选择&底色填充高亮』功能。如果我们需要『选择大于100的所有产品取值并对单元格填充红色』,直接如下图所示,在『条件格式』中选择『突出显示单元格规则』即可进行设置。

2022了你还不会『低代码』?数据科学也能玩转Low-Code啦! ⛵

2022-08-09
阅读 5 分钟
205
低代码开发,顾名思义,指的是软件开发过程中只需要编写少量代码就够了。与传统开发方式相比,低代码大幅减少了编写代码的工作量,这使其具备了更快的速度、更短的开发时间与更低的成本。

Pandas 数据显示不全?快来了解这些设置技巧! ⛵

2022-08-05
阅读 4 分钟
267
💡 作者:韩信子@ShowMeAI📘 数据分析实战系列:[链接]📘 本文地址:[链接]📢 声明:版权所有,转载请联系平台与作者并注明出处📢 收藏ShowMeAI查看更多精彩内容📌 Pandas 数据显示的问题我们在应用 Python 进行数据分析挖掘和机器学习时,最常用的工具库就是 Pandas,它可以帮助我们快捷地进行数据处理和分析。对 Pandas 不熟...

一键自动化数据分析!快来看看 2022 年最受欢迎的 Python 宝藏工具库! ⛵

2022-08-05
阅读 6 分钟
529
实际工作中,我们往往依托于业务数据分析制定业务策略。这个过程需要频繁地进行数据分析和挖掘,发现模式规律。对于算法工程师而言,一个有效的 AI 算法系统落地,不仅仅是模型这么简单——数据才是最底层的驱动。

图解大数据 | Spark GraphFrames-基于图的数据分析挖掘

2022-03-09
阅读 7 分钟
521
由Databricks、UC Berkeley以及MIT联合为Apache Spark开发了一款图处理类库,名为GraphFrames。该类库构建在DataFrame之上,既能利用DataFrame良好的扩展性和强大的性能,同时也为Scala、Java和Python提供了统一的图处理API。
封面图

图解大数据 | 综合案例-使用Spark分析挖掘音乐专辑数据

2022-03-08
阅读 21 分钟
702
文娱影音是目前大数据与AI应用最广泛的场景之一,本案例以音乐专辑发行数据为背景,讲解使用pyspark对HDFS存储的数据进行处理数据分析的过程,并且对分析结果做了可视化呈现。
封面图

图解大数据 | 综合案例-使用spark分析新冠肺炎疫情数据

2022-03-08
阅读 16 分钟
1.5k
2020以来新冠疫情改变了全世界,影响着大家的生活,本案例结合大数据分析技术,使用pyspark对2020年美国新冠肺炎疫情进行数据分析,并结合可视化方法进行结果呈现。
封面图

Python数据分析 | seaborn工具与数据可视化

2022-02-25
阅读 10 分钟
1.2k
Python中最常用于数据可视化的工具库包括Matplotlib和Seaborn。其中,Matplotlib属于 Python 数据可视化的基础库,具备很高的灵活度,但应用过于复杂——官方文档有3000 多页,包含上千个方法以及数万个参数。
封面图

Python数据分析 | 基于Pandas的数据可视化

2022-02-25
阅读 4 分钟
996
大家在前面的教程中看到了Pandas进行数据分析的灵活操作,但同时作为一个功能强大的全能工具库,它也能非常方便地支持数据可视化,而且大部分基础图像绘制只要一行代码就能实现,大大加速了我们的分析效率,本文我们介绍pandas可视化及绘制各种图形的方法。
封面图

Python数据分析 | 数据可视化原则与方法

2022-02-25
阅读 3 分钟
859
我们经常听到一个说法“能用图描述的就不用表,能用表就不用文字”,确实我们在认知上,对于图形的敏感度远比文字高,获取的信息也更丰富。我们在互联网企业中更是随处可见各种数据看板,帮助我们第1时间了解数据与业务状况。
封面图

Python数据分析 | Pandas数据分组与操作

2022-02-25
阅读 4 分钟
1.2k
作者:韩信子@ShowMeAI教程地址:[链接]本文地址:[链接]声明:版权所有,转载请联系平台与作者并注明出处当我们提到python数据分析的时候,大部分情况下都会使用Pandas进行操作。pandas整个系列覆盖以下内容:图解Pandas核心操作函数大全图解Pandas数据变换高级函数Pandas数据分组与操作一、Pandas数据分组与操作在我们...
封面图

Python数据分析 | Pandas数据变换高级函数

2022-02-25
阅读 5 分钟
967
作者:韩信子@ShowMeAI教程地址:[链接]本文地址:[链接]声明:版权所有,转载请联系平台与作者并注明出处当我们提到python数据分析的时候,大部分情况下都会使用Pandas进行操作。pandas整个系列覆盖以下内容:图解Pandas核心操作函数大全图解Pandas数据变换高级函数Pandas数据分组与操作本篇为『图解Pandas数据变换高级...
封面图

Python数据分析 | Pandas核心操作函数大全

2022-02-25
阅读 7 分钟
1.1k
当我们提到python数据分析的时候,大部分情况下都会使用Pandas进行操作。本篇为pandas系列的导语,对pandas进行简单介绍,整个系列覆盖以下内容:
封面图

Python数据分析 | 数据分析工具库Pandas介绍

2022-02-25
阅读 2 分钟
943
作者:韩信子@ShowMeAI教程地址:[链接]本文地址:[链接]声明:版权所有,转载请联系平台与作者并注明出处一、Pandas介绍官网:[链接]文档:[链接]Pandas最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发团队继续开发和维护,属于PyData项目的一部分。Pan...
封面图

Python数据分析 | Numpy与高维数组操作

2022-02-25
阅读 3 分钟
868
n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇讲解Numpy与3维、更高维数组的操作。
封面图

Python数据分析 | Numpy与2维数组操作

2022-02-25
阅读 6 分钟
989
作者:韩信子@ShowMeAI教程地址:[链接]本文地址:[链接]声明:版权所有,转载请联系平台与作者并注明出处n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇讲解Numpy与2维数组操作。一、向量初始化NumPy中曾有一个专用的matrix类来...
封面图

Python数据分析 | Numpy与1维数组操作

2022-02-25
阅读 5 分钟
619
作者:韩信子@ShowMeAI教程地址:[链接]本文地址:[链接]声明:版权所有,转载请联系平台与作者并注明出处n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇讲解Numpy与1维数组操作。一、向量初始化可以通过Python列表创建NumPy数组...
封面图

Python数据分析 | 统计与科学计算工具库Numpy介绍

2022-02-25
阅读 2 分钟
650
数据分析、机器学习和深度学习领域,很多计算过程可以通过向量和矩阵进行并行化的高效处理,而NumPy可以很好地支撑向量化运算。NumPy 包是Python生态系统中科学计算的核心支撑之一,数据分析工具库 pandas,计算机视觉工具库OpenCV等库都基于NumPy。熟悉NumPy之后,知名的深度学习框架PyTorch、TensorFlow、Keras等,也...
封面图

图解数据分析 | 业务分析与数据挖掘

2022-02-25
阅读 4 分钟
660
作者:韩信子@ShowMeAI教程地址:[链接]本文地址:[链接]声明:版权所有,转载请联系平台与作者并注明出处数据分析分核心步骤分为:业务认知与数据探索、数据预处理、业务认知与数据探索等三个核心步骤。本文介绍第三个步骤——业务认知与数据探索。一、业务分析模型1.1 AB测试AB测试,简单来说,就是为同一个产品目标制定...
封面图

图解数据分析 | 数据清洗与预处理

2022-02-25
阅读 4 分钟
705
作者:韩信子@ShowMeAI教程地址:[链接]本文地址:[链接]声明:版权所有,转载请联系平台与作者并注明出处数据分析分核心步骤分为:业务认知与数据探索、数据预处理、业务认知与数据探索等三个核心步骤。本文介绍第二个步骤——数据预处理。不能想当然地认为数据是有效的。 在现实世界中,数据一般都是异构的、有缺失的、...
封面图