数据分析大作战,SQL V.S. Python,来看看这些考题你都会吗 ⛵

2022-08-26
阅读 15 分钟
480
SQL与Pandas都可以完成大部分数据分析需求。本文用SQL与Pands逐一实现10类核心数据分析需求,轻松进行对比学习:数据选择、限制、统计计数、排序、新字段生成、数据选择、数据分组、统计均值、方差、极差/范围。

图数据挖掘!使用图分析+AI进行保险欺诈检测 ⛵

2022-08-26
阅读 5 分钟
157
本文将基于保险欺诈场景案例讲解如何进行有效的图挖掘,并将挖掘到的信息提供给AI模型,辅助精准检测和识别商业保险欺诈。💡 作者:韩信子@ShowMeAI📘 机器学习实战系列:[链接]📘 本文地址:[链接]📢 声明:版权所有,转载请联系平台与作者并注明出处📢 收藏ShowMeAI查看更多精彩内容保险欺诈是一个巨大的问题,保险业长期以...

20 行代码!带你快速构建基础文本搜索引擎 ⛵

2022-08-26
阅读 6 分钟
237
本文使用tf-idf(词频-逆文件频率)、lsi(潜在语义索引)和 doc2vec(文档向量化嵌入)这3种最基础的NLP文档嵌入技术,对文本进行嵌入操作(即构建语义向量)并完成比对检索,构建一个基础版的文本搜索引擎。

面试现场!月薪3w+的这些数据挖掘SQL面试题你都掌握了吗? ⛵

2022-08-26
阅读 10 分钟
135
💡 作者:韩信子@ShowMeAI📘 数据分析实战系列:[链接]📘 AI 面试题库系列:[链接]📘 本文地址:[链接]📢 声明:版权所有,转载请联系平台与作者并注明出处📢 收藏ShowMeAI查看更多精彩内容本篇内容基于场景面试题完成,在给定场景和数据表的前提下,有一系列的分析挖掘问题,大家可以基于SQL来完成。场景:Danny非常喜欢日本...

AI听曲识歌!哼曲、口哨吹,都能秒识! ⛵

2022-08-26
阅读 6 分钟
240
本文讲解音频检索技术及其广泛的应用场景。以『听曲识歌』为例,技术流程为具对已知歌曲抽取特征并构建特征向量库,而对于待检索的歌曲音频,同样做特征抽取后进行比对和快速匹配。

边缘计算 | 在移动设备上部署深度学习模型的思路与注意点 ⛵

2022-08-26
阅读 6 分钟
140
本文介绍AI模型适用于小型本地设备上的方法技术:压缩模型参数量,设计更小的模型结构,知识蒸馏,调整数据格式,数据复用等,并介绍移动小处理设备的类型、适用移动设备的模型框架等。

AI 音辨世界:艺术小白的我,靠这个AI模型,速识音乐流派选择音乐 ⛵

2022-08-26
阅读 21 分钟
234
音乐领域,借助于歌曲相关信息,模型可以根据歌曲的音频和歌词特征,将歌曲精准进行流派分类。本文讲解如何基于机器学习完成对音乐的识别分类。💡 作者:韩信子@ShowMeAI📘 数据分析实战系列:[链接]📘 机器学习实战系列:[链接]📘 本文地址:[链接]📢 声明:版权所有,转载请联系平台与作者并注明出处📢 收藏ShowMeAI查看更多...

大厂技术实现 | 图像检索及其在高德的应用 @计算机视觉系列

2022-08-15
阅读 9 分钟
175
ShowMeAI社区的技术专家小伙伴们对图像检索的典型算法做了实现,构建了相关应用 🏆『基于CNN与三元组的图像检索实现』,对细节感兴趣的话,请前往 这里 查看实现代码参考。代码的整理花费了很多心思,欢迎大家 PR 和 Star!

大厂技术实现 | 图像检索及其在淘宝的应用 @计算机视觉系列

2022-08-15
阅读 11 分钟
191
ShowMeAI社区的技术专家小伙伴们对图像检索的典型算法做了实现,构建了相关应用 🏆『基于CNN与三元组的图像检索实现』,对细节感兴趣的话,请前往 这里 查看实现代码参考。代码的整理花费了很多心思,欢迎大家 PR 和 Star!

数据专家最常使用的 10 大类 Pandas 函数 ⛵

2022-08-09
阅读 4 分钟
254
Python具有极其活跃的社区和覆盖全领域的第三方库工具库,近年来一直位居编程语言热度头部位置,而数据科学领域最受欢迎的python工具库之一是 Pandas。随着这么多年来的社区高速发展和海量的开源贡献者,使得 pandas 几乎可以胜任任何数据处理工作。

钻石价格预测的ML全流程!从模型构建调优道部署应用!⛵

2022-08-09
阅读 6 分钟
230
我们经常会谈到工业界端到端的机器学习建模,所谓端到端,是指的把整个过程构建在一个完整的流程(比如pipeline管道)中,包括数据侧的处理、模型建模调优,及模型部署应用等环节,如我们之前所说,完整的机器学习开发流程如下:

掌握这9个单行代码技巧!你也能写出『高端』Python代码 ⛵

2022-08-09
阅读 4 分钟
231
Python 是一个简单易上手可读性强且功能强大的编程语言,它有一些独特的技巧和写法,可以在不影响可读性的情况下大大缩短我们的 Python 代码,让它看起来更加紧凑和高级。

刘畊宏男孩女孩看过来!运动数据分析挖掘!⛵

2022-08-09
阅读 10 分钟
236
因为疫情,2年多的时间里,大家多了很多居家的经历,但是运动健康并不能因为居家而停止,健身随时随处可以进行!健身环大冒险等大热,而前阵子的刘畊宏跳操,带火了一大票畊宏男孩女孩,可穿戴设备市场大涨,而这些设备也记录了大量的运动数据。

二手车价格预测 | 构建AI模型并部署Web应用 ⛵

2022-08-09
阅读 16 分钟
268
一份来自『RESEARCH AND MARKETS』的二手车报告预计,从 2022 年到 2030 年,全球二手车市场将以 6.1% 的复合年增长率增长,到 2030 年达到 2.67 万亿美元。人工智能技术的广泛使用增加了车主和买家之间的透明度,提升了购买体验,极大地推动了二手车市场的增长。

毫秒级!千万人脸库快速比对,上亿商品图片检索,背后的极速检索用了什么神器? ⛵

2022-08-09
阅读 7 分钟
269
互联网发展的数十年来,技术在飞速前进,伴随着海量结构化表格数据的存储,结构化数据上的商业智能分析挖掘发展,也有海量的非结构化数据散布于各个互联网平台:

AI+医疗:使用神经网络进行医学影像识别分析 ⛵

2022-08-09
阅读 10 分钟
269
近年高速发展的人工智能技术应用到了各个垂直领域,比如把深度学习应用于各种医学诊断,效果显著甚至在某些方面甚至超过了人类专家。典型的 CV 最新技术已经应用于阿尔茨海默病的分类、肺癌检测、视网膜疾病检测等医学成像任务中。

看看你离世界一流大厂有多远?3道Google最新SQL面试题 ⛵

2022-08-09
阅读 6 分钟
235
下面是最新的 3 道 Google SQL 面试题和参考答案。这些题目面向的 Google 职位包括:数据科学 家、数据分析师、商业智能 工程师、数据工程师和商业分析师。

客户流失?来看看大厂如何基于spark+机器学习构建千万数据规模上的用户留存模型 ⛵

2022-08-09
阅读 33 分钟
293
Sparkify 是一个音乐流媒体平台,用户可以获取部分免费音乐资源,也有不少用户开启了会员订阅计划(参考QQ音乐),在Sparkify中享受优质音乐内容。

机器学习模型太慢?来看看英特尔(R) 扩展加速 ⛵

2022-08-09
阅读 6 分钟
223
我们在应用机器学习模型时,除了最终效果,也非常关注它们的性能。而机器学习模型的性能,不仅仅取决于我们的应用方式(特征多少、模型复杂度),也和硬件息息相关。

再见 Excel,你好 Python Spreadsheets! ⛵

2022-08-09
阅读 6 分钟
220
💡 作者:韩信子@ShowMeAI📘 数据分析◉技能提升系列:[链接]📘 数据分析实战系列:[链接]📘 本文地址:[链接]📢 声明:版权所有,转载请联系平台与作者并注明出处📢 收藏ShowMeAI查看更多精彩内容Excel是大家最常用的数据分析工具之一,借助它可以便捷地完成数据清理、统计计算、数据分析(数据透视图)和图表呈现等。但是!大...

羡慕 Excel 的高级选择与文本框颜色呈现?Pandas 也可以拥有!! ⛵

2022-08-09
阅读 5 分钟
225
用过 Excel 的数据分析师,对 Excel 的『条件选择』与『格式呈现』功能大都印象深刻。下方动图演示了 Excel『数据选择&底色填充高亮』功能。如果我们需要『选择大于100的所有产品取值并对单元格填充红色』,直接如下图所示,在『条件格式』中选择『突出显示单元格规则』即可进行设置。

AI识万物:从0搭建和部署手语识别系统 ⛵

2022-08-09
阅读 13 分钟
213
据北京听力协会预估数据,我国听障人群数量已过千万。而在全球范围内有4.66亿人患有残疾性听力损失,约占全世界人口的5%。聋哑人士很特殊,他们需要使用手语进行交流,其他与常人无异,我国存在特殊教育水平在各城市中发展力度具有较大差异,国家通用手语推广程度浅,但不懂手语,与听力障碍者交流会非常困难。

听音识情绪 | 程序员手把手教你搭建神经网络,更快get女朋友情绪,求生欲max!⛵

2022-08-09
阅读 10 分钟
270
这说的是人对于一种事物有感而生,必然表现在声音上。而晚清名臣曾国藩也提到,他在认人识人中有自己独到的方法,其中,特别喜欢通过声音来识别人才。他认为,声音不仅能反映出一个人的贵贱和修养,也能听出其内心情绪变化。结合这个方法他一生提拔了大量人才。

爆肝万字,终于搞定这篇⛵神经网络搭建全全全流程!学不会你来找我~

2022-08-09
阅读 18 分钟
333
深度学习是机器学习的一类算法,它应用各种结构的神经网络解决问题(深度学习中的『深度』指的是我们会通过深层次的神经网络构建强大的学习器),模仿人类获得某些类型知识的方式,与传统机器学习模型相比,神经网络有更灵活的结构设计,更强的学习能力,能支撑更大量级的数据学习,因此广泛引用于各种业务中。

全自动化机器学习建模!效果吊打初级炼丹师! ⛵

2022-08-09
阅读 8 分钟
200
自动化机器学习,也称为自动化 ML 或 AutoML,是自动化完成开发耗时且需要反复迭代的机器学习建模过程。它让数据科学家、分析师和开发人员轻松构建具有高规模、高效率和生产力的机器学习模型,同时保持模型质量。

股市预测,销量预测,病毒传播...一个时间序列建模套路搞定全部!⛵

2022-08-09
阅读 10 分钟
216
💡 作者:韩信子@ShowMeAI📘 深度学习实战系列:[链接]📘 NLP 实战系列:[链接]📘 本文地址:[链接]📢 声明:版权所有,转载请联系平台与作者并注明出处📢 收藏ShowMeAI查看更多精彩内容我们在日常业务中遇到的很多问题,都可以归属到时间序列范畴内——股市涨跌变化、电商销量预测、传染病传播挖掘等,其实都可以用『时间序列』...

机器学习建模高级用法!构建企业级AI建模流水线 ⛵

2022-08-09
阅读 12 分钟
321
💡 作者:韩信子@ShowMeAI📘 机器学习实战系列: [链接]📘 本文地址:[链接]📢 声明:版权所有,转载请联系平台与作者并注明出处📢 收藏ShowMeAI查看更多精彩内容机器学习与流水线(pipeline)简介我们知道机器学习应用过程包含很多步骤,如图所示『标准机器学习应用流程』,有数据预处理、特征工程、模型训练、模型迭代优化、...

2022了你还不会『低代码』?数据科学也能玩转Low-Code啦! ⛵

2022-08-09
阅读 5 分钟
205
低代码开发,顾名思义,指的是软件开发过程中只需要编写少量代码就够了。与传统开发方式相比,低代码大幅减少了编写代码的工作量,这使其具备了更快的速度、更短的开发时间与更低的成本。

Pandas 数据显示不全?快来了解这些设置技巧! ⛵

2022-08-05
阅读 4 分钟
267
💡 作者:韩信子@ShowMeAI📘 数据分析实战系列:[链接]📘 本文地址:[链接]📢 声明:版权所有,转载请联系平台与作者并注明出处📢 收藏ShowMeAI查看更多精彩内容📌 Pandas 数据显示的问题我们在应用 Python 进行数据分析挖掘和机器学习时,最常用的工具库就是 Pandas,它可以帮助我们快捷地进行数据处理和分析。对 Pandas 不熟...

一键自动化数据分析!快来看看 2022 年最受欢迎的 Python 宝藏工具库! ⛵

2022-08-05
阅读 6 分钟
529
实际工作中,我们往往依托于业务数据分析制定业务策略。这个过程需要频繁地进行数据分析和挖掘,发现模式规律。对于算法工程师而言,一个有效的 AI 算法系统落地,不仅仅是模型这么简单——数据才是最底层的驱动。