大数据分析,鲁班为祖师

2017-04-17
阅读 2 分钟
3.3k
本书以数据分析领域最热的Python语言为主要线索,介绍数据分析库Numpy、Pandas与机器学习库Scikit-Learn,使用了可视化环境Orange3来理解算法的一些细节。

新书《全栈数据之门》完整目录

2017-03-21
阅读 4 分钟
4.6k
全栈数据之门 前言 自强不息,厚德载物 0x1 Linux,自由之光 0x10 Linux,你是我的眼 0x11 Linux 基础,从零开始 01 Linux 之门 02 文件操作 03 权限管理 04 软件安装 05 实战经验 0x12 Sed 与Grep,文本处理 01 文本工具 02 grep 的使用 03 grep 家族 04 sed 的使用 05 综合案例 0x13 数据工程,必备Shell 01 She...

《全栈数据之门》初稿完成

2016-08-11
阅读 2 分钟
3.5k
原计划写的是七章,每章七篇,共计七七得四十九篇。只是在写作过程中,舍弃了部分原计划的篇幅。感觉以目前的功力,或是写不出特色,或是没有好的应用场景,或是没有写作的动力,或是……总之,理由总是可以找出来的,正如男人总是可以找到出轨的理由一样可笑。

0x08 大数据分析,七层基本功

2016-01-12
阅读 4 分钟
2.9k
摘要:欲练数据神功,必先挥刀……,嗯,先扎好马步吧!编写SQL语句,是数据统计分析最基本的能力了。觉得SQL的自定义功能太弱了,或者你觉得就算是Hive调用外部脚本也麻烦了,那么我们上当前最热的Spark00 引言2016就要来了,避不及,躲不开。新一年来之前,还是有一件值得高兴的事情,那便是年终奖了。