大数据分析,鲁班为祖师

2017-04-17
阅读 2 分钟
3.3k
本书以数据分析领域最热的Python语言为主要线索,介绍数据分析库Numpy、Pandas与机器学习库Scikit-Learn,使用了可视化环境Orange3来理解算法的一些细节。

新书《全栈数据之门》完整目录

2017-03-21
阅读 4 分钟
4.6k
全栈数据之门 前言 自强不息,厚德载物 0x1 Linux,自由之光 0x10 Linux,你是我的眼 0x11 Linux 基础,从零开始 01 Linux 之门 02 文件操作 03 权限管理 04 软件安装 05 实战经验 0x12 Sed 与Grep,文本处理 01 文本工具 02 grep 的使用 03 grep 家族 04 sed 的使用 05 综合案例 0x13 数据工程,必备Shell 01 She...

新书《全栈数据之门》预告

2017-01-24
阅读 1 分钟
2.1k
终于,可以给各位关心《全栈数据之门》的亲人、朋友一个交待了! 经过出版社三个多月的编辑与排版,目前已经编辑完成了最后的版本。就等过完年,吃好、喝好、玩好后回来,就可以开始印刷了。 预计在2017年3月份可以与各位读者见面! 没有什么技术含量,仅仅是些实战经验。 没有名人作序推荐,仅仅是用心去写作。 书名最...

0x07 数据民工,一致性洗车

2016-01-04
阅读 3 分钟
2.1k
摘要:数据科学家是二十一世纪最性感的的职业。面临充斥着脏乱差的数据,处理数据一致性问题是其中一项重要任务。人的强项在于智能,却不善于处理重复且枯燥无味的事情。机器不具有智能,却善于处理重复且简单的事情。

0x03 近朱者赤,相亲knn

2015-12-31
阅读 2 分钟
2.8k
摘要:城市越大,圈子越小,人越感到孤单。相亲,在对对方一无所知的情况下,怎么快速的掌握对方的信息呢?想知道眼前的帅哥有没有房子,KNN,即K近邻算法,便可以很好解决相亲的问题。

0x01 念念Python,必有回响

2015-12-31
阅读 2 分钟
6k
摘要:灵蛇出现,必有异像,Python最热的领域,估计非数据分析、挖掘领域莫属了。以Scikit-Learn为代表的数据分析领域,从这里开始,便是Python的天下;一边操作实例,一边阅读文档,再辅助以相关的理论基础,持之数日,则大业可成也。01 灵蛇出现,必有异像