大数据分析,鲁班为祖师

2017-04-17
阅读 2 分钟
3.5k
本书以数据分析领域最热的Python语言为主要线索,介绍数据分析库Numpy、Pandas与机器学习库Scikit-Learn,使用了可视化环境Orange3来理解算法的一些细节。

新书《全栈数据之门》完整目录

2017-03-21
阅读 4 分钟
4.7k
全栈数据之门 前言 自强不息,厚德载物 0x1 Linux,自由之光 0x10 Linux,你是我的眼 0x11 Linux 基础,从零开始 01 Linux 之门 02 文件操作 03 权限管理 04 软件安装 05 实战经验 0x12 Sed 与Grep,文本处理 01 文本工具 02 grep 的使用 03 grep 家族 04 sed 的使用 05 综合案例 0x13 数据工程,必备Shell 01 She...

新书《全栈数据之门》预告

2017-01-24
阅读 1 分钟
2.2k
终于,可以给各位关心《全栈数据之门》的亲人、朋友一个交待了! 经过出版社三个多月的编辑与排版,目前已经编辑完成了最后的版本。就等过完年,吃好、喝好、玩好后回来,就可以开始印刷了。 预计在2017年3月份可以与各位读者见面! 没有什么技术含量,仅仅是些实战经验。 没有名人作序推荐,仅仅是用心去写作。 书名最...

《全栈数据之门》初稿完成

2016-08-11
阅读 2 分钟
3.5k
原计划写的是七章,每章七篇,共计七七得四十九篇。只是在写作过程中,舍弃了部分原计划的篇幅。感觉以目前的功力,或是写不出特色,或是没有好的应用场景,或是没有写作的动力,或是……总之,理由总是可以找出来的,正如男人总是可以找到出轨的理由一样可笑。

0x08 大数据分析,七层基本功

2016-01-12
阅读 4 分钟
3k
摘要:欲练数据神功,必先挥刀……,嗯,先扎好马步吧!编写SQL语句,是数据统计分析最基本的能力了。觉得SQL的自定义功能太弱了,或者你觉得就算是Hive调用外部脚本也麻烦了,那么我们上当前最热的Spark00 引言2016就要来了,避不及,躲不开。新一年来之前,还是有一件值得高兴的事情,那便是年终奖了。

0x07 数据民工,一致性洗车

2016-01-04
阅读 3 分钟
2.2k
摘要:数据科学家是二十一世纪最性感的的职业。面临充斥着脏乱差的数据,处理数据一致性问题是其中一项重要任务。人的强项在于智能,却不善于处理重复且枯燥无味的事情。机器不具有智能,却善于处理重复且简单的事情。

0x06 缘起Linux, 一入Mac误终身

2015-12-31
阅读 3 分钟
4.7k
摘要:苹果公司总裁乔布斯是贤动千佛中的金刚慧佛,由他创造的iPod,iPhone,Mac,引领着IT世界之潮流。Mac基于Unix,和Linux师出同门,强大的Shell保证了工作习惯和效率。Mac版本的爱奇艺没有广告。01 缘起Linux宇宙在成、住、坏、空的循环成灭过程中,现在的劫称为贤劫,贤劫中出现于世之千佛即为贤劫千佛。当今世界之...

0x05 Python数据分析,Anaconda八斩刀

2015-12-31
阅读 2 分钟
4.5k
摘要:武侠,是成人的童话。江湖,是门派的斗争。数据科学已经开山立派,Python便是其中独领风搔的兵器。如果数据科学是IT武侠中的咏春,那么Anaconda便是数据科学中的八斩刀。做数据分析,Anaconda,你值得拥有。武侠,是成人的童话。江湖,是门派的斗争。要想在江湖中闯出名堂,那么称手的兵器很有必要。数据科学已经...

0x04 App接口,三大环境

2015-12-31
阅读 3 分钟
2.4k
摘要:互联天下,移动为王。丝丝理清,避免乱麻。程序员在自己的环境,有自己熟悉的开发工具或者IDE,有自己熟悉的调试工具或者流程。修改生产环境的任何一行代码,都可能会影响到用户。没有任何人敢保证当前这行代码不会影响用户的使用。

0x03 近朱者赤,相亲knn

2015-12-31
阅读 2 分钟
2.9k
摘要:城市越大,圈子越小,人越感到孤单。相亲,在对对方一无所知的情况下,怎么快速的掌握对方的信息呢?想知道眼前的帅哥有没有房子,KNN,即K近邻算法,便可以很好解决相亲的问题。

0x01 念念Python,必有回响

2015-12-31
阅读 2 分钟
6.1k
摘要:灵蛇出现,必有异像,Python最热的领域,估计非数据分析、挖掘领域莫属了。以Scikit-Learn为代表的数据分析领域,从这里开始,便是Python的天下;一边操作实例,一边阅读文档,再辅助以相关的理论基础,持之数日,则大业可成也。01 灵蛇出现,必有异像