使用机器学习识别出拍卖场中作弊的机器人用户(二)

2017-04-18
阅读 22 分钟
12.1k
数据预处理&特征工程——Feature_Engineering.ipynb & Feature_Engineering2.ipynb

使用机器学习识别出拍卖场中作弊的机器人用户

2017-04-18
阅读 20 分钟
8.5k
数据预处理&特征工程——Feature_Engineering.ipynb & Feature_Engineering2.ipynb

用Python处理csv文件的一些小玩意儿

2016-12-17
阅读 16 分钟
12.8k
Python CSV Toolkit 整理了一些个人在利用python处理csv文件时经常用到的一些自定义方法,放在这里主要方便自己查阅,也可以给其他人做参考 目录 输出CSV文件某列的匹配/不匹配的记录 调整csv文件的列的顺序 CSV转换器 抽取特定列 除去完全重复的记录 根据列名排序 键值互换 输出CSV文件某列的匹配/不匹配的记录 主要用...

csv文件与字典,列表等之间的转换小结【Python】

2016-10-08
阅读 12 分钟
33k
本文针对前面利用Python 所做的一次数据匹配实验,整理了其中的一些对于csv文件的读写操作和常用的Python'数据结构'(如字典和列表)之间的转换(Python Version 2.7)

用Python实现不同数据源的对象匹配【思考】

2016-10-07
阅读 1 分钟
3.2k
开始匹配之前可以进行一些简单的判断,看看所得到的数据的纯净度如何,比如是否存在重复数据?重复数据重复的情形(完全重复or部分重复)以及按某一字段排序来进一步分析看看;

用Python实现不同数据源的对象匹配【实验记录】

2016-09-18
阅读 51 分钟
8.9k
nationality or place of birth?应该还是用nationality,不过分析数据过程中发现存在诸如' Morocco|Germany '的字段,考虑用分隔后,多国籍分别分组

Algorithms(第四版)1.1课后练习答案(个人整理)

2016-09-12
阅读 15 分钟
12.4k
最近着手学习Robert Sedgewick的Algorithms这本书,开始做习题时发现配套网站上对应的习题答案并不完全,google后发现github以及有些人的博客上有部分答案,不过一般只做了第一章节的题目,大概是题目太多了的原因,在此自己整理自己所做的一份答案,希望有同行的人一起交流,分享。