有event.csv,train.csv,test.csv三个csv文件。但event文件太大了,我想选取部分的特征去进行运算,而这些部分特征是从train和test文件中出现并统计出来的。
所以想问问大家怎么个思路,有什么相应的python函数可以实现。
有event.csv,train.csv,test.csv三个csv文件。但event文件太大了,我想选取部分的特征去进行运算,而这些部分特征是从train和test文件中出现并统计出来的。
所以想问问大家怎么个思路,有什么相应的python函数可以实现。
2 回答5.2k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答1.4k 阅读✓ 已解决
3 回答1.3k 阅读✓ 已解决
3 回答1.2k 阅读✓ 已解决
2 回答857 阅读✓ 已解决
1 回答1.7k 阅读✓ 已解决
pandas的DataFrame实现了类似SQL的操作方式.
http://pandas.pydata.org/pand...
具体的还是看文档吧,我也不太熟.