Python+Mongodb 与Pandas 数据统计相关问题

Question

Python+Mongodb 与Pandas 数据统计相关问题

发布于
2018-11-29

更新于
2018-11-29

def getuser():
    users = user.find({
        'totalRecharge': {'$gt': 0},
        '$or': [
            {'recharge.from': 'weixin'},
            {'recharge.from': 'alipay'},
            {'recharge.from': {'$ne': 'jCode'}},
            {'recharge.from': {'$ne': 'regCoupon'}}
        ]
    })
    data = [u for u in users]
    frame = pd.DataFrame(data, columns=['phone', 'balance', 'totalRecharge'])
    print(frame[(frame['balance']/100 > 100) & (frame['totalRecharge']/100 > 1000)].count())
    return

最近重新研究Python用于数据统计，数据库是MongoDB，最近发现Pandas有的会与Pymongo的聚合管道功能相近，pandas目前还不熟练基本上都是边写边去网上找一些方法。

问题数据库的里int字段比例都是1:100 比如balance字段 1元=100.如何在构建dataframe时除以100？
而且groupbycut这些方法为什么国内很少有文章？
一堆各种入门、必看、XX个牛逼方法尼玛全都是来回复制的文档的，真正自己使用总结或使用的干货却很少？

从代码量看我还是比较倾向Pandas! 请老手们给条明路。

python

mongodb

阅读 1.9k

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

Python+Mongodb 与Pandas 数据统计相关问题

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？