我花了几个小时到处浏览,试图从 pandas 的数据框中创建一个多索引。这是我的数据框(发布 excel 表模型。我在 pandas 数据框中有这个):
这就是我想要的:
我努力了
newmulti = currentDataFrame.set_index(['user_id','account_num'])
但它返回一个数据框,而不是多索引。另外,我不知道如何使“user_id”级别为 0 和“account_num”级别为 1。我认为这一定是微不足道的,但我已经阅读了很多帖子、教程等,但仍然无法弄清楚。部分原因是我是一个非常注重视觉的人,而大多数帖子都不是。请帮忙!
原文由 puifais 发布,翻译遵循 CC BY-SA 4.0 许可协议
在这种情况下,您可以简单地使用
groupby
,这将在对所请求列的销售额求和时自动创建多索引。你也应该能够简单地做到这一点:
尽管您可能想避免任何重复(例如,两行或更多行具有相同的
user_id
,account_num
和date
将它们的销售额相加,但数字不同,其中的数字)这就是我推荐使用groupby
的原因。如果您需要多索引,您可以简单地访问 viat
new_df.index
其中new_df
是从上述两个操作之一创建的新数据帧。并且
user_id
将是级别 0 和account_num
将是级别 1。