我是学习 Python 及其一些库(numpy、pandas)的新手。
我找到了很多 关于 numpy ndarrays、pandas 系列和 python 字典如何工作的文档。
但由于我对 Python 缺乏经验,我很难确定 何时 使用它们中的每一个。而且我还没有找到任何可以帮助我理解和决定何时使用每种数据结构更好的最佳实践。
一般来说,是否有任何最佳实践来决定应将特定数据集加载到这三种数据结构中的哪一种(如果有)?
原文由 Rodolfo Orozco 发布,翻译遵循 CC BY-SA 4.0 许可协议
我通常应用的经验法则: 使用仍能满足您需求的最简单的数据结构。如果我们将数据结构从最简单到最不简单进行排序,结果通常是这样的:
所以首先考虑字典/列表。如果这些允许您执行所需的所有数据操作,那么一切都很好。如果没有,开始考虑 numpy 数组。迁移到 numpy 数组的一些典型原因是:
然后还有一些超越 numpy 数组和更复杂但也更强大的 pandas 系列/数据帧的典型原因: