我有一个包含 423244 行的大型数据框。我想把它分成 4 个。我尝试了下面的代码,它给出了一个错误? ValueError: array split does not result in an equal division
for item in np.split(df, 4):
print item
如何将此数据框分成 4 组?
原文由 Nilani Algiriyage 发布,翻译遵循 CC BY-SA 4.0 许可协议
我有一个包含 423244 行的大型数据框。我想把它分成 4 个。我尝试了下面的代码,它给出了一个错误? ValueError: array split does not result in an equal division
for item in np.split(df, 4):
print item
如何将此数据框分成 4 组?
原文由 Nilani Algiriyage 发布,翻译遵循 CC BY-SA 4.0 许可协议
我想做同样的事情,但我首先遇到了拆分功能的问题,然后是安装 pandas 0.15.2 的问题,所以我回到了我的旧版本,并编写了一个运行良好的小功能。我希望这能有所帮助!
# input - df: a Dataframe, chunkSize: the chunk size
# output - a list of DataFrame
# purpose - splits the DataFrame into smaller chunks
def split_dataframe(df, chunk_size = 10000):
chunks = list()
num_chunks = len(df) // chunk_size + 1
for i in range(num_chunks):
chunks.append(df[i*chunk_size:(i+1)*chunk_size])
return chunks
原文由 elixir 发布,翻译遵循 CC BY-SA 4.0 许可协议
2 回答5.3k 阅读✓ 已解决
2 回答1.2k 阅读✓ 已解决
4 回答1.5k 阅读✓ 已解决
3 回答1.4k 阅读✓ 已解决
3 回答1.3k 阅读✓ 已解决
2 回答955 阅读✓ 已解决
1 回答1.8k 阅读✓ 已解决
使用
np.array_split
: