新手上路，请多包涵

我有一个数据框，我想弹出一定数量的记录，而不是我想作为百分比值传递的数字。

例如，

df.head(n=10)

从数据集中弹出前 10 条记录。我想要一个小的变化而不是 10 条记录我想从我的数据集中弹出前 5% 的记录。如何在熊猫中做到这一点。

我正在寻找这样的代码，

df.head(frac=0.05)

有什么简单的方法可以得到这个吗？

原文由 Mohamed Thasin ah 发布，翻译遵循 CC BY-SA 4.0 许可协议

python pandas percentage

阅读 946

2 个回答

得票最新

社区维基

发布于
2023-01-08

✓ 已被采纳

我想弹出记录的前 5%

没有内置方法，但您可以这样做：

您可以 multiply 总行数占您的百分比，并将结果用作 head 方法的参数。

 n = 5
df.head(int(len(df)*(n/100)))

因此，如果您的数据框包含 1000 行和 n = 5% 您将获得第一行 50 行。

原文由 Mihai Alexandru-Ionut 发布，翻译遵循 CC BY-SA 4.0 许可协议

社区维基

发布于
2023-01-08

我已经扩展了 Mihai 对我的使用的回答，它可能对外面的人有用。目的是自动选择时间序列抽样的前 n 条记录，因此您确定您正在使用旧记录进行培训，并使用最近的记录进行测试。

 # having
# import pandas as pd
# df = pd.DataFrame...

def sample_first_prows(data, perc=0.7):
    import pandas as pd
    return data.head(int(len(data)*(perc)))

train = sample_first_prows(df)
test = df.iloc[max(train.index):]

原文由 Julian 发布，翻译遵循 CC BY-SA 4.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

Pandas - 根据百分比获取前 n 行

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？

Stack Overflow 翻译