如果我想要随机训练/测试拆分,我使用 sklearn 辅助函数:
In [1]: from sklearn.model_selection import train_test_split
...: train_test_split([1,2,3,4,5,6])
...:
Out[1]: [[1, 6, 4, 2], [5, 3]]
获得非混洗训练/测试拆分的最简洁方法是什么,即
[[1,2,3,4], [5,6]]
编辑 目前我正在使用
train, test = data[:int(len(data) * 0.75)], data[int(len(data) * 0.75):]
但希望有更好的东西。我在 sklearn 上开了一个问题 https://github.com/scikit-learn/scikit-learn/issues/8844
编辑 2: 我的 PR 已合并,在 scikit-learn 版本 0.19 中,您可以将参数 shuffle=False
传递给 train_test_split
以获得非随机拆分。
原文由 maxymoo 发布,翻译遵循 CC BY-SA 4.0 许可协议
除了易于复制粘贴功能外,我并没有对 Psidom 的答案添加太多内容:
更新:在某些时候,此功能已内置,因此现在您可以: