我有一个 csv
格式的数据集(没有标题),我想将它分成两部分:(1)没有最后一列的实际数据集,(2)最后一列(类标签)。我的数据集有 100K 行和 65 个特征(最后一列,第 65 列,是我想要分离的类标签)。我写了以下内容:
dataset_path = 'dataset.csv'
dataset = np.genfromtxt(dataset_path, delimiter=',')
class_label = dataset[:-1]
dataset.drop(class_label, axis=1, inplace=True)
print dataset.shape
print class_label
这其实是错误的。我无法实现我想要的。任何帮助表示赞赏。
原文由 Medo 发布,翻译遵循 CC BY-SA 4.0 许可协议
假设您的数据集没有标题