将 CSV 解析为 Pytorch 张量

新手上路,请多包涵

我有一个 CSV 文件,其中包含除标题行以外的所有数值。尝试构建张量时,出现以下异常:

 Traceback (most recent call last):
  File "pytorch.py", line 14, in <module>
    test_tensor = torch.tensor(test)
ValueError: could not determine the shape of object type 'DataFrame'

这是我的代码:

 import torch
import dask.dataframe as dd

device = torch.device("cuda:0")

print("Loading CSV...")
test = dd.read_csv("test.csv", encoding = "UTF-8")
train = dd.read_csv("train.csv", encoding = "UTF-8")

print("Converting to Tensor...")
test_tensor = torch.tensor(test)
train_tensor = torch.tensor(train)

使用 pandas 而不是 Dask 进行 CSV 解析会产生相同的错误。我还尝试在对 — 的调用中指定 dtype=torch.float64 torch.tensor(data) ,但再次遇到相同的错误。

原文由 hildebro 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 1.5k
2 个回答

首先尝试将其转换为数组:

 test_tensor = torch.Tensor(test.values)

原文由 karla 发布,翻译遵循 CC BY-SA 4.0 许可协议

我想你只是错过了 .values

 import torch
import pandas as pd

train = pd.read_csv('train.csv')
train_tensor = torch.tensor(train.values)

原文由 Arash 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题