torchvision 的 transforms.ToTensor 干了什么事情？

Q:torchvision 的 transforms.ToTensor 干了什么事情？

A:torchvision 的 transforms.ToTensor() 是将 PIL Image 或 numpy.ndarray 转化成 torch.FloatTensor 数据类型的方法。这个方法的主要功能是：

将 PIL Image 或 numpy.ndarray 转化成 torch.FloatTensor 数据类型。
像素值在 0-255 范围内的 PIL Image 或 numpy.ndarray 在被转化成 torch.FloatTensor 时，会自动除以 255，使其像素值在 0-1 之间。
如果像素值已经在 0-1 范围内，那么就不会自动除以 255。

简而言之，transforms.ToTensor() 的作用是将输入的 PIL Image 或 numpy.ndarray 转换为 Tensor 类型，并且进行标准化操作，方便神经网络的训练。因为神经网络需要的输入数据类型一般是 FloatTensor 类型，且需要进行标准化，这个过程常常使用 transforms.ToTensor() 方法来实现。

Q:torchvision 的 transforms.ToTensor() 处理过的数据，还能复原回一张图片吗？
A:可以通过 transforms.ToPILImage() 将处理后的数据转换为 PIL 图像格式，从而复原回一张图片。例如：

from torchvision import transforms
from PIL import Image

# 读取图片
image = Image.open('example.jpg')

# 对图片进行 transforms.ToTensor() 处理
preprocess = transforms.Compose([
    transforms.ToTensor()
])
tensor = preprocess(image)

# 将处理后的数据还原成一张图片
to_pil = transforms.ToPILImage()
image_restored = to_pil(tensor)
image_restored.show()

这段代码会将一张名为 example.jpg 的图片读入，经过 transforms.ToTensor() 处理后，将处理后的数据还原成一张图片并展示出来。

torchvision 的 transforms.ToTensor 干了什么事情？

universe_king

引用和评论

钉钉文档打开「允许添加企业外的人为协作者」之后，还是显示「已禁止外部成员主动申请权限」

🔥全程不用写代码，我用 AI 程序员写了一个飞机大战

从 DeepSeek 看25年前端的一个小趋势

人工智能与机器学习入门：基尼系数（Gini Index）和基于熵（Entropy）

DeepSeek(私有化)+IDEA+Dify+微信搭建AI助手保姆级教程

Open WebUI：开源AI交互平台的全面解析

大模型中的Token究竟是什么？从原理到作用深度解析

torchvision 的 transforms.ToTensor 干了什么事情？

universe_king

引用和评论

钉钉文档打开「允许添加企业外的人为协作者」之后，还是显示「已禁止外部成员主动申请权限」

🔥全程不用写代码，我用 AI 程序员写了一个飞机大战

从 DeepSeek 看25年前端的一个小趋势

人工智能与机器学习入门：基尼系数（Gini Index）和基于熵（Entropy）

DeepSeek(私有化)+IDEA+Dify+微信 搭建AI助手保姆级教程

Open WebUI：开源AI交互平台的全面解析

大模型中的Token究竟是什么？从原理到作用深度解析

DeepSeek(私有化)+IDEA+Dify+微信搭建AI助手保姆级教程