如何使用 pytorch 的 resnet50 模型输出一个 2048 纬度的向量？

Question

如何使用 pytorch 的 resnet50 模型输出一个 2048 纬度的向量？

universe_king

3.4k14411869

发布于
2023-03-02 浙江

更新于
2023-03-02

我让 chatGPT 为了生成了一段代码

图片.png

代码如下：

import torch
import torchvision.models as models
import torchvision.transforms as transforms
from PIL import Image

# 加载 ResNet50 模型并设置为评估模式
resnet50 = models.resnet50(pretrained=True)
resnet50.eval()

# 定义图片预处理方法
transform = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])

# 加载图片并进行预处理
img = Image.open('/Users/ponponon/Desktop/code/me/image2vector/resources/images/wallhaven-l8896l.png')
img_tensor = transform(img).unsqueeze(0) # 增加一个 batch 维度

# 使用 ResNet50 模型进行特征提取
with torch.no_grad():
    features = resnet50(img_tensor)

# 打印特征向量的形状
print(features.shape) # 输出 (1, 2048)

但是我发现了一个问题，这个代码运行输出来的向量纬度是 1000，而不是 2048，我需要这么才能获取 2048 纬度的向量呢？

pytorch 深度学习神经网络算法机器学习

阅读 5.1k

1 个回答

得票最新

universe_king

3.4k14411869

发布于
2023-03-02 浙江

更新于
2024-02-02

✓ 已被采纳

问题已解决，pytorch 里面的 resnet50 默认输出纬度是 1000

因为最后的全连接层是这样定义的：Linear(in_features=2048, out_features=1000, bias=True)

PyTorch 的 ResNet50 模型的默认输出维度为 1000。这是因为预训练的 ResNet50 模型是在 ImageNet 数据集上训练的，ImageNet 数据集包含1000个类别，因此模型的最后一层是一个全连接层，输出维度为1000。如果需要获得不同的输出维度，可以将全连接层替换为一个新的全连接层，输出维度与需要的维度相匹配。

要修改成输出为 2048 的，需要自己加一行代码

import torch
import torchvision.models as models
import torchvision.transforms as transforms
from PIL import Image
import torch.nn as nn

# 加载 ResNet50 模型并设置为评估模式
resnet50 = models.resnet50(pretrained=True)
resnet50.fc = nn.Linear(2048, 2048)
resnet50.eval()

# 定义图片预处理方法
transform = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])

# 加载图片并进行预处理
img = Image.open('/Users/ponponon/Desktop/code/me/image2vector/resources/images/wallhaven-l8896l.png')
img_tensor = transform(img).unsqueeze(0) # 增加一个 batch 维度

# 使用 ResNet50 模型进行特征提取
import time

started_at=time.time()

for i in range(1):
    with torch.no_grad():
        features = resnet50(img_tensor)
        
ended_at=time.time()

print(ended_at-started_at)

# 打印特征向量的形状
print(features.shape) # 输出 (1, 2048)

但是这样有一个坏处，会让结果变随机：https://github.com/pytorch/vision/issues/7937

因为 fc 层也是有权重参数的

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

如何使用 pytorch 的 resnet50 模型输出一个 2048 纬度的向量？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

python有什么小型项目用到机器学习，神经网络进行数据分析的？

本地部署使用 miniCpmV2-6 、chatglm 这些本地 LLM 的时候，如何实现统计 token？

在标签中提供内容的类型是否跟另外建一套表描述不同类型的内容是等价的？

AI本地部署对计算机要求高不？

Java转大模型应用开发是否可以？

反序输出字符串的一道小题目？