fastapi+pytorch 推理遇到内存泄露问题

2023-10-13
阅读 1 分钟
839
现象描述:uvicorn + fastapi + 不使用 async def 的时候,随着请求持续增加,内存会一直涨上去但是内存不是线性增长的。当请求 QPS 很低的时候,几乎不怎么增长;但是当 QPS 比较大的时候,会一点点增长。连续持续的 QPS 让内存增长非常缓慢但是短短续续的大QPS,会让QPS刚到达的那几秒就有几十MB的快速增长,然后增长...

华为 Ascend AI Compiler (ATC) 工具的 framework 参数是什么意思?

2023-08-09
阅读 1 分钟
589
上面,chatGPT 的回答是错误的正确的答案,看官方文档:[链接]

浅尝 ChatGLM2-6B

2023-06-30
阅读 5 分钟
1.4k
听闻大名,说了拿下了中文榜单第一名:ChatGLM-6B第二代模型开源,拿下LLM模型中文能力评估榜单第一名排行榜原地址:[链接]ChatGLM2-6B 支持FP16,最厉害,但是需要的资源也最多int8,中庸int4,最笨,但是资源也最少FP16 火力全开多卡互联我有两个 M60,各是 8GB 的显存。因为跑 FP16 需要 12.5GB 的显存,所以必须上两...

pytorch 的 torchvision 的 transforms.Resize 会修改图片比例吗?

2023-04-17
阅读 1 分钟
1.9k
是的,torchvision 的 transforms.Resize 可以修改图像的大小和比例。如果您只指定了一个维度(例如高度),则另一个维度(例如宽度)将按比例调整以保持原始图像的纵横比。如果您指定两个维度,则图像将被拉伸以填充新尺寸。

torchvision 的 transforms.ToTensor 干了什么事情?

2023-04-17
阅读 1 分钟
1.2k
A:torchvision 的 transforms.ToTensor() 是将 PIL Image 或 numpy.ndarray 转化成 torch.FloatTensor 数据类型的方法。这个方法的主要功能是:

计算向量距离的时候,l2和 ip 哪个更好?有什么区别?应该如何选择?

2023-04-17
阅读 1 分钟
2.8k
A:计算向量距离的时候,L2范数和内积(IP)都是常用的度量方式。它们的计算方法和意义有所不同,因此在不同的场景下选择不同的度量方式会更加合适。

深度学习 preprocess 预处理图片方式去 pytorch 化

2023-04-04
阅读 2 分钟
1.2k
我的模型需要线上部署了,想直接使用 onnx,而不是 pytorch,所以我需要把代码中关于 pytorch 的都删除了,比如下面这段代码,怎么使用其他库替代?

pytorch 中 Tensor 的 pow 方法是干嘛的?

2023-03-29
阅读 1 分钟
1.4k
在PyTorch中,Tensor的pow方法可以用来计算张量的幂次方,即将张量中的每个元素提升为指定幂次的值。例如,如果t是一个包含[2, 3, 4]的一维张量,那么t.pow(2)将返回一个新的张量,其中的元素为[4, 9, 16]。

pytorch resnet50 模型转成 onnx 的代码样例,batch_size 是动态可调节的

2023-03-29
阅读 1 分钟
1.9k
注意,在将模型导出为 ONNX 格式时,需要指定 input_names 和 output_names 参数来指定输入和输出张量的名称,以便在 ONNX 运行时中使用。此外,我们还需要使用 dynamic_axes 参数来指定批处理大小的动态维度。最后,在 ONNX 运行时中使用 session.run() 方法来运行模型。

torch.cat 速度太慢

2023-03-15
阅读 2 分钟
2.4k
torch.cat 是 PyTorch 中用于连接多个张量的函数。如果需要频繁地执行 torch.cat 操作,可能会影响程序的性能。以下是一些优化 torch.cat 速度的方法:

tensor.to 将数据 to cuda 太慢? tensor.to 速度测试

2023-03-15
阅读 2 分钟
1.4k
测试代码: {代码...} 测试在不同平台下的运行速度,因为这个肯定和内存速度、显存带宽、显存速度等等都有关系测试平台一:intel Xeon E5-2690 CPU + tesla-m60 GPUCPU: Intel Xeon E5-2690RAM: DDR4 2400 MHzGPU: NVIDIA Tesla M60运行结果 {代码...} 测试平台二:Intel(R) Xeon(R) Gold 5218 CPU @ 2.30GHz + tesla-T4...

resnet50 一共有多少层?层数计算

2023-03-14
阅读 10 分钟
1.2k
ResNet50 卷积神经网络简介ResNet-50特殊层详解再来看看代码层面的 {代码...} 输出 {代码...}

不同 batch_size 生成的 vector 不一样

2023-03-14
阅读 1 分钟
643
之前发现,在不同设备上,推理生成的向量会不一样比如在同一台电脑是,使用 CPU 生成的向量和 GPU 生成的向量换一台电脑,这台电脑的 CPU 生成的向量和另一台电脑 CPU 生成的向量也不一样现在我还发现,一样的电脑,一样的 CPU,但是 batch_size 不一样,生成的向量也可以不一样这没有关系,因为生成的向量区别都到小数...

tesla-t4 GPU 推理 resnet50 比 CPU 快多少?

2023-03-09
阅读 1 分钟
940
tesla-t4 GPU 推理 resnet50 比 CPU 快 27 倍出处: [链接]

如何使用 resnet 生成图片向量?

2023-01-16
阅读 1 分钟
1.3k
有什么封装好的 python 的包,可以直接生成图片的向量吗?有什么封装好的 python 的包,可以开箱即用,直接生成图片的向量吗?有什么封装好的 python 的包,可以通过 resnet,残差神经网络开箱即用,直接生成图片的向量吗?