python后端实战经验分享 - SegmentFault 思否

使用 modelscope 跑 OpenBMB/MiniCPM-V-2_6

universe_king

2024-10-25

阅读 3 分钟

831

使用 modelscope 跑 OpenBMB/MiniCPM-V-2_6-int4，绕开 huggingface 的网络封锁完整版[链接] {代码...} int4 量化版本[链接] {代码...}

fastapi+pytorch 推理遇到内存泄露问题

universe_king

2023-10-13

阅读 1 分钟

2.7k

现象描述：uvicorn + fastapi + 不使用 async def 的时候，随着请求持续增加，内存会一直涨上去但是内存不是线性增长的。当请求 QPS 很低的时候，几乎不怎么增长；但是当 QPS 比较大的时候，会一点点增长。连续持续的 QPS 让内存增长非常缓慢但是短短续续的大QPS，会让QPS刚到达的那几秒就有几十MB的快速增长，然后增长...

华为 Ascend AI Compiler (ATC) 工具的 framework 参数是什么意思？

universe_king

2023-08-09

阅读 1 分钟

938

上面，chatGPT 的回答是错误的正确的答案，看官方文档：[链接]

浅尝 ChatGLM2-6B

universe_king

2023-06-30

阅读 5 分钟

1.9k

听闻大名，说了拿下了中文榜单第一名：ChatGLM-6B第二代模型开源，拿下LLM模型中文能力评估榜单第一名排行榜原地址：[链接]ChatGLM2-6B 支持FP16，最厉害，但是需要的资源也最多int8，中庸int4，最笨，但是资源也最少FP16 火力全开多卡互联我有两个 M60，各是 8GB 的显存。因为跑 FP16 需要 12.5GB 的显存，所以必须上两...

pytorch 的 torchvision 的 transforms.Resize 会修改图片比例吗？

universe_king

2023-04-17

阅读 1 分钟

2.8k

是的，torchvision 的 transforms.Resize 可以修改图像的大小和比例。如果您只指定了一个维度（例如高度），则另一个维度（例如宽度）将按比例调整以保持原始图像的纵横比。如果您指定两个维度，则图像将被拉伸以填充新尺寸。

torchvision 的 transforms.ToTensor 干了什么事情？

universe_king

2023-04-17

阅读 1 分钟

2.4k

A:torchvision 的 transforms.ToTensor() 是将 PIL Image 或 numpy.ndarray 转化成 torch.FloatTensor 数据类型的方法。这个方法的主要功能是：

计算向量距离的时候，l2和 ip 哪个更好？有什么区别？应该如何选择？

universe_king

2023-04-17

阅读 1 分钟

4.4k

A：计算向量距离的时候，L2范数和内积（IP）都是常用的度量方式。它们的计算方法和意义有所不同，因此在不同的场景下选择不同的度量方式会更加合适。

深度学习 preprocess 预处理图片方式去 pytorch 化

universe_king

2023-04-04

阅读 2 分钟

1.7k

我的模型需要线上部署了，想直接使用 onnx，而不是 pytorch，所以我需要把代码中关于 pytorch 的都删除了，比如下面这段代码，怎么使用其他库替代？

pytorch 中 Tensor 的 pow 方法是干嘛的？

universe_king

2023-03-29

阅读 1 分钟

2.1k

在PyTorch中，Tensor的pow方法可以用来计算张量的幂次方，即将张量中的每个元素提升为指定幂次的值。例如，如果t是一个包含[2, 3, 4]的一维张量，那么t.pow(2)将返回一个新的张量，其中的元素为[4, 9, 16]。

pytorch resnet50 模型转成 onnx 的代码样例，batch_size 是动态可调节的

universe_king

2023-03-29

阅读 1 分钟

2.8k

注意，在将模型导出为 ONNX 格式时，需要指定 input_names 和 output_names 参数来指定输入和输出张量的名称，以便在 ONNX 运行时中使用。此外，我们还需要使用 dynamic_axes 参数来指定批处理大小的动态维度。最后，在 ONNX 运行时中使用 session.run() 方法来运行模型。

torch.cat 速度太慢

universe_king

2023-03-15

阅读 2 分钟

3.8k

torch.cat 是 PyTorch 中用于连接多个张量的函数。如果需要频繁地执行 torch.cat 操作，可能会影响程序的性能。以下是一些优化 torch.cat 速度的方法：

tensor.to 将数据 to cuda 太慢? tensor.to 速度测试

universe_king

2023-03-15

阅读 2 分钟

1.9k

测试代码： {代码...} 测试在不同平台下的运行速度，因为这个肯定和内存速度、显存带宽、显存速度等等都有关系测试平台一：intel Xeon E5-2690 CPU + tesla-m60 GPUCPU: Intel Xeon E5-2690RAM: DDR4 2400 MHzGPU: NVIDIA Tesla M60运行结果 {代码...} 测试平台二：Intel(R) Xeon(R) Gold 5218 CPU @ 2.30GHz + tesla-T4...

resnet50 一共有多少层？层数计算

universe_king

2023-03-14

阅读 10 分钟

1.8k

ResNet50 卷积神经网络简介ResNet-50特殊层详解再来看看代码层面的 {代码...} 输出 {代码...}

不同 batch_size 生成的 vector 不一样

universe_king

2023-03-14

阅读 1 分钟

907

之前发现，在不同设备上，推理生成的向量会不一样比如在同一台电脑是，使用 CPU 生成的向量和 GPU 生成的向量换一台电脑，这台电脑的 CPU 生成的向量和另一台电脑 CPU 生成的向量也不一样现在我还发现，一样的电脑，一样的 CPU，但是 batch_size 不一样，生成的向量也可以不一样这没有关系，因为生成的向量区别都到小数...

tesla-t4 GPU 推理 resnet50 比 CPU 快多少？

universe_king

2023-03-09

阅读 1 分钟

1.4k

tesla-t4 GPU 推理 resnet50 比 CPU 快 27 倍出处: [链接]

如何使用 resnet 生成图片向量？

universe_king

2023-01-16

阅读 1 分钟

1.8k

有什么封装好的 python 的包，可以直接生成图片的向量吗？有什么封装好的 python 的包，可以开箱即用，直接生成图片的向量吗？有什么封装好的 python 的包，可以通过 resnet，残差神经网络开箱即用，直接生成图片的向量吗？