SF
python后端实战经验分享
python后端实战经验分享
注册登录
关注博客
注册登录
主页
关于
RSS
一个大模型需要多大GPU内存才能跑起来的计算公式
universe_king
1 月 2 日
阅读 1 分钟
1k
一个大模型需要多大GPU内存才能跑起来的计算公式: M = ( (P 4B) / (32 / Q) ) 1.2M: 所需的 GPU 显存,单位是 GB。P: 模型的参数数量。例如,7B 模型有 70 亿个参数。4B: 每个参数占用的字节数,这里假设每个参数占用 4 个字节(通常指 FP32 或 Float32 格式)。32: 4 个字节等于 32 位。Q: 加载模型时使用的位数。例如...
聊聊智谱ai平台作为商用llm的弊端——胆小敏感且怕事
universe_king
2024-11-27
阅读 1 分钟
757
最近在使用智谱的 glm 系列的 llm 做业务因为业务输入是来自爬虫对互联网内容的抓取然后交给 llm 做内容提取但是智谱的 llm 非常的胆小怕事,输入的内容只要出现一丁点暴力、色情、血腥、台du 的内容,就会拒绝回答,这非常的影响业务所以我换成了 aliyun 的 qwen下面展示一下对于同一个敏感问题,智谱和qwen的表现差异...
Qwen2-VL-2B-Instruct 量化,使用更少的显存运行
universe_king
2024-11-19
阅读 1 分钟
793
首先在魔搭社区搜索了一下 Qwen2-VL 相关的:[链接]然后发现了这些 2B 的量化版本首选 int4 查看:[链接]
ray 初体验,回答几个关注分布式的问题
universe_king
2024-11-14
阅读 2 分钟
764
QA 记录ray.init(address="auto") 为什么不要配置集群的ip端口等信息?副问题:ray 怎么创建一个中心ray.init(address="auto") 为什么不要配置集群的ip端口等信息?我们看到的 ray 的代码示例 demo 都是类似下面这样的 {代码...} 这我就很奇怪,ray 没有一个中心节点吗?或者不需要把自己变成一个中心节点吗?不区分 mas...
Failed to initialize NVML: Driver/library version mismatch
universe_king
2024-11-06
阅读 1 分钟
1k
遇到 Failed to initialize NVML: Driver/library version mismatch 的解决方案遇到这个问题的原因,多半是你更新了 apt 包前提是 nv 的驱动是没有更新的运行了 apt 更新之后,多半这个 nv 驱动就用不了了 {代码...} 那怎么办?多半重启机器就行了
manus 的替代品有哪些?使用LLM大模型技术做手机/网页/浏览器自动化操作技术汇总
universe_king
2024-10-30
阅读 1 分钟
1.8k
副标题:使用 LLM 大模型自动化操作浏览器、手机使用 VLM 多模态大模型自动化操作浏览器、手机使用 多模态视觉大模型自动化操作浏览器、手机
关注到一个 airllm 的项目
universe_king
2024-10-11
阅读 1 分钟
755
from 8G显存运行Llama 3.1 405B!项目地址 [链接]然后我有一个疑问留在这里了:[链接]
MiniCPM-V 是基于哪个模型二开的?
universe_king
2024-09-23
阅读 1 分钟
868
MiniCPM-V 2.6是清华和面壁智能最新发布的多模态模型,亦称面壁“小钢炮”,它是 MiniCPM-V 系列中最新、性能最佳的模型。该模型基于 SigLip-400M 和 Qwen2-7B 构建,仅 8B 参数,但却取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧 AI 多模态能力拉升至全面对标 GPT-4V 水平。参考:[链接]
华为 Ascend AI Compiler (ATC) 工具的 framework 参数是什么意思?
universe_king
2023-08-09
阅读 1 分钟
938
上面,chatGPT 的回答是错误的正确的答案,看官方文档:[链接]
浅尝 ChatGLM2-6B
universe_king
2023-06-30
阅读 5 分钟
1.9k
听闻大名,说了拿下了中文榜单第一名:ChatGLM-6B第二代模型开源,拿下LLM模型中文能力评估榜单第一名排行榜原地址:[链接]ChatGLM2-6B 支持FP16,最厉害,但是需要的资源也最多int8,中庸int4,最笨,但是资源也最少FP16 火力全开多卡互联我有两个 M60,各是 8GB 的显存。因为跑 FP16 需要 12.5GB 的显存,所以必须上两...
torchvision 的 transforms.ToTensor 干了什么事情?
universe_king
2023-04-17
阅读 1 分钟
2.4k
A:torchvision 的 transforms.ToTensor() 是将 PIL Image 或 numpy.ndarray 转化成 torch.FloatTensor 数据类型的方法。这个方法的主要功能是:
pytorch 中 Tensor 的 pow 方法是干嘛的?
universe_king
2023-03-29
阅读 1 分钟
2.1k
在PyTorch中,Tensor的pow方法可以用来计算张量的幂次方,即将张量中的每个元素提升为指定幂次的值。例如,如果t是一个包含[2, 3, 4]的一维张量,那么t.pow(2)将返回一个新的张量,其中的元素为[4, 9, 16]。
tensor.to 将数据 to cuda 太慢? tensor.to 速度测试
universe_king
2023-03-15
阅读 2 分钟
1.9k
测试代码: {代码...} 测试在不同平台下的运行速度,因为这个肯定和内存速度、显存带宽、显存速度等等都有关系测试平台一:intel Xeon E5-2690 CPU + tesla-m60 GPUCPU: Intel Xeon E5-2690RAM: DDR4 2400 MHzGPU: NVIDIA Tesla M60运行结果 {代码...} 测试平台二:Intel(R) Xeon(R) Gold 5218 CPU @ 2.30GHz + tesla-T4...
如何查看一个 pytorch 的 tensor 占用了多少字节
universe_king
2023-03-15
阅读 1 分钟
3.2k
可以使用 torch.numel() 方法来计算一个 PyTorch 张量占用的总字节数,以及 element_size() 方法来计算一个元素所占的字节数。将这两个方法返回的结果相乘即可得到 PyTorch 张量占用的总字节数。
resnet50 一共有多少层?层数计算
universe_king
2023-03-14
阅读 10 分钟
1.8k
ResNet50 卷积神经网络简介ResNet-50特殊层详解再来看看代码层面的 {代码...} 输出 {代码...}
不同 batch_size 生成的 vector 不一样
universe_king
2023-03-14
阅读 1 分钟
907
之前发现,在不同设备上,推理生成的向量会不一样比如在同一台电脑是,使用 CPU 生成的向量和 GPU 生成的向量换一台电脑,这台电脑的 CPU 生成的向量和另一台电脑 CPU 生成的向量也不一样现在我还发现,一样的电脑,一样的 CPU,但是 batch_size 不一样,生成的向量也可以不一样这没有关系,因为生成的向量区别都到小数...
如何判断深度学习推理是不是真的跑在显卡上了
universe_king
2023-02-15
阅读 1 分钟
2.7k
seo 优化:如何判断深度学习推理是不是真的跑在显卡上了如何判断 pytorch 跑在 cpu 还是在 GPU如何判断当前程序 运行在 cpu 还是在 GPU英伟达显卡如何判断程序是否运行的显卡上nvidia-smi 判断程序是否运行的显卡上如何判断显卡是不是真的被使用了此方法针对英伟达显卡,使用 nvidia-smi 命令方法一:看 GPU 利用率这个...
如何使用 resnet 生成图片向量?
universe_king
2023-01-16
阅读 1 分钟
1.8k
有什么封装好的 python 的包,可以直接生成图片的向量吗?有什么封装好的 python 的包,可以开箱即用,直接生成图片的向量吗?有什么封装好的 python 的包,可以通过 resnet,残差神经网络开箱即用,直接生成图片的向量吗?
为什么异或问题线性不可分割
universe_king
2019-07-14
阅读 1 分钟
7.6k
为什么异或问题是线性不可分割的? 看教材的时候多说,感知机(单层神经网络)不能解决异或问题,那为什么呢??? 因为 感知机是处理线性问题的 异或问题是非线性问题 什么是线性可分? N维的 binary dataset是否线性可分取决于是否存在 N-1维的线性空间分割这个 dataset成两部分. 按照直觉来说 对于一个一维直线(或曲...
第2话 TensorFlow 数据流图———TensorBoard的使用
universe_king
2019-07-13
阅读 2 分钟
5k
TensorFlow使用符号计算图,这与Theano相似,不过与Theano相比,TensorFlow 更简洁。TensorFlow 的名字本身描述了它自身的执行原理: Tensor (张量)意味着N维数组,Flow (流)意味着基于数据流图的计算。数据流图中的图就是我们所说的有向图,在图这种数据结构中包含两种基本元素:节点和边。这两种元素在数据流图中有自己...
第1话 TensorFlow基础概念 (计算图、张量、会话、常量、变量、占位符)
universe_king
2019-07-10
阅读 8 分钟
10.8k
(代码基于tensorflow 1.14 cpu版本,读者需要具有良好的python基础和线性代数知识)第三章主要介绍TensorFlow的计算模型、数据模型和运行模型,对TensorFlow的工作原理能有一个大致了解。TensorFlow程序一般分为两个阶段。第一阶段:定义计算图中所有的计算,然后定义一个计算来得到他们的和;第二阶段:执行计算。1 计...