SF

python后端实战经验分享

python后端实战经验分享

注册登录
关注博客注册登录
主页
关于
RSS

Qwen2-VL-2B-Instruct 量化,使用更少的显存运行

头像
universe_king
    2024-11-19 浙江
    阅读 1 分钟
    0

    首先在魔搭社区搜索了一下 Qwen2-VL 相关的:https://www.modelscope.cn/models?name=Qwen2-VL

    然后发现了这些 2B 的量化版本

    图片.png

    首选 int4 查看:https://www.modelscope.cn/models/Qwen/Qwen2-VL-2B-Instruct-GP...

    llmchatgpt深度学习神经网络人工智能
    阅读 785发布于 2024-11-19

    头像
    universe_king
    3.5k 声望716 粉丝

    « 上一篇
    ray 初体验,回答几个关注分布式的问题
    下一篇 »
    记录一个 nameko standalone rpc 应答不消费导致阻塞的问题

    引用和评论

    推荐阅读
    头像
    linux 中,分析 cpu 占用率过高和分析磁盘压力的命令

    universe_king赞 1阅读 307

    头像
    大模型中的Token究竟是什么?从原理到作用深度解析

    DBLens赞 5阅读 3.6k

    头像
    Open WebUI:开源AI交互平台的全面解析

    DBLens赞 5阅读 1.7k

    头像
    一文掌握 MCP 上下文协议:从理论到实践

    陈明勇赞 5阅读 1.6k

    头像
    Vue3-ChatGPT:基于vite4.x+vue3+pinia2模仿chatgpt聊天AI实例

    xiaoyan2017赞 2阅读 10.5k评论 4

    头像
    MySQL × 向量数据库:大模型时代的黄金组合实战指南

    DBLens赞 5阅读 1.7k

    头像
    AdventureX 2025 正式启动:五天四夜,120小时极限创造!一起在杭州点燃青年创新之火!

    思否编辑部赞 2阅读 4.3k

    0 条评论
    得票最新
    头像
    评论支持部分 Markdown 语法:**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。
    ©2025 python后端实战经验分享
    除特别声明外,作品采用《署名-非商业性使用-相同方式共享 4.0 国际》进行许可
    SF使用 SegmentFault 发布
    SegmentFault - 凝聚集体智慧,推动技术进步
    服务协议隐私政策浙ICP备15005796号-2浙公网安备33010602002000号