SF

python后端实战经验分享

python后端实战经验分享

注册登录
关注博客注册登录
主页
关于
RSS

Qwen2-VL-2B-Instruct 量化,使用更少的显存运行

头像
universe_king
    2024-11-19 浙江
    阅读 1 分钟
    0

    首先在魔搭社区搜索了一下 Qwen2-VL 相关的:https://www.modelscope.cn/models?name=Qwen2-VL

    然后发现了这些 2B 的量化版本

    图片.png

    首选 int4 查看:https://www.modelscope.cn/models/Qwen/Qwen2-VL-2B-Instruct-GP...

    llmchatgpt深度学习神经网络人工智能
    阅读 848发布于 2024-11-19

    头像
    universe_king
    3.5k 声望716 粉丝

    « 上一篇
    ray 初体验,回答几个关注分布式的问题
    下一篇 »
    记录一个 nameko standalone rpc 应答不消费导致阻塞的问题

    引用和评论

    推荐阅读
    头像
    避坑指南:升级到 rabbitmq3.13.7 后队列 State crashed

    universe_king阅读 349

    头像
    一文掌握 MCP 上下文协议:从理论到实践

    陈明勇赞 6阅读 2k

    头像
    AI Agent爆火后,MCP协议为什么如此重要!

    程序员海军赞 5阅读 548

    头像
    Vue3-ChatGPT:基于vite4.x+vue3+pinia2模仿chatgpt聊天AI实例

    xiaoyan2017赞 2阅读 11k评论 4

    头像
    分享自制小工具:AutomateGPT – 在 ChatGPT 里批量执行任务

    Meathill赞 3阅读 832评论 1

    头像
    AdventureX 2025 正式启动:五天四夜,120小时极限创造!一起在杭州点燃青年创新之火!

    思否编辑部赞 2阅读 5.4k

    头像
    MCP 协议为何不如你想象的安全?从技术专家视角解读

    Baihai_IDP赞 2阅读 575

    0 条评论
    得票最新
    头像
    评论支持部分 Markdown 语法:**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。
    ©2025 python后端实战经验分享
    除特别声明外,作品采用《署名-非商业性使用-相同方式共享 4.0 国际》进行许可
    SF使用 SegmentFault 发布
    SegmentFault - 凝聚集体智慧,推动技术进步
    服务协议隐私政策浙ICP备15005796号-2浙公网安备33010602002000号