人工智能 - 【模型部署】vLLM 部署 Qwen2-VL 踩坑记 01 - 环境安装 - 个人文章

【模型部署】vLLM 部署 Qwen2-VL 踩坑记 01 - 环境安装

NLP Github 项目：

NLP 项目实践：fasterai/nlp-project-practice
介绍：该仓库围绕着 NLP 任务模型的设计、训练、优化、部署和应用，分享大模型算法工程师的日常工作和实战经验
AI 藏经阁：https://gitee.com/fasterai/ai-e-book
介绍：该仓库主要分享了数百本 AI 领域电子书
AI 算法面经：fasterai/nlp-interview-handbook#面经
介绍：该仓库一网打尽互联网大厂NLP算法面经，算法求职必备神器
NLP 剑指Offer：https://gitee.com/fasterai/nlp-interview-handbook
介绍：该仓库汇总了 NLP 算法工程师高频面题

2024年8月30日，阿里云重磅发布Qwen2-VL！Qwen2-VL是Qwen模型系列中最新版本的视觉语言模型。Qwen2-VL是由阿里云qwen2团队开发的多模态大型语言模型系列。Qwen2-VL 基于 Qwen2 打造，相比 Qwen-VL，它具有以下特点：

读懂不同分辨率和不同长宽比的图片：Qwen2-VL 在 MathVista、DocVQA、RealWorldQA、MTVQA 等视觉理解基准测试中取得了全球领先的表现。
理解20分钟以上的长视频：Qwen2-VL 可理解长视频，并将其用于基于视频的问答、对话和内容创作等应用中。
能够操作手机和机器人的视觉智能体：借助复杂推理和决策的能力，Qwen2-VL 可集成到手机、机器人等设备，根据视觉环境和文字指令进行自动操作。
多语言支持：为了服务全球用户，除英语和中文外，Qwen2-VL 现在还支持理解图像中的多语言文本，包括大多数欧洲语言、日语、韩语、阿拉伯语、越南语等。

使用vLLM部署 Qwen2-VL 模型

环境配置

pip install qwen-vl-utils
pip install transformers
pip install accelerate

pip install vllm

启动vllm服务

python -m vllm.entrypoints.openai.api_server --served-model-name Qwen2-VL-7B-Instruct --model Qwen/Qwen2-VL-7B-Instruct

错误原因：vllm 版本不一致导致的错误

# 卸载vllm
pip uninstall vllm

查看CUDA版本

# 重新安装vllm
# Change to your CUDA version
CUDA_VERSION=cu122
pip install 'vllm==0.6.1' --extra-index-url https://download.pytorch.org/whl/${CUDA_VERSION}

启动之后同样报错：

准备重新安装环境。

系列文章：

本文由mdnice多平台发布

【模型部署】vLLM 部署 Qwen2-VL 踩坑记 01 - 环境安装

【模型部署】vLLM 部署 Qwen2-VL 踩坑记 01 - 环境安装

环境配置

启动vllm服务

青松

引用和评论

【NLP高频面题 - Transformer篇】Transformer的位置编码是如何计算的？

喜大普奔，适用于 VS Code 的 GitHub Copilot 全新免费版本正式推出，GitHub 全球开发者突破1.5亿

从云计算一哥到全球生成式 AI 前行者：回顾 re:Invent 2024 三项重要发布

AI 驱动的个性化推荐系统设计

【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶

从 re:Invent 2024 看 AWS 最前沿的 AI 基础设施架构

智能图像识别系统设计与实现