Docker 模型运行器：本地 AI 开发中的变革者（C# 开发者视角）

发布于 7 月 2 日

主要观点：AI 特别是 LLM 的重大突破和进展使开发者能更快速地将 AI 能力集成到应用中，但在本地开发、运行和测试这些模型时面临诸多挑战，Docker 推出的 Docker Model Runner 旨在简化此过程。
关键信息：

Docker Model Runner 是 Docker Desktop 的一个功能，可简化 LLM 模型的本地开发和测试，解决开发者在 AI 项目中面临的问题，如简化设置、本地运行、环境一致性、与 Docker 生态系统集成、OpenAI 兼容 API 等。
要设置 Docker Model Runner，需确保安装 Docker Desktop 4.40 或更新版本，在设置中打开 Beta Features 并启用 Docker Model Runner 和主机侧 TCP 支持，重启 Docker Desktop 后可使用docker model命令。
可从 Docker Hub 拉取兼容的模型，如ollama/ollama，并使用docker model list查看可用模型，通过docker model run运行模型，还可创建.NET 控制台应用与 OpenAI 兼容端点交互。
重要细节：
在设置 Docker Model Runner 时，若 Windows 系统支持 NVIDIA GPU，可启用“GPU-backed inference”以提高性能。
在.NET 控制台应用中，通过HttpClient向http://localhost:12434/engines/llama.cpp/v1/chat/completions端点发送请求与模型交互，请求负载包含模型信息和用户输入。
运行应用时使用dotnet run命令，可直接在终端与模型交互。
结论：Docker Model Runner 对本地 AI 模型开发很有价值，简化了与模型的交互，让开发者能快速将智能功能集成到应用中，无需担心云托管 AI 服务的成本和延迟问题。
参考文献：
Docker Documentation 的“Docker Model Runner”[https://docs.docker.com/ai/mo...]。
Ollama[https://ollama.com/]。

阅读 310