在 10 分钟内通过 Ollama + Python 从零到本地 AI

发布于 2025-11-18

主要观点：Ollama 提供本地优先的开发路径，具有零摩擦、统一 API、包含多种功能、可重复性等优点，2025 年末有云模型、OpenAI 兼容端点等新功能，介绍其工作架构、安装及多种调用方式（REST、Python SDK、Modelfile），还提供本地 RAG 示例、性能和正确性提示、安全强化清单、本地与云运行时选择、常见陷阱及解决方法，最后给出后续可探索的方向。

关键信息：

本地优先，默认运行在localhost，零摩擦安装和按需拉取模型。
2025 年末有云模型预览、OpenAI 兼容端点、Windows 桌面应用、安全质量更新。
工作架构包括轻量级服务器、GGUF 模型格式、llama.cpp 推理引擎等。
安装简单，多种系统通用，可通过终端验证服务运行。
有三种调用方式，REST 适用于任何语言，Python SDK 官方提供，Modelfile 可配置重复行为。
有本地 RAG 示例，无需框架，可离线工作。
提供性能和正确性相关提示，如模型大小与硬件适配等。
有安全强化清单，包括网络设置等。
可选择本地或云运行时，开发和部署可无缝切换。
列出常见陷阱及快速解决方法。
给出后续可探索的方向，如更换模型、添加向量库等。

重要细节：

不同调用方式的代码示例，如 REST 调用的 curl 命令、Python SDK 的代码等。
安全强化清单中的具体操作，如绑定接口、使用反向代理等。
常见陷阱的具体表现及解决办法，如端口被占用等。

阅读 101