无服务器机器学习：无需管理基础设施即可运行 AI 模型

主要观点：介绍无服务器机器学习（Serverless machine learning），即无需配置和管理服务器即可部署机器学习推理代码，使用函数即服务（FaaS）平台（如 AWS Lambda、Azure Functions）按需运行模型预测，具有自动扩展、按使用付费计费和低运营开销等优势。同时介绍了无服务器函数的约束及最佳实践，并分别阐述了在 AWS（Lambda 与 SageMaker 和 S3）和 Azure（Functions 与 Azure ML 和 Blob Storage）上的实现方式及示例代码，最后总结了无服务器机器学习的优点、注意事项和适用场景。

关键信息：

无服务器机器学习无需管理服务器，通过 FaaS 平台按需运行模型预测，自动扩展且成本低。
无服务器函数有执行时间限制、固定内存/CPU 和无状态执行等约束。
AWS 上的无服务器机器学习模式：Lambda 与 SageMaker 端点结合，或在 Lambda 中使用 S3 存储的模型进行推理；Azure 上类似，Functions 与 Azure ML 端点或 Blob Storage 结合。
最佳实践包括减少冷启动、高效加载模型、合理配置资源、使用优化格式、处理超时、控制并发和成本、日志监控、保障安全和测试等。

重要细节：

AWS Lambda + SageMaker：Lambda 作为前端调用 SageMaker 端点，SageMaker 处理模型托管和自动扩展，Lambda 处理请求；代码中通过 sagemakerRuntime.invokeEndpoint 调用端点并处理结果。
AWS Lambda + S3：将模型存储在 S3 中，冷启动时从 S3 下载到内存或磁盘，后续调用复用缓存模型；有多种打包选项。
Azure Functions + Azure ML：Azure Function 作为 API 层调用 Azure ML 在线端点，接收请求并返回预测；端点可按需缩放。
Azure Functions + Blob Storage：在 Function 中从 Blob Storage 下载并初始化模型，用于轻量级或间歇性推理；需注意内存/CPU 限制。
最佳实践中的各项要点及其具体做法，如减少冷启动可使用 AWS Provisioned Concurrency 或 Azure Premium 计划等。