一种面向生产规模的大型语言模型（LLM）应用的后端优先方法

发布于 9 月 19 日

主要观点：几个月前推出无 AI 功能的平台，几周前推出含大型语言模型（LLMs）的第二版，通过结构化工作流程运行，测试时正常但用户使用后出现新问题，需添加保障措施，后端成为核心，提高效率且更稳定；介绍实现步骤，包括后端基于 Laravel 与 Redis、MySQL 配合，定义 LLM 请求作业、从控制器调度作业、SSE 端点用于流传输、前端消费与认证（使用 EventSourcePolyfill 解决认证问题）、将结果存入数据库，以及安全与可靠性措施（如用户配额、速率限制、提示验证等）。
关键信息：无 AI 功能平台到含 LLM 平台的转变，各技术组件的作用及协作，如 Laravel、Redis、MySQL 等，作业定义与调度过程，SSE 实现实时流传输，前端认证问题及解决办法，数据库存储及作用，安全可靠性措施。
重要细节：后端在所有 LLM 操作中居中心，Redis 处理高容量任务更快，作业在 Laravel 中隔离处理可重试，SSE 保持连接开放推送令牌，前端使用 EventSourcePolyfill 解决认证，数据库防止“丢失生成”，通过中间件实现用户配额和速率限制等。

阅读 207