作者:希铭

概述

随着 LLM(大语言模型)基础技术的不断成熟和应用领域的广泛挖掘,越来越多的企业和开发者开始将 LLM 技术集成到自己的互联网服务架构中,市场上涌现出了一大批基于 LLM 技术搭建的爆款应用。Python 语言受益于其丰富的框架和社区生态,成为了众多开发者搭建这些 AI 应用时的第一选择。但随着 AI 应用架构日益成熟,吞吐量、访问性能、可扩展性、微服务生态等重要指标也成为众多开发者和运维人员关注的焦点。恰好,经历了互联网时代考验的 Java 语言在这些方面已经有了很成熟的解决方案和生态。那么,使用 Java 语言能否也像 Python 一样快速搭建出来 AI 应用呢?

作为炙手可热的 Java 应用开发框架,Spring 给出了解决方案——Spring AI[1]。Spring AI 旨在简化 Java AI 应用程序开发,让 Java 开发者像使用 Spring 开发普通应用一样开发 AI 应用。以 Spring AI 为底座,Spring AI Alibaba 项目[2]引入了阿里云通义系列大模型的全面适配,带来了丰富的工具集和深度的云服务集成,让开发者数分钟就能搭建一个 AI 应用。

在生成式 AI 应用中,可观测性也是一个非常重要的能力,它不仅可以应对应用本身的性能调优、错误追踪等常规问题,还能成为解决 AI 应用中成本控制、模型偏见、模型幻觉等问题的利器。Spring AI Alibaba 在 Spring AI 可观测性基础上进行了扩展,对通义系列大模型及阿里云工具集的可观测性进一步扩展,提供了更加细节的可观测能力。此外,阿里云应用实时监控服务(ARMS)原生集成了对 Spring AI 可观测性数据的支持,使用者无需修改业务代码,只需适当调整启动配置,就能获得全套的企业级可观测服务。

本文将基于 Spring AI Alibaba,借由通义千问提供的模型服务搭建一个简单的在线聊天 AI 应用,并借助 ARMS 完成对 AI 应用中调用过程的追踪和用量观测。

快速搭建 Spring AI 应用

本节演示如何基于 Spring AI Alibaba 开发一个在线聊天 Agent 应用,并支持大模型调用本地函数来查询某城市某天的天气,可以在此处查看示例源码[3]。

  1. 新建一个项目,在项目的 pom.xml 中引入 spring-ai-alibaba-starter 依赖:
<dependency>
  <groupId>com.alibaba.cloud.ai</groupId>
  <artifactId>spring-ai-alibaba-starter</artifactId>
  <version>1.0.0-M3.2</version>
</dependency>
  1. 修改 application.yml,添加 dashscope 的 api key,请将 ${AI_DASHSCOPE_API_KEY} 替换为您通义大模型的 API Key,获取方式参见[4]:
spring:
  application:
    name: chatmodel-example

  ai:
    dashscope:
      api-key: ${AI_DASHSCOPE_API_KEY}
  1. 编写聊天服务 Controller 类,/weather-service 基于客户的提示词查询天气:
@RestController
@RequestMapping("/ai/func")
public class FunctionCallingController {

  private final ChatClient chatClient;

  public FunctionCallingController(ChatClient.Builder chatClientBuilder) {
    this.chatClient = chatClientBuilder.build();
  }

  @GetMapping("/weather-service")
  public String weatherService(String subject) {
    return chatClient.prompt()
      .function("getWeather", "根据城市查询天气", new MockWeatherService())
      .user(subject)
      .call()
      .content();
  }
}
  1. 编写 function 供大模型调用:
public class MockWeatherService implements Function<MockWeatherService.Request, Response> {
  @Override
  public Response apply(Request request) {
    if (request.city().contains("杭州")) {
      return new Response(String.format("%s%s晴转多云, 气温32摄氏度。", request.date(), request.city()));
    }
    else if (request.city().contains("上海")) {
      return new Response(String.format("%s%s多云转阴, 气温31摄氏度。", request.date(), request.city()));
    }
    else {
      return new Response(String.format("暂时无法查询%s的天气状况。", request.city()));
    }
  }

  @JsonInclude(JsonInclude.Include.NON_NULL)
  @JsonClassDescription("根据日期和城市查询天气")
  public record Request(
      @JsonProperty(required = true, value = "city") @JsonPropertyDescription("城市, 比如杭州") String city,
      @JsonProperty(required = true, value = "date") @JsonPropertyDescription("日期, 比如2024-08-22") String date) {
  }
}
  1. 编写 Spring Boot 启动类:
@SpringBootApplication
public class FunctionCallingExampleApplication {
  public static void main(String[] args) {
    SpringApplication.run(FunctionCallingExampleApplication.class, args);
  }
}

部署应用

通过以上五步,我们的 AI Agent 应用已经可以正常部署,要集成可观测性并将数据上报到 ARMS,还需要做少量改动。

  1. 修改 application.yml 文件,开启可观测性相关数据的开关,实际生产中可以按需开启:
spring:
  ai:
    chat:
      client:
        observations:
          # 记录调用者输入的内容
          include-input: true
      observations:
          # 记录大模型输出
          include-completion: true
          # 记录大模型提示词
          include-prompt: true
  1. 修改 pom.xml 文件,引入可观测性相关依赖:
<dependency>
  <!-- spring 提供的可观测工具包,用于初始化 micrometer 组件 -->
  <groupId>org.springframework.boot</groupId>
  <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>

<dependency>
  <!-- micrometer-opentelemetry 桥接器,用于将 micrometer 链路追踪代理到 opentelemetry -->
  <groupId>io.micrometer</groupId>
  <artifactId>micrometer-tracing-bridge-otel</artifactId>
</dependency>
  1. 在 Spring Boot 启动类中调整 OpenTelemetrySdk 获取方式,改为直接从 GlobalOpenTelemetry 中获取(这一步是为了获取到 Java Agent 中的 sdk 实例,而 micrometer 默认行为是初始化一个新的 sdk 实例。)
@Bean
public OpenTelemetry openTelemetry() {
    return GlobalOpenTelemetry.get();
}
  1. 下载 Aliyun Java Agent 并在应用的启动脚本中添加以下三行,相关内容获取可以参考接入文档 [5],请将:${path-to-agent} 和 ${your-license-key} 分别替换为 Java Agent 的解压路径和从 ARMS 控制台获取到的 licenseKey:

如果您正在使用 K8s 部署您的应用,则不需要修改任何的启动命令,直接在您的集群安装 ack-onepilot,并为应用添加相关 label 即可,详情可参考文档 [6]。

-javaagent:/${path-to-agent}/aliyun-java-agent.jar
-Darms.licenseKey=${your-license-key}
-Darms.appName=spring-ai-alibaba-chat-demo
  1. 启动应用并验证效果。

验证调用效果

  1. 在浏览器地址栏输入以下链接访问:
http://localhost:8080/ai/func/weather-service?subject=2024年8月12日杭州天气怎么样?

返回如下响应:

2024年8月12日,杭州的天气预报为晴转多云,气温32摄氏度。请做好防晒措施,并留意实际天气变化。
  1. 登录 ARMS 控制台,找到 spring-ai-alibaba-chat-demo 应用查看对应调用链信息。

  1. 查看某一条特定的 trace,可以看到用量信息及其他关键信息,如大模型调用的 response id、模型名称、temperature 等:

  1. 单击右侧的 “Events”,可以查看到模型调用过程的输入输出信息:

展望

截止到目前,Spring AI Alibaba 已经全面兼容 Spring AI 最新版本可观测能力,并为通义系列多模态大模型可观测性提供了支持。未来将围绕 VectorStore、Retrieve、Tool 等场景集成更加丰富的可观测性,并深度集成 ARMS 产品,提供更多维度的 AI 应用观测视图和总览大盘。如果您也对 Spring AI Alibaba 项目感兴趣,欢迎参与社区贡献!

社区链接:https://github.com/alibaba/spring-ai-alibaba

参考文档:

[1] Spring AI

https://spring.io/projects/spring-ai

[2] Spring Cloud Alibaba

https://sca.aliyun.com

[3] 在线聊天应用示例

https://github.com/alibaba/spring-ai-alibaba/tree/main/spring-ai-alibaba-examples/function-calling-example

[4] 如何获取 API Key

https://help.aliyun.com/zh/model-studio/getting-started/first...

[5] 手动安装 Java 探针

https://help.aliyun.com/zh/arms/application-monitoring/user-g...

[6] 监控 ACK 集群下的 Java 应用

https://help.aliyun.com/zh/arms/application-monitoring/gettin...


阿里云云原生
1.1k 声望310 粉丝