头图

Kubernetes 中的应用参数配置案例详析

✏️ 作者简介:
宗玉芬,Zilliz 测试开发工程师,华中科技大学计算机技术工程硕士。目前专注于 Milvus 数据库的质量保障工作,包括但不限于接口测试、SDK 测试、Benchmark 测试等。一个喜欢定位问题、热爱探究混沌工程理论与故障演练实践的测试开发小朋友。

如何修改 Milvus Advanced Configuration

背景

在使用 Milvus 时,我们可能希望修改默认参数,以满足不同场景的需求。前不久,已有 Milvus 用户分享了如何在使用 docker-compose 部署时修改配置文件(点击阅读:技术分享|如何对 Milvus 2.0 进行参数配置),本文将简单介绍如何在使用 Kubernetes 部署 Milvus 时修改配置参数。

不同的参数配置可以选择不同的修改方案。Milvus 所有的配置文件都位于 /milvus/configs/ 路径下。当使用 Kubernetes 安装 Milvus 应用时我们会添加 Milvus Chart 仓库,添加后通过命令 helm show values milvus/milvus 查看 Chart 支持配置的参数项。如果这些参数项中包含我们想要修改的参数,则可以通过 --values--set 两种方式传递配置数据,具体使用细节请参考 Milvus Helm ChartHelm;如果不包含我们想修改的参数,则可以考虑下文介绍的小方法:

Milvus 在 Kubernetes 中的配置文件管理是通过 ConfigMap 资源对象实现的。如果我们需要修改 Milvus Chart 可配置选项以外的参数,则需要先更新对应 Chart Release 的 ConfigMap 对象,然后修改相应 Pod 的 Deployment 资源文件。接下来,以修改 /milvus/configs/advanced/root_coord.yaml 文件中的 rootcoord.dmlChannelNum 参数为例进行说明,按照先修改 ConfigMap 对象属性再修改 Deployment 对象属性两个步骤进行,将其值从 256 修改为 128

需要注意的是,该方法只针对已经部署的 Milvus 应用进行配置修改。如果需要在部署时或部署前修改 /milvus/configs/advanced/*.yaml 中的配置,我们需要对 Milvus Helm Chart 进行再开发。

修改 ConfigMap 清单文件

Kubernetes 中运行的 Release 对应着名为 milvus-chaos 的 ConfigMap 对象,其 data 属性只包含了 milvus.yaml 文件的配置。同理,我们需要将 rootcoord.dmlChannelNum 参数所在的 root_coord.yaml 配置到 data 属性中,同时将 rootcoord.dmlChannelNum 修改为 128 即可。

kind: ConfigMap
apiVersion: v1
metadata:
  name: milvus-chaos
  ...
data:
  milvus.yaml: >
    ......
  root_coord.yaml: |
    rootcoord:
      dmlChannelNum: 128
      maxPartitionNum: 4096
      minSegmentSizeToEnableIndex: 1024
      timeout: 3600 # time out, 5 seconds
      timeTickInterval: 200 # ms

修改 Deployment 清单文件

ConfigMap 对象中存储的数据可以被 configMap 类型的卷引用,然后向 Pod 注入配置数据,从而被 Pod 中运行的容器化应用使用。如果我们想让 Pod 访问新的配置文件,则需修改那些会加载 root_coord.yaml 配置的 Pod 模板,具体是在 Deployment 资源清单文件中的 spec.template.spec.containers.volumeMounts 下添加一个挂载声明。以 rootcoord pod 的 Deployment 资源清单为例,从 spec.template.spec.volumes 关键字可以看到 Pod 顶层声明了一个名为 milvus-config,类型是 configMapVolume,并且 Pod 中的 rootcoord 容器声明将卷 milvus-chaos 的 milvus.yaml 文件挂载到路径 /milvus/configs/milvus.yaml 下。同理,我们只需要将 root_coord.yaml 文件挂载到 /milvus/configs/advanced/root_coord.yaml 路径下,以便容器能访问即可。

spec:
  replicas: 1
  selector:
    ......
  template:
    metadata:
      ...
    spec:
      volumes:
        - name: milvus-config
          configMap:
            name: milvus-chaos
            defaultMode: 420
      containers:
        - name: rootcoord
          image: 'milvusdb/milvus-dev:master-20210906-86afde4'
          args:
            ...
          ports:
            ...
          resources: {}
          volumeMounts:
            - name: milvus-config
              readOnly: true
              mountPath: /milvus/configs/milvus.yaml
              subPath: milvus.yaml
            - name: milvus-config
              readOnly: true
              mountPath: /milvus/configs/advanced/root_coord.yaml
              subPath: root_coord.yaml
          terminationMessagePath: /dev/termination-log
          terminationMessagePolicy: File
          imagePullPolicy: IfNotPresent
      restartPolicy: Always
      terminationGracePeriodSeconds: 30
      dnsPolicy: ClusterFirst
      securityContext: {}
      schedulerName: default-scheduler

验证结果

完成上述两步修改后,Pod 重新挂载了 ConfigMap 卷,且 ConfigMap 属性的修改被检测到后,Pod 会滚动更新。当新的 Pod 重新进入 Running 状态后,我们可以进入 Pod 验证是否修改成功,具体命令如下所示。可以看到 /milvus/configs/advanced/root_coord.yaml 文件中的rootcoord.dmlChannelNum 的值已经更新为 128 了。

$ kctl exec -ti milvus-chaos-rootcoord-6f56794f5b-xp2zs -- sh

# cd configs/advanced
# pwd
/milvus/configs/advanced
# ls
channel.yaml  common.yaml  data_coord.yaml  data_node.yaml  etcd.yaml  proxy.yaml  query_node.yaml  root_coord.yaml

# cat root_coord.yaml
rootcoord:
  dmlChannelNum: 128
  maxPartitionNum: 4096
  minSegmentSizeToEnableIndex: 1024
  timeout: 3600 # time out, 5 seconds
  timeTickInterval: 200 # ms
# exit

至此,该修改 Milvus 配置的方法已经介绍完毕。在 Milvus 之后的版本中,我们会将用户所关心的配置参数统一放置到一个文件中,且支持通过 Helm Chart 配置更新。在新版本诞生前,希望这篇文档介绍的临时修改方案能对大家有所帮助!


Milvus
我们的愿景是 reinvent data science ,重新定义数据科学。 成立于 2016 年,ZILLIZ 致力于将数据科学与...

Vector database for production ready AI

96 声望
803 粉丝
0 条评论
推荐阅读
MoBYv2AL :结合 BOYL 和 MoCo 的主动学习算法
主动学习(AL),即查询学习,旨在从大量未标记的数据中抽取信息最丰富、最多样化的有效示例来查询它们的标签。然而当模型学习到的特征较为局限时,主动学习的整体选择也会受到影响,并累积偏差导致性能降低。为...

Zilliz

一次偶然机会发现的MySQL“负优化”
今天要讲的这件事和上述的两个sql有关,是数年前遇到的一个关于MySQL查询性能的问题。主要是最近刷到了一些关于MySQL查询性能的文章,大部分文章中讲到的都只是一些常见的索引失效场合,于是我回想起了当初被那个...

骑牛上青山7阅读 1.6k评论 2

张晋涛:我的 2022 总结
大家好,我是张晋涛。2022 年已经结束,我每年都会惯例的做个小回顾,今年因为阳了在恢复身体,一直拖到了今天才写。生活在 2022 年初做回顾的时候,觉得 2021 是魔幻的一年,但现在看来 2022 年其实更加魔幻。一...

张晋涛6阅读 708评论 2

封面图
Kubernetes v1.26 新特性一览
我每期的 「k8s生态周报」都有一个叫上游进展的部分,所以很多值得关注的内容在之前的文章中已经发过了。这篇中我会再额外介绍一些之前未涵盖的,和之前介绍过的值得关注的内容。

张晋涛2阅读 636评论 1

封面图
深入剖析容器网络和 iptables
Docker 能为我们提供很强大和灵活的网络能力,很大程度上要归功于与 iptables 的结合。在使用时,你可能没有太关注到 iptables 的作用,这是因为 Docker 已经帮我们自动完成了相关的配置。

张晋涛3阅读 1.3k

封面图
Mysql索引覆盖
通常情况下,我们创建索引的时候只关注where条件,不过这只是索引优化的一个方向。优秀的索引设计应该纵观整个查询,而不仅仅是where条件部分,还应该关注查询所包含的列。索引确实是一种高效的查找数据方式,但...

京东云开发者2阅读 703

封面图
MySQL 数据库索引技术原理初探
一本书 500 页的书,如果没有目录,直接去找某个知识点,可能需要找一会儿,但是借助前面的目录,就可以快速找到对应知识点在书的哪一页。这里的目录就是索引。

mylxsw1阅读 1.2k

Vector database for production ready AI

96 声望
803 粉丝
宣传栏