1

源码版本

kubernetes version: v1.3.0

简介

前一节介绍了Garbage Collection,涉及到的策略基本与磁盘资源有关。对于k8s集群如何高效的利用各种资源,也非常值得我们涉猎学习。管理好资源才能更好的创建服务,所以这节继续学习kubelet的diskSpaceManager。
diskSpaceManager顾名思义就是管理磁盘空间的,实际它的实现较为简单,就是给kubelet所在的节点预留磁盘空间的,当该节点磁盘空间低于该值时,将拒绝Pod的创建。

策略初始化

跟GC介绍的套路一样,先从策略入手。
相关的结构如下:

type DiskSpacePolicy struct {
    // free disk space threshold for filesystem holding docker images.
    DockerFreeDiskMB int
    // free disk space threshold for root filesystem. Host volumes are created on root fs.
    RootFreeDiskMB int
}

该结构的出厂设置在cmd/kubelet/app/server.go中的UnsecuredKubeletConfig()接口进行。

func UnsecuredKubeletConfig(s *options.KubeletServer) (*KubeletConfig, error) {
...
    diskSpacePolicy := kubelet.DiskSpacePolicy{
        DockerFreeDiskMB: int(s.LowDiskSpaceThresholdMB),
        RootFreeDiskMB:   int(s.LowDiskSpaceThresholdMB),
    }
...
}

赋值的KubeletServer的LowDiskSpaceThresholdMB参数的初始化在cmd/kubelet/app/options/options.go中的NewKubeletServer()接口中进行:

func NewKubeletServer() *KubeletServer {
    return &KubeletServer{
        ...
        LowDiskSpaceThresholdMB:      256,
        ...
    }
}

diskSpaceManager保留磁盘空间的默认值是256MB,当然这个值我们也可以手动修改,这些kubelet的手动配置都是在cmd/kubelet/app/options/options.go中的AddFlags()接口:

func (s *KubeletServer) AddFlags(fs *pflag.FlagSet) {
...
    fs.Int32Var(&s.LowDiskSpaceThresholdMB, "low-diskspace-threshold-mb", s.LowDiskSpaceThresholdMB, "The absolute free disk space, in MB, to maintain. When disk space falls below this threshold, new pods would be rejected. Default: 256")
...

所以手动的话,需要修改kubelet命令flags中的low-diskspace-threshold-mb。

diskSpaceManager初始化

先介绍diskSpaceManager:

type diskSpaceManager interface {
    // Checks the available disk space
    IsRootDiskSpaceAvailable() (bool, error)
    IsRuntimeDiskSpaceAvailable() (bool, error)
}

跟前一章的套路一样,该diskSpaceManager是个interface。
具体的初始化需要查看pkg/kubelet/kubelet.go中的NewMainKubelet()接口。
调用流程: main -- app.Run -- UnsecuredKubeletConfig --> RunKubelet -- CreateAndInitKubelet -- NewMainKubelet
NewMainKubelet接口如下:

func NewMainKubelet(
    hostname string,
    nodeName string,
...
) (*Kubelet, error) {
...
    diskSpaceManager, err := newDiskSpaceManager(cadvisorInterface, diskSpacePolicy)
    if err != nil {
        return nil, fmt.Errorf("failed to initialize disk manager: %v", err)
    }
...
}

继续查看newDiskSpaceManager()接口,该接口传入了cadvisorInterface和diskSpacePolicy参数,比较好理解这些参数,因为磁盘管理需要使用cAdvisor来获取磁盘信息,而diskSpacePolicy就是上面介绍策略初始化的结构。
该接口在pkg/kubelet/disk_manager.go中,继续查看源码:

func newDiskSpaceManager(cadvisorInterface cadvisor.Interface, policy DiskSpacePolicy) (diskSpaceManager, error) {
    // 检查策略参数是否有效
    // 实际就是判断下是否 < 0
    err := validatePolicy(policy)
    if err != nil {
        return nil, err
    }

    dm := &realDiskSpaceManager{
        cadvisor:   cadvisorInterface,
        policy:     policy,
        cachedInfo: map[string]fsInfo{},
    }

    return dm, nil
}

该接口的返回值是diskSpaceManager,而实际返回是realDiskSpaceManager结构体。
所以所有diskSpaceManager的接口实现需要根据realDiskSpaceManager进行查看。
realDiskSpaceManager结构如下:

type realDiskSpaceManager struct {
    // 用于获取磁盘相关信息
    cadvisor   cadvisor.Interface
    // 用于缓存文件系统信息
    cachedInfo map[string]fsInfo // cache of filesystem info.
    // 操作锁
    lock       sync.Mutex        // protecting cachedInfo.
    // 磁盘管理策略
    policy     DiskSpacePolicy   // thresholds. Set at creation time.
}

查看下realDiskSpaceManager结构实现的diskSpaceManager接口:

// 查看Runtime占用的磁盘空间是否够用
func (dm *realDiskSpaceManager) IsRuntimeDiskSpaceAvailable() (bool, error) {
    return dm.isSpaceAvailable("runtime", dm.policy.DockerFreeDiskMB, dm.cadvisor.ImagesFsInfo)
}
// 查看根目录的磁盘空间是否够用
func (dm *realDiskSpaceManager) IsRootDiskSpaceAvailable() (bool, error) {
    return dm.isSpaceAvailable("root", dm.policy.RootFreeDiskMB, dm.cadvisor.RootFsInfo)
}

上面两个方法最终都调用了dm.isSpaceAvailable(),该接口使用了3个参数:

  • 文件系统类型

  • 磁盘保留空间大小,用于判断是否有效

  • cAdvisor的接口,用于获取RootFS和ImagesFs使用的磁盘情况

而该接口返回的是一个Bool值,true or false。
接口如下:

func (dm *realDiskSpaceManager) isSpaceAvailable(fsType string, threshold int, f func() (cadvisorapi.FsInfo, error)) (bool, error) {
    fsInfo, err := dm.getFsInfo(fsType, f)
    if err != nil {
        return true, fmt.Errorf("failed to get fs info for %q: %v", fsType, err)
    }
    // 有效值判断
    if fsInfo.Capacity == 0 {
        return true, fmt.Errorf("could not determine capacity for %q fs. Info: %+v", fsType, fsInfo)
    }
    if fsInfo.Available < 0 {
        return true, fmt.Errorf("wrong available space for %q: %+v", fsType, fsInfo)
    }
    // 判断该文件系统可用的磁盘空间是否小于最小预留空间
    if fsInfo.Available < int64(threshold)*mb {
        glog.Infof("Running out of space on disk for %q: available %d MB, threshold %d MB", fsType, fsInfo.Available/mb, threshold)
        return false, nil
    }
    return true, nil
}

继续看dm.getFsInfo()接口:

func (dm *realDiskSpaceManager) getFsInfo(fsType string, f func() (cadvisorapi.FsInfo, error)) (fsInfo, error) {
    dm.lock.Lock()
    defer dm.lock.Unlock()
    // 先查看缓存中的文件系统信息
    // 需要比较该信息的时间有效性,为2s内
    fsi := fsInfo{}
    if info, ok := dm.cachedInfo[fsType]; ok {
        timeLimit := time.Now().Add(-2 * time.Second)
        if info.Timestamp.After(timeLimit) {
            fsi = info
        }
    }
    // 2s之外的话,需要调用cAdvisor接口重新获取磁盘信息
    if fsi.Timestamp.IsZero() {
        // 该f()接口作为参数传入,不同的文件系统对应不同的接口
        // runtime: dm.cadvisor.ImagesFsInfo
        // rootfs: dm.cadvisor.RootFsInfo
        fs, err := f()
        if err != nil {
            return fsInfo{}, err
        }
        fsi.Timestamp = time.Now()
        fsi.Usage = int64(fs.Usage)
        fsi.Capacity = int64(fs.Capacity)
        fsi.Available = int64(fs.Available)
        // 更新cache
        dm.cachedInfo[fsType] = fsi
    }
    return fsi, nil
}

diskSpaceManager实现

上面的初始化可以看到diskSpaceManager的两个关键性接口IsRuntimeDiskSpaceAvailable()和IsRootDiskSpaceAvailable(),说简单点就是用于判断对应的磁盘空间是否还够用。
该功能具体作用的地方,一下子找不到的话,我们可以通过搜索上面两个接口来查看调用者。
其实就是pkg/kubelet/kubelet.go中的isOutOfDisk()接口:

// handleOutOfDisk detects if pods can't fit due to lack of disk space.
func (kl *Kubelet) isOutOfDisk() bool {
    // Check disk space once globally and reject or accept all new pods.
    withinBounds, err := kl.diskSpaceManager.IsRuntimeDiskSpaceAvailable()
    // Assume enough space in case of errors.
    if err != nil {
        glog.Errorf("Failed to check if disk space is available for the runtime: %v", err)
    } else if !withinBounds {
        return true
    }

    withinBounds, err = kl.diskSpaceManager.IsRootDiskSpaceAvailable()
    // Assume enough space in case of errors.
    if err != nil {
        glog.Errorf("Failed to check if disk space is available on the root partition: %v", err)
    } else if !withinBounds {
        return true
    }
    return false
}

该接口很简单,就是分别调用diskSpaceManager实现的两个接口,然后判断磁盘空间是否够用。
到这里我们可以猜想一下,最开始介绍该功能的时候已经说了是用于预留磁盘空间,以此为条件来判断Pods是否能成功创建。所以可以想到这个isOutOfDisk()肯定是作用于Pods创建的流程中,在创建之前判断是否有条件可以创建。
具体的Pod管理流程内容较多,后面新启一篇文章进行单独介绍。


Robinly
71 声望46 粉丝

专注docker、kubernetes技术开发