k8s集群高负载pod优化策略

4 月 9 日
阅读 4 分钟
185
随着业务的激增,集群中某个服务的日调用次数达到100亿的量级,这些高负载pod占用了node节点上绝大部分的cpu,导致节点上其他的pod访问延迟也开始增大,被驱逐的pod越来越多。

利用云厂商提供的API获取云服务信息

4 月 2 日
阅读 5 分钟
290
华为云 Python SDK传送门:[链接]目标:获取华为云ecs服务器信息,输出以下格式: {代码...} 华为云sdk代码 {代码...} 阿里云sdk代码 {代码...}

多个prometheus之间的交互

3 月 28 日
阅读 10 分钟
525
A:在Linux主机上自建的Prometheus,启动参数为:./prometheus --web.enable-remote-write-receiver,这是一个启动 Prometheus 时使用的命令行选项,用于启用 Prometheus 服务器接收来自其他 Prometheus 实例的推送数据(remote write)的功能,将这个Prometheus作为中央仓库B:部署在LKE集群上的Prometheus,需要将它采...

Alertmanager with Slack

1 月 17 日
阅读 2 分钟
416
{代码...} {代码...} {代码...} 更多告警规则[链接]发送的告警内容样式模板 {代码...} {代码...}

AWS EKS 集群自动扩容 Cluster Autoscaler

1 月 17 日
阅读 5 分钟
373
aws iam create-policy --policy-name AmazonEKSClusterAutoscalerPolicy --policy-document file://cluster-autoscaler-policy.json

Kubernetes(EKS集群)部署Nacos

1 月 17 日
阅读 4 分钟
706
部署文件目录结构官方提供的为nacos-k8s,使用的是nfs存储和mysql pod,这里我修改为使用aws RDS mysql数据库设置 {代码...} 创建k8s资源对象依次创建 nacos-cm、nacos-headless、nacos-statefulset、nacos-ingress {代码...} 设置登陆密码升级到2.1.0版本 {代码...}

Loki日志服务实践整理

1 月 17 日
阅读 11 分钟
669
Add the configuration of your storage, pointing to the designated S3 bucket.StorageConfig with AWS S3 :

Prometheus+grafana监控告警实现(二)

1 月 17 日
阅读 5 分钟
5.4k
使用helm安装grafana[链接] {代码...} 添加ingress对外访问 {代码...} 常用模板[链接] {代码...} 添加jvm 监控 (可选)a、制作包含jmx_exporter的基础镜像 {代码...} b、创建configmap {代码...} c、修改git仓库charts目录下文件配置d、修改prometheus配置 {代码...} e、导入grafana模板 【id: 8563】

Prometheus+grafana监控告警实现(一)

1 月 17 日
阅读 5 分钟
348
方法一、此文档描述的安装方法不适用新版本的k8s适用的k8s版本低于1.25,当前使用的版本为1.26[链接] {代码...} 方法二、所在区域不支持从模板快速安装Prometheus for Amazon EKS Quick Start Reference Deployment[链接]三、使用 Prometheus 控制平面指标[链接] {代码...} 四、设置Grafana[链接]helm install {代码...} ...

玩转AWS(七):EBS CSI driver for EKS

2023-08-02
阅读 5 分钟
744
本文记录使用AWS CLI创建Amazon EBS CSI插件的配置过程、出现的问题及解决方案。 {代码...} 问题及修复 {代码...} 再次查看已恢复正常 {代码...} 参考文档[链接]

GitOps 流程:AWS DevOps实践(五)

2023-07-14
阅读 4 分钟
538
一、GitHub settings开启workflow权限Actions secrets and variablesDeploy keys (argocd添加repo)

使用ArgoCD:AWS DevOps实践(四)

2023-07-13
阅读 1 分钟
444
ArgoCD介绍及配置使用ArgoCD是Kubernetes的声明式GitOps持续交付工具, 可以让你更轻松地在 Kubernetes上管理和运行应用程序。与传统CICD工作流的比较架构图流程安装部署 {代码...} 使用上一步生成的密码登陆argocd参考文档[链接]

配置AWS Application Load Balancer:AWS DevOps实践(三)

2023-07-13
阅读 4 分钟
443
为EKS集群配置ALB在上一篇文章中我整理了创建EKS集群的思维导图流程,这一篇介绍如何为EKS集群创建ALB。架构图实战思维导图附录及测试 {代码...} 部署demo应用cat nginx-demo.yaml {代码...} 部署demo-ingrss {代码...} {代码...} 参考文档[链接][链接]

EKS集群配置:AWS DevOps实践(二)

2023-07-13
阅读 1 分钟
423
创建EKS集群详细步骤过于繁琐,这里用思维导图简化一下,具体操作请参照AWS官方文档创建EKS ClusterRole和 NodeRole在AWS EKS界面创建集群小结参考文档[链接][链接]

从0到1:AWS DevOps实践(一)

2023-07-13
阅读 1 分钟
609
这里展示了如何在AWS上从0到1的一个DevOps实践案例,使用的AWS产品包括: EC2,EKS,S3等相关服务,CICD流水线是github actions + argoCD,监控日志系统使用的是开源方案:Prometheus + Grafana + Loki, 其他的方案细节后续补充。

玩转AWS(六):利用Lambda函数获取S3 url写入mysql

2023-06-09
阅读 2 分钟
1.3k
实战步骤样例代码 gets3url.py {代码...}

玩转AWS(四):S3 replication

2023-06-06
阅读 1 分钟
430
介绍实战参考链接[链接]

玩转AWS(三):S3简介

2023-06-06
阅读 1 分钟
523
简介S3 lifecyclemake public参考链接[链接][链接]

从阿里云OSS传输数据到AWS S3

2023-06-06
阅读 1 分钟
929
从阿里云OSS传输文件到AWS S3简单流程参考链接[链接][链接]

Helm简单使用

2023-06-02
阅读 1 分钟
439

玩转AWS(二):EKS集群配置ALB

2023-06-02
阅读 1 分钟
406
参考链接[链接]

玩转AWS(一):EKS实战

2023-06-02
阅读 1 分钟
590
参考链接[链接]

k8s相关思维导图整理-04

2023-02-13
阅读 1 分钟
429

k8s相关思维导图整理-03

2023-02-13
阅读 1 分钟
812

k8s相关思维导图整理-02

2023-02-10
阅读 1 分钟
636

k8s相关思维导图整理-01

2023-02-10
阅读 1 分钟
448

从零开始攻略k8s(四):集群架构

2021-05-18
阅读 2 分钟
2.5k
首先来看一个最简单的系统架构图:由一个主节点和若干工作节点组成,开发者将一个应用列表提交到主节点,k8s会将它们部署到集群的工作节点,组件被部署在哪个节点对开发者和系统管理员来说都不用关心。在这个层级上,k8s可以看成是集群的操作系统,帮助开发者聚焦核心应用功能,不必去考虑额外的服务如:服务发现、扩容...

从零开始攻略k8s(三):一分钟了解容器

2021-05-13
阅读 1 分钟
1.2k
容器的核心概念是Namespace和Cgroup,在最早的容器概念中包含了对文件目录视图的抽象隔离,所有这一切都需要有工具来驱动,来提供一个可供用户操作的接口,以此来创建一个容器。所以容器的最小组成可由此公式表达:容器=cgroup+namespace+rootfs+容器引擎(用户态工具)​