Terraform 系列-什么是 IaC?

2023-04-11
阅读 2 分钟
1.2k
系列文章👉 Terraform 系列文章前言聊到 Terraform, 必然绕不开 IaC 这个概念?那么,什么是 IaC? 🤔基本概念基础架构即代码 (Infrastructure as Code, IaC) 是指通过代码而不是手动流程/控制台点击来管理和配置基础架构。这里有 2 个关键词:InfrastructureCodeInfrastructure 是被管理对象,在这里,主要是指公有云(还...

Wikijs简介-强大&可扩展的开源维基软件

2023-04-06
阅读 4 分钟
2.1k
Wikijs - 最强大 最可扩展的开源维基软件使用 wiki.js 美丽直观的界面,让文档成为写作的乐趣!优点🔧 随时随地安装几乎适用于任何平台,并与PostgreSQL、MySQL、MariaDB、MS SQL Server 或 SQLite 兼容!⚙️ 管理强大使用广泛而直观的管理区域管理维基的所有方面。🚀 性能Wiki.js运行在快速的Node.js引擎上,它是基于性能...

为什么我推荐你使用 systemd timer 替代 cronjob?

2023-04-05
阅读 11 分钟
1.1k
前几天在使用 Terraform + cloud-init 批量初始化我的实验室 Linux 机器。正好发现有一些定时场景需要使用到 cronjob, 进一步了解到 systemd timer 完全可以替换 cronjob, 并且 systemd timer 有一些非常有趣的功能。

Wiki.js配置LDAP认证

2023-04-04
阅读 1 分钟
1.1k
安装好wikijs 之后, 可以进行进一步的详细配置. 这里介绍 LDAP 认证的配置.在 管理 -> 身份验证 -> 添加策略 -> 选择 LDAP/AD , 如下:接下来进行详细配置:显示名称: 按需修改是否启用: 是LDAP URL: 格式为: ldap://serverhost:389 or ldaps://serverhost:636Admin Bind DN: CN=xxxx,OU=xxxx部,OU=xxxx,DC=xxxxx...

Terraform 系列-Terraform 项目的典型文件布局

2023-04-01
阅读 3 分钟
1.4k
系列文章👉 Terraform 系列文章典型文件布局 {代码...} 🔥 提示:- [ ] 表示该项为可选内容示例如 examples/ 表示该项为文件夹详细说明顶层文件夹用于隔离环境modules:Terraform (可复用)模块文件夹stage:预发布 Envprod:生产 envmgmt:管理/DevOps 环境(如:堡垒机、Jenkins 等)global:用于运行各种环境下都要共...

Rancher 系列文章-Rancher 对接 Active Directory 实战

2023-03-29
阅读 3 分钟
752
概述只要是个公司,基本上都有邮箱和 AD(Active Directory). 在 AD 里,已经有了:用户账号密码邮箱用户组组织架构所以对于一些仅限于本公司一定范围内人员使用的管理或后台或运营运维类系统,其实是非常适合对接 AD 来进行认证、分组,以及根据分组来进行权限分配的。对于 Rancher,假设使用者只会有这么几类:管理员:...

Rancher 系列文章-K3S 集群升级

2023-03-27
阅读 7 分钟
573
概述书接上回:《Rancher 系列文章-Rancher 升级》, 我们提到:将 Rancher 用 Helm 从 v2.6.3 升级到 v2.6.4).接下来开始进行 K3S 集群的升级:将 K3S 集群从 v1.21.7+k3s1 升级到 v1.22.5+k3s2相关信息本次升级的 K3S 集群的基本信息为:天翼云上用 4 台机器安装的一个 1 master(及 etcd) 3 node 的 K3S 集群其实... ...

K3s Traefik 报错-Failed to create middleware keys

2023-03-26
阅读 3 分钟
794
概述书接上回:《Rancher 系列文章-K3S 集群升级》, 我们提到:通过一键脚本升级 K3S 集群有报错。接下来开始进行 Traefik 报错的分析和修复, 问题是:所有 Traefik 的 IngressRoute 访问报错 404问题描述报错如下: {代码...} 即无法跨 NameSpace 调用 Traefik MiddleWare.解决过程首先根据官方文档说明:Kubernetes Ing...

Rancher 系列文章-在腾讯云的 K3S 上安装高可用 Rancher 集群

2023-03-25
阅读 6 分钟
794
开篇📜 引言:三人行必有我师焉知识共享,天下为公《K3s 系列文章》《Rancher 系列文章》方案在腾讯云的 K3S 上安装 Rancher方案目标高可用3 台 master 的 k3s 集群高可用模式的 rancher数据备份rancher 数据备份到 腾讯云对象存储 cos安全加密不能存在 http,全部是 https面向客户公网可访问;域名可访问;正式证书尽量...

Prometheus Operator 与 kube-prometheus 之一-简介

2023-03-21
阅读 4 分钟
1.3k
Prometheus Operator: 在 Kubernetes 上管理 Prometheus 集群。该项目的目的是简化和自动化基于 Prometheus 的 Kubernetes 集群监控堆栈的配置。

NGINX配置SSL支持

2023-03-17
阅读 4 分钟
734
博客本身配置更改包括: (这篇文章就先不细说了)网页内链接全部从http改为https(其实配置下SITEURL, 工具会自动生成好) 并重新发布. (特别要注意, 如果有的站内css, js等没有用https就尴尬了, 会被各类浏览器拦截掉, 并提示"不安全的脚本")网站有用到的第三方工具(如拨测), 把网站的地址改为 https开头的.

Minio架构简介

2023-03-16
阅读 3 分钟
1.3k
Minio是一个go编写基于Apache License v2.0开源协议的对象存储系统,是为海量数据存储、人工智能、大数据分析而设计,它完全兼容Amazon S3接口,十分符合存储大容量的非结构化数据从几十kb到最大5T不等。是一个小而美的开源分布式存储软件。

Kubecost | Kubernetes 开支监控和管理

2023-03-14
阅读 5 分钟
828
👉️URL: [链接]📝Description:Kubeccost 为使用 Kubernetes 的团队提供实时成本可视化和洞察,帮助您持续降低云成本。

K8S 性能优化 - OS sysctl 调优

2023-03-12
阅读 5 分钟
649
前言K8S 性能优化系列文章,本文为第一篇:OS sysctl 性能优化参数最佳实践。参数一览sysctl 调优参数一览 {代码...} 如果是 AWS,额外增加如下: {代码...} 如果启用了 IPv6,额外增加如下: {代码...} 参数解释分类内核参数说明参考链接Kubernetesvm.max_map_count = 262144限制一个进程可以拥有的VMA(虚拟内存区域)的...

K8S 性能优化-K8S Node 参数调优

2023-03-11
阅读 1 分钟
859
前言K8S 性能优化系列文章,本文为第四篇:Kubernetes Node 性能优化参数最佳实践。系列文章:《K8S 性能优化 - OS sysctl 调优》《K8S 性能优化 - K8S APIServer 调优》《K8S 性能优化 - 大型集群 CIDR 配置》两个参数控制可以为 K8S Node 调度的最大 pod 数量的两个参数: podsPerCore 和 maxPods。当两个参数都被设置...

K8S 性能优化 - K8S APIServer 调优

2023-03-10
阅读 1 分钟
1.1k
前言K8S 性能优化系列文章,本文为第二篇:Kubernetes API Server 性能优化参数最佳实践。系列文章:《K8S 性能优化 - OS sysctl 调优》参数一览kube-apiserver 推荐优化的参数如下:--default-watch-cache-size:默认值 100;用于 List-Watch 的缓存池;建议 1000 或更多;--delete-collection-workers:默认值 1;用于...

K8S 1.20 弃用 Docker 评估之 Docker CLI 的替代产品

2023-02-28
阅读 7 分钟
1.2k
2020 年 12 月初,Kubernetes 在其最新的 Changelog 中宣布,自 Kubernetes 1.20 之后将弃用 Docker 作为容器运行时。

大规模 IoT 边缘容器集群管理的几种架构-5-总结

2023-02-24
阅读 1 分钟
821
前文回顾大规模 IoT 边缘容器集群管理的几种架构-0-边缘容器及架构简介大规模 IoT 边缘容器集群管理的几种架构-1-Rancher+K3s大规模 IoT 边缘容器集群管理的几种架构-2-HashiCorp 解决方案 Nomad大规模 IoT 边缘容器集群管理的几种架构-3-Portainer大规模 IoT 边缘容器集群管理的几种架构-4-Kubeedge📚️Reference:IoT 边...

大规模 IoT 边缘容器集群管理的几种架构-3-Portainer

2023-02-22
阅读 2 分钟
1k
前文回顾大规模 IoT 边缘容器集群管理的几种架构-0-边缘容器及架构简介大规模 IoT 边缘容器集群管理的几种架构-1-Rancher+K3s大规模 IoT 边缘容器集群管理的几种架构-2-HashiCorp 解决方案 Nomad大规模 IoT 边缘容器集群管理的几种架构-3-Portainer📚️Reference:IoT 边缘计算系列文章Portainer + Docker简介Portainer: 强...

HTTPS基础原理和配置-3

2023-02-15
阅读 7 分钟
836
书接上文:HTTPS 基础原理和配置 - 2,接下来介绍:配置 NGINX后端 HTTPS检查配置配置 HSTSOCSP Stapling重要部分来了。如何使用这些选项并配置NGINX?一、NGINX 的 HTTPS 配置这里有一些基本的原语(或叫做指令),你可以使用:ssl_certificate、ssl_certificate_key、ssl_protocols 和ssl_ciphers。1.1 NGINX 配置参数(...

Grafana 系列文章(九):开源云原生日志解决方案 Loki 简介

2023-02-06
阅读 4 分钟
774
Grafana 是用于时序数据的事实上的仪表盘解决方案。它支持近百个数据源。Grafana Labs 想从一个仪表盘解决方案转变成一个可观察性 (observability) 平台,成为你需要对系统进行调试时的首选之地。

Grafana 系列文章(二):使用 Grafana Agent 和 Grafana Tempo 进行 Tracing

2023-01-29
阅读 5 分钟
1.2k
👉️URL: [链接]✍Author: Robert Fratto • 17 Nov 2020📝Description:Here's your starter guide to configuring the Grafana Agent to collect traces and ship them to Tempo, our new distributed tracing system.编者注:代码片段已于 2021-06-23 更新。

Docker 基础 - 3

2023-01-26
阅读 13 分钟
1.4k
为什么需要 daemon off; ?想象这样的场景:如果没有 daemon off, nginx 后台运行, 这时 nginx 并不是 pid 为 1 的程序, 而是执行的其他(如 bash), 这个 bash 执行了 nginx 指令后就结束了, 容器也会随之退出.或直接修改/etc/nginx/nginx.conf 文件:echo -e "\ndaemon off;" >> /etc/nginx/nginx.conf

Crossplane - 比 Terraform 更先进的云基础架构管理平台?

2023-01-23
阅读 12 分钟
986
在 11 月的 KCD 上海现场,听了一场阿里云的工程师关于他们自己的多云基础架构管理工具的介绍,前边的引言部分有介绍到 Terraform,还有另一款竞品就是 Crossplane,而且表示 Crossplane 在通用性 API 等方面做得比 Terraform 更好,阿里云的也参考了其架构和实现。就让我很感兴趣,同时在 2019 年使用 OpenShift 4 的时...

在 K8S Volume 中使用 subPath

2023-01-11
阅读 3 分钟
1k
有时,在单个 Pod 中共享卷以供多方使用是很有用的。 volumeMounts.subPath 属性可用于指定所引用的卷内的子路径,而不是其根路径。

如何使用 Blackbox Exporter 监控 URL?

2022-12-31
阅读 9 分钟
1.9k
监控域名和 URL 是可观察性的一个重要方面,主要用于诊断可用性问题。接下来会详细介绍如何使用 Blackbox Exporter 和 Prometheus 在 Kubernetes 中实现 URL 监控。

将git仓库从submodule转换为subtree

2022-12-28
阅读 4 分钟
1.6k
📚️Reference:我对它进行了修改和改进。现在,新的subtree将指向与旧 submodule 相同的提交。以前,脚本只是从目标存储库下载最新的提交,这可能会导致兼容性问题。

高可用系列文章之二 - 传统分层架构技术方案

2022-12-18
阅读 7 分钟
1.2k
保障系统的高可用, 方法论上,高可用保证的原则是「集群化」(或 「冗余」), 只有一个单点,该单点宕机所有服务都会受影响而不可用;如果有冗余或备份,其中一个点宕机还有其他冗余或备份节点能够提供服务。

「笔记」某移动SRE运维体系交流

2022-12-14
阅读 1 分钟
783
📝Notes:可能更适合国内国企实际情况痛点传统竖井式IT架构(封闭、隔离、非标、难运维)X86 服务器硬件稳定性不足开源软件可靠性不足,且不可控出了故障,被动救火救不完转型由此催生了转型升级的需求:运维智能(SRE)的转型SRE运维模式核心职责保证:业务连续性应用连续性平台连续性职责分工综合运维岗7*24 在线或远程...

Velero系列文章(五):基于 Velero 的 Kubernetes 集群备份容灾生产最佳实践

2022-12-13
阅读 1 分钟
872
考量维度基于CSI 快照基于Restic 文件复制应用性能影响低,CSI 接口调用存储系统快照取决于数据量,占用额外资源数据可用性依赖于存储系统对象存储和生产环境隔离,独立可用性,支持跨站点可用性数据一致性支持Crash Consistency,配合 hook 机制实现一致性无保障,基于hook 最佳实践高频本地快照+低频 restic 备份到s3...