Linux 日志处理

1:find

1. `find` 基本语法

find [path] [expression]

[path]：指定从哪个目录开始搜索（默认为当前目录）。
[expression]：定义搜索条件和操作。它可以包含测试条件（如文件名模式）、动作（如删除文件）以及操作符（如 AND 和 OR）

示例：

查找当前目录及其子目录下的所有 .txt 文件：

find . -name "*.txt"

2. 常见使用场景及示例

（1）按名称查找文件

查找特定名称或模式的文件是最常见的需求之一。

查找名为 example.txt 的文件：

find /path/to/search -name "example.txt"

忽略大小写的查找：

find /path/to/search -iname "example.txt" # -iname 忽略大小写

（2）按类型查找 -type

可以基于文件类型进行查找，如普通文件、目录、符号链接等。

查找所有目录：
```
find /path/to/search -type d
```
查找所有普通文件：
```
find /path/to/search -type f
```
查找所有符号链接：
```
find /path/to/search -type l
```

（3）按大小查找 -size

根据文件大小过滤结果。

查找大于 100MB 的文件：
```
find /path/to/search -size +100M
```
查找小于 50KB 的文件：
```
find /path/to/search -size -50k
```
查找正好 1GB 的文件：
```
find /path/to/search -size 1G
```

（4）按修改时间查找

根据文件的最后修改时间查找文件。

查找过去 7 天内修改过的文件：
```
find /path/to/search -mtime -7
```
查找恰好 30 天前修改的文件：
```
find /path/to/search -mtime 30
```
查找超过 60 天未修改的文件：
```
find /path/to/search -mtime +60
```

（5）组合条件

使用逻辑运算符 -a (AND) 和 -o (OR) 组合多个条件。

查找以 .log 结尾且在过去 7 天内修改过的文件：
```
find /path/to/search -name "*.log" -a -mtime -7
```

查找以 .bak 或 .tmp 结尾的文件：

find /path/to/search $ -name "*.bak" -o -name "*.tmp" $

（6）执行命令

找到文件后执行特定命令，如删除、移动或压缩文件。

删除找到的所有 .bak 文件：

find /path/to/search -name "*.bak" -exec rm {} \;

对每个找到的文件运行 ls -l 命令：

find /path/to/search -name "*.log" -exec ls -l {} \;

使用 xargs 批量处理（更高效）：

find /path/to/search -name "*.log" | xargs ls -l

（7）查找空文件或目录

查找并列出所有空文件或目录。

查找所有空文件：
```
find /path/to/search -type f -empty
```
查找所有空目录：
```
find /path/to/search -type d -empty
```

（8）避免错误信息

当没有权限访问某些目录时，find 可能会输出错误信息。可以通过重定向错误输出到 /dev/null 来避免这些信息。

find /path/to/search -name "*.txt" 2>/dev/null

3. 总结

find 命令提供了丰富的选项和灵活性，使其成为 Linux 系统管理中不可或缺的工具。无论是日常维护还是复杂的数据检索任务，掌握 find 的用法都可以极大地提高工作效率。通过结合不同的选项和条件，你可以实现从简单的文件查找至复杂的批量操作。理解如何有效地使用 find，可以帮助你更好地管理和利用文件系统中的资源。

2:grep

grep 是 Linux 系统中一个非常强大且常用的命令行工具，用于在文件中搜索符合特定模式的文本行。它的名字来源于“Global Regular Expression Print”的缩写。grep 可以用来快速查找包含特定字符串或匹配正则表达式的行，并支持递归目录搜索、忽略大小写、显示行号等多种选项。

1. 基本语法

grep [选项] 模式 [文件...]

模式：要搜索的字符串或正则表达式。
[文件...]：要搜索的一个或多个文件。如果未指定文件，则从标准输入读取数据。

2. 常见选项

选项	描述
`-i`	忽略大小写进行匹配
`-v`	反向匹配，输出不包含匹配模式的行
`-n`	显示匹配行及其行号
`-r` 或 `-R`	递归地在当前目录及其子目录中搜索
`-l`	只列出包含匹配内容的文件名
`-c`	统计每个文件中匹配的行数
`-w`	匹配整个单词
`-A n`	显示匹配行及其后 n 行
`-B n`	显示匹配行及其前 n 行
`-C n`	显示匹配行及其前后各 n 行
`-E`	使用扩展正则表达式
`-F`	将模式解释为固定字符串列表而不是正则表达式

3. 常见使用场景

（1）基本文本搜索

在单个文件中搜索特定字符串：

grep "search_term" filename.txt

（2）忽略大小写搜索

忽略大小写差异进行搜索：

grep -i "search_term" filename.txt

（3）反向匹配

查找不包含特定字符串的行：

grep -v "exclude_term" filename.txt

（4）显示行号

同时显示匹配行及其所在的行号：

grep -n "search_term" filename.txt

（5）递归目录搜索

在目录及其所有子目录中递归搜索文件中的特定字符串：

grep -r "search_term" /path/to/directory

（6）仅显示匹配的文件名

只列出包含匹配内容的文件名，而不显示具体的匹配行：

grep -l "search_term" *.txt

（7）统计匹配次数

统计每个文件中匹配的行数：

grep -c "search_term" *.log

（8）上下文查看

显示匹配行及其前后几行的内容。例如，显示匹配行及其前后两行：

grep -C 2 "search_term" filename.txt

-A n：显示匹配行及其后 n 行。
-B n：显示匹配行及其前 n 行。
-C n：显示匹配行及其前后各 n 行。

（9）匹配完整单词

确保只匹配完整的单词，而不是作为其他单词一部分出现的字符串：

grep -w "word" filename.txt

（10）使用正则表达式

利用正则表达式进行更复杂的模式匹配：

grep -E "pattern1|pattern2" filename.txt

-E：启用扩展正则表达式支持，允许使用 |（或）、()（分组）等高级特性。

（11）管道输入

结合其他命令使用，例如通过管道将另一个命令的输出传递给 grep 进行过滤：

ls -l | grep "txt"

这个例子会列出当前目录下的所有文件，并筛选出文件名中包含 "txt" 的行。

（12）多文件搜索

在多个文件中同时搜索特定字符串：

grep "search_term" file1.txt file2.txt file3.txt

或者使用通配符表示多个文件：

grep "search_term" *.log

4. 示例

查找特定错误信息：在所有日志文件中查找包含 "ERROR" 的行：
```
grep "ERROR" *.log
```
查找不包含某关键词的行：查找不包含 "DEBUG" 的行：
```
grep -v "DEBUG" application.log
```
递归查找项目中的特定代码片段：在整个项目中递归查找包含 "TODO" 注释的代码文件：
```
grep -r "TODO" .
```
统计不同级别的日志数量：统计日志文件中每种日志级别（如 INFO, WARN, ERROR）出现的次数：
```
grep -c -E "INFO|WARN|ERROR" application.log
```

5. 总结

grep 是一个功能强大且灵活的文本搜索工具，适用于各种场景，无论是简单的字符串查找还是复杂的正则表达式匹配。掌握 grep 的常见选项和用法，可以帮助你更高效地处理文本数据，特别是在需要快速定位问题或分析大量日志时特别有用。

3:sed

sed 是一个流编辑器（stream editor），用于在 Linux 和 Unix 环境中对文本进行过滤和转换。它非常适合用于处理大量数据或自动化脚本中的文本处理任务。sed 主要用来执行基本的文本替换、删除、添加等操作，且可以不修改原始文件而直接输出结果。

基本语法

sed [选项] '[命令]' 文件

常见选项

-n：只打印受影响的行。
-e：允许多个命令序列。
-f：从脚本文件读取命令。
-i：直接编辑文件（就地编辑）。

常见命令

s/旧字符串/新字符串/：替换匹配到的旧字符串为新字符串。
d：删除匹配到的行。
p：打印匹配到的行。
a：在指定行之后追加文本。
i：在指定行之前插入文本。
c：替换整行内容。

常见使用场景

基本替换
替换文件中所有出现的“old”为“new”：
```
sed 's/old/new/g' filename.txt
```
注意这里的 g 表示全局替换，即一行中有多个匹配项时全部替换。
就地编辑
直接在原文件中进行替换（小心使用，因为它会直接修改文件）：
```
sed -i 's/old/new/g' filename.txt
```
仅打印匹配的行
使用 -n 选项与 p 命令结合，仅打印包含特定模式的行：
```
sed -n '/pattern/p' filename.txt
```
删除行
删除包含特定模式的所有行：
```
sed '/pattern/d' filename.txt
```
多命令序列
同时执行多个命令，例如先替换后删除某些行：
```
sed -e 's/old/new/g' -e '/pattern/d' filename.txt
```
追加文本
在包含特定模式的行后面添加一行文本：
```
sed '/pattern/a This is a new line' filename.txt
```
插入文本
在包含特定模式的行前面插入一行文本：
```
sed '/pattern/i This is an inserted line' filename.txt
```
替换整行
将包含特定模式的行替换为新的行内容：
```
sed '/pattern/c This line has been replaced' filename.txt
```
限制范围操作
只对符合指定范围内的行应用操作，例如只在第2到第5行之间替换“old”为“new”：
```
sed '2,5s/old/new/g' filename.txt
```
使用正则表达式
利用正则表达式来进行更复杂的匹配和替换操作，如替换数字组成的单词：
```
sed -E 's/\b[0-9]+\b/replacement/g' filename.txt
```
这里 -E 选项启用扩展正则表达式支持。

这些例子只是 sed 能力的一部分展示，通过组合不同的选项和命令，可以实现非常强大的文本处理功能。sed 非常适合于需要快速处理文本的场合，尤其是在编写shell脚本时。

总结

sed 是一个流编辑器（stream editor），用于在 Linux 和 Unix 环境中对文本进行过滤和转换。它可以执行基本的文本替换、删除、添加等操作，并且可以通过管道与其他命令结合使用。sed 的主要优点是可以不修改原始文件而直接输出结果。更强大的功能可以结合awk命令

4:awk

awk 是一种编程语言，专门用于在Linux和Unix环境中处理文本。它以其强大的文本处理能力而闻名，尤其擅长于对数据进行过滤、转换以及报告生成。awk这个名字来源于它的三个原始作者的姓氏首字母：Alfred Aho, Peter Weinberger, 和 Brian Kernighan。

基本语法

基本的 awk 命令格式如下：

awk 'pattern {action}' filename

pattern：这是一个可选的条件，决定了哪一行会被处理。如果省略，则所有行都被处理。
action：这是当模式匹配时执行的操作。如果省略，则默认操作是打印当前行。
filename：要处理的文件名。

常见使用场景

打印特定列或字段
假设有一个CSV文件，每行包含姓名、年龄和城市信息，想要提取每个人的姓名和城市，可以使用：
```
awk -F, '{print $1 ", " $3}' people.csv
```
这里 -F, 指定了逗号作为字段分隔符。
过滤符合条件的行
要查找所有来自北京的人，可以使用：
```
awk -F, '$3 == "Beijing" {print $0}' people.csv
```
这个命令会输出所有第三列（城市）为“Beijing”的行。
统计信息
例如，计算一个文件中某个特定单词出现的次数：
```
awk '/word/ {count++} END {print count}' file.txt
```
此命令会遍历 file.txt 文件中的每一行，每当找到“word”这个词时，计数器就会增加，并在最后打印总数。
处理日志文件
日志文件通常很大且格式化良好，这使得 awk 成为了分析它们的理想工具。比如，找出所有错误级别的日志条目：
```
awk '/ERROR/ {print $0}' logfile.log
```
复杂的数据处理
awk 可以进行更复杂的操作，如数学运算、字符串操作等。例如，给定一个销售记录文件，计算每个销售人员的总销售额：
```
awk '{sales[$1] += $2} END {for (person in sales) print person, sales[person]}' sales.txt
```
假设 sales.txt 的格式是每个销售人员的名字后面跟着他们的销售额，这个命令会汇总每个销售人员的总销售额。

awk 非常强大，但这些只是冰山一角。通过结合不同的模式和动作，以及利用其内置函数和变量，awk 可以完成更加复杂和精细的任务。

总结

awk 是 Linux 中处理文本数据的利器，适用于以下场景：

提取特定列
过滤和匹配行
计算和统计
格式化输出
处理结构化数据（如日志、CSV 文件）

通过灵活使用 awk 的模式匹配、字段操作和内置变量，可以高效完成各种文本处理任务。

Linux 日志处理

1:find

1. find 基本语法

示例：

2. 常见使用场景及示例

（1）按名称查找文件

（2）按类型查找 -type

（3）按大小查找 -size

（4）按修改时间查找

（5）组合条件

（6）执行命令

（7）查找空文件或目录

（8）避免错误信息

3. 总结

2:grep

1. 基本语法

2. 常见选项

3. 常见使用场景

（1）基本文本搜索

（2）忽略大小写搜索

（3）反向匹配

（4）显示行号

（5）递归目录搜索

（6）仅显示匹配的文件名

（7）统计匹配次数

（8）上下文查看

（9）匹配完整单词

（10）使用正则表达式

（11）管道输入

（12）多文件搜索

4. 示例

5. 总结

3:sed

基本语法

常见选项

常见命令

常见使用场景

总结

4:awk

基本语法

常见使用场景

总结

philadelphia

引用和评论

OpenInfra 基金会董事会宣布加入 Linux 基金会意向，增强开源全球影响力

rocky linux 使用记录

快捷键打开某个窗口(如网页chatGPT)

但是，I/O多路复用中是如何判断文件“可读”/“可写”的？

麒麟系统中theia终端崩溃问题排查小记

【笔记】CentOS 7 中配置 YUM

为什么你学不会 Emacs？

1. `find` 基本语法