导读
本文将讲解一些比较简单的 zsh 脚本实例。
实例一:复制一个目录的目录结构
功能:
将一个目录及它下边的所有目录复制到另一个目录中(即创建同名目录),但不复制目录下的其他类型文件。
例子:
src 的目录结构:
src
├── a
├── b
│ ├── 1.txt
│ └── 2
│ └── 3.txt
├── c.txt
├── d
├── e f
│ └── g
│ └── 4.txt
└── g h -> e f
要构造一个 dst 目录,只包含 src 下的目录,内容如下:
dst
└── src
├── a
├── b
│ └── 2
├── d
└── e f
└── g
思路:
- 首先需要先将 src 目录下的目录名筛选出来,可以用
**/*(/)
匹配。 - 然后用
mkdir -p
在 dst 目录中创建对应的目录。
# 参数 1:src 目录
# 参数 2:待创建的 dst 目录
#!/bin/zsh
for i ($1/**/*(/)) {
# -p 参数是递归创建目录,这样不用考虑目录的创建顺序
mkdir -p $2/$i
}
实例二:寻找不配对的文件
功能:
需要当前目录下有一些 .txt 和 .txt.md5sum 的文件,需要寻找出没有对应的 .md5sum 文件的 .txt 文件。(实际的场景是寻找已经下载完成的文件,未下载完的文件都对应某个带后缀的文件。)
例子:
当前目录的所有文件:
aa.txt
bb.txt
bb.txt.md5sum
cc dd.txt
cc dd.txt.md5sum
ee ff.txt.md5sum
gg.txt
hh ii.txt
需要找出没有对应 .md5sum 的 .txt 文件:
aa.txt
gg.txt
hh ii.txt
思路:
- 找到所有 .md5sum 文件,然后把文件名中的 .md5sum 去掉,即为那些需要排除的 .txt 文件(a)。
- 所有的文件,排除掉 .m5sum 文件,再排除掉 a,即结果。
实现:
#!/bin/zsh
all_files=(*)
bad_files=(*.md5sum)
bad_files+=(${bad_files/.md5sum})
# 数组差集操作
echo ${all_files:|bad_files}
实例三:用 sed 批量重命名文件
功能:
用形如 sed 命令的用法批量重命名文件。
例子:
# 实现 renamex 命令,接受的第一个参数为 sed 的主体参数,其余参数是文件列表
# 效果是根据 sed 对文件名的修改重命名这些文件
% tree
.
├── aaa_aaa.txt
├── aaa.txt
├── ccc.txt
└── xxx
├── aaa bbb.txt
└── bbb ccc.txt
% renamex s/aaa/bbb/g **/*
'aaa_aaa.txt' -> 'bbb_bbb.txt'
'aaa.txt' -> 'bbb.txt'
'xxx/aaa bbb.txt' -> 'xxx/bbb bbb.txt'
% tree
.
├── bbb_bbb.txt
├── bbb.txt
├── ccc.txt
└── xxx
├── bbb bbb.txt
└── bbb ccc.txt
思路:
- 要找出所有的文件名,然后用 sed 替换成新文件名。
- 如果文件名有变化,用 mv 命令移动
实现:
#!/bin/zsh
(($+2)) || {
echo 'Usage: renamex s/aaa/bbb/g *.txt'
return
}
for name ($*[2,-1]) {
local new_name="$(echo $name | sed $1)"
[[ $name == $new_name ]] && continue
mv -v $name $new_name
}
实例四:根据文件的 md5 删除重复文件
功能:
删除当前目录以及子目录下所有的重复文件(根据 md5 判断,不是很严谨)。
思路:
- 用 md5sum 命令计算所有文件的 md5。
- 使用哈希表判断 md5 是否重复,删除哈希表里已经有 md5 的后续文件。
实现:
#!/bin/zsh
# D 是包含以 . 开头的隐藏文件
local files=("${(f)$(md5sum **/*(.D))}")
local files_to_delete=()
local -A md5s
for i ($files) {
# 取前 32 位,即 md5 的长度
local md5=$i[1,32]
if (($+md5s[$md5])) {
# 取 35 位之后的内容,即文件路径,md5 后边有两个空格
files_to_delete+=($i[35,-1])
} else {
md5s[$md5]=1
}
}
(($#files_to_delete)) && rm -v $files_to_delete
实例五:转换 100 以内的汉字数字为阿拉伯数字
功能:
转换 100 以内的汉字数字为阿拉伯数字,如六十八转换成 68。
思路:
- 建一个哈希表存放汉字与数字的对应关系。
- 比较麻烦的是“十”,在不同的位置,转换成的数字不同,需要分别处理。
实现:
#!/bin/zsh
local -A table=(
零 0
一 1
二 2
三 3
四 4
五 5
六 6
七 7
八 8
九 9
)
local result
if [[ $1 == 十 ]] {
result=一零
} elif [[ $1 == 十* ]] {
result=${1/十/一}
} elif [[ $1 == *十 ]] {
result=${1/十/零}
} elif [[ $1 == *十* ]] {
result=${1/十}
} else {
result=$1
}
for i ({1..$#result}) {
result[i]=$table[$result[i]]
if [[ -z $result[i] ]] {
echo error
return 1
}
}
echo $result
运行结果:
% ./convert 一
1
% ./convert 十
10
% ./convert 十五
15
% ./convert 二十
20
% ./convert 五十六
56
% ./convert 一百
error
实例六:为带中文汉字数字的文件名重命名成以对应数字开头
功能:
见下边例子。
例子:
当前目录有如下文件:
Zsh-开发指南(第一篇-变量和语句).md
Zsh-开发指南(第七篇-数值计算).md
Zsh-开发指南(第三篇-字符串处理之转义字符和格式化输出).md
Zsh-开发指南(第九篇-函数和脚本).md
Zsh-开发指南(第二篇-字符串处理之常用操作).md
Zsh-开发指南(第五篇-数组).md
Zsh-开发指南(第八篇-变量修饰语).md
Zsh-开发指南(第六篇-哈希表).md
Zsh-开发指南(第十一篇-变量的进阶内容).md
Zsh-开发指南(第十七篇-使用-socket-文件和-TCP-实现进程间通信).md
Zsh-开发指南(第十三篇-管道和重定向).md
Zsh-开发指南(第十九篇-脚本实例讲解).md
Zsh-开发指南(第十二篇-[[-]]-的用法).md
Zsh-开发指南(第十五篇-进程与作业控制).md
Zsh-开发指南(第十八篇-更多内置模块的用法).md
Zsh-开发指南(第十六篇-alias-和-eval-的用法).md
Zsh-开发指南(第十四篇-文件读写).md
Zsh-开发指南(第十篇-文件查找和批量处理).md
Zsh-开发指南(第四篇-字符串处理之通配符).md
需要重命名成这样:
01_Zsh-开发指南(第一篇-变量和语句).md
02_Zsh-开发指南(第二篇-字符串处理之常用操作).md
03_Zsh-开发指南(第三篇-字符串处理之转义字符和格式化输出).md
04_Zsh-开发指南(第四篇-字符串处理之通配符).md
05_Zsh-开发指南(第五篇-数组).md
06_Zsh-开发指南(第六篇-哈希表).md
07_Zsh-开发指南(第七篇-数值计算).md
08_Zsh-开发指南(第八篇-变量修饰语).md
09_Zsh-开发指南(第九篇-函数和脚本).md
10_Zsh-开发指南(第十篇-文件查找和批量处理).md
11_Zsh-开发指南(第十一篇-变量的进阶内容).md
12_Zsh-开发指南(第十二篇-[[-]]-的用法).md
13_Zsh-开发指南(第十三篇-管道和重定向).md
14_Zsh-开发指南(第十四篇-文件读写).md
15_Zsh-开发指南(第十五篇-进程与作业控制).md
16_Zsh-开发指南(第十六篇-alias-和-eval-的用法).md
17_Zsh-开发指南(第十七篇-使用-socket-文件和-TCP-实现进程间通信).md
18_Zsh-开发指南(第十八篇-更多内置模块的用法).md
19_Zsh-开发指南(第十九篇-脚本实例讲解).md
思路:
- 首先需要写将汉字数字转成阿拉伯数字的函数。
- 然后需要从文件名中截取汉字数字,然后转成阿拉伯数字。
- 拼接文件名,然后移动文件。
实现:
#!/bin/zsh
# 转换数字的逻辑和上一个实例一样
local -A table=(
零 0
一 1
二 2
三 3
四 4
五 5
六 6
七 7
八 8
九 9
)
convert() {
local result
if [[ $1 == 十 ]] {
result=一零
} elif [[ $1 == 十* ]] {
result=${1/十/一}
} elif [[ $1 == *十 ]] {
result=${1/十/零}
} elif [[ $1 == *十* ]] {
result=${1/十}
} else {
result=$1
}
for i ({1..$#result}) {
result[i]=$table[$result[i]]
if [[ -z $result[i] ]] {
echo error
return 1
}
}
echo $result
}
for i (Zsh*.md) {
# -Z 2 是为了在前边补全一个 0
# 把文件名“第”之前和“篇”之后的全部去除
local -Z 2 num=$(convert ${${i#*第}%篇*})
mv -v $i ${num}_$i
}
实例七:统一压缩解压工具
功能:
Linux 下常用的压缩、归档格式众多,参数各异,写一个用法统一的压缩解压工具,用于创建、解压 .zip
.7z
.tar
.tgz
.tbz2
.txz
.tar.gz
.tar.bz2
.tar.xz
.cpio
.ar
.gz
.bz2
.xz
等文件。(类似 atool
,但 atool
很久没更新了,一些新的格式不支持,没法定制。而且是用 perl
写的,很难看懂。所以还是决定自己写一个,只覆盖 atool
的一部分常用功能。)
例子:
# a 用于创建压缩文件
% a a.tgz dir1 file1 file2
dir1/
file1
file2
# al 用于列出压缩文件中的文件列表
% al a.tgz
drwxr-xr-x goreliu/goreliu 0 2017-09-13 11:23 dir1/
-rw-r--r-- goreliu/goreliu 3 2017-09-13 11:23 file1
-rw-r--r-- goreliu/goreliu 3 2017-09-13 11:23 file2
# x 用于解压文件
% x a.tgz
dir1/
file1
file2
a.tgz -> a
# 如果解压后的文件名或目录名中当前目录下已经存在,则解压到随机目录
% x a.tgz
dir1/
file1
file2
a.tgz -> /tmp/test/x-c4I
思路:
- 压缩文件时,根据传入的文件名判断压缩文件的格式。
- 解压和查看压缩文件内容时,根据传入的文件名和
file
命令结果判断压缩文件的格式。 - 为了复用代码,多个命令整合到一个文件,然后
ln -s
成多个命令。
实现:
#!/bin/zsh
get_type_by_name() {
case $1 {
(*.zip|*.7z|*.jar)
echo 7z
;;
(*.rar|*.iso)
echo 7z_r
;;
(*.tar|*.tgz|*.txz|*.tbz2|*.tar.*)
echo tar
;;
(*.cpio)
echo cpio
;;
(*.cpio.*)
echo cpio_r
;;
(*.gz)
echo gz
;;
(*.xz)
echo xz
;;
(*.bz2)
echo bz2
;;
(*.lzma)
echo lzma
;;
(*.lz4)
echo lz4
;;
(*.ar)
echo ar
;;
(*)
return 1
;;
}
}
get_type_by_file() {
case $(file -bz $1) {
(Zip *|7-zip *)
echo 7z
;;
(RAR *)
echo 7z_r
;;
(POSIX tar *|tar archive)
echo tar
;;
(*cpio archive*)
echo cpio
;;
(*gzip *)
echo gz
;;
(*XZ *)
echo xz
;;
(*bzip2 *)
echo bz2
;;
(*LZMA *)
echo lzma
;;
(*LZ4 *)
echo lz4
;;
(current ar archive)
echo ar
;;
(*)
return 1
;;
}
}
(($+commands[tar])) || alias tar=bsdtar
(($+commands[cpio])) || alias cpio=bsdcpio
case ${0:t} {
(a)
(($#* >= 2)) || {
echo Usage: $0 target files/dirs
return 1
}
case $(get_type_by_name $1) {
(7z)
7z a $1 $*[2,-1]
;;
(tar)
tar -cavf $1 $*[2,-1]
;;
(cpio)
find $*[2,-1] -print0 | cpio -H newc -0ov > $1
;;
(gz)
gzip -cv $*[2,-1] > $1
;;
(xz)
xz -cv $*[2,-1] > $1
;;
(bz2)
bzip2 -cv $*[2,-1] > $1
;;
(lzma)
lzma -cv $*[2,-1] > $1
;;
(lz4)
lz4 -cv $2 > $1
;;
(ar)
ar rv $1 $*[2,-1]
;;
(*)
echo $1: error
return 1
;;
}
;;
(al)
(($#* >= 1)) || {
echo Usage: $0 files
return 1
}
for i ($*) {
case $(get_type_by_name $i || get_type_by_file $i) {
(7z|7z_r)
7z l $i
;;
(tar)
tar -tavf $i
;;
(cpio|cpio_r)
cpio -itv < $i
;;
(gz)
zcat $i
;;
(xz)
xzcat $i
;;
(bz2)
bzcat $i
;;
(lzma)
lzcat $i
;;
(lz4)
lz4cat $i
;;
(ar)
ar tv $i
;;
(*)
echo $i: error
;;
}
}
;;
(x)
(($#* >= 1)) || {
echo Usage: $0 files
return 1
}
for i ($*) {
local outdir=${i%.*}
[[ $outdir == *.tar ]] && {
outdir=$outdir[1, -5]
}
if [[ -e $outdir ]] {
outdir="$(mktemp -d -p $PWD x-XXX)"
} else {
mkdir $outdir
}
case $(get_type_by_name $i || get_type_by_file $i) {
(7z|7z_r)
7z x $i -o$outdir
;;
(tar)
tar -xavf $i -C $outdir
;;
(cpio|cpio_r)
local file_path=$i
[[ $i != /* ]] && file_path=$PWD/$i
cd $outdir && cpio -iv < $file_path && cd ..
;;
(gz)
zcat $i > $outdir/$i[1,-4]
;;
(xz)
xzcat $i > $outdir/$i[1,-4]
;;
(bz2)
bzcat $i > $outdir/$i[1,-5]
;;
(lzma)
lzcat $i > $outdir/$i[1,-6]
;;
(lz4)
lz4cat $i > $outdir/$i[1,-5]
;;
(ar)
local file_path=$i
[[ $i != /* ]] && file_path=$PWD/$i
cd $outdir && ar x $file_path && cd ..
;;
(*)
echo $i: error
;;
}
local files=$(ls -A $outdir)
if [[ -z $files ]] {
rmdir $outdir
} elif [[ -e $outdir/$files && ! -e $files ]] {
mv -v $outdir/$files . && rmdir $outdir
echo $i " -> " $files
} else {
echo $i " -> " $outdir
}
}
;;
(*)
echo error
return 1
;;
}
实例八:方便并发运行命令的工具
功能:
我们经常会遇到在循环里批量处理文件的场景(比如将所有 jpg 图片转换成 png 图片),那么就会遇到一个麻烦:如果在前台处理文件,那同一时间只能处理一个,效率太低;如果在后台处理文件,那么瞬间就会启动很多个进程,占用大量资源,系统难以承受。我们希望的是在同一时间最多同时处理固定数量(比如 10 个)的文件,如果已经达到了这个数量,那么就先等一会,直到有退出的进程后再继续。parallel
命令中在一定程度上能满足这个需求,但用起来太麻烦。
例子:
# rr 是一个函数(可放在 .zshrc 中),直接 rr 加命令即可使用
# 命令中支持变量、重定向等等,格式上和直接输入命令没有区别(不支持 alias)
% rr sleep 5
[4] 5031
% rr sleep 5
[5] 5032
# 如果不加参数,则显示当前运行的进程数、最大进程并发数和运行中进程的进程号
# 默认最大进程并发数是 10
% rr
running/max: 2/10
pid: 5031 5032
# 5 秒之后,运行结束
% rr
running/max: 0/10
# 用 -j 来指定最大进程并发数,指定一次即可,如需修改可再次指定
# 可以只调整最大进程并发数而不运行命令
% rr -j2 sleep 10
[4] 5035
% rr sleep 10
[5] 5036
# 超过了最大进程并发数,等待,并且每一秒检查一次是否有进程退出
# 如果有进程退出,则继续在后台运行当前命令
% rr sleep 10
running/max: 2/2, wait 1s ...
pid: 5035 5036
running/max: 2/2, wait 1s ...
pid: 5035 5036
[4] - done $*
[4] 5039
# 实际使用场景,批量将 jpg 图片转换成 png 图片,gm 是 graphicsmagick 中的命令
# 转换图片格式比较耗时,顺序执行的话需要很久
% for i (*.jpg) { rr gm convert $i ${i/jpg/png} }
[4] 5055
[5] 5056
[6] 5057
[7] 5058
[8] 5059
[9] 5060
[10] 5061
[11] 5062
[12] 5063
[13] 5064
running/max: 10/10, wait 1s ...
pid: 5060 5061 5062 5063 5064 5055 5056 5057 5058 5059
running/max: 10/10, wait 1s ...
pid: 5060 5061 5062 5063 5064 5055 5056 5057 5058 5059
[11] done $*
[5] done $*
[5] 5067
[12] done $*
[11] 5068
[6] done $*
[6] 5069
[12] 5070
running/max: 10/10, wait 1s ...
pid: 5070 5060 5061 5064 5055 5067 5068 5069 5058 5059
[13] - done $*
[4] done $*
[4] 5072
[13] 5073
running/max: 10/10, wait 1s ...
pid: 5070 5060 5072 5061 5073 5067 5068 5069 5058 5059
[5] done $*
[6] done $*
[5] 5075
[6] 5076
running/max: 10/10, wait 1s ...
pid: 5070 5060 5072 5061 5073 5075 5076 5068 5058 5059
...
思路:
- 需要在全局变量里记录最大进程并发数和当前运行的进程(哈希表)。
- 每运行一个进程,将对应的进程号放入哈希表中。
- 如果当前运行进程数达到最大进程并发数,则循环检查哈希表里的进程是否退出。
实现:
rr() {
(($+max_process)) || typeset -g max_process=10
(($+running_process)) || typeset -gA running_process=()
[[ $1 == -j<1-> ]] && {
max_process=${1[3,-1]}
shift
}
(($# == 0)) && {
for i (${(k)running_process}) {
[[ -e /proc/$i ]] || unset "running_process[$i]"
}
echo "running/max: $#running_process/$max_process"
(($#running_process > 0)) && echo "pid: ${(k)running_process}"
return
}
while ((1)) {
local running_process_num=$#running_process
if (($running_process_num < max_process)) {
$* &
running_process[$!]=1
return
}
for i (${(k)running_process}) {
[[ -e /proc/$i ]] || unset "running_process[$i]"
}
(($#running_process == $running_process_num)) && {
echo "running/max: $running_process_num/$max_process, wait 1s ..."
echo "pid: ${(k)running_process}"
sleep 1
}
}
}
实例九:批量转换图片格式
功能:
将当前目录及子目录的所有常见图片格式转换成 jpg 格式(jpg 格式也要转换一遍,可以减少文件体积),然后删除原图片。需要用 5 个并发进程来处理。注意避免仅扩展名不同的文件互相覆盖的情况。
例子:
% tree
.
├── mine
│ ├── 信.txt
│ ├── 第一封信.jpg
│ └── 第二封信.JPG
├── 搞笑
│ ├── 卖萌.GIF
│ ├── 猫吃鱼.gif
│ └── 猫抢东西吃.gif
└── 素材
├── 104 按键模板.jpg
├── 104 按键模板.psd
├── ahk
│ ├── ahk_bg.jpg
│ ├── ahk_home_logo.jpg
│ ├── ahk_home_logo.txt
│ ├── ahk_home_qr.jpg
│ ├── ahk_home_qr_small.jpg
│ └── ahk_logo.png
├── stp_fc_cw_png_pk
│ ├── HD.PNG
│ ├── newimage.png
│ ├── nshd.PNG
│ └── std.png
├── 地球.jpg
├── 星系.JPEG
├── 木纹 背景.GIF
├── 木纹 背景.jpeg
└── 木纹 背景.jpg
5 directories, 23 files
% alltojpg
running/max: 0/5
running: 5, wait 1.0000000000s ...
pid: 5953 5954 5955 5956 5957
running: 5, wait 1.0000000000s ...
pid: 5965 5966 5967 5968 5959
% tree
.
├── mine
│ ├── 信.txt
│ ├── 第一封信.jpg
│ └── 第二封信.jpg
├── 搞笑
│ ├── 卖萌_g.jpg
│ ├── 猫吃鱼_g.jpg
│ └── 猫抢东西吃_g.jpg
└── 素材
├── 104 按键模板.jpg
├── 104 按键模板.psd
├── ahk
│ ├── ahk_bg.jpg
│ ├── ahk_home_logo.jpg
│ ├── ahk_home_logo.txt
│ ├── ahk_home_qr.jpg
│ ├── ahk_home_qr_small.jpg
│ └── ahk_logo_p.jpg
├── stp_fc_cw_png_pk
│ ├── HD_p.jpg
│ ├── newimage_p.jpg
│ ├── nshd_p.jpg
│ └── std_p.jpg
├── 地球.jpg
├── 星系_e.jpg
├── 木纹 背景_e.jpg
├── 木纹 背景_g.jpg
└── 木纹 背景.jpg
5 directories, 23 files
思路:
- 并发运行命令的方法见上一个实例。
- 转换图片格式用
gm convert
命令(graphicsmagick 中)或者convert
命令(imagemagick 中)。 - 常见的图片文件扩展名有
jpg
jpeg
png
gif
,另外可能是大写的扩展名。 - 为了避免类似
a.gif
覆盖a.jpg
的情况,为不同的文件格式添加不同后缀,这样可以无需检查是否有同名文件,加快速度。
实现:
#!/bin/zsh
# rr 是上一个实例中代码的改进版本
rr() {
(($+max_process)) || typeset -gi max_process=10
(($+check_interval)) || typeset -gF check_interval=1
(($+running_process)) || typeset -gA running_process=()
while {getopts i:j:h arg} {
case $arg {
(i)
((OPTARG > 0)) && check_interval=$OPTARG
;;
(j)
((OPTARG > 0)) && max_process=$OPTARG
;;
(h)
echo "Usage: $0 [-i check_interval] [-j max_process] [cmd] [args]"
return
;;
}
}
shift $((OPTIND - 1))
(($# == 0)) && {
for i (${(k)running_process}) {
[[ -e /proc/$i ]] || unset "running_process[$i]"
}
echo "running/max: $#running_process/$max_process"
(($#running_process > 0)) && echo "pid: ${(k)running_process}"
return 0
}
while ((1)) {
local running_process_num=$#running_process
if (($running_process_num < max_process)) {
$* &
running_process[$!]=1
return
}
for i (${(k)running_process}) {
[[ -e /proc/$i ]] || unset "running_process[$i]"
}
(($#running_process == $running_process_num)) && {
echo "running: $running_process_num, wait ${check_interval}s ..."
echo "pid: ${(k)running_process}"
sleep $check_interval
}
}
}
# JPG 作为中间扩展名
rename .JPG .jpg **/*.JPG
# 设置进程并发数为 5
rr -j5
for i (**/*.(jpg|png|PNG|jpeg|JPEG|gif|GIF)) {
rr gm convert $i $i.JPG
}
# 等所有操作结束
wait
# 删除原文件
rm **/*.(jpg|png|PNG|jpeg|JPEG|gif|GIF)
# 避免覆盖同名文件
rename .jpg.JPG .jpg **/*.JPG
rename .png.JPG _p.jpg **/*.JPG
rename .PNG.JPG _p.jpg **/*.JPG
rename .jpeg.JPG _e.jpg **/*.JPG
rename .JPEG.JPG _e.jpg **/*.JPG
rename .gif.JPG _g.jpg **/*.JPG
rename .GIF.JPG _g.jpg **/*.JPG
总结
本文讲解了几个比较实用的 zsh 脚本,后续可能会补充更多个。
更新历史
2017.09.13:新增“实例七”、“实例八”和“实例九”。
本文不再更新,全系列文章在此更新维护:github.com/goreliu/zshguide
付费解决 Windows、Linux、Shell、C、C++、AHK、Python、JavaScript、Lua 等领域相关问题,灵活定价,欢迎咨询,微信 ly50247。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。