Bash技巧:使用参数扩展转换字符串的大小写和替换字符串

在 bash 中,通常使用 ${parameter} 表达式来获取 parameter 变量的值,这是一种参数扩展 (parameter expansion)。
Bash 还提供了其他形式的参数扩展,可以对变量值做一些处理,起到操作字符串的效果。例如:

  • ${parameter^^pattern}parameter 变量值中匹配 pattern 模式字符的小写字母转成大写。
  • ${parameter,,pattern}parameter 变量值中匹配 pattern 模式字符的大写字母转成小写。
  • ${parameter/pattern/string}parameter 变量值中匹配 pattern 模式的部分替换为 string 字符串。

注意:这些表达式都不会修改 parameter 自身的变量值,它们只是基于 parameter 变量值扩展得到新的值。
如果要保存这些值,需要赋值给具体的变量。

查看 man bash 的 Parameter Expansion 小节,就能看到相关说明。具体举例说明如下。

${parameter^^pattern} 和 ${parameter,,pattern}

查看 man bash 对 ${parameter^pattern}, ${parameter^^pattern}, ${parameter,pattern}, ${parameter,,pattern} 的说明如下:

Case modification.
This expansion modifies the case of alphabetic characters in parameter. The pattern is expanded to produce a pattern just as in pathname expansion.

The ^ operator converts lowercase letters matching pattern to uppercase; the , operator converts matching uppercase letters to lowercase.
The ^^ and ,, expansions convert each matched character in the expanded value; the ^ and , expansions match and convert only the first character in the expanded value.

If pattern is omitted, it is treated like a ?, which matches every character.

If parameter is @ or *, the case modification operation is applied to each positional parameter in turn, and the expansion is the resultant list.
If parameter is an array variable subscripted with @ or *, the case modification operation is applied to each member of the array in turn, and the expansion is the resultant list.

即,这四个表达式会在 parameter 变量值中匹配 pattern 模式,并对匹配的字符进行大小写转换:

  • ^ 操作符把小写字母转换为大写,且只转换开头的第一个字符
  • , 操作符把大写字母转换为小写,且只转换开头的第一个字符
  • ^^ 操作符把小写字母转换为大写,会转换每一个匹配的字符
  • ,, 操作符把大写字母转换为小写,会转换每一个匹配的字符

这里的 pattern 模式可以使用通配符进行扩展,注意不是用正则表达式。

注意^, 不是转换第一个匹配到的字符,而是只转换 parameter 变量值的首字符。
所给的 pattern 模式必须和 parameter 变量值的首字符匹配才会转换,不会转换字符串中间的字符。

具体举例说明如下:

$ value="This Is a Test String."
$ echo ${value^t}
This Is a Test String.
$ echo ${value^^t}
This Is a TesT STring.
$ echo ${value,T}
this Is a Test String.
$ echo ${value,,T}
this Is a test String.

可以看到,使用 ${value^t} 不会把 value 变量值中间小写的 t 字符换行为大写。
因为这个表达式只匹配和转换 value 变量值的首字符,value 变量值并不是以小写字母 t 开头,不做转换。

${value^^t} 表达式会匹配 value 变量值中的每一个小写字母 t,并转换为大写。
所以输出结果里面不再有小写的 t 字符。

类似的,${value,T} 表示把 value 变量值开头的大写 T 转换为小写的 t
${value,,T} 表示把 value 变量值所有的大写 T 转换为小写的 t

如果省略 pattern 模式,则表示匹配任意字符,但并不表示会转换所有字符,^, 操作符还是只转换首字符。

以上面的 value 变量值举例如下:

$ echo ${value^}
This Is a Test String.
$ echo ${value^^}
THIS IS A TEST STRING.
$ echo ${value,}
this Is a Test String.
$ echo ${value,,}
this is a test string.

可以看到,${value^} 只会把 value 变量值首字符变成大写,由于原本就是大写,所以输出结果跟 value 值一样。
${value^^} 把所有字符都转换为大写。
${value,}value 变量值首字符变成小写。
${value,,} 把所有字符都转换为小写。

注意:如果要匹配多个字符,要用方括号 [] 把字符串括起来,进行 pathname expansion,才会得到多个可匹配的字符。
直接把 pattern 模式写成字符串并不能匹配该字符串中的每一个字符。

以上面的 value 变量值举例如下:

$ echo ${value,TI}
This Is a Test String.
$ echo ${value,,TI}
This Is a Test String.
$ echo ${value,,[TI]}
this is a test String.
$ echo ${value,[TI]}
this Is a Test String.

可以看到,当所给模式写为 TI 时,无论是使用 , 还是 ,, ,都不能把大写的 TI 转换为小写。
${value,TI} 甚至都不能转换开头的 T 字符。

而写为 ${value,,[TI]} 就会把所有大写的 TI 都转换为小写。
[TI] 就是 pathname expansion 的一种写法,表示匹配方括号 [] 里面的每一个字符。
基于字符匹配,不是基于字符串匹配。
写为 ${value,[TI]} 表示把首字符 T 或者首字符 I 转换为小写,只匹配首字符。

关于 pathname expansion 的具体写法可以查看 man bash 的 Pathname Expansion 部分。

最常见的就是用 * 通配符匹配零个或多个任意字符,用 ? 匹配任意单个字符。
上面说明中提到,如果省略 pattern 模式,就相当于写为 ?
${parameter^^} 等价于 ${parameter^^?}

${parameter/pattern/string}

查看 man bash 对 ${parameter/pattern/string} 的说明如下:

Pattern substitution.
The pattern is expanded to produce a pattern just as in pathname expansion. Parameter is expanded and the longest match of pattern against its value is replaced with string.

If pattern begins with /, all matches of pattern are replaced with string. Normally only the first match is replaced. If pattern begins with #, it must match at the beginning of the expanded value of parameter.
If pattern begins with %, it must match at the end of the expanded value of parameter.

If string is null, matches of pattern are deleted and the / following pattern may be omitted.

If parameter is @ or *, the substitution operation is applied to each positional parameter in turn, and the expansion is the resultant list.
If parameter is an array variable subscripted with @ or *, the substitution operation is applied to each member of the array in turn, and the expansion is the resultant list.

即,${parameter/pattern/string} 表达式可以替换 parameter 变量值的字符串。
所给的 pattern 模式会按照文件名扩展 (pathname expansion) 的方式来扩展,然后对 parameter 变量值进行扩展。
其值中最长匹配 pattern 的部分会被替换成 string 指定的字符串。

如果 pattern 模式开始于 /,所有匹配 pattern 模式的地方都被替换成 string 字符串。
通常仅仅替换第一个匹配的地方。

如果 pattern 模式开始于 #,它必须从头开始匹配 parameter 变量值。
如果 pattern 模式开始于 %,它必须从后往前匹配 parameter 变量值。

如果 string 字符串是空,匹配 pattern 模式的地方会被删除,且跟在 pattern 模式之后的 / 字符可以省略。

具体举例说明如下:

$ value="This is a test string. This is a new test"
$ echo ${value/test/TEST}
This is a TEST string. This is a new test
$ echo ${value//test/TEST}
This is a TEST string. This is a new TEST
$ echo ${value/#test/TEST}
This is a test string. This is a new test
$ echo ${value/#This/THIS}
THIS is a test string. This is a new test
$ echo ${value/%test/TEST}
This is a test string. This is a new TEST
$ echo ${value/test}
This is a string. This is a new test
$ echo ${value//test}
This is a string. This is a new

可以看到,在 ${value/test/TEST} 表达式中,value 变量值是要被替换的原始字符串。
中间的 test 是要被替换的模式,且只替换第一个出现的 "test" 字符串,不会替换所有的 "test" 字符串。
后面的 TEST 是替换之后的内容。
最终输出的结果是把 value 变量值中的第一个 "test" 字符串替换成了 "TEST",第二个 "test" 字符串没有被替换。

${value//test/TEST} 表达式的 "/test" 模式以 / 开头,表示替换所有出现的 "test" 字符串。
输出结果所有的 "test" 字符串都替换成了 "TEST"。

${value/#test/TEST} 表达式的 "#test" 模式以 # 开头,表示要从 value 变量值的第一个字符开始匹配。
由于 value 变量值不是以 "test" 开头,所以匹配不到,并没有做替换。

要使用 ${value/#This/THIS} 来把 value 变量值开头的 "This" 替换成 "THIS"。
${value/%test/TEST} 表达式的情况类似,要求从 value 变量值的末尾往前匹配 "test" 字符串。
这两者都是从最后一个字符往前开始匹配。

${value/test} 表达式没有提供替换后的 string 参数,表示从 value 变量值中删除第一个出现的 "test" 字符串。
${value//test} 表达式的 "/test" 模式以 / 开头,表示从 value 变量值中删除所有出现的 "test" 字符串。

上面提到 "最长匹配" 部分会被替换。
所谓的 "最长匹配" 是指被 pattern 模式括起来的最长部分。
常见于用通配符匹配多个字符形成嵌套的情况。

具体举例如下:

$ value="This is a |test string|new test|, check it"
$ echo ${value/|*|/NEW STRING}
This is a NEW STRING, check it
$ echo ${value/|*|}
This is a , check it

可以看到,所给的匹配模式是 |*|。使用 * 通配符来匹配在两个 | 之间的任意字符串。
在所给的 value 变量值里面,"|test string|"、"|test string|new test|" 这两种形式都匹配这个模式。
实际被替换的是最后一种,也就是最长匹配。
由于该模式没有以 / 开头,只处理第一个匹配的地方,所以 "|new test|" 不会被匹配到。

即,当 pattern 模式的扩展结果是不定长的字符串时,它会有一个前缀部分、中间变长部分、后缀部分。
那么最长匹配是从前缀部分开始匹配,一直到最后一个匹配的后缀部分为止,而不是遇到第一个匹配的后缀部分就停止。
中间变长部分可以包含多个前缀部分和后缀部分。

下面再举例说明如下:

$ value="This is a test string, first check it"
$ echo ${value/t*st}
This is a check it

可以看到,在所给的 value 变量值里面,t*st 模式的后缀部分 "st" 匹配到了 "first" 字符串后面的 "st"。
而不是匹配到 "test" 字符串的 "st"。
最终结果取最长匹配的部分。

阅读 616

推荐阅读
南木阁
用户专栏

考据党一枚,力求讲述的每个知识点都有出处,有理有据。如能恰好地解答您的疑问,欢迎点赞,谢谢!

239 人关注
82 篇文章
专栏主页