如何在Linux shell下做中文字符串的匹配

James_490254

25111

发布于
2014-05-13

Humphry

16.4k63044

更新于
2014-05-14

假如我有字符串 A,
A="米饭 + 爆炒牛肉 + 豉汁肉片 + 蒜蓉芥蓝"
我想过滤它是否含有某个中文字符，比如“牛肉" ，使用

test.sh

#!/bin/bash
set -x

A="米饭 + 爆炒牛肉 + 豉汁肉片 + 蒜蓉芥蓝"
F="牛肉"

if [ `echo "$A" |egrep "$F" ` ] ; then echo "A include $F"  ;fi

出现以下错误：

$ ./test.sh
+ A='米饭 + 爆炒牛肉 + 豉汁肉片 + 蒜蓉芥蓝'
+ F=$'\347\211\233\350\202\211'
++ egrep $'\347\211\233\350\202\211'
++ echo '米饭 + 爆炒牛肉 + 豉汁肉片 + 蒜蓉芥蓝'
+ '[' $'\347\261\263\351\245\255' + $'\347\210\206\347\202\222\347\211\233\350\202\211' + $'\350\261\211\346\261\201\350\202\211\347\211\207' + $'\350\222\234\350\223\211\350\212\245\350\223\235' ']'
./test.sh: line 7: [: too many arguments

是不是应该在哪个环境变量设置一下。

linux-kernel shell

阅读 20.2k

3 个回答

BikongV

Humphry

✓ 已被采纳

export LANG=zh_CN.UTF-8
A="米饭 + 爆炒牛肉 + 豉汁肉片 + 蒜蓉芥蓝"
B="牛肉"
F="毛线"
echo $A | grep "$B" &>/dev/null
if [[ $? == 0 ]]; then
   echo $B Match
fi
echo $A | grep "$F" &>/dev/null
if [[ $? == 0 ]]; then
   echo $F Match
fi

你看看咯

另外，确实使用bash的匹配更方便

if [[ "$A" =~ "$B" ]]; then
   echo Match ${BASH_REMATCH[0]}
fi

有时候胜过sed的分组捕获，bash的匹配用起来更简单，也支持分组捕获，结果保存在BASH_REMATCH数组中

James_490254

Humphry

使用 =~ bash里的字符串匹配方法解决了这个问题。

cat test.sh
#!/bin/bash
set -x

A="米饭 + 爆炒牛肉 + 豉汁肉片 + 蒜蓉芥蓝"
F="牛肉"

if [[ $A =~ $F ]] ; then echo "A include $F"  ;fi


$ ./test.sh
+ A='米饭 + 爆炒牛肉 + 豉汁肉片 + 蒜蓉芥蓝'
+ F=$'\347\211\233\350\202\211'
+ [[ 米饭 + 爆炒牛肉 + 豉汁肉片 + 蒜蓉芥蓝 =~ 牛肉 ]]
+ echo 'A include 牛肉'
A include 牛肉

ThisTusooa

16912

发布于
2014-05-13

if echo "$A" |egrep "$F" &>/dev/null ; then echo "A include $F" ;fi

不应该有[和]。
另外这个出错信息很奇怪。理应当出现

[: missing `]'

的

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进