匹配末尾的端口号

提取这个字符串的末尾端口号

2017-04-17 08:16:14 INFO     connecting lh3.googleusercontent.com:443 from 111.111.111.111:26215

我可以用grep awk 做出来

1.grep   echo "2017-04-17 08:16:14 INFO     connecting lh3.googleusercontent.com:443 from 111.111.111.111:26215"| grep -Po  '\d+$'
2.ack  echo "2017-04-17 08:16:14 INFO     connecting lh3.googleusercontent.com:443 from 111.111.111.111:26215"| ack -o  '\d+$'

为何下面的sed awk 无法做到?

3.sed    echo "2017-04-17 08:16:14 INFO     connecting lh3.googleusercontent.com:443 from 111.111.111.111:26215"| sed  's/\(.*\)::\(\d+\)$/\2/g'
4.awk   echo "2017-04-17 08:16:14 INFO     connecting lh3.googleusercontent.com:443 from 111.111.111.111:26215"| awk '{b=gensub(/^(.+)\d+)$/,"\2","g";print b}'
阅读 3.7k
2 个回答
  1. 在awk/sed中, \d并不能代表数字, 数字只能用[0-9]来匹配, 所以\d匹配都是失败的

  2. awk中有语法错误: gensub括号不成对, 在引用捕获分组时, 需要 \\, 不能单单一个\, 因为shell层面也要转义一次

  3. sed虽然没有语法错误, 但是匹配样式错了, 多了:
    修改后的答案:

awk:
    echo "2017-04-17 08:16:14 INFO     connecting lh3.googleusercontent.com:443 from 111.111.111.111:26215"| awk '{print gensub(/^.+:([0-9]+)$/,"\\1","g")}'
sed:
    echo "2017-04-17 08:16:14 INFO     connecting lh3.googleusercontent.com:443 from 111.111.111.111:26215"| sed -r  's/(.*):([0-9]+)$/\2/g'

你的用法用错了:

  1. sed里面有两个冒号

  2. sed里面不支持\d

  3. sed里面加号+需要转义

awk的用法也有一些错误
clipboard.png

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进