windows 下 有没有针对 大文本文件(10M-50M) 搜索模式匹配文字的 高性能命令行工具 ?

windows 下 有没有针对 大文本文件(10M-50M) 搜索匹配文字的 高性能工具??

支持: 1. 正则,大小写等规则。 支持搜索中文。是命令行工具不是软件。

  1. 性能要高,命令行执行命令能快速返回结果
  2. windows的find 不支持正则,findstr存在很多问题,如果文件不是 ANSI 编码,在搜索中文时会不准确。

https://stackoverflow.com/questions/60895277/is-there-a-way-to-use-findstr-with-non-ascii-in-this-case-japanese-chinese-cha

目前看到尚未尝试的方案:

  1. 安装 https://gnuwin32.sourceforge.net/packages/grep.htm win_grep 软件,不知道效果怎么样
阅读 1.1k
2 个回答

觉的GNU工具好用为什么不装msys2或者cygwin呢?有大量的GNU工具可以使用,生产力太高了

我用的工具也不多,试了下在七年前的轻薄本上,用 busyboxMsys2 里的 grep

100 MB (GBK) / 150 MB (UTF-8) 的小说里,所有超过 10 的中文数字:

  1. 650 KB 的 BusyBox for Windows

    可以处理中文,但实际上不认识 Unicode,全部当 ascii 看待。
    所以正则 [] 里,无法使用 Unicode 字符,只能用 16 个分支的形式,匹配有点慢。
    如果源文件是 UTF-8,正则也需要转成 UTF-8

  1. Msys2

    认识 UTF-8,正则只用一个分支,即使文件大一半,速度也快一倍。。

如果两个都不满意,建议上 Github 看看,有啥针对 Windowsgrep 工具吗。。

推荐问题
logo
Microsoft
子站问答
访问
宣传栏