接触了一滴滴的lucene库,想做一个文件目标内容收集(比如日志内容,收集出现exception 的所有日志信息内容然后显示)。
目前用lucene能收集目标内容出现的文件位置(不知道能找到具体文件内容位置?)。
然后通过获取的文件路径进行对该文件读入string操作,截取出目标内容以及其附近的小内容,刚试了下实现。觉得当文件很多又很大的时候,时间开销会比较大,一个txt差不多700kb,20多个txt差不多要执行掉200ms。
求大神指导一下,或者给点资料看看~
接触了一滴滴的lucene库,想做一个文件目标内容收集(比如日志内容,收集出现exception 的所有日志信息内容然后显示)。
目前用lucene能收集目标内容出现的文件位置(不知道能找到具体文件内容位置?)。
然后通过获取的文件路径进行对该文件读入string操作,截取出目标内容以及其附近的小内容,刚试了下实现。觉得当文件很多又很大的时候,时间开销会比较大,一个txt差不多700kb,20多个txt差不多要执行掉200ms。
求大神指导一下,或者给点资料看看~
这个直接用Lucene就可以,不用二次扫描,可以参考FastVectorHighlighter