求教Java问题

新手上路,请多包涵

如果有一个大数据量的文本文件,每行一个字符串,如何用java对该文件进行排序并且去重?

阅读 2k
1 个回答

关键还是看数据量大小,

如果可以在内存里,直接用 java.util.TreeSet 就解决了。

如果数据量特别大,不适合直接在内存里处理,又不想自己写太复杂的算法,就用临时文件,分段缓存,先保证唯一性,再对每一段进行排序,最后组合起来。更简单的一点的办法就是用数据库,比如 SQLite,全部插入,排序,去重,处理起来都比较简单了。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题