面试题,给你256M的内存,对10G的文件进行排序(文件每行1个数字)

给你256M的内存,对10G的文件进行排序(文件每行1个数字),如何实现? 对10G的文件进行查找如何实现?统计10G文件每个关键字出现的次数如何实现

阅读 11.2k
5 个回答

不懂php,但是看这个题目似曾相识。
说说思路吧。
1、排序的实现
这是一个单机外部排序的典型题目。具体的方法就是先分块进行排序然后多路归并成输出文件。
2、查找
如果不能对文件进行处理的话,只能遍历进行查找。
如果是可以对文件进行处理的话,那么上面已经排序好了文件,就可以进行二分查找
3、统计
如果不能对文件进行处理的话,还是没有好的办法,只能是遍历一遍。
如果已经拍好序了,那么就可以直接二分查找。在找到的位置向两头搜索出现的个数。

新手上路,请多包涵

用时间换空间呗
具体的实现都是分批载入文件,然后计算

java吗 用nio和用mapreduce的思想

可以看看《编程珠玑》这本书,好像就有这个问题。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题